Khóa luận Tìm hiểu công tác số hoá tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia

pdf 83 trang thiennha21 16/04/2022 7160
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Tìm hiểu công tác số hoá tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhoa_luan_tim_hieu_cong_tac_so_hoa_tai_lieu_tai_cuc_thong_ti.pdf

Nội dung text: Khóa luận Tìm hiểu công tác số hoá tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN KHOA THÔNG TIN - THƢ VIỆN -­­­­­­­­o0o­­­­­­ NGUYỄN THU HÀ TÌM HIỂU CÔNG TÁC SỐ HÓA TÀI LIỆU TẠI CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH: THÔNG TIN – THƢ VIỆN Hệ đào tạo: Chính quy Khoá học : QH – 2008 - X NGƢỜI HƢỚNG DẪN: ThS. TRẦN HỮU HUỲNH HÀ NỘI, 2012
  2. LỜI CAM ĐOAN Đề tài khoá luận của tôi là “Tìm hiểu công tác số hoá tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia”. Tôi xin cam đoan nội dung khoá luận do bản thân tự nghiên cứu, tìm tòi và học hỏi, dưới sự hướng dẫn và chỉ bảo của giáo viên hướng dẫn. Trong quá trình thực hiện khoá luận, bên cạnh sự cố gắng, nỗ lực không ngừng của bản thân, tôi đã luôn nhận được sự động viên và giúp đỡ nhiệt tình từ phía các thầy cô giáo, gia đình và bạn bè. Qua đây, tôi gửi lời cảm ơn chân thành tới các thầy cô giáo và các bạn học khoa Thông tin - Thư viện, trường Đại học Khoa học xã hội và Nhân văn, đồng thời tôi xin chân thành cảm ơn các các cô chú, anh chị, các cán bộ công tác trong Cục Thông tin Khoa học và công nghệ Quốc gia đã chỉ bảo tận tình và tạo điều kiện giúp đỡ tôi hoàn thành khóa luận này. Đặc biệt, tôi xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới thầy giáo, ThS. Trần Hữu Huỳnh - người đã tận tình hướng dẫn, động viên và giúp đỡ tôi trong suốt thời gian thực hiện khoá luận này. Hà Nội, ngày 10 tháng 2 năm 2012 Sinh viên Nguyễn Thu Hà DANH MỤC TỪ VIẾT TẮT CTTKH&CNQG Cục Thông tin Khoa học và Công nghệ Quốc gia. CSDL Cơ sở dữ liệu.
  3. KQNC Kết quả nghiên cứu. NDT Người dùng tin. KH&CN Khoa học và Công nghệ KH&KT Khoa học và Kỹ thuật. TT-TV Thông tin Thư viện. TVKH&KTTW Thư viện Khoa học kỹ thuật và Trung ương. STD Scientific and technological Documents (Tài liệu Khoa học và Công nghệ) DANH MỤC CÁC BẢNG BIỂU, SƠ ĐỒ ĐƢỢC THỂ HIỆN TRONG KHOÁ LUẬN Bảng 1: Thống kê nguồn lực thông tin tại CTTKH&CNQG. Bảng 2: Sự khác nhau giữa cán bộ thư viện số và cán bộ thư viện truyền thống Bảng 3: Yêu cầu kỹ thuật khi số hóa tài liệu.
  4. MỤC LỤC PHẦN MỞ ĐẦU 1 1. Tính cấp thiết của đề tài 1 2. Mục đích và nhiệm vụ nghiên cứu của đề tài 1 3. Tình hình nghiên cứu 2 4. Đối tượng và phạm vi nghiên cứu 2 5. Cơ sở lý luận và phương pháp nghiên cứu 3 6. Những đóng góp của đề tài 3 7. Bố cục của khóa luận 4 PHẦN NỘI DUNG 5 CHƢƠNG 1: CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA VỚI CÔNG TÁC SỐ HOÁ TÀI LIỆU 5
  5. 1.1 Quá trình hình thành và phát triển Cục Thông tin Khoa học và Công nghệ Quốc gia 5 1.1.1 Sơ lược lịch sử hình thành và phát triển 5 1.1.2 Chức năng và nhiệm vụ 11 1.1.3 Đội ngũ cán bộ và cơ cấu tổ chức 13 1.2 Đặc điểm người dùng tin và nhu cầu tin của Cục 16 1.2.1 Đặc điểm người dùng tin 16 1.2.2 Nhu cầu tin 17 1.3 Nguồn lực thông tin 20 1.4 Tầm quan trọng của công tác số hóa tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia 23 1.4.1 Khái niệm về tài liệu, tài liệu số, tài liệu điện tử và số hóa tài liệu 23 1.4.2 Vai trò công tác số hóa tài liệu ở CTTTKH&CNQG 25 CHƢƠNG 2: THỰC TRẠNG CÔNG TÁC SỐ HOÁ TÀI LIỆU TẠI CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA 27 2.1 Tài liệu số hóa tại Cục Thông tin Khoa học và Công nghệ Quốc gia 27 2.1.1 Đặc điểm nguồn tài liệu số hóa 27 2.1.2 Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Cục 28 2.1.2.1 Cơ sở dữ liệu thư mục 28 2.1.2.2 Cơ sở dữ liệu toàn văn 28 2.1.3 Dịch vụ số hóa tài liệu của Cục 29 2.2 Nguồn nhân lực số hoá tài liệu 30 2.2.1 Số lượng nguồn nhân lực 30 2.2.2 Chất lượng nguồn nhân lực 30 2.3 Hạ tầng cơ sở vật chất và thiết bị 32 2.3.1 Hạ tầng cơ sở thông tin và thiết bị số hóa 33 2.3.2 Phần mềm quản lý tài liệu số 35 2.4 Tiến trình và quy trình thực hiện công tác số hóa tài liệu 37 2.4.1 Tiến trình thực hiện công tác số hóa tài liệu tại Cục 37 2.4.2 Quy trình thực hiện công tác số hóa tài liệu 38 2.4.2.1 Thực hiện số hóa tài liệu 43 2.4.2.2 Xử lý tài liệu đã số hóa 44 2.5 Các nguyên tắc trong số hoá tài liệu 51 2.6 Phương pháp bảo quản tài liệu số 51 2.7 Tổ chức khai thác nguồn tài liệu số 53 2.7.1 Cung cấp trực tuyến từ xa 53 2.7.2 Cung cấp tài liệu tại chỗ 53 2.7.3 Cung cấp trọn gói tới địa phương 53
  6. 2.8 Một số sản phẩm thông tin số hóa của Cục 54 2.8.1 Cơ sở dữ liệu tài liệu KH&CN Việt Nam (STD) 54 2.8.2 Cơ sở dữ liệu báo cáo kết quả nghiên cứu (KQNC) 55 2.8.3 Cơ sở dữ liệu Nghiên cứu và Phát triển 56 CHƢƠNG 3: NHẬN XÉT VÀ GIẢI PHÁP KIẾN NGHỊ NHẰM NÂNG CAO HIỆU QUẢ CÔNG TÁC SỐ HÓA TÀI LIỆU TẠI CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA 59 3.1 Nhận xét chung 59 3.1.1 Ưu điểm 59 3.1.2 Hạn chế 61 3.2 Một số đề xuất, kiến nghị nhằm nâng cao hiệu quả của công tác số hóa tài liệu 62 3.2.1 Tổ chức đào tạo nghiệp vụ chuyên môn cho cán bộ thực hiện số hoá tài liệu 62 3.2.2 Tăng cường cơ sở vật chất phục vụ công tác số hóa tài liệu 63 3.2.3 Chính sách số hoá tài liệu và đảm bảo ngân sách 63 3.2.4 Tổ chức các buổi hội nghị, hội thảo về công tác số hóa tài liệu 64 3.2.5 Đảm bảo an toàn cho tài liệu số 64 3.2.6 Tăng cường trao đổi, chia sẻ nguồn tài nguyên số 66 3.2.7 Đẩy mạnh marketing về nguồn thông tin số 67 PHẦN KẾT LUẬN 69 DANH MỤC TÀI LIỆU THAM KHẢO 71 PHỤ LỤC
  7. PHẦN MỞ ĐẦU 1. Tính cấp thiết của đề tài. Muốn xây dựng vững chắc cho sự phát triển nền kinh tế và xã hội tri thức trong thế kỷ 21, giải pháp có ý nghĩa quyết định là phải tăng cường đầu tư cải cách và đổi mới nâng cao chất lượng giáo dục trong toàn xã hội, đáp ứng những yêu cầu của nền kinh tế và xã hội mới trong tương lai. Một nền giáo dục kết hợp hài hoà những thành tựu khoa học hiện đại với những tinh hoa của truyền thống mang bản sắc riêng sẽ có hiệu quả để phát triển và hội nhập với xu hướng chung của thế giới. Các thư viện thế giới xu hướng tự động hóa nghiệp vụ xây dựng thư viện điện tử, thư viện số nhằm đáp ứng đầy đủ nhu cầu thông tin và tri thức của con người trong xã hội đương đại. Các tài liệu trong thư viện không chỉ đơn thuần là các tài liệu truyền thống như: sách, báo, tạp chí mà còn bao gồm các tài liệu dạng số, dạng điện tử. Gần đây, nhiều thư viện trên thế giới và Việt Nam đã và đang tiến hành số hóa tài liệu với quy mô khác nhau. Công tác số hóa tài liệu đã kéo dài tuổi thọ tài liệu, tiết kiệm được diện tích kho, bạn đọc truy cập nhanh chóng chính xác thông tin tài liệu bất cứ ở đâu, thời điểm nào khi máy tính được nối mạng. Với xu thế đó, Cục Thông tin Khoa học và Công nghệ Quốc gia (CTTKH&CNQG) đã và đang được triển khai công tác số hóa tài liệu khoa học và công nghệ (KH&CN) nhằm đa dạng hóa các sản phẩm thông tin phục vụ cho người dùng tin. Xuất phát từ yêu cầu thực tế và nhận thức của bản thân trong quá trình thực tập tại Cục, tôi đã lựa chọn đề tài “Tìm hiểu công tác số hóa tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia” làm đề tài khóa luận tốt nghiệp của mình. 2. Mục đích và nhiệm vụ nghiên cứu của đề tài.
  8. * Mục đích nghiên cứu: Trên cơ sở bước đầu tìm hiểu nghiên cứu về công tác số hóa tài liệu, khóa luận muốn đem lại cái nhìn khái quát về thực trạng triển khai công tác số hóa tài liệu tại CTTKH&CNQG. Từ đó đề xuất một số giải pháp nhằm nâng cao hiệu quả công tác số hóa tài liệu và bảo quản nguồn tài liệu số tại Cục. * Nhiệm vụ nghiên cứu: Đề thực hiện mục tiêu trên, đề tài thực hiện các nhiệm vụ sau: Thứ nhất: Khái niệm và nội dung, quy trình và bảo quản công tác số hóa tài liệu. Thứ hai: Khảo sát tìm hiểu thực trạng công tác số hóa tài liệu tại CTTKH&CNQG. Thứ ba: Đề xuất và đưa ra những giải pháp áp dụng và triển khai nhằm hoàn thiện công tác số hóa tài liệu tại CTTKH&CNQG. 3. Tình hình nghiên cứu. Công tác số hóa tài liệu đã và đang được các cơ quan thông tin- thư viện đề cập tiến tới sẽ triển khai trong sự phát triển của hoạt động thông tin – thư viện (TT – TV) hiện nay. Song nghiên cứu về vấn đề này còn hạn chế ở nước ta do nguyên nhân khách quan và chủ quan của các cơ quan TT-TV nói chung và CTTKH&CNQG nói riêng. Bởi thế, các đề tài đã nghiên cứu mới chỉ đề cập đến mức độ nhất định, chưa có đề tài nghiên cứu về một mô hình tổ chức công tác số hóa tài liệu cụ thể. Từ việc đưa ra một mô hình tổng quan ứng dụng công nghệ thông tin, đến vấn đề đầu tư hệ thống trang thiết bị hiện đại, cũng như vấn đề đào tạo nguồn nhân lực để đáp ứng yêu cầu tổ chức công tác số hóa tài liệu. Nếu có nghiên cứu chỉ là từng vấn đề trong toàn bộ hoạt động nghiệp vụ TT-TV của hệ thống đó. 4. Đối tƣợng và phạm vi nghiên cứu. * Đối tượng nghiên cứu chính của đề tài là công tác số hóa tài liệu tại Cục TTKH&CNQG.
  9. * Phạm vi nghiên cứu: Phạm vi về thời gian: Nghiên cứu công tác số hóa tài liệu tại CTTKH&CNQG trong giai đoạn hiện nay. Phạm vi về không gian: Khảo sát và tìm hiểu công tác số hóa tài liệu tại CTTKH&CNQG . 5. Cơ sở lý luận và phƣơng pháp nghiên cứu. * Cơ sở lý luận: - Dựa trên cơ sở phương pháp luận của chủ nghĩa Mác – Lênin và tư tưởng Hồ Chí Minh về công tác thông tin- thư viện. - Dựa vào các cơ sở lý luận và quan điểm của Đảng, Nhà nước về thông tin học và thư viện học. - Các tài liệu chỉ đạo của Đảng và Nhà nước về công tác thông tin khoa học và công nghệ. * Phương pháp nghiên cứu: - Điều tra và khảo sát thực tế. - Trao đổi trực tiếp với cán bộ phụ trách chuyên môn, cán bộ lãnh đạo, quản lý. - Thu thập, phân tích, tổng hợp và đánh giá các tài liệu liên quan. 6. Những đóng góp của đề tài. Về lý luận: Kết quả nghiên cứu của khóa luận sẽ góp phần hoàn thiện những vấn đề lý thuyết cơ bản của công tác số hóa tài liệu trong hoạt động TT-TV. Khóa luận làm rõ nội hàm các khái niệm: tài liệu số, tài liệu điện tử, ; quy trình, nội dung vai trò, tầm quan trọng của công tác số hóa tài liệu trong hoạt động TT-TV. Về thực tiễn: Khóa luận nghiên cứu thực trạng công tác số hóa tài liệu từ đó mang ý nghĩa sâu sắc về thực tiễn:
  10. - Đưa ra quy trình, kinh nghiệm số hóa tài liệu, bảo quản nguồn tài liệu số để các cơ quan TT-TV khác tham khảo. - Đưa ra những nhận xét, đánh giá mang tính khách quan về công tác số hóa tài liệu tại CTTKH&CNQG. - Đưa ra những kiến nghị, giải pháp nhằm nâng cao hiệu quả của công tác số hóa tài liệu, góp phần làm thỏa mãn tối đa nhu cầu thông tin của người dùng tin trong kỷ nguyên số. 7. Bố cục của khóa luận. Ngoài phần mở đầu, phần kết luận, mục lục, danh mục tài liệu tham khảo, phụ lục thì bố cục chính của khóa luận được chia thành 3 chương như sau: Chương 1. Cục thông tin Khoa học và Công nghệ Quốc gia với công tác số hóa tài liệu. Chương 2. Thực trạng công tác số hóa tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia. Chương 3. Một số giải pháp nâng cao hiệu quả công tác số hóa tài liệu ở Cục Thông tin Khoa học và Công nghệ Quốc gia.
  11. PHẦN NỘI DUNG CHƢƠNG 1 CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA VỚI CÔNG TÁC SỐ HÓA TÀI LIỆU 1.1 .Quá trình hình thành và phát triển Cục Thông tin Khoa học và Công nghệ Quốc gia. 1.1.1 Sơ lƣợc lịch sử hình thành và phát triển. Cục Thông tin Khoa học và Công nghệ Quốc gia (CTTKH&CNQG) là đơn vị thuộc Bộ Khoa học và Công nghệ, được thành lập trên cơ sở triển khai thực hiện nghị định 28/2008/NĐ-CP ngày 14/3/2008 của Chính phủ quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Bộ Khoa học và Công nghệ, nghị định 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt động thông tin khoa học và công nghệ, nghị định 30/2006/NĐ-CP ngày 29/03/2006 của Chính phủ về thống kê khoa học và công nghệ. Tên giao dịch quốc tế là National Agency for Science and Technology Information (viết tắt là NASATI) CTTKH&CNQG thành lập nhằm mục tiêu: - Tăng cường và hoàn thiện chức năng quản lý nhà nước về thông tin, thư viện, thống kê KH&CN; - Đẩy mạnh các hoạt động và dịch vụ công trong lĩnh vực thông tin, thư viện, thống kê KH&CN, phát triển chợ công nghệ và thiết bị, phát triển mạng thông tin tiên tiến. Cùng với sự phát triển của Bộ KH&CN (KH&CN), ngành thông tin KH&CN Việt Nam có một bề dày lịch sử phát triển trải qua 50 năm. Quá trình phát triển ngành thông tin KH&CN Việt Nam qua các thời kỳ xây dựng và phát triển của Thư
  12. viện Khoa học và Kỹ thuật Trung ương (TVKH&KTTW), của Viện Thông tin KH&PT Trung ương, của Trung tâm Thông tin KH&CN Quốc gia và hiện nay là Cục Thông tin KH&CN Quốc gia. * Thư viện Khoa học kỹ thuật Trung ương. - Giai đoạn 1959-1965. TVKH&KTTW Hội đồng Chính phủ ra quyết định thành lập hoạt động từ ngày 06/02/1960. Trong giai đoạn này, kho tài liệu của thư viện hình thành theo hướng thư viện khoa học tổng hợp, gồm các lĩnh vực khoa học tự nhiên, khoa học kỹ thuật và khoa học xã hội. Các hoạt động nghiệp vụ của thư viện từng bước được đưa vào nề nếp. Công tác nghiên cứu nghiệp vụ và đào tạo đội ngũ cán bộ luôn được thư viện coi trọng. - Giai đoạn 1966-1975. Năm 1965, do điều kiện chiến tranh, TVKH&KTTW phải phân tán hoạt động: Cơ sở chính tại Hà Nội và các cơ sở sơ tán nằm rải rác tại 4 tỉnh (an toàn khu tại Tuyên Quang, Vĩnh Phú - nay là Vĩnh Phúc, Hà Bắc - nay là Bắc Ninh và Hà Sơn Bình - nay là Hoà Bình) nhưng các cán bộ của thư viện đã cố gắng thực hiện tốt chức năng, nhiệm vụ được giao, phục vụ tốt công tác nghiên cứu khoa học và giảng dạy. Năm 1968, Thư viện được tách thành 2 đơn vị: Thư viện Khoa học Xã hội - thuộc Ủy ban Khoa học Xã hội và Thư viện KH&KT Trung ương - thuộc Ủy ban KH&KT Nhà nước. - Giai đoạn 1976-1990. Đây là giai đoạn thư viện triển khai các hoạt động nghiệp vụ và dịch vụ phục vụ nhu cầu thông tin phát triển kinh tế - xã hội của đất nước. 1986 các chính sách đổi mới, phát triển hợp tác quốc tế của nhà nước, đội ngũ cán bộ của thư viện có điều kiện nâng cao trình độ nghiệp vụ. Xu hướng tin học hoá thư viện bước đầu được xúc tiến. Ngày 21/12/1976, lãnh đạo Ủy ban KH&KT Nhà nước đã phê duyệt điều lệ tổ chức và hoạt động của thư viện, trong đó có nhiệm vụ quản lý mạng lưới thư viện KH&KT trong cả nước. Đánh dấu chặng đường 20 năm thành lập,
  13. TVKH&KTTW đã vinh dự được Chủ tịch nước tặng Huân chương Lao động hạng Nhất. * Viện Thông tin khoa học và kỹ thuật Trung ương. - Giai đoạn 1961-1965. Ngày 18/08/1961, theo quyết định số 64-KHH/QĐ của Ủy ban Khoa học Nhà nước, Phòng Thông tin khoa học thuộc Ủy ban chính thức được thành lập. Phòng đã giúp Ủy ban chỉ đạo xây dựng công tác thông tin khoa học phù hợp với tình hình cũng như yêu cầu trong nước và phổ biến những kinh nghiệm, thành tựu, tình hình phát triển KH&KT trong và ngoài nước. - Giai đoạn 1966-1972. Đất nước trong thời kỳ chiến tranh, Phòng Thông tin khoa học của Ủy ban KH&KT Nhà nước đã phải sơ tán, điều kiện làm việc không ổn định. Tuy vậy, nhằm đẩy mạnh việc xây dựng hệ thống thông tin trong cả nước, đưa công tác thông tin KH&KT phục vụ phát triển kinh tế một cách hiệu quả hơn, ngày 04/03/1971, Phòng Thông tin khoa học đã tổ chức thành công Hội nghị Thông tin KH&KT toàn quốc lần thứ nhất tại Hà Nội. Hội nghị này đã góp phần thúc đẩy sự ra đời của nghị quyết 89-CP của Hội đồng Chính phủ về “Tăng cường công tác thông tin KH&KT”, đánh dấu mốc phát triển của ngành thông tin KH&KT được thể chế hóa ở mức cao nhất. Ngày 04/10/1972, Viện Thông tin KH&KT Trung ương được thành lập theo quyết định số 187/CP của Chính phủ trên cơ sở Phòng Thông tin khoa học. - Giai đoạn 1973-1990. Sau Hội nghị Thông tin KH&KT toàn quốc lần thứ hai được tổ chức thành công vào tháng 3/1977, mạng lưới cơ quan thông tin KH&KT đã được củng cố và mở rộng trong phạm vi cả nước. Đến cuối năm 1986, mạng lưới này đã bao quát hầu hết các ngành kinh tế và lĩnh vực KH&KT ở trung ương và địa phương với tổng số hơn 250 đơn vị. Công tác thông tin KH&KT đã trở thành một hoạt động mang tính xã hội, đạt được nhiều thành tựu và có đóng góp tích cực phục vụ công tác lãnh đạo, quản lý, nghiên cứu và sản xuất từ trung ương đến địa phương, Viện Thông tin
  14. KH&KT Trung ương đã chủ động củng cố, mở rộng mạng lưới và từng bước xây dựng hệ thống thông tin KH&KT quốc gia. * Trung tâm Thông tin Khoa học và Công nghệ Quốc gia. - Giai đoạn 1990 - 1995. Để tăng cường khai thác, phát huy vốn tư liệu KH&KT phong phú của thư viện KH&KT Trung ương cũng như năng lực xử lý, phổ biến thông tin, đặc biệt là năng lực ứng dụng công nghệ thông tin của Viện Thông tin KH&KT Trung ương, ngày 24/09/1990, Chủ nhiệm Ủy ban Khoa học Nhà nước đã ký quyết định số 487/TCCB thành lập Trung tâm Thông tin Tư liệu KH&CN Quốc gia (TTTTTLKH&CNQG) trên cơ sở hợp nhất Thư viện KH&KT Trung ương và Viện Thông tin KH&KT Trung ương. Trung tâm tiến hành đổi mới công tác kế hoạch và phương thức cấp phát kinh phí thông qua ký kết hợp đồng thực hiện nhiệm vụ cụ thể. Do đó đã nâng cao hiệu quả đồng vốn đầu tư, xây dựng tiềm lực thông tin có định hướng; mở rộng và đa dạng hóa các sản phẩm và dịch vụ thông tin; tạo quyền chủ động cho các cơ quan thông tin trong hoạt động, đồng thời mở rộng các mối quan hệ và tăng cường liên kết giữa các cơ quan thông tin trong hệ thống. Sau 5 năm thực hiện, số kinh phí đầu tư tăng dần hàng năm (từ 200 triệu đồng lên đến 1 tỷ đồng). Ngoài việc bổ sung và trao đổi tài liệu, Trung tâm đã mở rộng được mối quan hệ hợp tác quốc tế nhằm tăng cường nguồn tin và trang thiết bị của các đối tác quốc tế. Do đó đã tạo lập được trên 10 cơ sở dữ liệu (CSDL) với khoảng 400.000 biểu ghi. Các CSDL được tích hợp từ các CSDL chuyên đề, đưa vào mạng nội bộ và nối mạng trong toàn quốc (VISTA). Ngoài ra để quản lý sử dụng hiệu quả các đề tài và kết quả nghiên cứu, Trung tâm đã tiến hành xây dựng các CSDL đề tài khoa học với gần 2.500 biểu ghi/8.500 đề tài đã đăng ký và gần 2.900 biểu ghi/3.000 kết quả nghiên cứu đã đăng ký. Bên cạch đó, Trung tâm tổ chức thu thập tư liệu từ vệ tinh xây dựng hàng trăm băng hình KH&KT phục vụ công tác tuyên truyền và phổ biến các thành tựu KH&CN.
  15. - Giai đoạn 1996 - 1999. Trung tâm đã triển khai biên soạn dự thảo “Chiến lược tăng cường công tác thông tin KH&CN phục vụ sự nghiệp công nghiệp hóa- hiện đại hóa đất nước và nhiệm vụ đến năm 2000”. Bản chiến lược này đã cải tiến, nâng cao chất lượng các sản phẩm và dịch vụ, Trung tâm đã đẩy mạnh dịch vụ phục vụ thông tin có thu, ký kết hợp đồng thông tin trọn gói với các ngành và địa phương. Thông qua đó, tiềm lực thông tin của Trung tâm gia tăng đáng kể. Mạng “Thông tin khoa học, công nghệ và môi trường quốc gia” với giao thức Internet đã được thiết lập, tạo điều kiện truy nhập rộng rãi các CSDL trong và ngoài hệ thống. CSDL toàn văn cũng bắt đầu được triển khai tại Trung tâm. Các phòng đọc đều có máy tính để tra cứu, phòng đọc đa phương tiện được thành lập. Trung tâm đã trở thành nhà cung cấp dịch vụ Internet dùng riêng và nhà cung cấp nội dung thông tin trên Internet. - Giai đoạn 2000 – 2004. Công tác thông tin KH&CN chuyển biến căn bản lên một tầm cao mới. Năm 2003 TTTTTLKH&CNQG được đổi tên thành Trung tâm Thông tin KH&CN Quốc gia, TTTTKH&CNQG nhằm thực hiện công tác thông tin KH&CN có hiệu quả đã hoàn thành việc soạn thảo và trình Chính phủ ban hành Nghị định 159/2004/NĐ-CP ngày 31/08/2004 về hoạt động thông tin KH&CN, tạo lập và phát triển thị trường công nghệ ở Việt Nam. Trung tâm được lãnh đạo Bộ KH&CN giao làm đầu mối, thường trực, phối hợp với các đơn vị tổ chức thành công chợ Công nghệ và thiết bị Việt Nam 2003 (Techmart Việt Nam 2003) với quy mô quốc gia lần đầu tiên ở nước ta. Sau đó, Thủ tướng Chính phủ đã chính thức ra quyết định tổ chức techmart định kỳ 2 năm 1 lần ở quy mô quốc gia và khuyến khích tổ chức techmart tại các khu vực và địa phương trong cả nước. Từ đó, Trung tâm được giao nhiệm vụ tổ chức và quản lý hoạt động Techmart Việt Nam. Techmart ảo cũng được triển khai đã hỗ trợ tích cực và hiệu quả cho các tổ chức, cá nhân trong giao dịch và chuyển giao công nghệ, triển khai nhân rộng mô hình cung cấp thông tin KH&CN phục vụ phát triển kinh tế - xã hội khu vực nông thôn, miền núi, thúc đẩy ứng dụng các kỹ
  16. thuật tiến bộ, góp phần xóa đói, giảm nghèo tại hàng trăm xã/phường trong cả nước. Mô hình này hiện đang được hàng chục địa phương nhân rộng và phát huy hiệu quả thiết thực. Năm 2004, TTTTKH&CNQG được Chủ tịch nước tặng thưởng Huân chương Lao động hạng nhất. - Giai đoạn 2005-2009. Từ năm 2006, Trung tâm được lãnh đạo Bộ giao làm đầu mối và chủ trì triển khai kết nối mạng thông tin Á - Âu giai đoạn II (TEIN 2). Sau một thời gian triển khai, VinaREN được khai trương vận hành (tháng 2.2008). Tính đến nay, VinaREN đã có 55 mạng thành viên gồm các viện nghiên cứu, trường đại học hàng đầu, một số bệnh viện và trung tâm thông tin lớn tại 11 tỉnh, thành phố trong cả nước. Qua đó, cộng đồng các nhà khoa học Việt Nam giao lưu và liên kết hợp tác với hơn 40 triệu nhà khoa học tại hơn 4.000 trường đại học, phòng thí nghiệm hàng đầu trên thế giới. VinaREN đang hỗ trợ tích cực các hoạt động hợp tác nghiên cứu khoa học và đào tạo như: hội nghị truyền hình trực tuyến chất lượng cao, đào tạo trực tuyến, y học từ xa VinaREN thúc đẩy mạnh mẽ hiệu quả truy cập, chia sẻ và sử dụng rộng rãi các nguồn tài nguyên thông tin điện tử phong phú thiết thực công tác nghiên cứu, đào tạo, sản xuất kinh doanh của đất nước. Từ ngày 11/03/2005, Việt Nam chính thức được UNESCO chấp nhận là quốc gia thành viên của mạng lưới mã số chuẩn quốc tế cho xuất bản phẩm nhiều kỳ (ISSN). Trung tâm được chỉ định là trung tâm ISSN quốc gia của Việt Nam, trực tiếp tổ chức thực hiện việc đăng ký, cấp mã số chuẩn quốc tế cho xuất bản phẩm nhiều kỳ trên lãnh thổ Việt Nam. Tính đến tháng 6/2009, Trung tâm ISSN Việt Nam đã đăng ký và cấp ISSN cho 294 xuất bản phẩm. Tháng 9/2009, TTTTKH&CNQG đã tổ chức thành công chợ Công nghệ và Thiết bị Việt Nam ASEAN+3 (Techmart Việt Nam ASEAN+3) quy mô quốc tế với sự tham gia của 651 đơn vị thuộc các nước ASEAN+3 và trong nước. Tổng trị giá hợp đồng được ký kết tại Techmart này đạt 1.718 tỷ đồng. Hiện nay, Trung tâm
  17. đang tích cực đẩy mạnh công tác quảng bá, triển khai, giới thiệu các nguồn tin điện tử, hướng dẫn các nhà khoa học, cán bộ giảng dạy khai thác các nguồn tin hiệu quả nhằm phục vụ công tác nghiên cứu và đào tạo. Năm 2008, nghị định 28/2008/NĐ-CP quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Bộ KH&CN, có Cục Thông tin KH&CN Quốc gia để tăng cường công tác quản lý và phát triển sự nghiệp thông tin KH&CN. Ngày 27/12/2009, Bộ đã có quyết định 2880/QĐ-BKHCN thành lập Cục Thông tin KH&CN Quốc gia trên cơ sở tổ chức của TTTTKH&CNQG. Ngày 28/01/2010, Bộ trưởng đã ban hành điều lệ tổ chức và hoạt động của Cục Thông tin KH&CN Quốc gia (CTTKH&CNQG) kèm theo quyết định số 116/QĐ-BKH&CN. Trải qua chặng đường lịch sử 50 năm xây dựng và trưởng thành, CTTKH&CNQG Việt Nam đã phát triển mạng lưới thư viện KH&KT rộng lớn. Những thành tựu có được ngày hôm nay là nhờ sự quan tâm của Đảng và Nhà nước; sự chỉ đạo sát sao của lãnh đạo Ủy ban Khoa học Nhà nước, Bộ KH&CN; sự hỗ trợ của quốc tế và sự đóng góp đầy tâm huyết của nhiều thế hệ cán bộ thư viện và thông tin. CTTKH&CNQG Việt Nam đã từng bước khẳng định vai trò quan trọng của mình trong xã hội, một nghề hữu ích đầy triển vọng và được thừa nhận là một yếu tố của tiềm lực KH&CN, một nguồn lực quốc gia cho sự phát triển đất nước. 1.1.2 Chức năng và nhiệm vụ. * Chức năng. Xuất phát từ yêu cầu phát triển hoạt động thông tin, thư viện và thống kê KH&CN, ngày 17/12/2009, Bộ trưởng Bộ KH&CN đã ký và ban hành quyết định số 2880/QĐ-BKHCN về việc thành lập CTTKH&CNQG thuộc Bộ KH&CN trên cơ sở tổ chức lại Trung tâm thông tin KH&CN Quốc gia. Xác định chức năng sau: “CTTKH&CNQG có chức năng tham mưu giúp Bộ trưởng quản lý nhà nước và tổ chức thực hiện các hoạt động sự nghiệp về thông tin, thư viện, thống kê KH&CN”. Bộ trưởng cũng giao cho Cục trưởng CTTKH&CNQG xây dựng điều lệ tổ chức và hoạt động của Cục trình Bộ trưởng phê duyệt.
  18. * Nhiệm vụ. - Xây dựng và trình Bộ trưởng Bộ KH&CN: + Dự thảo các văn bản quy phạm pháp luật, tiêu chuẩn và quy chuẩn kỹ thuật trong lĩnh vực thông tin- thư viện, thống kê KH&CN, phát triển chợ công nghệ và thiết bị, phát triển các mạng thông tin KH&CN tiên tiến. + Dự thảo chiến lược, chính sách, quy hoạch, kế hoạch dài hạn, 5 năm, hàng năm, đề án xây dựng cơ sở hạ tầng cho thông tin- thư viện, thống kế KH&CN, phát triển chợ công nghệ và thiết bị, trung tâm giao dịch thông tin công nghệ và đầu tư phát triển các mạng thông tin KH&CN tiên tiến. - Hướng dẫn, kiểm tra và tổ chức thực hiện các văn bản quy phạm pháp luật, tiêu chuẩn và quy chuẩn kỹ thuật, chiến lược, chính sách , quy hoạch, kế hoạch, đề án sau khi được cấp có thẩm quyển ban hành, phê duyệt. - Tuyên truyền, phổ biến, giáo dục pháp luật trong lĩnh vực thông tin- thư viện, thống kê KH&CN. - Ban hành các văn bản cá biệt, văn bản quy phạm nội bộ thuộc lĩnh vực TT- TV, thống kê KH&CN, chỉ đạo và tổ chức thực hiện các nhiệm vụ trong lĩnh vực TT-TV, thống kê KH&CN, phát triển chợ công nghệ và các thiết bị và phát triển các mạng thông tin KH&CN tiên tiến như: Nghiên cứu khoa học và phát triển công nghệ, ứng dụng công nghệ thông tin và các thành tựu KH&CN tiên tiến; Đào tạo, bồi dưỡng nâng cao trình độ chuyên môn, nghiệp vụ; Đăng ký, lưu giữ và sử dụng thông tin kết quả các nhiệm vụ KH&CN; Quản lý và cấp mã số chuẩn quốc tế cho các xuất bản phẩm kế tiếp (ISSN); Hoạt động hợp tác quốc tế. - Chỉ đạo và tổ chức thực hiện các nhiệm vụ trong lĩnh vực TT-TV, thống kê KH&CN, phát triển chợ công nghệ và thiết bị, các mạng thông tin KH&CN tiên tiến: + Nghiên cứu khoa học và phát triển công nghệ, ứng dụng công nghệ thông tin và các thành tựu KH&CN tiên tiến. + Đào tạo, bồi dưỡng nâng cao trình độ chuyên môn, nghiệp vụ.
  19. + Đăng ký, lưu giữ và sử dụng thông tin kết quả các nhiệm vụ KH&CN; Quản lý và cấp mã số chuẩn quốc tế cho các xuất bản phẩm kế tiếp (ISSN). + Hoạt động hợp tác quốc tế. - Phối hợp thanh tra; Kiểm tra và giải quyết khiếu nại, tố cáo và xử lý vi phạm hành chính trong lĩnh vực động TT-TV, thống kê KH&CN, phát triển chợ công nghệ và thiết bị, các mạng thông tin KH&CN tiên tiến theo quy định của pháp luật; - Tổ chức và phát triển thư viện KH&CN Quốc gia và Liên hiệp thư viện Việt Nam về các nguồn thông tin KH&CN (Vietnam Library Consortium); Chủ trì cập nhật, bổ sung và phát triển nguồn thông tin KH&CN cho cả nước. - Tổ chức và thực hiện xử lý phân tích - tổng hợp và cung cấp thông tin phục vụ lãnh đạo, phục vụ hoạt động quản lý nhà nước, nghiên cứu, đào tạo, sản xuất, kinh doanh và phát triển kinh tế - xã hội nông thôn, miền núi; Cập nhật và phát triển cổng điện tử về thông tin KH&CN Việt Nam; Xây dựng cơ sở dữ liệu quốc gia về KH&CN trong đó có: các CSDL về nhân lực, thành tựu KH&CN, CSDL thống kê KH&CN; Xuất bản các sách KH&CN, Tạp chí Thông tin và tư liệu và các xuất bản phẩm thông tin KH&CN khác. - Tổ chức phát triển dịch vụ giao dịch thông tin công nghệ, chợ công nghệ và thiết bị Việt Nam; Tổ chức, tham gia các triển lãm, hội chợ trong nước và quốc tế; Cung cấp thông tin công nghệ phục vụ các doanh nghiệp; Tổ chức và thực hiện công tác thống kê KH&CN. - Tổ chức, vận hành và phát triển mạng Nghiên cứu và đào tạo Việt Nam (VinaREN) - Tổ chức hoạt động dịch vụ trong lĩnh vực TT-TV, thống kê KH&CN và tổ chức các sự kiện KH&CN. - Thực hiện cải cách hành chính trong lĩnh vực TT-TV. - Quản lý về tổ chức, cán bộ, tài sản và hồ sơ tài liệu của Cục theo sự phân cấp và quy định của Bộ. - Thực hiện các nhiệm vụ khác do Bộ trưởng giao.
  20. 1.1.3 Đội ngũ cán bộ và cơ cấu tổ chức.  Đội ngũ cán bộ. Hiện tại CTTKH&CNQG có nguồn nhân lực với 165 cán bộ TT-TV có trình độ cao, có tính chuyên nghiệp, trong đó với hơn 72% số cán bộ có trình độ từ đại học trở lên, trong đó có 7 tiến sỹ (chiếm 4,2%), trên 20 thạc sỹ (chiếm 13 %). Nguồn nhân lực: Trình độ đại học và trên đại học: 120 72,72% Tiến sỹ: 7 4,24% Thạc sỹ: 22 13,33% Đại học: 91 55,15% Trình độ khác: 45 21,81%. Tổng số: 165 100 % Sơ đồ cơ cấu tổ chức Cục như sau:
  21. * Cơ cấu tổ chức. CTTKH&CNQG gồm: Cục trưởng là: TS. Tạ Bá Hưng. 4 Phó Cục trưởng là: TS. Phùng Minh Lai; ThS. Cao Minh Kiểm; ThS.Lê Thị Khánh Vân; TS. Lê Xuân Định. Bao gồm 12 phòng ban, trong đó:
  22. - Khối đơn vị quản lý nhà nước gồm: Văn phòng, Phòng Kế hoạch-Tài chính, Phòng Quản lý Thông tin thống kê, Phòng Hợp tác Quốc tế. - Khối đơn vị sự nghiệp gồm: Thư viện KH&CN Quốc gia, Trung tâm xử lý và phân tích thông tin, Trung tâm giao dịch Thông tin Công nghệ Việt Nam, Trung tâm Thống kê KH&CN, Trung tâm Tin học và đào tạo, Trung tâm Quản lý mạng Nghiên cứu và đào tạo Việt Nam, Tạp chí Thông tin & tư liệu, Trung tâm Thông tin phát triển. 1.2 . Đặc điểm ngƣời dùng tin và nhu cầu tin của Cục. 1.2.1 Đặc điểm người dùng tin. Người dùng tin (NDT) là đối tượng phục vụ chính của mọi hệ thống thông tin, đó là đối tượng phục vụ của công tác thông tin tư liệu. NDT vừa là khách hàng của các dịch vụ thông tin, đồng thời họ là người sản sinh ra thông tin mới. Họ giữ vai trò quan trọng trong các hệ thống thông tin tại CTTKH&CNQG. NDT luôn là cơ sở để định hướng các hoạt động của đơn vị thông tin, đề ra các sản phẩm và dịch vụ thông tin phù hợp. Họ tham gia vào hầu hết các công đoạn của dây chuyền thông tin và có thể thông báo hoặc đánh giá các nguồn tin cho cơ quan thông tin. NDT là người sử dụng thông tin và là người sáng tạo, làm giàu nguồn thông tin. Thỏa mãn nhu cầu tin cho NDT đồng nghĩa với việc phát triển nguồn tin của thư viện. sự thỏa mãn nhu cầu tin cho họ chính là cơ sở để đánh giá chất lượng hoạt động thông tin trong thư viện. Hiện nay NDT tại Cục CTTKH&CNQG phát triển nhanh chóng cả về số lượng và thành phần. Trình độ của NDT có nhiều cấp độ khác nhau và đa dạng: các nhà quản lí, lãnh đạo các cấp, các ngành; các nhà khoa học, các cán bộ nghiên cứu, giảng dạy ở các viện, trung tâm nghiên cứu, các trường đại học cao đẳng, trung học chuyên nghiệp; cán bộ công tác tại các cơ quan, các cơ sở KH&CN địa phương, các cán bộ kỹ thuật, kỹ sư nhà máy sản xuất, kinh doanh; sinh viên các trường đại học cao đẳng có nhu cầu thông về khoa học và công nghệ nói chung.
  23. Qua quá trình thực tập và khảo sát tại CTTKH&CNQG, tôi tạm thời chia thành 4 nhóm chính như sau: Nhóm 1: Cán bộ lãnh đạo, quản lý. Nhóm 2: Các cán bộ nghiên cứu, giảng dạy. Nhóm 3: Cán bộ lĩnh vực sản xuất – kinh doanh. Nhóm 4: Nghiên cứu sinh, học viên cao học và sinh viên. Hiện nay, theo thống kê mới nhất, CTTKH&CNQG có trên 35.600 bạn đọc, trong đó trên 9.500 bạn đọc thường xuyên tới sử dụng tài liệu và hàng vạn người sử dụng dịch vụ. Trong đó có 3.800 bạn đọc là cán bộ có trình độ tiến sỹ, phó giáo sư, giáo sư (chiếm 18,4%) đã được cấp sổ mượn sách về nhà, 10.045 bạn đọc là sinh viên các trường đại học, cao đẳng, trung học dạy nghề, (chiếm 55%); 3.420 bạn đọc là cán bộ kỹ thuật, kỹ sư nhà máy, xí nghiệp khối sản xuất (chiếm 18%); 1.330 bạn đọc là bạn đọc khối công ty liên doanh, công ty TNHH chiếm (7%). Có thể nói rằng số cán bộ có trình độ cao, có học hàm, học vị kỹ sư, cán bộ kỹ thuật đang chiếm tỷ lệ lớn trong số bạn đọc của Cục. 1.2.2 Nhu cầu tin. Khoa học kỹ thuật ngày càng phát triển, nhu cầu thông tin của con người ngày càng lớn, đa dạng và phong phú. Nhu cầu thông tin là nhu cầu khách quan của người dùng tin về những thông tin cần thiết cho công việc của họ. Nó tùy thuộc vào từng nhóm người dùng tin, vào bản chất công việc và nhiệm vụ mà người dùng tin phải hoàn thành. Chất lượng của việc đáp ứng nhu cầu tin lại phụ thuộc vào sự nắm bắt những đặc điểm của những nhu cầu, yêu cầu dùng tin đó. Yêu cầu tin càng rõ ràng, cụ thể thì việc thỏa mãn nhu cầu tin càng nhanh chóng và hiệu quả. Vì thế nếu không nắm chắc nhu cầu dùng tin sẽ ảnh hưởng trực tiếp đến toàn bộ quá trình hoạt động thông tin thư viện của cơ quan. Phân nhóm người dùng tin cho phép ta có được những sản phẩm tin phù hợp với từng nhóm. Vì không một sản phẩm thông tin nào lại có thể đáp ứng mọi mặt cho mọi người với nhu cầu thông tin khác nhau.
  24. Nhu cầu tin xuất phát từ nhu cầu nhận thức của con người tăng lên cùng với sự gia tăng các mối quan hệ trong xã hội và mang tính chất chu kỳ. Nếu nhu cầu tin được thỏa mãn kịp thời, chính xác thì nhu cầu tin ngày càng được phát triển. NDT gồm nhiều độ tuổi khác nhau, mỗi độ tuổi được sinh ra và lớn lên trong những điều kiện xã hội tương đồng. Sự khác nhau về độ tuổi trình độ của họ có những đặc điểm tâm lý riêng tạo nên sự khác biệt về nhu cầu. Theo thống kê gần đây tính trung bình hàng tháng, CTTKH&CNQG đã phục vụ được: - 8.500 lượt người đọc tại các phòng đọc của thư viện và tra cứu các nguồn thông tin mà Cục đặt mua. - 54.240 lượt tài liệu được lưu thông. - Trên 10.000 lượt người truy cập vào các nguồn tin điện tử trực tuyến. - 466.733 trang tài liệu các loại được tin, sao và tải về qua mạng. Như vậy, so với năm 2006, năm 2010 số lượt bạn đọc đến thư viện tăng 139%, số tài liệu luân chuyển tăng 289%. [Trần Thị Thu, Phát triển nguồn tin phục vụ nghiên cứu và đào tạo Việt Nam. Kỷ yếu hội thảo khoa học ngành thông tin thống kê KH&CN lần thứ VI, Cục Thông tin Khoa học và Công nghệ Quốc gia. Bộ Khoa học và Công nghệ] * Nhu cầu tin là cán bộ lãnh đạo, quản lý. Đây là nhóm NDT chiếm số lượng không nhiều song là nhóm rất quan trọng của CTTKH&CNQG. Họ cần cơ sở lý luận để đưa ra quyết định mang tính chiến lược và sách lược có ảnh hưởng đến lợi ích và sự phát triển của toàn xã hội. Họ là những người có học hàm, học vị rất cao là chủ thể thực hiện chức năng quản lý vừa là người xây dựng các nhiệm vụ chiến lược phát triển kinh tế- xã hội. Thông tin giúp họ quản lý thành thực tiễn hành động, khi thông tin đầy đủ chính xác thì quá trình quản lý, lãnh đạo càng đạt kết quả cao. Họ cần nghiên cứu các loại hình tài liệu về các ngành: khoa học công nghệ, quản lý xã hội, sản xuất kinh doanh mang tính chuyên sâu về các lĩnh vực chuyên
  25. môn. Họ là người có nhu cầu sử dụng thông tin tài liệu “xám” và sáng tạo ra những thông tin mới có giá trị cao. * Nhu cầu tin là các cán bộ nghiên cứu, giảng dạy. Đây là nhóm NDT cũng có trình độ học vấn cao, hoạt động thông tin năng động và tích cực. Họ vừa là chủ thể vừa là khách thể của hoạt động thông tin, luôn khai thác mạnh nguồn lực thông tin nói chung và nguồn tài liệu xám nói riêng. Nhu cầu của họ là những thông tin mang tính chất chuyên ngành, vừa mang tính chất lý luận và thực tiễn chuyên sâu. Nhóm này chiếm tỉ lệ khá cao tại Cục, nhu cầu tin của họ khá cao về các loại hình thức tài liệu truyền thống và hiện đại. Thường là tài liệu quý hiếm, tài liệu xám đã số hóa; các tài liệu chuyên sâu về một ngành, một lĩnh vực cụ thể mà họ quan tâm. * Nhu cầu tin là cán bộ lĩnh vực sản xuất – kinh doanh (SXKD) SXKD là khu vực rộng lớn nhất của nền sản xuất xã hội, nó trải rộng trong mọi lĩnh vực của đời sống và cần có sự tham gia của nhiều người trên mọi miền đất nước. Họ là người có trình độ chuyên môn, trình độ học vấn khác nhau: kỹ sư, công nhân lành nghề, thương nhân, Nhiệm vụ chính của họ là trực tiếp hoặc gián tiếp làm ra các sản phẩm phục vụ xã hội hoặc trực tiếp phục vụ nhu cầu xã hội. Nhóm NDT này có tỉ lệ tương đối thấp, tuy nhiên đã phần nào cho thấy thành phần NDT đến với CTTKH&CNQG phong phú và đa dạng. Cần nghiên cứu và điều tra rõ nhu cầu tin của họ để có kế hoạch đáp ứng thông tin đầy đủ và chính xác cho đối tượng này. * Nhu cầu tin là nghiên cứu sinh, học viên cao học và sinh viên. Đây là nhóm NDT chiếm tỉ lệ lớn nhất tại CTTKH&CNQG luôn biến động tại Cục. Nhu cầu tin của họ rất đa dạng, tham khảo để mở rộng kiến thức và cập nhật các thông tin mới về nhu cầu của học tập và nghiên cứu khoa học phù hợp với ngành học và lĩnh vực cần nghiên cứu.
  26. Nghiên cứu đặc điểm người dùng tin và nhu cầu tin tại CTTKH&CNQG sẽ giúp cho việc nhận dạng nhu cầu thông tin và sử dụng các nguồn tài liệu số của họ, qua đó tìm ra những biện pháp phù hợp nhằm đáp ứng đúng với nhu cầu thông tin của mỗi nhóm NDT. 1.3 . Nguồn lực thông tin. Nguồn lực thông tin là nền tảng chính cho mọi hoạt động thông tin của cơ quan thông tin- thư viện. Đó chính là cơ sở để tạo ra các sản phẩm và dịch vụ thông tin mới, để thực hiện sự hợp tác, trao đổi, chia sẻ nguồn lực giữa các thư viện và cơ quan thông tin. Việc phát triển nguồn lực thông tin và tổ chức quản lý khai thác một cách có hiệu quả nguồn lực đó phục vụ nhiệm vụ phát triển kinh tế- xã hội của đất nước càng có ý nghĩa hơn khi công nghệ thông tin đã và đang ngày càng phát triển chi phối toàn bộ hoạt động của xã hội. CTTKH&CNQG đã tạo lập, lưu giữ, quản trị, cập nhật, phát triển và đưa vào phục vụ nguồn tin KH&CN lớn nhất Việt Nam với vốn tư liệu rất lớn và phong phú, ngân hàng dữ liệu có thể truy cập tại chỗ hoặc trực tuyến. Sau đây là một số nguồn thông tin KH&CN chủ yếu mà Cục đã xây dựng và được bổ sung được trong nhiều năm qua với nhiều dạng tài liệu khác nhau:  Nguồn tài liệu dạng in. Với tư cách là thư viện trung tâm của cả nước về KH&CN, kho tài liệu trên vật mang tin truyền thống của Cục rất phong phú, bao gồm: - Trên 450.000 đầu tên sách thuộc nhiều lĩnh vực KH&CN. - Hơn 7.000 đầu tên tạp chí và ấn phẩm kế tiếp xuất bản trên giấy, trong đó có gần 1000 tên tạp chí được bổ sung thường xuyên. - Hơn 11.000 báo cáo KQNC của các đề tài nghiên cứu các cấp. - Hơn 7 triệu bản mô tả sáng chế trên vi phiếu. - Kho tài liệu tra cứu quý. Trước năm 1990, khoảng 55% tài liệu thư viện của CTTKH&CNQG thu thập được là tài liệu tiếng Nga, 40% là tài liệu bằng các ngôn ngữ gốc latinh, 5% là tài
  27. liệu tiếng Việt và các ngôn ngữ khác. Từ sau năm 1990, tài liệu được bổ sung vào Cục chủ yếu là tài liệu tiếng Anh, tiếng Pháp và tiếng Việt. Phần tài liệu tiếng Nga bổ sung mới là không đáng kể. Theo thống kê từ năm 2009, tỷ lệ tài liệu của Cục theo lĩnh vực như sau: - Khoa học tự nhiên: 35% - Kỹ thuật và công nghệ: 45% - Nông-lâm-ngư, y học: 19% - Khác: 1% Tỷ lệ phân bố tài liệu theo ngôn ngữ như sau: - 58% là thuộc nhóm ngôn ngữ latin (chủ yếu là tiếng Anh); - 33% là tiếng Nga; - 9% là tiếng Việt. Có thể khẳng định đây là kho tài liệu KH&CN lớn nhất của Việt Nam. Đặc biệt, kho báo cáo kết quả các đề tài nghiên cứu KH&CN các cấp (cấp nhà nước, cấp bộ/ngành, cấp tỉnh/thành phố trực thuộc Trung ương, cấp cơ sở) với hơn 11.000 tập báo cáo là nguồn tài liệu quý và lớn nhất Việt Nam về kết quả nghiên cứu khoa học. Loại tài liệu Số lượng Sách 270.000 tên sách Tạp chí trên giấy cập nhật thường xuyên 700 tên Tạp chí điện tử toàn văn Hơn 15.000 tên CSDL thư mục Hơn 50 triệu biểu ghi Báo cáo kết quả nghiên cứu 11.000 báo cáo Phát minh sáng chế 7triệu bản trên Microfiches Ngoài ra các vật mang tin như: vi phim, băng hình, CD-ROM, CSDL, CSDL trực tuyến và các nguồn tin trên Internet.  Các CSDL do Cục xây dựng.
  28. Xây dựng, duy trì và phổ biến thông tin KH&CN trong nước là một trong những nhiệm vụ trọng tâm của CTTKH&CNQG. Cục đã xây dựng một số CSDL quan trọng và đưa lên khai thác phục vụ theo chế độ trực tuyến trên mạng thông tin KH&CN Việt Nam (VISTA) và mạng Nghiên cứu và đào tạo Việt Nam (VinaREN). Cục có khoảng trên 10 CSDL, trong đó có các CSDL lớn được xây dựng từ nhiều năm trước như: STD (tài liệu KH&CN Việt Nam) xây dựng từ năm 1987; Book (Sách tại Thư viện KHKT Trung ương); KQNC (Báo cáo kết quả nghiên cứu khoa học, CSDL về chợ công nghệ Việt Nam )  Các CSDL KH&CN trên thế giới. Trên 10 CSDL, trong đó có các CSDL nổi tiếng như: IEEE/IEE Fulltext (Thư viện điện tử về CNTT, điện và điện tử) Chemical Abstracts (Tạp chí tóm tắt về hoá học); PASCAL (CSDL đa ngành về KH&CN), đặc biệt là các CSDL trực tuyến như: ScienceDirect; ISI- Web of Knowledge; Ebrary,  Nguồn điện tử không trực tuyến: Nguồn tin điện tử không trực tuyến bao gồm các cơ sở dữ liệu do Cục xây dựng hoặc mua trên CD- ROM, hoặc thư viện điện tử trên ổ đĩa cứng máy tính.  Mạng VISTA. Mạng Thông tin KH&CN Việt Nam bao gồm nhiều dịch vụ về KH&CN như: - Các dịch vụ Thư viện thông qua website: www.clst.ac.vn. - Khai thác thông tin KH&CN trên CSDL thư mục của CTTKH&CNQG. - Khai thác các thông tin trong chợ ảo về công nghệ thông qua www.techmartvietnam.com.vn - Cung cấp các dịch vụ Internet. - Quảng cáo trên mạng VISTA.  Chợ Công nghệ và thiết bị Việt Nam trên mạng (techmart ảo)
  29. Chợ Công nghệ ảo có chức năng giới thiệu công nghệ, thiết bị cần mua và chào bán trong và ngoài nước, đồng thời là sàn giao dịch về công nghệ, thiết bị và tư vấn KH&CN.  Xuất bản phẩm. Hiện nay, Cục có rất nhiều xuất bản phẩm dạng in như : Sách KH&CN Việt Nam, tạp chí Thông tin - Tư liệu, Tổng luận Khoa học – Công nghệ - Kinh tế và hàng chục bản tin điện tử như: Nông thôn đổi mới, Khoa học và công nghệ môi trường,  Các chương trình phim KHCN. Các phim KH&CN trong nước và nước ngoài được cung cấp cho NDT dưới dạng các đĩa VCD, DVD theo yêu cầu. 1.4 . Tầm quan trọng của công tác số hóa tài liệu tại Cục Thông tin Khoa học và Công nghệ Quốc gia. 1.4.1 Khái niệm về tài liệu, tài liệu số, tài liệu điện tử và số hóa tài liệu. * Tài liệu. Ở nước Nga, theo tiêu chuẩn quốc gia về thuật ngữ GOST 16487-70 “Văn thư và công tác lưu trữ- các thuật ngữ và định nghĩa”, tài liệu được định nghĩa: “Là phương tiện để giữ lại các tin tức về những sự việc, sự kiện, hiện tượng của thực tiễn khách quan và hoạt động tư duy của con người”. Ngày nay, tài liệu định nghĩa:“Tài liệu - là thông tin được gắn trên vật mang tin với những tiêu chí cho phép nhận dạng nó”. Đối với công tác quản lý văn thư, lưu trữ điều quan trọng là nhận dạng thông tin chứa đựng trong tài liệu, trình bày theo trật tự được thiết lập với những tiêu chí nhất định. * Tài liệu số. Theo từ điển giải nghĩa của Mindwrrap “Tài liệu số là những tài liệu được lưu giữ bằng máy tính”, có thể được tạo lập bởi máy tính như việc xử lý các file văn bản, các bảng biểu hoặc chúng có thể được chuyển đổi sang dạng số từ những tài liệu dạng khác. Tài liệu số: là các đối tượng được lưu trữ, xử lý trên bộ nhớ máy tính và được truyền đi thông qua các thiết bị số và mạng.
  30. Tài liệu số được xây dựng qua 2 kênh: - Kênh 1: Tạo lập tài liệu gốc bằng máy tính thông qua việc xử lý các file văn bản, hình ảnh, bảng biểu, - Kênh 2: Tạo lập tài liệu số thông qua hình thức chuyển đổi định dạng các tài liệu đã được tạo lập ở dạng khác như: Scan, ghi âm, * Tài liệu điện tử. Sự phát triển của khoa học công nghệ, đặc biệt là công nghệ thông tin trong thực tiễn đã sản sinh ra một loại hình tài liệu mới, đó là tài liệu điện tử. Hiện nay, khái niệm về tài liệu điện tử ở Việt Nam vẫn chưa thống nhất. Có thể xem tài liệu điện tử là tài liệu được trình bày và lưu trữ trên các vật mang tin điện tử và có thể truy cập được thông qua hệ thống máy tính điện tử và mạng máy tính. Các vật mang tin ở đây có thể là băng từ, đĩa từ, các bộ phận lưu trữ thông tin của máy tính * Số hóa tài liệu. Thư viện trường Đại học Cornell định nghĩa số hóa: “Số hóa là quá trình biến các tài liệu in ấn trên giấy được chuyển sang dạng số, cho phép các trang thiết bị như máy tính để đọc, máy quét hình phẳng, camera số, camera động và một loạt các thiết bị khác được sử dụng để số hóa tài liệu”. Thông thường, các dữ liệu dạng chữ, hình ảnh, âm thanh sử dụng trên máy tính và được máy tính nhận biết đúng định dạng, được gọi chung là dữ liệu số. Quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết được gọi là số hoá dữ liệu. Số hóa (Digitization) là quá trình chuyển đổi những thông tin trên những đối tượng thực sang dạng điện tử còn gọi là dạng số. Số hóa là việc chuyển đổi một dạng nào khác của thông tin như sách báo, văn bản, biểu mẫu tiếng Việt in trên giấy hay dạng Analogue, thành tài liệu lưu trữ trên máy tính (tài liệu dạng số) và có thể chỉnh sửa thông qua các dịch vụ, phần mềm nhận dạng.
  31. Như vậy, số hoá tài liệu là hình thức chuyển đổi các dữ liệu truyền thống bên ngoài thành dạng tài liệu số mà máy tính có thể hiểu được/đọc được. 1.4.2.Vai trò công tác số hóa tài liệu ở CTTKH&CNQG. Nhu cầu của NDT về sản phẩm và dịch vụ thông tin ngày một tăng theo chiều hướng phát triển của nguồn lực thông tin. Bên cạnh sản phẩm thông tin truyền thống như: hệ thống mục lục, các bản thư mục cần xây dựng các sản phẩm thông tin: cơ sở dữ liệu, ấn phẩm tóm tắt, tổng quan và các dịch vụ thông tin mới như: dịch vụ tư vấn, dịch vụ SDI, CAS Các sản phẩm và dịch vụ thông tin sẽ giúp NDT chọn lọc thông tin phù hợp với nhu cầu của họ một cách dễ dàng, thuận tiện và nhanh chóng. Xây dựng nguồn tài nguyên số chính là một xu thế tất yếu vì mục đích sao lưu, bảo quản tài liệu, mở rộng đối tượng phục vụ và chia sẻ tài liệu, tận dụng tối đa cơ sở vật chất và trang thiết bị hiện đại. Kế hoạch số hóa tại CTTKH&CNQG được bắt đầu thực hiện năm 1990, trong đó các nguồn dữ liệu được đưa vào số hóa là Báo cáo kết quả nghiên cứu khoa học, các ấn phẩm khoa học và công nghệ, Công tác số hóa tài liệu đã được xác định là nhiệm vụ trọng tâm của Cục hiện nay. Nhu cầu của NDT về sản phẩm và dịch vụ thông tin (SP&DVTT) ngày một tăng theo chiều hướng phát triển của nguồn lực thông tin như: cơ sở dữ liệu, ấn phẩm tóm tắt, tổng quan cũng như dịch vụ thông tin mới như: dịch vụ tư vấn, dịch vụ theo chế độ hỏi đáp, dịch vụ bạn đọc đặc biệt, dịch vụ tra cứu thông tin qua mạng và số hóa tài liệu để nguồn thông tin cung cấp cho bạn đọc được thuận tiện hơn. Số hoá nguồn tài liệu -đây là công đoạn đòi hỏi đầu tư nhiều công sức, kinh phí: - Giúp việc lưu trữ, sử dụng, chia sẻ thông tin dễ dàng, nhanh chóng. - Linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau. - Giảm chi phí tối đa quản lý, không gian lưu trữ. - Tiết kiệm thời gian tìm kiếm, chia sẻ thông tin.
  32. - Có khả năng chỉnh sửa và tái sử dụng dữ liệu số. - Khỏi bị hủy hoại trong quá trình phục vụ. Việc số hóa tài liệu là hoạt động đòi hỏi rất nhiều công sức, trí tuệ và kinh nghiệm của cán bộ TT-TV. Có thể coi số hóa là phương thức cốt lõi để đảm bảo sự phát triển bền vững của nguồn tin điện tử trong cơ quan thông tin. Mặc dù nguồn tin điện tử của cơ quan phần lớn là các tài liệu ở sẵn dạng điện tử như: tạp chí điện tử, sách điện tử, bản tin điện tử, CSDL trực tuyến, Song những nguồn tin không phải ở dạng điện tử cần được số hóa mang lại lợi ích rõ nét: - Sự tiến bộ về truy cập: tạo ra khả năng đa truy cập, tức là nhiều người dùng tin từ nhiều nơi khác nhau có thể cùng truy cập và sử dụng tài liệu đó. - Bảo quản nguồn tin: các tài liệu được số hóa ít bị ảnh hưởng bởi mức độ sử dụng thường xuyên của số lượng lớn NDT, giúp cho bảo quản nguồn tin được dễ dàng, thuận tiện và kéo dài tuổi thọ của tài liệu. Vì lý do này mà số hóa được xem là phương thức hữu hiệu để bảo quản các nguồn tin quý hiếm, các tài liệu độc bản hay các tài liệu xám  Tiểu kết chương 1: Qua chương 1, Khoá luận đã trình bày sơ lược về lịch sử phát triển, chức năng nhiệm vụ, cơ cấu tổ chức, nguồn lực thông tin của CTTKH&CNQG. Đồng thời nghiên cứu và trình bày đặc điểm chính của người dùng tin và nhu cầu tin tại CTTKH&CNQG. Nêu bật lên tầm quan trọng của tài liệu số đối với công tác thông tin thư viện nói chung và đối với sự phát triển của nguồn tin KH&CN nói riêng tại CTTKH&CNQG, nêu rõ nội hàm những khái niệm cơ bản: tài liệu, tài liệu số, số hoá tài liệu, tài liệu điện tử nhằm làm rõ hơn cho giải quyết vấn đề ở chương 2.
  33. CHƢƠNG 2 THỰC TRẠNG CÔNG TÁC SỐ HÓA TÀI LIỆU TẠI CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA 2.1. Tài liệu số hóa tại Cục Thông tin Khoa học và Công nghệ Quốc gia. 2.1.1Đặc điểm nguồn tài liệu số hoá. Số hoá các tài liệu nội sinh, tài liệu tiếng Việt, nhất là những tài liệu có giá trị lâu dài, là xu hướng tất yếu trong hoạt động thông tin KH&CN ở nước ta. Nhận thức được tính tất yếu của xu hướng phát triển đó và giá trị to lớn của nguồn tài liệu hiện có, CTTKH&CNQG đã và đang tiến hành số hoá nguồn tài liệu nội sinh, tài liệu xám, tài liệu quý hiếm và xây dựng các cơ sở dữ liệu toàn văn phục vụ bạn đọc tốt nhất. KQNC là một trong các dạng tài liệu được xếp vào dạng “tài liệu xám”, loại tài liệu có giá trị khoa học rất cao và được sử dụng lâu dài. Mặt khác, báo cáo KQNC là một trong những tài liệu phản ánh rõ nét nhất các tính chất cơ bản của hoạt động nghiên cứu khoa học và phát triển công nghệ. Bằng việc số hoá KQNC, các tính chất này có điều kiện thuận lợi để phát huy, làm tăng hiệu quả sử dụng KQNC. Kho báo cáo kết quả các đề tài nghiên cứu KH&CN các cấp (cấp nhà nước, cấp bộ/ngành, cấp tỉnh/thành phố trực thuộc Trung ương, cấp cơ sở) với hơn 11.000 tập báo cáo là nguồn tài liệu quý và lớn nhất Việt Nam về kết quả nghiên cứu khoa học. CTTKH&CNQG đã và đang tiến hành số hoá các đầu sách thuộc nhiều lĩnh vực KH&CN khác nhau, phục vụ cho nhu cầu tin của từng nhóm NDT khác nhau. Các tài liệu được số hoá bao gồm nhiều loại tài liệu khác nhau: các tạp chí trong và ngoài nước về KH&CN, sách và tài liệu quý về KH&CN. Cục có nguồn tài liệu làm nguyên liệu đầu vào đủ lớn để phục vụ cho công tác tạo lập nguồn tài liệu số, gồm:
  34. Kho sách, tạp chí tiếng Việt và ngoại văn với khối lượng lớn; nguồn thông tin đa dạng và cập nhật được cung cấp từ các nhà khoa học và doanh nghiệp, ) Đến hết năm 2011, Cục đã thu thập và số hóa khoảng 6000 đề cương đề tài và báo cáo KQNC của các địa phương. Trên cơ sở số hóa sẽ xây dựng được sưu tập báo cáo KQNC được số hóa tại Cục Thông tin KH&CN Quốc gia, đảm bảo bảo quản lâu dài và phục vụ hiệu quả theo những quy định cụ thể. 2.1.2 Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Cục. CTTKH&CNQG là một trong những đơn vị có nguồn tài nguyên số về KH&CN lớn nhất cả nước, bên cạnh những nguồn tài nguyên số mua từ bên ngoài, Cục là cơ quan đứng đầu về nguồn tài nguyên số nội sinh. Nguồn tài nguyên số của Cục rất phong phú về nội dung và đa dạng về hình thức, có thể phân chia thành CSDL thư mục và CSDL toàn văn: 2.1.2.1 Cơ sở dữ liệu thư mục. Các CSDL thư mục là nguồn tài liệu số nội sinh lớn nhất hiện có của CTTKH&CNQG. Nguồn tài liệu này giúp cho NDT có thể tiếp cận tới nguồn tài nguyên truyền thống quý báu với hàng triệu bản mà Cục đang lưu giữ. Tính đến năm 2009, Cơ sở dữ liệu này gồm : - Sách ở Thư viện KHKT Trung ương 143.969 biểu ghi. - Tạp chí ở Thư viện KHKT Trung ương 6.938 biểu ghi. - Tài liệu KH&CN nước ngoài 345.323 biểu ghi. - Báo cáo kết quả nghiên cứu 9.851 biểu ghi. - Tài liệu KH&CN Việt Nam trước 2004: 73.259 biểu ghi - Đề tài đang tiến hành: 3.706 biểu ghi. - Mục lục liên hợp tạp chí: 3.808 biểu ghi. 2.1.2.2 Cơ sở dữ liệu toàn văn. CSDL toàn văn về khoa học công nghệ bao gồm: toàn văn các bài báo đăng tải trong các ấn phẩm khoa học công nghệ, kinh tế, văn hoá được công bố ở Việt Nam, các bản tin điện tử của Cục, toàn văn báo cáo các kết quả nghiên cứu.
  35. Các CSDL toàn văn của Cục được xây dựng hầu hết từ năm 2004 đến nay, bao gồm: - Tài liệu KH&CN Việt Nam STD (từ 2004 đến T10/2011 với khoảng 76.000 biểu ghi có tệp toàn văn đính kèm) - Thư viện điện tử KH&CN phục vụ nông thôn: 226.122 tài liệu toàn văn và đa phương tiện (tính đến cuối tháng 9/2011). Trong đó có 79.998 tài liệu thuộc lĩnh vực KH&CN với 1.045 phim khoa học, 3.039 tiêu chuẩn và 2.312 bài trích từ các tạp chí và kỷ yếu hội nghị, hội thảo. - Công nghệ chào bán: hơn 7.600 biểu ghi (2009) - Dịch vụ KH&CN: 856 biểu ghi (2009) - Báo cáo kết quả nghiên cứu: trên 10.000 biểu ghi (2010) - Văn bản pháp quy về KH&CN. - Giải pháp phần mềm (2288 biểu ghi) - Tiêu chuẩn Việt Nam. - Nhãn hiệu hàng hoá. - Các bản tin điện tử: Nông thôn đổi mới, Tri thức phát triển, Tổng luận về KH&CN, Khoa học Công nghệ, Môi trường và phát triển bền vững, - Thư viện phim KH&CN (hơn 256 phim được lưu giữ trên 145 đĩa CD-ROM) - Ngoài ra, Cục còn lưu giữ nhiều CSDL trước năm 2004 như : Khoa học Công nghệ Môi trường, VietNam Development News, Tạp chí Hoạt động Khoa học, Communication physics, Báo cáo Khoa học Công nghệ, - Với hàng triệu biểu ghi thuộc nhiều CSDL quý như : Book, STD, Kết quả nghiên cứu. Nguồn tài nguyên số nội sinh đã và đang là nguồn lực thông tin chủ yếu trong cơ cấu nguồn tin của Cục. 2.1.3 Dịch vụ số hoá tài liệu của Cục. Với hệ thống số hoá tài liệu hiện đại và công suất cao gồm 2 máy Kirtas 1600 và hệ thống thiết bị và phần mềm xử lý và lưu trữ dữ liệu số, CTTKH&CNQG cung cấp dịch vụ số hoá tài liệu cho các trường đại học, viện nghiên cứu, các trung tâm
  36. lưu trữ, thư viện có nhu cầu số hoá tài liệu ở quy mô công nghiệp. Với hệ thống và thiết bị số hóa Kirtas APT1600 và Kabis, tài liệu gốc được bảo đảm không phải tháo rời và công suất số hoá đạt đến 1.600 trang/giờ. Sản phẩm số hoá có thể ở nhiều khổ mẫu dữ liệu theo lựa chọn như: dạng PDF, ảnh GPEG, dạng TIFF, 2.2 . Nguồn nhân lực số hoá tài liệu. 2.2.1 Số lượng nguồn nhân lực. Hiện nay CTTKH&CNQG công tác số hoá nguồn tài liệu do phòng số hoá thực hiện (tầng 4), số lượng cán bộ tiến hành công tác số hoá là 2 cán bộ chính thức. Các cán bộ số hoá của Cục làm việc với tinh thần trách nhiệm cao. Tuy nhiên khối lượng công việc số hoá nhiều, Cục đã điều chuyển một số cán bộ khác đến làm việc tại phòng số hoá. Hiện nay, số lượng cán bộ làm việc trong phòng số hoá là 11 cán bộ. 2.2.2 Chất lượng nguồn nhân lực. Hiện nay, Cục có đội ngũ cán bộ số hoá có trình độ và được đào tạo đầy đủ các kỹ năng nghiệp vụ cho nhiệm vụ phát triển nguồn tài nguyên số với số lượng lớn. Tuy nhiên, khi khối lượng công việc quá tải, Cục đã bổ sung thêm cán bộ để đảm bảo hiệu quả trong công tác số hoá tài liệu. Trình độ của 2 cán bộ chính thức trong phòng số hoá là bậc đại học. Người cán bộ thư viện được xem như là người tổ chức và chuyên gia thông tin, môi trường làm việc của họ là môi trường “số”. Nhiệm vụ của một cán bộ thư viện số được xem xét với các góc độ sau: - Thu thập tư liệu: Lựa chọn, bổ sung, xử lý, bảo quản, tổ chức phục vụ các bộ sưu tập số. - Thiết kế cấu trúc kỹ thuật cho thư viện số. - Biên mục: Mô tả nội dung tài liệu số (siêu dữ liệu); - Xây dựng kế hoạch, hỗ trợ các dịch vụ số (định hướng thông tin, tư vấn chuyển giao ).
  37. - Tạo lập các giao diện thân thiện với người sử dụng trong hệ thống mạng. - Xây dựng các chính sánh, tiêu chuẩn liên quan đến thư viện. - Thiết kế, duy trì và chuyển giao các sản phẩm thông tin chất lượng cao với giá trị gia tăng. - Bảo vệ quyền sở hữu trí tuệ đối với thông tin số trong môi trường mạng. - Bảo đảm an ninh thông tin. - Hình thức, phương thức phục vụ. Có kiến thức tổng hợp: để đáp ứng được yêu cầu của thư viện số, người cán bộ thông tin- thư viện cần có những kiến thức cơ bản về các ngành khoa học thư viện, khoa học thông tin, công nghệ thông tin, ngoại ngữ và một số chuyên ngành cụ thể khác. Nội dung Cán bộ TV truyền thống Cán bộ TV số Vai trò trong xã hội Thu thập tư liệu, Phổ biến Chuyên gia thông tin, Định tư liệu hướng thông tin Môi trường làm việc Thư viện truyền thống Thư viện số Hệ thống kiến thức Đơn lẻ Tổng hợp Nhóm độc giả Cố định Bất cứ người dùng kết nối mạng máy tính Cơ sở dịch vụ Bên trong toàn nhà thư Trên hệ mạng máy tính viện Nội dung công việc Đơn điệu Đa dạng, phong phú Cách thức phục vụ Bị động Chủ động Đối tượng làm việc Tài liệu in Các bộ sưu tập số
  38. Nội dung công việc Gửi giao tài liệu Định hướng thông tin, tư vấn và chuyển giao công nghệ hiện đại Trình độ làm việc Thấp (Ngoại ngữ và Cao, chuyên nghiệp. CNTT) Sự khác nhau giữa cán bộ thư viện số và cán bộ thư viện truyền thống Cán bộ làm công tác số hóa tài liệu có kiến thức chuyên môn cao, biết vận hành hệ thống máy móc, ứng dụng công nghệ thông tin, trang thiết bị hiện đại và có các kỹ năng thao tác xử lý thông tin, với trình độ đại học trở lên 2.3 . Hạ tầng cơ sở vật chất và thiết bị. Việc lựa chọn công nghệ để tiến hành thực hiện số hóa tài liệu rất quan trọng, bởi vì nó là công cụ đắc lực giúp ta thực hiện các công việc trong quy trình tạo lập và vận hành của bộ sưu tập số. Do đó công nghệ để thực hiện phải đáp ứng các yêu cầu: Là công cụ và môi trường để đảm bảo các tài liệu số hóa sau khi được tạo lập sẽ dễ dàng, thuận tiện cho người dùng tiếp cận. Có đủ độ tin cậy cho người quản trị và kỹ thuật viên trong quá trình tạo lập, bảo quản và cung cấp dữ liệu sau khi đưa bộ sưu tập vào hoạt động. Đáp ứng đầy đủ các yêu cầu về chuẩn nghiệp vụ thông tin - thư viện. Đáp ứng yêu cầu phân quyền truy cập đến tài liệu theo từng tài liệu và từng nhóm đối tượng người dùng (rất quan trọng đảm bảo tuân thủ Luật bản quyền của tài liệu). Dễ dàng trao đổi dữ liệu với các chuẩn khác, có công cụ sao lưu an toàn và xuất, nhập dữ liệu. Dựa theo các yêu cầu trên, để bộ sưu tập số phát huy được hết tác dụng, Thư viện khi thực hiện tạo lập bộ sưu tập số cần có cơ sở hạ tầng sau: + Phải có hệ thống mạng Intranet được kết nối Internet với tốc độ đường truyền đủ mạnh đáp ứng cho số người dùng tối thiểu của thư viện (hiện nay hầu hết các trường đã xây dựng mạng LAN của thư viện với tính năng là một nhánh của hệ
  39. thống Intranet nhà trường, điều này sẽ rất hạn chế khi thư viện muốn đưa bộ sưu tập lên Internet). + Hệ thống máy chủ đủ mạnh để đáp ứng việc lưu trữ, bảo quản, cung cấp dữ liệu và quản lý người dùng và các phần mềm hệ thống có bản quyền. + Trang Web đăng tải và là cổng truy cập của người dùng vào bộ sưu tập (phát huy hiệu quả nên xây dựng cổng thông tin điện tử để thực hiện các giao dịch và hỗ trợ trực tuyến với người dùng). + Phần mềm quản lý tài liệu số: Hiện nay có nhiều phần mềm (phần mềm nguồn mở Greenstone và một số phần mềm thương mại do các công ty và cá nhân xây dựng). Phần mềm quản lý tài liệu số phải đáp ứng các yêu cầu: Quản lý đa dạng các đối tượng số khác nhau (Text, hình ảnh, âm thanh, Video, GIS ). Hỗ trợ đa ngôn ngữ. Có tính năng Upload tài liệu từ máy trạm hoặc từ máy chủ. Có khả năng phân quyền truy cập theo mức độ mật của tài liệu hoăc theo đặc thù của từng nhóm đối tượng người dùng (cán bộ quản lý, giáo sư, giảng viên, sinh viên tuỳ theo chính sách của từng thư viện). Đối với những tài liệu không thu phí sử dụng, phần mềm cần có công cụ phân quyền hạn chế: Chỉ được mở xem, không sao chép để hạn chế việc sao chép bất hợp pháp ( chưa có trong các phần mềm nguồn mở). Đối với những tài liệu có thu phí sử dụng, phần mềm cần có công cụ giao dịch trực tuyến để người dùng có đăng ký tự Download hoặc đăng nhập nhận tài liệu qua E-mail. Giao diện tra cứu OPAC đồng nhất cho tất cả các bộ sưu tập. Có khả năng hỗ trợ tra tìm, lướt tìm theo các điểm truy cập cơ bản như tác giả, nhan đề, chủ đề, từ khoá, nơi lưu giữ, kích thước tài liệu Đặc biệt, OPAC cần hỗ trợ công cụ trình duyệt theo chủ đề, tác giả và nhan đề theo từng bộ sưu tập. Đây là công cụ rất hữu ích và tiện dụng cho người sử dụng, kể cả những người chưa có kỹ năng tìm tin.
  40. 2.3.1 Hạ tầng cơ sở thông tin và thiết bị số hoá. Hiện nay, để triển khai công tác số hóa tài liệu, Cục đã xây dựng được dây truyền số hóa hiện đại với hệ thống và thiết bị số hóa Kirtas dựa trên công nghệ hiện đại. Giai đoạn này được đặc trưng với việc hình thành bộ phận chuyên trách số hóa tài liệu của Cục trên cơ sở hệ thống thiết bị số hóa của hãng KIRTAS. Hiện nay, Cục được trang bị hai máy số hóa chuyên nghiệp: Kirtas APT1600 và Kabis.  Về hệ thống số hóa KIRTAS: Đây là những thiết bị được thiết kế phù hợp với những đòi hỏi về số hóa tài liệu đóng tập. Về cơ bản, hệ thống vận hành và công suất thiết bị của hãng Kirtas APT1600 và Kabis không khác nhau nhiều. Toàn bộ hệ thống số hóa của hãng Kirtas đều sử dụng máy ảnh kỹ thuật số chất lượng cao, khác với công nghệ máy quét phẳng truyền thống để sao chụp hình ảnh. Thông số kỹ thuật của Kirtas APT1600 và Kabis như sau: - Tốc độ quét: 1600 trang/giờ. - Hình ảnh: màu/đen trắng. - Định dạng đầu ra: TIFF, JPEG, RAW, - Sao chụp: Máy ảnh kỹ thuật số 16.7 triệu điểm ảnh, độ sâu 24 bit RGB, 4.992 x 3.228 điểm ảnh. - Độ phân giải ảnh 300 ppi có thể tăng lên đến 600 ppi. - Kích cỡ trang giấy : 11,4cm x 17,8cm x 35,5cm. - Độ dày trang giấy: 20g/m2 đến 30g/m2 - Độ dày đóng tập: 10,16cm - Kích cỡ máy ( Rộng x Dài x Cao): 84cm x 72cm x 122cm. - Tính chính xác: Bộ cảm biến Page Edge Sensor. - Thiết bị chia tách trang Page Seperato. - Trọng lượng: 73kg. - Nguồn điện: 110 – 240VAC, 50/60 Hz, 15 A. - Trạm xử lý: Máy chủ: Kirtas Image Server.
  41. Ngoài ra, hệ thống số hóa Kirtas còn tích hợp phần mềm BookScan Editor cho phép căn chỉnh trang tự động theo khối dữ liệu với năng suất cao và phần mềm nhận dạng ký tự quang học (OCR) cho 189 ngôn ngữ. 2.3.2 Phần mềm quản lý tài liệu số. CTTKH&CNQG là một trong những cơ quan đi đầu trong quá trình ứng dụng công nghệ thông tin. Việc ứng dụng các phần mềm quản lý tài liệu được triển khai từ khá sớm (từ đầu thập niên 80). Cùng với quá trình phát triển của công nghệ thông tin, Cục đã không ngừng đẩy nhanh quá trình áp dụng các phần mềm vào hoạt động. Hiện tại, Cục đang sử dụng đồng thời nhiều phần mềm để quản lý nguồn tài nguyên số. Dưới đây là một số phần mềm đã và đang sử dụng:  CDS/ISIS for DOS và WIN/ISIS. Phần mềm đầu tiên được áp dụng tại Cục là CDS/ISIS for DOS. Đây là phần mềm tư liệu dùng để quản lý các CSDL dạng văn bản có cấu trúc do UNESCO phát triển và phổ biến từ năm 1985 và được cung cấp miễn phí cho các thư viện Việt Nam. Đây cũng là phần mềm đầu tiên dùng phổ biến ở thư viện Việt Nam để quản lý thư viện truyền thống. CDS/ISIS có đặc trưng sau: - Sử dụng giao diện DOS để xây dựng CSDL. - Sử dụng dạng biên mục máy đọc được CFF (Common Communication Fomat) Hiện nay, WIN/ISIS đã phát triển đến phiên bản 1.5 nhưng do nhu cầu trong quản lý dữ liệu và thư viện tại Cục ngày càng cao, phần mềm WIN/ISIS không thể đáp ứng được nên Cục đã triển khai thêm các phần mềm khác. Phần mềm WIN/ISIS chỉ được sử dụng để xây dựng và quản lý một số CSDL như: Kết quả nghiên cứu, đề tài đang tiến hành và mục lục liên hợp. Các CSDL này sau khi được xây dựng trên WIN/ISIS sẽ được chuyển sang WEB/ISIS để phục vụ truy cập trực tuyến thông qua mạng VISTA.  Phần mềm Zope.
  42. Zope (Z Object Publishinh Environmen) là một tập hợp các phần mềm mã nguồn mở, do công ty Zope Corporation và một cộng đồng lớn các nhà phát triển phần mềm xây dựng. Zope được viết bằng ngôn ngữ Python, phiên bản đầu tiên của Zope là vào năm 1998. Zope cung cấp các dịch vụ nền tảng trên Web.  Phần mềm Libol. Libol (Library Online) là phần mềm quản trị thư viện tích hợp được công ty TINH VÂN phát triển từ 1998. Phiên bản Libol 5.5 đã được CTTKH&CNQG áp dụng vào quản lý các hoạt động thư viện từ 2004 đến nay. Mặc dù không được sử dụng để xây dựng và quản lý CSDL toàn văn nhưng Libol là phần mềm đóng vai trò quan trọng trong việc tạo ra nguồn tài liệu thư mục tại Cục. Hiện nay, bên cạnh các chức năng thống kê, quản lý bạn đọc, phần mềm này là công cụ chủ yếu để xây dựng, quản lý, khai thác CSDL Sách và Tạp chí. Libol 5.5 có khả năng hỗ trợ nghiệp vụ quản lý nội dung với nhiều tính năng nổi bật như chuẩn biên mục MARC 21, AACR_2 giúp nhập và xuất thông tin dễ dàng, có tính bảo mật cao, nhập liệu, tìm kiếm và hiển thị đa ngữ.  Phần mềm GreenStone. GreenStone là phần mềm nguồn mở thư viện số nổi tiếng và phổ biến nhất hiện nay được dùng để thu gom và biên mục tài liệu theo Dublin Core, đồng thời tổ chức thành bộ sưu tập và xuất ra đĩa CD hay để khai thác trực tuyến qua Internet. Greenstone được lưu hành với giấy phép GPL được dùng rộng rãi khắp nơi trên thế giới. Ở Việt Nam, nhiều trung tâm TT-TV và thư viện chuyên ngành đã sử dụng phần mềm Greenstone để xây dựng bộ sưu tập số. GreenStone được áp dụng vào hoạt động của CTTKH&CNQG từ khá sớm (2004). Hiện nay, GreenStone được sử dụng để quản lý và khai thác trực tuyến thư viện điện tử các tài liệu toàn văn về kỹ thuật nông nghiệp. GreenStone có tính năng: Xây dựng các bộ sưu tập tài liệu điện tử từ Internet và các CSDL trực tuyến dạng đa phương tiện, sưu tập âm thanh, hình ảnh, tranh ảnh, hình ảnh động, hoạt hình, đồ hình, toàn văn, Xây dựng các bộ sưu tập về các chuyên ngành, bằng cách số hoá
  43. các tài liệu hiện có ở thư viện: Sách, tạp chí, báo cáo khoa học, đề tài nghiên cứu khoa học, với bộ sưu tập toàn văn. 2.4 . Tiến trình và quy trình thực hiện công tác số hoá tài liệu. 2.4.1 Tiến trình thực hiện công tác số hoá tài liệu tại Cục. Công tác số hóa tài liệu KH&CN ở Cục Thông tin KH&CN Quốc gia có thể được chia thành hai thời kỳ: - Thời kỳ 2004- 2009: Số hóa phân tán, sử dụng máy quét thông thường (Scanner) - Thời kỳ 2010- đến nay: Số hóa tập trung, sử dụng hệ thống số hóa KIRTAS.  Hoạt động số hóa tài liệu thời kỳ 2004- 2009. Trong giai đoạn này, công tác số hóa tài liệu thực hiện theo cách phân tán, được giao trực tiếp cho những đơn vị chịu trách nhiệm xây dựng CSDL toàn văn. Bộ phận đăng ký KQNC và là nơi lưu giữ các báo cáo KQNC về KH&CN, chịu trách nhiệm số hóa các bài báo cáo KQNC do mình lưu giữ. Phòng CSDL nay là Trung Tâm xử lý và Phân tích thông tin, chịu trách nhiệm số hóa các bài báo KH&CN do Phòng chọn xử lý đưa vào CSDL STD. Thiết bị số hóa là máy quét văn phòng, chủ yếu là máy quét của HP. Mặc dù có sự khác nhau nhất định về đối tượng cần số hóa (bài báo hoặc cả quyển báo cáo KQNC) nhưng những vấn đề lựa chọn khổ mẫu tài liệu số là cơ bản như nhau.  Lựa chọn khổ mẫu dữ liệu số và phần mềm số hóa. Trên cơ sở những tìm hiểu về khổ mẫu dữ liệu trong lưu trữ và trao đổi thông tin, CTTKH&CNQG đã đề xuất lựa chọn khổ mẫu dữ liệu số PDF (Portable Document Format). Khổ mẫu dữ liệu PDF do hãng Adobe phát triển và sử dụng cùng với chương trình quét Adobe Acrobat. Phần mềm đọc tài liệu theo khổ mẫu PDF là Acrobat Reader là miễn phí, có sẵn trên hầu hết tất cả các máy tính.  Yêu cầu kỹ thuật đối với tệp số hóa.
  44. Để đảm bảo chất lượng tài liệu số hóa, đồng thời duy trì kích thước tệp tin hợp lý, Cục đã quy định: - Mật độ điểm ảnh tối đa 300 dpi và tối thiểu 200 dpi - Mỗi tài liệu trên giấy sẽ tương ứng với một tệp tin. Như vậy với CSDL STD, đối tượng cần số hóa là các tập báo cáo KQNC. Trên thực tế các tài liệu này có độ lớn khác nhau, có thể từ một vài chục trang đến vài trăm trang. Do báo cáo KQNC khá dày nên khi quét phải tháo bìa để có thể quét từng trang.  Xử lý tệp tin sau khi quét. Tệp tin sau khi quét được xử lý lại bằng phần mềm Adobe Acrobat. Các thao tác gồm: - Kiểm tra số trang. - Cắt riềm (Cropping) - Làm BOOKMARK. - Đặt lại tên tệp.  Hoạt động số hóa tài liệu từ 2010 – nay ( sử dụng hệ thống KIRTAS). Hiện nay triển khai công tác số hóa tài liệu, Cục đã xây dựng dây truyền số hóa hiện đại với hệ thống và thiết bị số hóa Kirtas dựa trên công nghệ hiện đại. Giai đoạn này được đặc trưng với việc hình thành bộ phận chuyên trách số hóa tài liệu của Cục trên cơ sở hệ thống thiết bị số hóa của hãng KIRTAS. Hiện nay, Cục được trang bị hai máy số hóa chuyên nghiệp: Kirtas APT1600 và Kabis. 2.4.2 Quy trình thực hiện công tác số hoá tài liệu. Số hóa tài liệu không đơn giản chỉ là việc trang bị các thiết bị phần cứng như máy quét (scanner), máy ảnh kỹ thuật số (camera), các loại thiết bị lưu trữ mà số hóa bao gồm những công đoạn phức tạp của quá trình tạo ra những bộ sưu tập tài liệu số nhằm bảo quản, tạo lập nguồn dữ liệu số cho thư viện số hóa, có thể chia sẻ trong mạng nội bộ hay phục vụ trực tuyến. Số hóa tài liệu là một quy trình đòi hỏi nhiều thời gian, do đó cần chuẩn bị một
  45. kế hoạch cụ thể. Trước khi tiến hành một dự án số hóa thư viện cần quan tâm tới những vấn đề sau: Hãy đặt nhiều / hoặc rất nhiều câu hỏi trước khi số hoá. Hãy xác định nguồn tài chính, nhân lực, thiết bị, sự hiểu biết về công nghệ số hóa. Thành lập Ban quản lý dự án. Lựa chọn bộ sưu tập hoặc loại tài liệu cần số hóa. Tiến hành số hóa tài liệu. Xử lý dữ liệu số. Tạo siêu dữ liệu (biên mục). Sao lưu, đánh dấu và chỉ mục. Kiểm soát chất lượng (ảnh/text, biểu ghi thư mục và liên kết tệp). Đưa chúng lên website (Internet). Kiểm soát lại chất lượng: Các đường liên kết, yếu tố biên mục Dưới đây là quy trình số hóa nguồn tài liệu: * Khuôn khổ pháp lý. Để hoàn thành chức năng và nhiệm vụ quy định trong Luật khoa học và công nghệ, nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính Phủ về hoạt động thông tin KH&CN và quyết định số 11/2004/QĐ-BKHCN quy định điều lệ về tổ chức và hoạt động của CTTKH&CNQG, CTTKH&CNQG cần đẩy nhanh quá trình hiện đại hoá công tác lưu giữ phát triển và phổ biến nguồn tin KH&CN. Nguồn tài liệu số đóng vai trò quan trọng, quyết định đến hiệu quả toàn bộ nguồn tin trong nước tại Cục. Do vậy, vấn đề xây dựng và phát triển nguồn tài liệu số tại Cục đang rất được quan tâm đẩy mạnh.  Vấn đề bản quyền. Đây là mối quan tâm hàng đầu trong tiến trình thực hiện số hóa tài liệu. Một trong những vấn đề liên quan tới xu hướng số hóa sách đối với hầu hết các nhà xuất
  46. bản là họ không biết đích xác thật sự mình đang sở hữu cái gì. Thật khó xác định tác quyền của một của một quyển sách không còn được xuất bản. Bản quyền cực kỳ quan trọng trong việc lựa chọn tài liệu, tài liệu sau khi số hóa sẽ được đưa lên Internet. Vấn đề bản quyền đối với tài liệu trong thư viện số chia làm 2 loại: - Các tài liệu hết luật bản quyền : Theo luật sở hữu trí tuệ Việt Nam 2005: điều 27, khoản (a), (b)” tác phẩm không thuộc loại hình quy định tại điểm a khoản này có thời hạn bảo hộ là suốt cuộc đời tác giả và 50 năm tiếp theo năm tác giả chết; Trong trường hợp tác phẩm có đồng tác giả thì thời hạn bảo hộ chấm dứt vào năm thứ 50 sau năm đồng tác giả cuối cùng chết “. - Đối với tài liệu còn luật bản quyền: Theo luật sở hữu trí tuệ việt nam 2005: Các trường hợp sử dụng tác phẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao cụ thể: 1.Tự sao chép một bản nhằm mục đích nghiên cứu khoa học, giảng dạy cá nhân; 2.Sao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu. Như vậy, việc số hóa tài liệu cho thư viện là không vi phạm bản quyền nếu: - Tài liệu nằm ngoài bản quyền: Tài liệu xuất bản bởi chính phủ như: văn bản pháp quy, số liệu thống kê, tài liệu thuộc lĩnh vực tư pháp (theo luật sở hữu trí tuệ Việt Nam; chương 1, mục 1, điều 15: Các đối tượng không thuộc phạm vi bảo hộ quyền tác giả. Tin tức thời sự thuần túy đưa tin; văn bản quy phạm pháp luật, văn bản hành chính, văn bản khác thuộc lĩnh vực tư pháp và bản dịch chính thức của văn bản đó; quy trình hệ thống, phương pháp hoạt động, khái niệm, nguyên lý, số liệu. - Tài liệu được bảo hộ bản quyền nhưng số hóa để sử dụng với mục đích phi thương mại trong phạm vi hạn chế của thư viện, trường học, viện nghiên cứu. bản thân việc số hóa tài liệu không vi phạm bản quyền, việc vi phạm hay không phụ thuộc vào mục đích sử dụng (chẳng hạn dùng với mục đích thương mại làm ảnh
  47. hưởng đến lợi ích kinh tế của người nắm giữ bản quyền là vi phạm) và phạm vi sử dụng (như phổ biến rộng rãi ra công chúng ngoài phạm vi thư viện là vi phạm). * Nghiên cứu các yếu tố liên quan. Trước khi xây dựng dự án số hóa cần cân nhắc những vấn đề sau đây: Tại sao cần số hóa tài liệu/để làm gì? Đối tượng phục vụ là ai? Số lượng tài liệu cần số hóa? Ai sở hữu tài liệu đó? Bản quyền tài liệu thuộc về ai? Thời gian thực hiện dự án? Ngân sách ở đâu (để tạo lập và duy trì)? Ai, cấp nào chịu trách nhiệm giải quyết khó khăn của dự án (nếu có)? Số hóa tài liệu như thế nào? Định dạng sản phẩm là gì? (ảnh/văn bản) Mô tả tài liệu như thế nào/dùng chuẩn biên mục gì? Quy định các chính sách truy cập tài liệu số? (ai/mức độ truy cập, miễn phí hay có thu phí ) Bảo quản và duy trì phục vụ như thế nào? Lưu ý cần phải xây dựng một khung thời gian thích hợp cho dự án số hóa. Quy trình số hóa cần đến thời gian cho quản lý, báo cáo, quản lý nhân sự, thao tác và tổ chức file dữ liệu, sao lưu, kiểm soát chất lượng và xây dựng giao diện người dùng tin một cách thích hợp (trẻ em, người lớn tuổi, tàn tật ). Tính toán thời gian làm một công việc hết bao nhiêu thời gian – trong thực tế nó mất nhiều thời gian hơn. * Sưu tập tài liệu. Việc lựa chọn tài liệu để số hoá là khâu quan trọng và là khâu quyết định nội dung tài liệu được mang số hoá. Công tác số hoá tài liệu tốn kém khá nhiều thời gian và công sức nên việc lựa chọn tài liệu rất cần quan tâm.
  48. Cần cân nhắc kỹ trước khi lựa chọn tài liệu cần số hóa, phụ thuộc vào chính sách của cơ quan cấp cho hoạt động số hoá tài liệu. Cần xác định rõ số vốn tài liệu cụ thể cần được số hóa, xây dựng các đối tượng số và các cơ sở dữ liệu hỗ trợ. Tiến hành lựa chọn tài liệu để số hóa có phục vụ được đông đảo người dùng tin và có phù hợp với mục tiêu đề ra không? đồng thời nhìn nhận được tầm quan trọng lâu dài của nguồn tài liệu. - Theo tiêu chí nhóm người dùng tin mà cơ quan cần xác định mức độ ưu tiên phục vụ như: + Cán bộ lãnh đạo. + Giảng viên, cán bộ nghiên cứu. + Cán bộ kỹ thuật, sản xuất. Kinh doanh. + Nghiên cứu sinh, học viên cao học, sinh viên. + Các đối tượng khác. - Theo tiêu chí nội dung tài liệu: Trên cơ sở xác định nhóm người dùng mục tiêu mà Thư viện lựa chọn các chủ đề theo nội dung tài liệu phục vụ; tài liệu phục vụ phát triển nông thôn miền núi; tài liệu khoa học kỹ thuật theo từng chuyên ngành, tài liệu có tần suất sử dụng cao - Theo tiêu chí điều kiện bảo quản hiện tại: Tình hình cụ thể của từng Thư viện trong tình trạng điều kiện bảo quản kết hợp với nội dung tài liệu mà quyết định lựa chọn tài liệu đưa vào. Ví dụ: ưu tiên cho các tài liệu in trên giấy ròn, dễ rách, có hóa chất bảo quản. - Theo tiêu chí các loại tài liệu đặc biệt: Tài liệu độc bản, tài liệu quý hiếm, thời gian xuất bản đã lâu (Luận án tiến sỹ, tài liệu cổ, tài liệu cẩm nang chuyên ngành; tài liệu độc bản; viết tay ) * Phân loại tài liệu và bảo quản tài liệu. Tất cả các tài liệu được sưu tập trước khi số hóa phải trải qua giai đoạn phân loại loại hình tài liệu ( sách, báo, tạp chí, tài liệu chép tay, bản thảo, tranh ảnh, tài
  49. liệu nghe nhìn hoặc điện tử, ngôn ngữ tài liệu ) và hiệu chỉnh về mặt vật lý (lau bụi, tháo bìa, tháo rời tài liệu, kiểm tra số trang, hiệu chỉnh kích cỡ). Đây là khâu quan trọng góp phần trong việc lực chọn thiết bị và kỹ thuật quét tài liệu phù hợp để có sản phẩm số hóa đạt chất lượng cao: Văn bản, âm thanh rõ ràng, hình ảnh, đầy đủ, sắc nét đúng như tài liệu gốc của nó. 2.4.2.1 Thực hiện số hoá tài liệu. Hệ thống hệ thống số hóa của hãng Kirtas sử dụng công nghệ lật trang tự động SureTurn giúp giảm bớt thao tác lật bằng tay. Với cánh tay robot được điều khiển bằng máy tính sử dụng một hệ thống hút chân không (hệ thống page luffers) cho phép nhẹ nhàng lật chỉ một trang duy nhất tại một thời điểm. Cùng thời điểm đó, cuốn sách nhờ bộ phận nâng sách được thiết kế theo công nghệ SmartCradle được nhẹ nhàng nâng lên, tự động dịch chuyển để bù vào việc giảm số lượng trang sách bên phải khu chúng được lật giở và sao chụp. Công nghệ SmartCradle giữ sách mở một góc đúng bằng 110 độ trong suốt quá trình vận hành, tạo ra môi trường áp suất thấp để xử lý những sách quý hiếm và dễ hỏng rách. Để đảm bảo việc chỉ lật duy nhất một trang, thiết bị số hoá được thiết kế với bộ cảm biến (Page Edge Sensor) và thiết bị chia tách trang (Page Separator). Thiết bị Page Separator giúp chia tách trang khi bộ cảm biến giám sát việc vận hành máy với độ chính xác cao và điều chỉnh đầu trang sách khi cần. Đồng thời, nó liên tục kiểm tra nhằm đảm bảo cánh tay Robot chỉ lật một trang duy nhất tại một thời điểm, và kiểm soát từ xa khi có trang bị bỏ sót. Khi đó, bộ cảm biến sẽ tạm ngừng vận hành máy để con người thực hiện thao tác điều chỉnh. Kirtas APT1600 và Kabis có thể sao chụp tới 1600 trang/giờ. * Khổ mẫu dữ liệu và phần mềm xử lý. Khác với việc quét bằng máy quét văn phòng, định dạng dữ liệu số mà hệ thống kirtas tạo ra gồm 2 loại: - Dữ liệu gốc: Dạng tệp ảnh (TIFF, JPEG, RAW, ): do máy ảnh số tạo ra, mỗi trang được quét tương ứng với một ảnh.
  50. - Dữ liệu đầu ra: Do phần mềm BookScan Editor xử lý các tệp ảnh gốc và tạo ra sau khi xử lý. Toàn bộ dữ liệu gốc được lưu trên máy chủ KIRTAS Image Server và được xử lý bằng phần mềm BookScan Editor. Có thể nói, hệ thống số hoá Kirtas thực sự lý tưởng cho những ấn phẩm đạt tiêu chuẩn thông thường. Đối với một số tài liệu in trên giấy quá mỏng như giấy Pơluya thì việc số hoá sẽ được tiến hành thông qua chức năng chụp bằng tay cho từng trang và việc căn chỉnh sau đó sẽ được thực hiện như thông thường bằng phần mềm BookScan Editor. Hệ thống số hoá này cho phép phục hồi phần nào những tài liệu sử dụng giấy quá mỏng hay quá ngả màu theo thời gian. CTTKH&CNQG tiếp tục chọn dữ liệu đầu ra cuối cùng là định dạng PDF. * Xử lý tệp tin đầu ra cuối cùng. - Đối với báo cáo KQNC, đầu ra cuối cùng là một tệp tin cho một báo cáo. Tệp tin này được sao và chuyển về bộ phận quản lý kho báo cáo số hóa. Đơn vị này có trách nhiệm thực hiện các bước xử lý tiếp theo, gồm: + Làm Bookmark. + Đặt/đổi tên tệp cho phù hợp. - Đối với CSDL STD: đối tượng liên kết trong CSDL là từng bài, trong khi đầu ra của số hóa tập trung là cả một số tạp chí (như một đơn vị số hoá) nên cần có bước xử lý tiếp theo bao gồm: + Chọn bài tạp chí cần phải số hóa. + Tách tệp tin của một số tạp chí thành các tệp tin của từng bài tạp chí. + Đặt tên tệp tin cho từng bài. 2.4.2.2 Xử lý tài liệu đã số hoá. * Đặt tên tệp. Một số nguyên tắc được đề ra khi đặt tên tệp tin là làm sao dễ xác định được tài liệu gốc của tệp tin số hoá, dễ nhận biết, dễ tìm lại khi cần. Trên cơ sở nguyên tắc đó, Cục đã đề xuất cách đặt tên tệp tin số hoá:
  51. + Đối với báo cáo kết quả nghiên cứu: Tệp tin sẽ trùng với số đăng ký cá biệt (kí hiệu kho) của báo cáo gốc. Phần mở rộng là PDF. Ví dụ: 3000.pdf; 3001.pdf Trong đó: 3000 và 3001 là số đăng ký cá biệt/kí hiệu kho của báo cáo. Nếu một đề tài có nhiều tập báo cáo (chuyên đề, báo cáo đề tài nhánh, ) được giao nộp, thì số đăng kí cá biệt của báo cáo đi kèm sẽ có thêm một hậu tố. Ví dụ: 3000-1; 3001-2. Phần đầu của tên tệp trước khi phần mở rộng (pdf) của báo cáo đi kèm vẫn sẽ được đặt đúng như của số đăng kí cá biệt: 3000-1.pdf; 3001-2.pdf, Đối với báo cáo KQNC do các Sở KH&CN cấp đăng kí và lưu giữ và chuyển CTTKH&CNQG số hoá theo nhiệm vụ xây dựng hệ thống thông tin nghiên cứu và phát triển, để đảm bảo không bị trùng lặp, tên tệp tin được quy định gồm những yếu tố sau như sau: Mã tỉnh- KQ + 4 số năm hoàn thành báo cáo -5 chữ của số thứ tự. Trong đó Mã tỉnh là 3 mã ký tự tên tỉnh theo tiêu chuẩn TCVN 7587-2007. Ví dụ: Tên tệp tin của báo cáo KQNC lưu giữ tại Sở KH&CN Hà Nội, báo cáo viết năm 2005, số thứ tự là 3, tên tệp tin sẽ là: HNI-KQ2005-00003.pdf Trong đó: HNI: Mã địa phương cho Hà Nội. KQ: Tệp tin về kết quả nghiên cứu. 2005: Năm 2005. 00003: Báo cáo có số thứ tự 3. Ví dụ: tên tệp tin của báo cáo KQNC của Tp Hồ Chí Minh, năm viết báo cáo 2010, số thứ tự là 201. HCM-KQ2010-00201.pdf
  52. + Đối với bài báo: Tên tệp được quy định gồm những phần sau: - Kí hiệu kho của tạp chí. - Năm của quyển tạp chí có chứa bài báo. Chữ S và số hoặc tập của số tạp chí có chứa bài ( Nếu số tập không đủ 2 chữ số thì thêm số 0 để thành 2 chữ số. Ví dụ, số 1 thành số 01, số 2 thành 02, ) Số trang đầu tiên của bài báo trong số tạp chí chứa bài đó. Nếu số của trang đầu tiên không đủ 3 chữ số thì thêm số 0 cho đủ. VD: 001, 002, Ví dụ, bài báo: Thành lập Cục Thông tin Khoa học và Công nghệ Quốc gia, cột mốc mới của sự phát triển/Cao Minh Kiểm//TC Thông tin và Tư liệu, số 1/2010.-tr. 2-10. (Tạp chí có kí hiệu kho Cvt 43). Khi số hoá có tên tệp được đặt như sau: Cvt43s012010002.pdf Trong đó: Cvt43: kí hiệu kho của tạp chí. S01: Số tạp chi (01) 2010: Năm xuất bản (2010) 002: Trang bắt đầu (trang 2) Với cách đặt tên như vậy, chúng ta có thể nhanh chóng xác định được tên tệp tin số hoá là của bài báo nằm trong tạp chí nào, năm nào, số nào, bắt đầu từ trang nào. * Nhận dạng quang học (mã hóa văn bản) OCR là gì? Văn bản, sách hoặc những tài liệu in ấn khác có thể chuyển dạng sang dạng văn bản, nó là một phần của quy trình số hóa. Đó là công nghệ OCR (Optical Character Recognition - nhận dạng ký tự quang học).
  53. Công nghệ nhận dạng chữ in OCR là công nghệ cho phép chuyển đổi tài liệu dạng ảnh (các ảnh đầu ra của máy quét, máy ảnh, file PDF dạng ảnh ) thành tài liệu có thể biên tập được (file text, file Word ). * Biên mục (Tạo siêu dữ liệu): Dùng chuẩn Dublin Core để biên mục tài liệu số hoặc có thể dùng chuẩn MARC. Hiện tại CTTKH&CNQG đang dùng chuẩn MARC để biên mục cho dữ liệu số. Metadata (Siêu dữ liệu) dùng để mô tả một tài nguyên thông tin được chia sẻ trên Internet. Một bản ghi metadata bao gồm một tập các thuộc tính hoặc tập các phần tử cần thiết để mô tả các tài nguyên theo yêu cầu. Ví dụ, một hệ thống metadata thông thường trong biên mục thư viện chứa một tập các bản ghi metadata dùng để mô tả sách như : tác giả, nhan đề, thời gian xuất bản, chủ đề -đề mục, chỉ số xác định vị trí trên kho, giá Có nhiều chuẩn mô tả biên mục mang tính chất metadata khá thông dụng, thí dụ MARC21/UNIMARC, Dublin Core Metadata, XML .Các dữ liệu này thường được gắn vào phần đầu cho mỗi tài liệu điện tử đặt trên website và rất thích hợp cho các máy tìm kiếm (search engine) tìm kiếm, lọc ra các thông tin metadata để tổ chức thành các kho dữ liệu mà không cần dùng đến hệ quản trị cơ sở dữ liệu truyền thống. Nói cách khác, ngay bản thân ngôn ngữ XML tự nó đã hỗ trợ cho việc hình thành một CSDL toàn văn bản, phi cấu trúc rất tiện lợi cho việc tìm kiếm và trao đổi thông tin. * Sao lưu dữ liệu. Trong quá trình scanning tài liệu, tạo sản phẩm số cho đến biên mục tài liệu số được cất giữ ở 2 dạng: Bộ nhớ lớn của máy chủ, trên CD-ROM, ổ cứng di động Store trong và ngoài thư viện. Sao lưu theo phương thức: mỗi nhóm tài liệu cùng chủ đề, chuyên ngành sẽ được lưu trữ trong 02 đĩa khác nhau phục vụ cho nhu cầu sao lưu và in sao, chuyển phát của người dùng tin. * Kiểm soát chất lượng số hoá.
  54. CTTKH&CNQG với việc số hóa lớn thì việc kiểm soát chất lượng là rất cần thiết. Cục thử nghiệm và kiểm tra kỹ lưỡng, có nhật ký ghi lại những thông số kỹ thuật đã thử nghiệm để làm mẫu, đó là những mẫu để có thể so sánh. Ghi nhật ký với những thông tin sau: Tên file ảnh, ngày tạo, các thông số về dung lượng, màu sắc, kích cỡ, và cả biểu ghi (nếu đã đưa vào CSDL, và kiểm tra đường dẫn kết nối đến file ). Chất lượng số hoá được đề cập ở đây bao gồm kích cỡ của hình ảnh, vấn đề xử lý chung, dạng tập tin, chiều sâu của bit, vùng sáng, vùng tối, giá trị âm thanh, độ sáng, độ tương phản, độ phân giải ảnh ppi , sự nhiễu, sự định hướng, tiếng động, sự điều chỉnh kênh màu, sự mất văn bản, sự điều chỉnh hình ảnh, sự mất đường truyền hay mất hình ảnh, sự sống động, chất lượng truy cập, hình thức ngắn gọn, rõ ràng của văn bản CTTKH&CNQG xây dựng quy trình kiểm soát chất lượng trong quy trình số hóa là rất quan trọng, hơn nữa việc truyền đạt lại kỹ lưỡng cho những người thực hiện công việc số hóa cũng cần quan tâm nhiều hơn, tránh những lỗi đã xảy ra và đảm bảo cho sản phẩm cuối cùng đạt chất lượng tốt nhất. STT YÊU CẦU KỸ THUẬT GHI CHÚ Phải đảm bảo qui trình số hóa không làm hư hỏng, biến dạng tài liệu gốc (không được tháo rời gáy tài 1 liệu, đảm bảo giữ nguyên tình trạng tài liệu gốc đúng như trước khi số hoá) Dịch vụ số hóa phải đảm bảo ảnh chụp trang sách dưới định dạng số có độ sâu màu tối thiểu là 24 Bit 2 RGB (Full Color 24 bit- RGB) áp dụng đối với bản in màu và ảnh Dịch vụ số hóa phải đảm bảo thực hiện được với 3 trang tài liệu có khổ cỡ: 11,4cm x 17,8cm x
  55. 35,5cm. Với tài liệu đóng tập có độ dày tập lên đến 10,16 cm. Tệp dữ liệu gốc đầu ra (để lưu giữ, bảo quản) (Dữ liệu dùng để lưu được lưu dưới định dạng TIFF, JPEG, RAW, có giữ, bảo quản lâu dài và 4 độ phân giải tối thiểu là 300 dpi 300 ppi có thể tăng lên đến 600 ppi. dùng lại khi có yêu cầu chuyển đổi công nghệ) Mỗi cuốn tài liệu số hóa phải gắn kết với một tệp (Phân tách từng trang, tin siêu dữ liệu kỹ thuật dưới dạng XML các thông tin về tài liệu bao gồm: tên tệp tin; 5 định dạng file, độ phân giải, kích cỡ, tỉ lệ nén ảnh; chỉ rõ trang trái hay phải, ngày tạo) Tệp dữ liệu kết quả đầu ra (để sử dụng) phải được Để có thể tìm kiếm theo nhận dạng quang học ký tự tiếng Việt (OCR) với toàn văn 6 font chữ Unicode và chuyển đổi sang định dạng *.DOC và *.PDF đảm bảo nội dung chính xác 100% so với tài liệu gốc . Dung lượng Tệp dữ liệu đầu ra (để sử dụng) không (dữ liệu dạng text có được lớn hơn 2 Mb / 100 trang A4 chèn một số hình ảnh) 7 Dữ liệu kết quả đầu ra dưới dạng ảnh phải được Các ảnh, bảng biểu đồ, hiển thị: Chữ sắc nét, hình ảnh đẹp, loại bỏ các vết bản đồ bẩn ố vàng trên trang tài liệu 8
  56. Tệp dữ liệu kết quả đầu ra dưới định dạng PDF phải được tạo siêu dữ liệu mô tả Bookmark theo 3 9 cấp (chương; mục; phân mục. Dữ liệu mô tả được biên soạn theo font Unicode) Bên nhận dịch vụ số hóa phải đảm bảo xóa bỏ khỏi hệ thống của mình toàn bộ dữ liệu số hóa đã được chấp nhận bởi bên mời thầu trong vòng 30 ngày kể từ ngày giao dữ liệu; Đảm bảo số hóa tập trung trên cùng một hệ thống, 10 không chia nhỏ và thực hiện phân tán trên nhiều địa điểm. Tuyệt đối không để dữ liệu bị sao chép bởi người không được ủy quyền và phải hoàn toàn chịu trách nhiệm về việc bảo vệ quyền sở hữu trí tuệ đối với tài liệu số hoá. Yêu cầu kỹ thuật số hóa tài liệu. * Đưa dữ liệu số hóa lên mạng phục vụ. Cách đơn giản nhất là tạo các trang web dưới dạng HTML và đưa dữ liệu đã được số hóa lên internet. Tại CTTKH&CNQG đã xây dựng và tạo nhiều CSDL để phục vụ các nhóm bạn đọc theo từng chuyên ngành khác nhau với chuẩn XML hoặc SGML. Hiện nay, Cục đang sử dụng một số phần mềm quản lý dữ liệu số hiện nay phần mềm nguồn mở Greenstone, Zope, Plone, Đây là khâu cuối cùng của tiến trình số hóa, bao gồm việc đưa bộ sưu tập lên mạng internet để phục vụ trực tuyến và thiết kế giao diện với người dùng: tạo ra các công cụ sử dụng, chính sách khai thác đối với người dùng, ý kiến đóng góp, đánh giá của người sử dụng, xây dựng các ứng dụng tùy biến, chính sách phát triển nguồn tài liệu Tất cả các kết quả này được thông qua trước hội đồng số hóa và toàn thể cán bộ để hoàn chỉnh lần cuối trước khi công bố kết quả bộ sưu tập đối với bạn đọc. * Công bố bộ sưu tập và phục vụ truy cập. CTTKH&CNQG là cơ quan tiến hành công tác số hoá tài liệu KH&CN hàng đầu ở nước ta. Với đặc thù là tài liệu sử dụng để số hoá chủ yếu là các tài liệu xám, các kết quả nghiên cứu, các tài liệu quý hiếm nên vấn đề công bố bộ sưu tập và chia sẻ nguồn tin số hoá cần được xem xét kỹ lưỡng.
  57. Ngoài ra, Cục còn số hoá các tài liệu kết quả nghiên cứu, các tài liệu về KH&CN của các tỉnh khác gửi lên nằm trong dự án chỉ đạo của Bộ KH&CN. Các tài liệu được số hoá xong sẽ được biên mục, tải lên mạng và chia sẻ nguồn tin theo chính sách và quyền truy cập và Cục đã xây dựng. Điều này phục thuộc hoàn toàn vào chính sách của từng đơn vị, hãy xác định các tài liệu đó được phục vụ miễn phí hay có thu phí, nếu tài liệu có thu phí, hãy xác định cách thức thanh toán, cách thức chuyển giao tài liệu số, và làm các thủ tục về tài chính theo quy định của chính phủ, đồng thời xây dựng các chính sách để quản lý tài chính. Trong toàn bộ nguồn tài nguyên số của Cục xây dựng, chỉ có CSDL STD là được phục vụ theo phương thức có trả phí. Tuy nhiên, phương thức này cũng có mặt hạn chế nhất định, làm giảm khả năng truy cập tới CSDL trong khi nó được coi là một trong những CSDL về KH&CN có giá trị nhất hiện nay. 2.5 . Các nguyên tắc trong số hoá tài liệu. + Tính phù hợp. Tài liệu số hoá phải phù hợp với tầm nhìn và định hướng phát triển của xã hội nói chung và của Cục nói riêng. Phù hợp với chiến lược phát triển của CTTKH&CNQG với và với vai trò, nhiệm vụ mà Bộ KH&CN quy định. + Tính hệ thống.Kết quả của dự án xây dựng tài nguyên số tại CTTKH&CNQG nằm trong thiết kế tổng thể không tách rời và là bước phát triển kế triển kế tiếp trong quá trình hiện đại hoá các hoạt động phục vụ bạn đọc. + Tính chuẩn và tính mở. Tuân thủ các tiêu chuẩn quốc tế và tạo lập, lưu trữ và phân phối các tài liệu điện tử. Cục thiết kế các tài liệu tuân thủ khổ mẫu trao đổi ISO 2709, cho phép trao đổi với CDS/ISIS và khổ mẫu MARC 21. Hỗ trợ công tác biên mục theo các tiêu chuẩn và quy tắc mô tả thư mục khác nhau như : ISBD, AACR2. Hỗ trợ đa ngôn ngữ, chuẩn Unicode, 2.6 . Phƣơng pháp bảo quản tài liệu số. Khi tài liệu được số hóa, một câu hỏi được đặt ra “Liệu chúng ta nên chấm dứt việc xuất bản sách in và thay vào đó là số hóa sách để đọc trên máy?”. Tiện ích của tài liệu số là điều không thể phủ nhận. Ngoài việc có thể đọc và lưu trữ tài liệu
  58. trên máy, số hóa sách mang lại nhiều lợi ích rất lớn. Chính vì vậy, chúng ta cần biết sử dụng và bảo quản các dạng tài liệu điện tử một cách phù hợp, mang lại hiệu quả cao cho người dùng tin. * Chiến lược bảo quản. - Làm mới dữ liệu: (Refreshment) : Là việc chuyển các file dữ liệu sang dạng lưu trữ mới. Là công việc quan trọng đối với bất cứ một tổ chức tham gia cam kết số hóa nào, công nghệ thường bị lỗi theo thời gian. Các nguồn sưu tập số phải đảm bảo khả năng truy cập liên tục tới tài liệu số cho đến khi còn cần thiết. Để đảm bảo truy cập lâu dài, luôn được chuyển sang phương tiện lưu trữ mới và ổn định. - Di trú dữ liệu (Migration): Chuyển file ở dạng fomat đã được mã hóa sang dạng fomat khác để có thể sử dụng được trong môi trường máy tính hiện đại hơn (ví dụ: chuyển file dạng word star sang dạng Word Perfect, rồi từ Word 3.0 sang Word 5.0, Word 97) - Di trú dữ liệu hướng tới việc chuyển các file ở các dạng fomat cũ sang dạng fomat hiện hành. Tiêu chí lựa chọn tài liệu số: Tính hữu dụng; Tính duy nhất; Nội dung học thuật; Tính thời sự; Tần suất cập nhật; Dễ dàng truy cập. * Quy trình quản lý tài liệu số. Chuyển đổi các tài liệu giấy sang những hồ sơ điện tử có thể lưu trữ dưới dạng file mềm. Một tài liệu giấy được quét vào máy quét (scan) rồi chuyển thành file ảnh. Sau đó phần mềm sẽ chuyển file đó thành file mềm giống nguyên dạng ban đầu và có thể lưu trữ theo ý của người sử dụng. Khi cần chỉ việc gõ từ khóa cần tìm, với hệ thống quản lý tài liệu kỹ thuật số có thể quản lý hàng triệu tài liệu và truy tìm chính xác trong vài giây, giảm các chi phí hoạt động. Người làm công tác thông tin- thư viện thường gặp hai loại tài liệu: tài liệu dạng điện tử và tài liệu in ấn cần phải số hóa. Nếu tài liệu điện tử thì công việc hết sức dễ dàng, ngay cả việc sưu tầm, tổ chức tập in và chuyển đổi về dạng thích hợp. Còn đối với dạng tài liệu in ấn phải tiến hành số hóa bằng cách quét tài liệu và
  59. chuyển qua dạng PDF (Acrobat Reader), khi sử dụng Greenstone để lưu trữ tài liệu trong đó CSDL thì tự động mang hai dạng HTML và PDF. 2.7 . Tổ chức khai thác nguồn tài liệu số. CTTKH&CNQG là đơn vị đi đầu trong lĩnh vực cung cấp tài nguyên số. Bên cạnh nguồn tài nguyên số được bổ sung từ bên ngoài, mỗi năm có hàng trăm nghìn biểu ghi số hoá nội sinh được bổ sung vào nguồn tài liệu số của Cục. Theo đó, các dịch vụ cung cấp tài nguyên số cũng được phát triển không ngừng. Hiện nay, Cục đang áp dụng nhiều hình thức cung cấp tài liệu, bao gồm 3 hình thức cung cấp chính như sau: Cung cấp tài liệu trực tuyến từ xa, Cung cấp tại chỗ và cung cấp thông tin trọn gói tới tổ chức/đơn vị sử dụng thông tin. 2.7.1 Cung cấp trực tuyến từ xa. Hình thức cung cấp tài liệu này tại Cục được chia thành 2 loại, đó là miễn phí và có trả phí. Hiện nay, nguồn tài liệu số của cục đều cho phép truy cập từ xa miễn phí (trừ CSDL STD và một số CSDL nước ngoài) với địa chỉ truy cập: www.vista.gov.vn 2.7.2 Cung cấp tài liệu tại chỗ. Hình thức cung cấp tài liệu này được áp dụng tại Cục từ nhiều năm nay, đặc biệt khi nhu cầu sử dụng của NDT ngày càng tăng cao thì phương thức cung cấp tại chỗ đối với tài liệu truyền thống được chuyển dần sang tài liệu số. Hình thức cung cấp thông tin này cũng được chia thành 2 phương thức: Cung cấp theo yêu cầu và cung cấp theo điểm truy cập miễn phí. Đối với một số NDT có nhu cầu tìm kiếm thông tin, Cục sẽ cung cấp các địa điểm truy cập miễn phí tại khu vực tra cứu tài liệu điện tử. Tại đó, NDT có thể truy cập vào mọi nguồn tin mà Cục đã tạo lập trong mạng phục vụ. 2.7.3 Cung cấp trọn gói tới địa phương. Hình thức này được triển khai bởi dự án ” Tăng cường cung cấp thông tin KH&CN phục vụ phát triển kinh tế - xã hội vùng sâu vùng xa”do TS. Tạ Bá Hưng chủ trì. Đến nay, dự án này đã chuyển thành mô hình cung cấp thông tin KH&CN
  60. phục vụ phát triển kinh tế xã hội nông thôn- miền núi. Tính đến tháng 6/2009, mô hình này đã cung cấp thông tin với 34 tỉnh trong cả nước với khoảng gần 200 cơ sở. Cùng với dự án này, mỗi đơn vị thuộc diện cung cấp thông tin của dự án được trang bị cả về thiết bị, thông tin, nhân lực và tổ chức để vận hành hệ thống thông tin được cung cấp. 2.8 . Một số sản phẩm thông tin số hóa của Cục. 2.8.1 Cơ sở dữ liệu tài liệu KH&CN Việt Nam (STD). CTTKH&CNQG hiện đang duy trì, cập nhật một CSDL lớn nhất Việt Nam về các bài báo công bố trên các tạp chí KH&CN và các kỷ yếu hội nghị, hội thảo của Việt Nam – CSDL Việt Nam (thường gọi tắt là STD). CSDL toàn văn STD được thiết kế theo cách tiếp cận kết hợp CSDL thư mục có khả năng truy cập tới các tài liệu toàn văn từ các tạp chí, ấn phẩm định kỳ, tài liệu hội nghị/hội thảo, kỷ yếu, xuất bản tại Việt Nam. Từ 1999 gần như toàn bộ các bài báo đăng tải trên hệ thống tạp chí và ấn phẩm định kỳ về KH&CN xuất bản tại Việt Nam đã được phản ánh trong CSDL STD. Ngoài ra, CSDL STD còn xử lý các kỷ yếu hội nghị, hội thảo KH&CN, các tuyển tập bài báo về KH&CN. Biểu ghi trong CSDL STD được phân loại theo Khung đề mục quốc gia. STD là CSDL có quy mô lớn nhất Việt Nam với trên 120.000 biểu ghi về các tài liệu KH&CN đăng tải trên khoảng 300 tạp chí KH&CN Việt Nam và hàng nghìn kỷ yếu hội thảo khoa học. Dữ liệu trong CSDL bao gồm 2 loại thuộc hai giai đoạn: - Dữ liệu thư mục không có toàn văn: từ năm 1987 đến năm 2004, với khoảng 73.000 biểu ghi thư mục. - Dữ liệu thư mục có đính kèm tệp toàn văn giai đoạn từ 2005 đến nay với khoảng 45.000 biểu ghi có toàn văn. STD là CSDL đa ngành và liên ngành, bao quát hầu hết các lĩnh vực khoa học, công nghệ và các ngành kinh tế - kỹ thuật: - Khoa học rự nhiên;
  61. - Khoa học kỹ thuật (Công nghệ); - Kinh tế - Kỹ thuật Công nghiệp; - Khoa học và kỹ thuật nông nghiệp, lâm nghiệp và ngư nghiệp; - Y tế và Y - Dược học; - Khoa học xã hội & nhân văn. Đây là CSDL rất có giá trị đối với việc giảng dạy của các thày cô giáo và học tập của sinh viên. Đến tháng 10/2011 CSDL có trên 135.000 biểu ghi và có 2 dạng biểu ghi: - Biểu ghi thư mục không có toàn văn (bao quát từ đầu cho đến năm 2003, với khoảng 60.000 biểu ghi thư mục) - Biểu ghi thư mục có đính kèm toàn văn (từ 2004 đến nay với khoảng 76.000 biểu ghi có tệp toàn văn đính kèm) Hiện tại CSDL toàn văn được cập nhật với mức độ khoảng 12.000-14.000 biểu ghi/năm. (xem phụ lục 1) 2.8.2 Cơ sở dữ liệu báo cáo kết quả nghiên cứu (KQNC) KQNC là một CSDL quý và lớn nhất Việt Nam về báo cáo kết quả nghiên cứu của các đề tài nghiên cứu các cấp có đăng ký và lưu giữ tại kho Báo cáo kết quả nghiên cứu của Cục. Cục đã số hóa hầu hết các báo cáo này và có thể cung cấp bản sao điện tử của các báo cáo theo yêu cầu. Cho đến năm 2007 (trước khi có Quyết định 03/2007/QĐ – BKHCN) CSDL KQNC bao quát tất cả báo cáo KQNC của tất cả các cấp đề tài (cấp nhà nước, cấp bộ, cấp tỉnh và cấp cơ sở). Từ năm 2007 trở đi, theo quy định Cục chỉ nhận cấp đăng ký và lưu giữ báo cáo KQNC đề tài cấp nhà nước và cấp Bộ (Các báo cáo KQNC đề tài cấp tỉnh sẽ do Sở KH&CN tỉnh, thành phố trực thuộc Trung ương cấp đăng ký và lưu giữ) Đến nay, Cục Thông tin KH&CN Quốc gia đã thu nhận, lưu giữ trên 10.000 báo cáo KQNC của các đề tài NC&PT các cấp. Cục đã xây dựng CSDL gọi là CSDL KQNC. Đây là CSDL quý, quy mô quốc gia về một dạng tài liệu xám. Theo
  62. phân tích từ CSDL, tỷ lệ biểu ghi của đề tài cấp nhà nước là 44,77%, đề tài cấp Bộ là 42,25% ,chỉ còn một tỷ lệ nhỏ là đề tài cấp cơ sở và cấp tỉnh. ( xem phụ lục 2 và 3). Về diện bao quát chủ đề, CSDL KQNC bao quát tất cả các chủ đề. Biểu ghi trong CSDL được phân loại theo Khung đề mục quốc gia. Từ năm 2004, Cục Thông tin KH&CN Quốc gia đã tiến hành số hóa các báo cáo KQNC và thử nghiệm liên kết tập toàn văn báo cáo KQNC với cơ sở dữ liệu KQNC. Tuy nhiên do đặc thù của loại tài liệu này nên hiện tại Cục mới tạo CSDL thư mục về báo cáo KQNC và đưa lên mạng VISTA để cung cấp cho người dùng tin. Những báo cáo KQNC số hóa được lưu giữ tách biệt, không đưa lên mạng Internet. Người dùng tin có thể yêu cầu cung cấp báo cáo số hóa theo quy định. 2.8.3 Cơ sở dữ liệu Nghiên cứu và Phát triển. Theo quy định, Cục chỉ thực hiện đăng ký và lưu giữ những báo cáo KQNC thuộc các nhiệm vụ KH&CN cấp nhà nước và cấp bộ có sử dụng ngân sách nhà nước. Báo cáo KQNC của những nhiệm vụ KH&CN cấp tỉnh có sử dụng ngân sách nhà nước được đăng ký và giao nộp tại các Sở KH&CN các tỉnh và thành phố trực thuộc Trung ương, điều đó dẫn đến sự phân tán trong lưu giữ bảo quản báo cáo KQNC ở địa phương. Để tạo điều kiện cho người dùng tin có thể tra cứu thông tin về nhiệm vụ KH&CN cấp địa phương cũng như khai thác thông tin của các báo cáo KQNC của các nhiệm vụ KH&CN cấp tỉnh nói trên, năm 2011 Bộ KH&CN giao Cục triển khai nhiệm vụ xây dựng hệ thống Thông tin NC&PT, mà nội dung chính là xây dựng CSDL thư mục về đề tài báo cáo KQNC KH&CN cấp tỉnh, số hóa báo cáo KQNC và xây dựng kho lưu giữ tập trung đã số hóa. Đến hết 2011, Cục phải thu thập và số hóa khoảng 6.000 đề cương đề tài và báo cáo KQNC của các địa phương. Trên cơ sở số hóa sẽ xây dựng được sưu tập báo cáo KQNC được số hóa tại Cục Thông tin KH&CN Quốc gia, đảm bảo bảo quản lâu dài và phục vụ hiệu quả theo những quy định cụ thể ( xem phụ lục 4).
  63. Cục là cơ quan có vốn tài liệu về KH&CN phong phú và luôn luôn được cập nhật. Với hệ thống số hoá tài liệu hiện đại và công suất cao gồm 2 máy Kirtas 1600 và hệ thống thiết bị và phần mềm xử lý và lưu trữ dữ liệu số, Cục cung cấp các dịch vụ tới NDT nhằm phục vụ bạn đọc khai thác và sử dụng nguồn tài liệu số tại Cục với các dịch vụ: - Dịch vụ “Bạn đọc đặc biệt” cho phép truy cập từ xa tới các nguồn tin điện tử mà Cục xây dựng. - Dịch vụ khai thác Internet, Vista, các CSDL toàn văn trực tuyến tại chỗ. - Dịch vụ chia sẻ nguồn lực số hóa. - Dịch vụ xây dựng và cung cấp CSDL toàn văn trên phần mềm thư viện số GreenStone phục vụ các Viện nghiên cứu, trường đại học. - Dịch vụ số hoá tài liệu. - Dịch vụ hướng dẫn nghiệp vụ tìm tin và khai thác thông tin số hóa: Internet, Vista, Các CSDL trên CD-ROM, - Dịch vụ tìm tin, cung cấp thông tin toàn văn trên CD-ROM về KH&CN theo yêu cầu.  Tiểu kết chương 2: Qua chương 2, Khoá luận đã đi sâu và giải quyết vấn đề chính mà đề tài đề cập tới. Trình bày cụ thể những đặc điểm tài liệu được số hoá tại CTTKH&CNQG, nêu lên thực trạng nguồn tài nguyên số nội sinh, dịch vụ số hoá tài liệu của Cục. Và chương 2 cũng nêu lên những trang thiết bị cơ sở vật chất, phần mềm quản lý tài liệu số, nguồn nhân lực phục vụ trong công tác số hoá tài liệu tại Cục. Khoá luận đã đưa ra chi tiết tiến trình và quy trình của công tác số hoá tài liệu tại CTTKH&CNQG từ trước đến nay. Đồng thời nêu ra những quy tắc, kiểm soát chất lượng tài liệu được số hoá trong công tác số hoá tài liệu. Cùng với đó chương 2 cũng đã làm rõ những bước tiếp theo trong quy trình đường đi của tài liệu số: đưa dữ liệu số hóa lên mạng để phục vụ, công bố bộ sưu tập và phục vụ truy cập, một vài phương pháp bảo quản tài liệu số, tổ chức khai thác
  64. nguồn tài liệu số của CTTKH&CNQG và cuối cùng là nêu lên một số sản phẩm thông tin số hóa của Cục.
  65. CHƢƠNG 3 NHẬN XÉT VÀ GIẢI PHÁP KIẾN NGHỊ NHẰM NÂNG CAO HIỆU QUẢ CÔNG TÁC SỐ HÓA TÀI LIỆU TẠI CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA 3.1 . Nhận xét chung. Gần hai năm sử dụng thiết bị Kirtas số hóa tài liệu tại Cục Thông tin KH&CN Quốc gia, có một số nhận xét như sau: (Đỗ Như Thơ và Trần Đức Trung, 2011) - Kirtas được thiết kế với độ rộng của gáy sách hay độ dày đóng tập ở mức tiêu chuẩn để phù hợp và tương ứng với hệ thống hơi thổi từ phía thành máy, để trong quá trình số hóa, từng trang sách được thổi tới giúp cho cánh tay lật trang hoạt động dễ dàng. Do đó, nếu sách cần số hóa quá mỏng thì nó phải được đặt trên một quyển sách khác ở bên phải trang sách để tăng độ dày đóng tập đến mực cho phép hệ thống hơi thổi và cánh tay lật trang hoạt động. - Trong quá trình số hoá người vận hành cần quan sát và theo dõi sự liên tục theo trật tự của số trang (tránh bị đúp trang). Khi thấy trang sách quá phồng, cần dùng tay vuốt nhẹ để hai trang sách trải đều sang hai phía, như vậy việc số hóa sẽ đạt chất lượng tốt. - Đối với sách có độ dày gáy lớn, sau khoảng 50-60 trang sách, cần dừng máy ở chế độ tạm thời để máy tự động căn chỉnh tâm của gáy sách vào chính giữa khai khe giá đỡ sách. - Cần quan tâm đến độ rộng của tài liệu số hóa để điểu chỉnh máy cho hợp lý và chính xác. Nên được làm ngay từ đầu cho các tài liệu có cùng độ rộng trong cùng một thời gian máy hoạt động để tiết kiệm thời gian căn chỉnh máy. 3.1.1 Ưu điểm. Số hóa tài liệu là một trong những nhiệm vụ quan trọng của Cục hiện nay để xây dựng các cơ sở dữ liệu trực tuyến và không trực tuyến. Với hệ thống số hóa mới