Thứ sáu, ngày 25/05/2018

Công tác nghiên cứu khoa học

Phát huy hiệu quả "mỏ vàng" tư liệu


(03/10/2017 14:51:26)

Đề tài “Nghiên cứu giải pháp bảo tồn và khai thác có hiệu quả tư liệu của TTXVN” do Trung tâm Thông tin tư liệu thực hiện. Trên cơ sở phân tích thực trạng công tác quản lý và khai thác nguồn tư liệu thông tin báo chí của TTXVN, phục vụ hoạt động của phóng viên, biên tập viên trong ngành nói riêng và của bạn đọc nói chung, nhóm nghiên cứu đã đề xuất các giải pháp có tính khả thi để khai thác hiệu quả “mỏ vàng” tư liệu của ngành. Nội san Thông tấn xin trích giới thiệu một số nội dung để bạn đọc cùng tham khảo.

Số hóa trong công tác bảo tồn

Tra cứu tài liệu tại Trung tâm Thông tin tư liệu

Đối với công tác lưu trữ tư liệu của TTXVN, việc số hóa là bước phát triển tất yếu, song song với việc cải thiện kỹ thuật, môi trường bảo quản những tư liệu gốc. 

Việc lưu trữ tư liệu của TTXVN nên lựa chọn đa dạng các vật mang tin, hướng tới những vật mang tin có tuổi thọ lâu dài, khả năng lưu trữ lớn, được sử dụng phổ biến ở các trung tâm lưu trữ lớn của thế giới. Khi số hóa tài liệu phải xem xét đến khả năng chứa đựng thông tin và tuổi thọ của bản sao, xem xét phương pháp, công nghệ, tiêu chuẩn để tạo lập bản sao và đặc biệt là giá trị pháp lý của bản sao để khi không còn tài liệu gốc, bản sao vẫn được thừa nhận một cách hợp pháp… Bản sao tài liệu có thể lưu trữ trên các vật mang tin, như: Giấy, đĩa CD, DVD, ổ cứng, thẻ nhớ USB, thiết bị lưu trữ mạng, Microfilm… Yêu cầu đối với việc vật mang tin được dùng để lưu trữ tư liệu là phải ổn định và lâu dài. Tuy nhiên, tuổi thọ có các vật mang tin là khác nhau, như: Đĩa CD có tuổi thọ trung bình là 5 năm, đĩa DVD tuổi thọ là 8 năm, ổ cứng (HDD) có tuổi thọ 10 năm, thiết bị lưu trữ mạng (NAS) có tuổi thọ là 20 năm, băng có tuổi thọ 25 năm, Microfilm có tuổi thọ từ vài chục tới vài trăm năm… 

Microfilm được sử dụng phổ biến trong công tác lưu trữ chuyên nghiệp hiện nay. Trung tâm Thông tin tư liệu có thể lựa chọn lưu trữ tư liệu báo chí bằng lập bản sao Microfilm với hai phương pháp: Ứng dụng công nghệ Microfilm để chụp Microfilm tài liệu lưu trữ; ứng dụng kết hợp công nghệ số hóa và công nghệ COM để số hóa tài liệu lưu trữ trước, sau đó chuyển dữ liệu ở dạng ảnh số sang Microfilm. Ngoài lưu trữ bằng Microfilm, những công nghệ hiện đại khác như “điện toán đám mây”, “dữ liệu lớn”… cũng cần nghiên cứu, áp dụng.

Thách thức ban đầu đối với công tác bảo quản dữ liệu số là vấn đề thiết bị lưu trữ các tài liệu số rất dễ bị tổn hại và mất mát so với tài liệu analog (như tài liệu giấy,…). Do đó, cần đặt ra chiến lược bảo quản tài liệu lâu dài bằng kỹ thuật số và nó cũng cần được đầu tư, duy trì, phát triển như bảo quản tài liệu analog khác. Đối với bản sao số gốc sẽ được bảo quản nghiêm ngặt bởi nhiệt độ và độ ẩm theo tiêu chuẩn và có thể được sao lưu trên nhiều thiết bị lưu trữ khác nhau, như đĩa quang, băng từ, ổ cứng… Đối với bản sao sử dụng có độ phân giải thấp được lưu trữ tại server và những bản lưu trữ dự phòng. 

Khi thực hiện số hóa tư liệu, cần xác định rõ mục tiêu số hóa tài liệu (để phục vụ thay vì sử dụng bản gốc, để lập bản sao bảo hiểm; hay cả hai mục đích trên) từ đó lựa chọn thiết bị và xây dựng các tiêu chuẩn số hóa cho phù hợp; chuẩn bị tốt đội ngũ cán bộ vì đây là khâu then chốt quyết định sự thành bại; chuẩn bị tốt cơ sở vật chất (máy móc, thiết bị, vật tư, kinh phí...) để triển khai việc số hóa tài liệu; chuẩn hóa các quy trình nghiệp vụ (quy trình số hóa, xác định các chuẩn thông tin đầu vào, đầu ra) để làm cơ sở cho việc thiết kế phần mềm ứng dụng cho phù hợp; dữ liệu ảnh, video số hóa phải được ghi trên các vật mang tin có chất lượng cao. Cần tiến hành nghiên cứu và đưa ra quy trình chuẩn bảo quản tài liệu số; thường xuyên nâng cao trình độ của cán bộ để có thể theo kịp với các thay đổi của công nghệ. 

Quy trình số hóa để nâng cao hiệu quả tư liệu phục vụ công tác báo chí
Trong tương lai, TTXVN có thể xây dựng mô hình vận hành và áp dụng quá trình số hóa dữ liệu nguồn tài liệu, tư liệu phục vụ công tác báo chí. Đây là quá trình chuyển dữ liệu lên nền tảng Internet, giúp cho phóng viên, biên tập viên nói riêng, bạn đọc nói chung có thể tiếp cận, khai thác nguồn tư liệu này một cách hiệu quả mọi lúc, mọi nơi. 

Trước khi đề xuất quy trình số hóa tài liệu, Trung tâm đưa ra mô hình kiến trúc dữ liệu cơ bản của một hệ thống thư viện số. Phần mềm thư viện số đóng một vai trò hết sức quan trọng trong sự hình thành và hoạt động của thư viện. 

Cấu trúc dữ liệu của một phần mềm thư viện số bao gồm:

Từ việc nắm được các mảng trong thư viện số, trong chuyên đề này, tác giả đưa ra mô hình triển khai theo bốn bước cụ thể như sau:

Bước 1: Xây dựng cấu trúc thư viện điện tử, thực chất là cấu trúc của một giao diện web có liên kết đến các nguồn tin số hoá, trong đó quan trọng nhất là các cơ sở dữ liệu toàn văn, được tổ chức theo cấu trúc có khả năng đáp ứng cho việc tìm kiếm và khai thác qua nền tảng của Internet.

Bước 2: Đầu tư hạ tầng cơ sở kỹ thuật
Để triển khai quá trình số hóa và xây dựng hệ thống thư viện điện tử, TTXVN cần đầu tư một cơ sở hạ tầng đủ mạnh, đó là:

- Hệ thống máy chủ lớn thực hiện việc quản trị và các dịch vụ khác nhau của quá trình số hóa và khai thác tư liệu: Máy chủ web, máy chủ lưu, bảo trì dữ liệu, máy chủ tường lửa bảo vệ tài nguyên, máy chủ cho các ứng dụng phụ trợ khác;...

- Hệ thống đường truyền mạng có kết nối nhanh với Internet;

- Hệ thống các máy trạm để cập nhật và khai thác dữ liệu thông tin tại chỗ nếu cần;

- Các thiết bị công nghệ chuyên dụng cho quá trình số hóa và xây dựng thư viện điện tử: Mã vạch, quản lý và in thẻ, máy quét, máy sao CD;...

Về phần mềm cho hoạt động quản trị: Mỗi phần mềm đều có những ưu, nhược điểm riêng, nhưng thông thường phải có các thành phần chính của một thư viện điện tử: Bổ sung; biên mục; quản lý kho; phục vụ bạn đọc; mục lục trực tuyến; phân hệ lưu hành; quản lý tài liệu điện tử; truy hồi và trình bày thông tin; mượn liên thư viện; quản trị hệ thống.

Ngoài ra, để tổ chức thư viện điện tử tốt, cũng cần có: Phần mềm hệ thống; hệ điều hành và hệ quản trị các cơ sở dữ liệu; phần mềm xuất bản điện tử, xuất bản CD/ROM.

Bước 3: Tạo lập kho tư liệu số hóa
a. Tiến hành chọn lọc số hoá nguồn tư liệu của Trung tâm Thông tin tư liệu, tức là chuyển tài liệu hiện có sang dạng số bằng phương pháp quét hay nhập lại thông tin từ bàn phím… 

Trong thời gian tới, Trung tâm Thông tin tư liệu sẽ tiến hành số hóa một số mảng tài liệu văn bản như: 

- Tư liệu về chủ quyền, lãnh thổ, biên giới, biển đảo; 

- Các bản tin của TTXVN từ 1952 - 1975 là số tài liệu cũ nhất, có nguy cơ hỏng, trong đó tin Trong nước, tin Đấu tranh thống nhất, bản tin Miền Nam là những tài liệu in trên giấy mỏng, chất lượng kém nhất;

- Tư liệu về miền Nam (tài liệu cũ, quý hiếm, chỉ có ở TTXVN): Những văn bản chính trong Hội nghị Geneva và thi hành Hiệp định Geneva; tư liệu về Mỹ - ngụy (Báo cáo mật của Lầu Năm Góc về cuộc chiến tranh Việt Nam; chính phủ bù nhìn thời kháng chiến; các vụ đảo chính;  sắc luật, hiến pháp ngụy Sài Gòn; các cuộc đàn áp, tội ác đẫm máu của đế quốc Mỹ…), gồm 51 cặp hồ sơ;

- Hồ sơ về Chủ tịch Hồ chí Minh và các vị lãnh tụ (Nguyễn Hữu Thọ, Lê Duẩn, Tôn Đức Thắng, Trường Chinh, Phạm Văn Đồng, Nguyễn Văn Linh…);

- Hồ sơ ngoại giao 102 cặp.

b. Bổ sung và tích hợp nguồn tin điện tử thông qua việc tạo mới, mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử  trước khi in ra giấy). 

c. Xây dựng các liên kết (tạo  khả năng truy cập) đến các nguồn  tài liệu liên quan trên nền tảng Internet, nhất là nguồn của các cơ quan có cùng diện chuyên đề bao quát.

Tạo lập và phát triển kho tài liệu số của riêng mỗi cơ quan thông tin/thư viện là vấn đề lớn nhất trong xây dựng thư viện điện tử. Công việc này đòi hỏi phải đầu tư lớn và liên tục. Ngoài ra, cũng cần quan tâm đến chất lượng của việc số hoá tài liệu cũng như cần sao lưu đầy đủ, kịp thời các tài liệu số hoá đó để tránh rủi ro cũng như tránh phải làm đi làm lại (lãng phí công sức, tiền của). 

Phải phối hợp, tận dụng sản phẩm số hoá của các cơ quan thông tin hay thư viện khác, nhất là của những cơ quan có cùng diện chuyên đề bao quát. Trên cơ sở đó, tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, công sức và tiền của.

Bước 4: Bảo quản và khai thác
Việc quản lý tài liệu điện tử cũng cơ bản giống như quản lý tài liệu giấy, trong mô hình vòng đời, tài liệu được xử lý qua các giai đoạn: Sản sinh tài liệu – phân phối sử dụng - bảo quản bán hiện hành - bảo quản không hiện hành (tại lưu trữ hiện hành) - tài liệu lưu trữ - tiêu hủy. Như vậy, các tài liệu điện tử cũng phải tạo lập thành những hồ sơ và được xác định giá trị, thời gian bảo quản cho từng hồ sơ, loại tài liệu. Một đặc điểm khác đối với tài liệu giấy, hồ sơ tài liệu điện tử sẽ được lập bằng cách tự động hoặc bán tự động và được quản lý bằng các siêu dữ liệu (có thể hiểu là các đặc điểm cơ bản để nhận biết hồ sơ).

Quy trình khai thác nguồn tư liệu số:

Đầu tiên, để tìm kiếm được nguồn tài liệu, tư liệu thông tin,  phóng viên, biên tập viên TTXVN nói riêng và công chúng nói chung sẽ tiến hành tra cứu trên hệ thống giao diện của thư viện điện tử. Các hình thức tra cứu chủ yếu như tìm lướt, tìm toàn văn, tìm bằng từ khóa hay bằng các toán tử, thuật ngữ tìm kiếm. Các phần mềm quản trị khai thác hệ thống thư viện điện tử đều cung cấp khả năng tra cứu một cách hiện đại, nhanh chóng và hiệu quả, giúp tiện lợi cho người tra cứu.

Công đoạn tiếp theo là kiểm soát truy cập chính. Hệ thống quản trị thư viện điện tử sẽ phân loại các nhóm khách hàng được quyền tiếp cận với những nhóm tài liệu nào. Chính sách lưu thông được thiết lập bởi những người xây dựng, vận hành và quản lý hệ thống dữ liệu này. Những phóng viên, biên tập viên sẽ được cung cấp những tài khoản với những chính sách nhất định trong quá trình tiếp cận các nguồn dữ liệu. Điều này tạo ra quy trình hoạt động chặt chẽ và bài bản đối với các nguồn tài liệu, tư liệu.

Tại công đoạn này, hệ thống quản trị có thể đưa ra các quyết định với bạn đọc nói chung (ngoài đội ngũ phóng viên, biên tập viên của TTXVN) mức độ truy cập theo thời lượng và chi phí dựa trên những chính sách lưu thông do hệ thống thư viện điện tử thiết lập. Mỗi đối tượng khi muốn xem, truy cập hay sao chép sẽ được miễn phí hoặc trả phí theo quy định.
Một góc làm việc của Trung tâm Thông tin tư liệu

Công đoạn cuối cùng là trình diễn. Hình thức này là một dạng thức mượn tài liệu ở kho tài liệu nếu kho đóng, bạn đọc được cán bộ thư viện phục vụ, nếu kho mở bạn đọc cần phải nắm được số đăng ký cá biệt hoặc số phân loại để tìm được đúng tài liệu đó trên giá. Trình diễn là sự thể hiện theo đúng quy định về cấu trúc tài liệu. Mối quan hệ phức tạp giữa các thành phần, trang, chương bài, phần đoạn… được giải quyết, đem lại sự tiện lợi cho người sử dụng. Việc trình diễn dạng tư liệu số còn có tính năng hiển thị thumbnail (ảnh nhỏ đại diện), tích hợp với các tính năng trình diễn ảnh số đặc biệt, cho phép quản lý các ảnh có độ phân giải cực lớn phù hợp với quản lý tranh ảnh, bảng biểu.

Với mô hình xây dựng và vận hành này, việc tiếp cận với kho cơ sở dữ liệu của đội ngũ phóng viên, biên tập viên nói riêng và công chúng nói chung là mọi lúc, mọi nơi, mọi thời điểm khi có kết nối Internet.
 

Theo Nội san thông tấn số 9/2017

CÁC TIN ĐÃ ĐĂNG:

Hướng tới sự chuyên nghiệp (23/01/2017 10:26:11)

Một số giải pháp nâng cao chất lượng đào tạo, bồi dưỡng phóng viên, biên tập viên TTXVN (05/12/2016 11:17:33)

Giải pháp nâng cao chất lượng thông tin kinh tế của TTXVN phục vụ sự nghiệp CNH - HĐH đất nước (11/10/2016 09:49:30)

Một số đề xuất về mô hình tổ chức và cơ chế hoạt động của các cơ quan thường trú trọng điểm ở trong nước  (04/10/2016 16:03:26)

Đề xuất thống nhất nội dung tuyên truyền về biển đảo (14/06/2016 14:19:21)

Nâng cao chất lượng tuyến tin phản hồi, định hướng, bác bỏ thông tin sai lệch (11/05/2016 15:40:38)

Giá trị thực tiễn của đề tài nghiên cứu khoa học (11/05/2016 15:33:26)

Bước khởi đầu cho chặng đường nghiên cứu khoa học (25/02/2016 15:55:30)