Thứ sáu, ngày 23/08/2019

Kỹ thuật - Công nghệ

diemthi.vnanet.vn - Công cụ xử lý "dữ liệu lớn" cho báo chí


(01/08/2019 14:43:23)


Giữa tháng 7/2019, Bộ Giáo dục và Đào tạo công bố điểm thi THPT quốc gia năm 2019. Phía sau đó là cơ sở dữ liệu lớn, bao gồm gần 2 triệu thông tin điểm thi của các thí sinh năm 2018 và 2019 với gần 30 triệu thông tin phái sinh về điểm các khối thi và thông tin liên quan đến chỉ tiêu, điểm chuẩn quá khứ của các trường đại học, cao đẳng. Làm thế nào để các thông tin quan trọng chìm sâu trong hàng chục triệu số liệu được thể hiện trực quan, đạt độ tin cậy tối đa và thu hút độc giả đặt ra bài toán cần phải có các phần mềm xử lý “dữ liệu lớn” hỗ trợ. 

Trung tâm Kỹ thuật Thông tấn đã nghiên cứu và kịp thời đưa vào sử dụng phần mềm diemthi.vnanet.vn không chỉ hỗ trợ các thí sinh tra cứu thuận tiện hơn mà còn giúp các ban thông tin nguồn, tòa soạn báo của Thông tấn xã Việt Nam (TTXVN) và hệ thống truyền thông có thêm công cụ để cập nhật, phân tích thông tin ở nhiều góc độ xung quanh sự kiện thu hút sự quan tâm của hàng triệu độc giả này.

Khai thác dữ liệu bằng đồ thị
 


Bộ Giáo dục và Đào tạo công bố điểm các môn thi, khối thi dưới dạng các đồ thị và hình ảnh được rất nhiều báo sử dụng. Tuy nhiên, nếu các bài báo này đi kèm với công cụ cho phép độc giả tương tác tra cứu điểm thi, tự chọn các môn thi, khối thi, tra cứu dữ liệu và vẽ đồ thị thì độ tin cậy sẽ tăng lên và thu hút độc giả hơn rất nhiều so với các bài báo chỉ kèm hình ảnh tĩnh. Hơn nữa, công cụ này còn giúp “giữ chân” độc giả ở lại lâu hơn trên website, tăng hệ số “Time on Page” lên nhiều lần. 

Cá nhân hóa số liệu tới từng độc giả 
 

Điểm đáng chú ý là tin, bài trên các báo điện tử về kỳ thi THPT quốc gia năm 2019 thường trích dẫn chung các số liệu cơ bản từ nguồn của Bộ Giáo dục và Đào tạo. Vì thế, khá thiếu số liệu, thiếu định lượng mà độc giả quan tâm. Chẳng hạn, làm thế nào để biết ai là thủ khoa khối A hay địa phương nào có điểm thi ngoại ngữ đứng đầu cả nước? Những câu hỏi này được giải quyết bằng các công cụ phân tích dữ liệu. Và điều này cần được nhìn nhận là cơ hội để mở rộng độc giả. 

Điều tra sâu
 

Dữ liệu góp phần quan trọng giúp phóng viên phát hiện vấn đề, tạo sự hấp dẫn, mới lạ và góc nhìn đa chiều cho bài báo. Quay lại ví dụ “Thủ khoa khối A”, công cụ phân tích dữ liệu đã phát hiện ra thủ khoa khối A suýt bị điểm liệt môn ngoại ngữ và sau đó đã có hàng loạt bài báo về tấm gương vượt khó của thí sinh này.

Thông tin về địa phương
 

Công cụ phân tích dữ liệu cung cấp cho các cơ quan thường trú thông tin về kỳ thi THPT quốc gia của địa phương. Công cụ giúp so sánh các số liệu của địa phương này với địa phương khác, cung cấp các thông tin mang tính phát hiện. Một ví dụ minh họa về môn Văn, Nghệ An là tỉnh chiếm 50% bài thi điểm cao trong top 100 của cả nước.

Môi trường liên kết giữa các website của TTXVN
 

Bài báo trên các báo điện tử TTXVN “nhúng” công cụ tra cứu điểm thi không chỉ làm tăng hệ số “Time on Page” của bài mà còn dẫn người đọc sang website tra cứu điểm thi. Website tra cứu điểm thi cho phép tổ chức kịch bản tư vấn thay đổi nguyện vọng cho thí sinh. Kịch bản tư vấn này cung cấp thông tin liên quan đến trường, khối thi... và các thông tin về kỳ thi lấy từ các website của TTXVN. Rất nhiều độc giả nhận tư vấn đã bấm vào xem thông tin trên các website này của TTXVN. Đây là vòng tròn khép kín giữ độc giả trong “hệ sinh thái” thông tin của TTXVN.

Phân tích bối cảnh
​​​​​​

Dữ liệu có thể giải thích rất trực quan và đơn giản các sự việc đằng sau các thông tin. Công cụ phân tích số liệu bao gồm các nghiên cứu sâu số liệu trong quá khứ và hiện tại, chỉ ra các thông tin trực quan cho độc giả. Ví dụ biểu đồ dưới đây chỉ ra năm nay không có gian lận điểm thi tại Hà Giang.

Thông tin dự báo
 

Dựa trên các số liệu trong quá khứ và hiện tại; căn cứ trên sự ổn định của tần suất điểm xét trúng tuyển của các trường đại học qua các năm, công cụ phân tích dữ liệu có thể dự đoán được điểm chuẩn của các trường năm 2019. Đây là các thông tin mà thí sinh và phụ huynh rất quan tâm. Báo chí có thể khai thác các thông tin này để tăng số lượng độc giả theo dõi.

Công cụ phân tích dữ liệu đóng vai trò quan trọng trong báo chí dữ liệu. Đây là xu hướng mới cho người làm báo. Đồng thời, là sự khởi đầu cho các bước tiếp theo của báo chí dữ liệu với sự hỗ trợ của các công cụ phân tích dữ liệu nhằm sử dụng một cách có hệ thống các công cụ “dữ liệu lớn”, điều mà từ trước vẫn giới hạn trong lĩnh vực khoa học và công nghệ.

Nội san Thông tấn số 7/2019

CÁC TIN ĐÃ ĐĂNG:

Triển khai chữ ký số chuyên dùng tại TTXVN (03/05/2019 15:37:49)

Website của bạn đã chuẩn SEO? (04/09/2018 16:56:24)

Ứng dụng công nghệ trong quản lý hành chính  (02/08/2017 15:25:28)

Thông tấn xã Việt Nam đứng thứ hai bảng xếp hạng về Chỉ số ICT 2016 (23/03/2017 08:49:11)

Trang thông tin điều hành tác nghiệp TTXVN (05/12/2016 10:42:24)

Biên tập viên và thuật toán: Tại sao truyền thông cần cả hai? (12/10/2015 14:48:44)

Alô… Trung tâm Kỹ thuật thông tấn xin nghe…  (05/08/2015 15:27:16)

Hiểu biết, bảo mật, cảnh giác khi tác nghiệp (07/07/2015 11:07:29)

OpenOffice – Phần mềm mã nguồn mở dành cho cơ quan Nhà nước  (08/06/2015 15:42:15)

Mười xu hướng công nghệ sẽ làm thay đổi cách thức làm báo (13/02/2015 16:33:56)