Thứ tư, ngày 03/07/2024

Sổ tay phóng viên

diemthi.vnanet.vn - Công cụ xử lý "dữ liệu lớn" cho báo chí


(01/08/2019 14:43:23)


Giữa tháng 7/2019, Bộ Giáo dục và Đào tạo công bố điểm thi THPT quốc gia năm 2019. Phía sau đó là cơ sở dữ liệu lớn, bao gồm gần 2 triệu thông tin điểm thi của các thí sinh năm 2018 và 2019 với gần 30 triệu thông tin phái sinh về điểm các khối thi và thông tin liên quan đến chỉ tiêu, điểm chuẩn quá khứ của các trường đại học, cao đẳng. Làm thế nào để các thông tin quan trọng chìm sâu trong hàng chục triệu số liệu được thể hiện trực quan, đạt độ tin cậy tối đa và thu hút độc giả đặt ra bài toán cần phải có các phần mềm xử lý “dữ liệu lớn” hỗ trợ. 

Trung tâm Kỹ thuật Thông tấn đã nghiên cứu và kịp thời đưa vào sử dụng phần mềm diemthi.vnanet.vn không chỉ hỗ trợ các thí sinh tra cứu thuận tiện hơn mà còn giúp các ban thông tin nguồn, tòa soạn báo của Thông tấn xã Việt Nam (TTXVN) và hệ thống truyền thông có thêm công cụ để cập nhật, phân tích thông tin ở nhiều góc độ xung quanh sự kiện thu hút sự quan tâm của hàng triệu độc giả này.

Khai thác dữ liệu bằng đồ thị
 


Bộ Giáo dục và Đào tạo công bố điểm các môn thi, khối thi dưới dạng các đồ thị và hình ảnh được rất nhiều báo sử dụng. Tuy nhiên, nếu các bài báo này đi kèm với công cụ cho phép độc giả tương tác tra cứu điểm thi, tự chọn các môn thi, khối thi, tra cứu dữ liệu và vẽ đồ thị thì độ tin cậy sẽ tăng lên và thu hút độc giả hơn rất nhiều so với các bài báo chỉ kèm hình ảnh tĩnh. Hơn nữa, công cụ này còn giúp “giữ chân” độc giả ở lại lâu hơn trên website, tăng hệ số “Time on Page” lên nhiều lần. 

Cá nhân hóa số liệu tới từng độc giả 
 

Điểm đáng chú ý là tin, bài trên các báo điện tử về kỳ thi THPT quốc gia năm 2019 thường trích dẫn chung các số liệu cơ bản từ nguồn của Bộ Giáo dục và Đào tạo. Vì thế, khá thiếu số liệu, thiếu định lượng mà độc giả quan tâm. Chẳng hạn, làm thế nào để biết ai là thủ khoa khối A hay địa phương nào có điểm thi ngoại ngữ đứng đầu cả nước? Những câu hỏi này được giải quyết bằng các công cụ phân tích dữ liệu. Và điều này cần được nhìn nhận là cơ hội để mở rộng độc giả. 

Điều tra sâu
 

Dữ liệu góp phần quan trọng giúp phóng viên phát hiện vấn đề, tạo sự hấp dẫn, mới lạ và góc nhìn đa chiều cho bài báo. Quay lại ví dụ “Thủ khoa khối A”, công cụ phân tích dữ liệu đã phát hiện ra thủ khoa khối A suýt bị điểm liệt môn ngoại ngữ và sau đó đã có hàng loạt bài báo về tấm gương vượt khó của thí sinh này.

Thông tin về địa phương
 

Công cụ phân tích dữ liệu cung cấp cho các cơ quan thường trú thông tin về kỳ thi THPT quốc gia của địa phương. Công cụ giúp so sánh các số liệu của địa phương này với địa phương khác, cung cấp các thông tin mang tính phát hiện. Một ví dụ minh họa về môn Văn, Nghệ An là tỉnh chiếm 50% bài thi điểm cao trong top 100 của cả nước.

Môi trường liên kết giữa các website của TTXVN
 

Bài báo trên các báo điện tử TTXVN “nhúng” công cụ tra cứu điểm thi không chỉ làm tăng hệ số “Time on Page” của bài mà còn dẫn người đọc sang website tra cứu điểm thi. Website tra cứu điểm thi cho phép tổ chức kịch bản tư vấn thay đổi nguyện vọng cho thí sinh. Kịch bản tư vấn này cung cấp thông tin liên quan đến trường, khối thi... và các thông tin về kỳ thi lấy từ các website của TTXVN. Rất nhiều độc giả nhận tư vấn đã bấm vào xem thông tin trên các website này của TTXVN. Đây là vòng tròn khép kín giữ độc giả trong “hệ sinh thái” thông tin của TTXVN.

Phân tích bối cảnh
​​​​​​

Dữ liệu có thể giải thích rất trực quan và đơn giản các sự việc đằng sau các thông tin. Công cụ phân tích số liệu bao gồm các nghiên cứu sâu số liệu trong quá khứ và hiện tại, chỉ ra các thông tin trực quan cho độc giả. Ví dụ biểu đồ dưới đây chỉ ra năm nay không có gian lận điểm thi tại Hà Giang.

Thông tin dự báo
 

Dựa trên các số liệu trong quá khứ và hiện tại; căn cứ trên sự ổn định của tần suất điểm xét trúng tuyển của các trường đại học qua các năm, công cụ phân tích dữ liệu có thể dự đoán được điểm chuẩn của các trường năm 2019. Đây là các thông tin mà thí sinh và phụ huynh rất quan tâm. Báo chí có thể khai thác các thông tin này để tăng số lượng độc giả theo dõi.

Công cụ phân tích dữ liệu đóng vai trò quan trọng trong báo chí dữ liệu. Đây là xu hướng mới cho người làm báo. Đồng thời, là sự khởi đầu cho các bước tiếp theo của báo chí dữ liệu với sự hỗ trợ của các công cụ phân tích dữ liệu nhằm sử dụng một cách có hệ thống các công cụ “dữ liệu lớn”, điều mà từ trước vẫn giới hạn trong lĩnh vực khoa học và công nghệ.

Nội san Thông tấn số 7/2019