BÁO CHÍ - TRUYỀN THƠNG CƠNG NGHỆ HỌC MÁY ĐƯỢC ỨNG DỤNG TRONG BÁO CHÍ NHƯ THẾ NÀO? HUYỀN THƯƠNG Dữ liệu tài nguyên quý Nhưng làm để khai thác liệu, đặc biệt liệu ngày trở thành khối lượng khổng lồ, q tải, khó kiểm sốt? Chính vậy, nhà báo thời đại công nghệ cho phải học hiểu cách sử dụng công cụ phân tích liệu học máy (machine learning - ML) Số - Tháng 1/2022 106 107 Số - Tháng 1/2022 BÁO CHÍ - TRUYỀN THƠNG Cơng nghệ học máy báo chí Học máy tập hợp trí tuệ nhân tạo giúp đào sâu báo cáo theo hướng liệu Đó kỹ thuật khơng hữu ích thời đại liệu lớn - mà kỹ thuật bắt buộc thời đại Quy tắc bất thành văn thời điểm sử dụng công nghệ học máy là: người khơng thể tự phân tích liệu cách hợp lý - nói hàng trăm nghìn dịng liệu bảng tính - đến lúc đưa máy móc vào Đối với nhà báo bắt đầu làm quen với công nghệ học máy, hiểu học máy có nhiều điểm tương đồng với thống kê Clayton Aldern, phóng viên liệu cấp cao Grist (Grist tạp chí trực tuyến phi lợi nhuận Mỹ thành lập vào năm 1999 chuyên viết môi trường), sử dụng học máy để xác định giếng dầu bị phân loại sai Texas New Mexico Clayton Aldern phóng viên tham gia loạt viết đoạt giải Waves of Abandonment Grist Sử dụng cơng nghệ học máy cách có giám sát mang lại “hiệu đáng kinh ngạc”, cách sử dụng sức mạnh tính tốn lượng lớn liệu chất lượng, người gắn nhãn “Nhưng khơng phải bước đột phá thuật tốn, mà thuật tốn làm kết hợp với liệu quy mô lớn tài ngun tính tốn”, Meredith Whittaker, Giáo sư Nghiên cứu Minderoo Đại học New York người đồng sáng lập kiêm giám đốc AI Now Institute, nói Điều quan trọng cần ghi nhớ, kết đột phá học máy khơng có nghĩa khơng có tham gia người Ngược lại, hiệu học máy nói chung, báo chí, khơng phụ thuộc vào khả tiếp cận liệu có chất lượng, gắn nhãn tài ngun tính tốn, mà cịn kỹ lực sở hạ tầng người kết nối phần lại với Nói cách khác, tịa soạn tận dụng học máy để đưa tin có nhà báo theo sát bước đường ứng dụng cơng nghệ Emilia Díaz-Struck, biên tập viên nghiên cứu International Consortium of Investigative Journalists (ICIJ), cho biết “Học máy có thành phần lớn người Nó khơng phải phép thuật, cần thời gian nguồn lực đáng kể” ICIJ, tổ chức tiếng với vụ điều tra hồ sơ Panama Pandora vừa qua, sử dụng công nghệ học máy điều tra năm năm “Các phóng viên, biên tập viên, kỹ sư phần mềm, học giả làm việc - nơi điều kỳ diệu xảy ra” Số - Tháng 1/2022 Khi học máy trở thành công cụ làm báo phù hợp? Thiết kế vận hành chương trình học máy nhiệm vụ lớn - có nhiều chương trình đào tạo miễn phí giá hợp lý dành cho nhà báo tòa soạn để trau dồi kỹ Nhưng làm để công nghệ học máy phù hợp với quy trình làm báo? Dưới số cách Quá tải thông tin: phân loại để lọc thông tin cần thiết Khi Tổ chức nhà báo điều tra quốc tế, tòa soạn phi lợi nhuận mạng lưới nhà báo tập trung Washington, DC, có tệp thông tin tạo nên hồ sơ Pandora (Pandora Papers) - giống tác phẩm điều tra bao gồm Panama Papers, Paradise Papers - lượng thông tin ban đầu gây ấn tượng mạnh “Các phóng viên bị chống ngợp”, Díaz-Struck nói Trước kể chuyện, họ cần biết có khối lượng thơng tin thơng tin họ khơng cần đến Để thực điều này, phóng viên ICIJ sử dụng học máy để xếp phân cụm, với phương pháp 108 khác “Đầu tiên, hoạt động giống lọc thư rác”, Díaz-Struck cho biết đề cập đến ứng dụng học máy phổ biến, ứng dụng xác định xác suất email thư rác hay thư rác Nhiệm vụ nghe đơn giản không dễ dàng “Giống trận đấu Dữ liệu lớn bên mặt khác, tất nhà báo, phóng viên, nhà phát triển phần mềm biên tập viên bên”, Díaz-Struck nói Cuối cùng, học máy giúp ICIJ tập hợp liệu thành nhóm dễ quản lý với công nghệ ICIJ Datashare phương pháp phân tích liệu khác, nhóm xử lý liệu lớn Song song đó, 600 phóng viên từ khắp nơi giới thực nỗ lực khổng lồ việc kết nối dấu chấm báo cáo việc trốn thuế giao dịch tài đáng ngờ hàng trăm nhà lãnh đạo tỷ phú giới Sử dụng công nghệ học máy để phát thông tin sai lệch Một cách sử dụng phổ biến khác học máy phát phân loại sai Đây cố thực vào năm 2015, Ben Poston, Joel Rubin Anthony Pesce tờ The Los Angeles Times sử dụng học máy phát Sở Cảnh sát Los Angeles phân loại nhầm khoảng 14.000 vụ hành nghiêm trọng “tội nhẹ” thời gian năm Việc phân loại sai khiến mức độ tội phạm thành phố thấp mức xác Tương tự, điều tra BuzzFeed News máy bay bí mật giám sát băng đảng ma túy Mexico, phóng viên Peter Aldhous Karla Zabludovsky, sử dụng thuật toán Random Forests (thuật tốn học có giám sát), mơ hình thống kê tiếng để phân loại, xác định máy bay giám sát tiềm Sự minh bạch tạo dựng niềm tin “Điều quan trọng không nói bạn biết mà giải thích bạn biết điều đó”, Aldhous nói, người giải thích tính minh bạch giá trị tảng Buzzfeed News “Khả nhìn sâu phương pháp phân tích liệu tốt Nó giải thích lý chúng tơi có số” Học hỏi từ người trước Nếu việc bắt đầu ứng dụng cơng nghệ học máy khó khăn, lợi ích khoa học liệu cộng đồng nguồn mở, Aldern nói Các nhà báo liệu chia 109 Số - Tháng 1/2022 BÁO CHÍ - TRUYỀN THƠNG sẻ mã liệu đào tạo GitHub, nhà báo liệu nhà khoa học liệu khác tiếp cận chia sẻ Đừng ngại việc chép - dán Hãy học hỏi, mượn thuật toán nhà báo trước thử nghiệm ứng dụng Đối với nhà báo liệu làm quen với công nghệ học máy, theo dõi cơng việc người khác để học hỏi Các tịa soạn thiếu nguồn lực xem xét quan hệ đối tác với học giả công ty ICIJ hợp tác với Đại học Stanford công ty độc lập để giải vấn đề liệu đặc biệt nghiêm trọng trì tính độc lập báo chí điều quan trọng xử lý tài liệu nhạy cảm cho câu chuyện lớn chưa bị điều tra ICIJ khơng th ngồi cơng việc đào tạo liệu để đảm bảo độ xác, họ sử dụng cơng cụ học máy có tên Snorkel để giúp phân loại văn hình ảnh Khi nhà báo học Số - Tháng 1/2022 giả độc lập cần công ty cơng nghệ tiếp cận sức mạnh tính tốn tài ngun trí tuệ để tiến hành nghiên cứu, cơng ty hỗ trợ Díaz-Struck nói: “Trong kỷ ngun liệu lớn, nhà báo không biến mất, họ trở nên cần thiết hết” Những câu chuyện cho thấy chứng thú vị khái niệm cách phóng viên tận dụng cơng cụ để từ có phát đáng quan tâm từ hồ sơ công khai khơ khan Điều đưa báo chí liệu lên cấp độ tiếp theo, nơi nhà báo thoải mái sử dụng cơng nghệ để thực số hoạt động đối sánh, xếp, nhóm thơng tin, phát bất thường - điều thực có ích với tập liệu đặc biệt lớn 110 Truyền thông Công cộng Phần Lan sử dụng trợ lý tin tức thông minh Voitto cung cấp tin tức cá nhân hóa cho độc giả Tờ báo danh tiếng Mỹ Wall Street Journal sử dụng hình thức thu phí dựa cơng nghệ ML mang lại gói cước đăng ký cá nhân hóa dựa thói quen đọc Reuters phát triển News Tracer Lynx Insight Cả hai công cụ sử dụng công nghệ học máy trí tuệ nhân tạo để hỗ trợ nhà báo Reuters trình thu thập tin tức Nhà báo có nên học kỹ thuật ML? Theo Google, câu trả lời có Google giới thiệu khóa học học máy khuôn khổ Sáng kiến Tin tức Google (Google New Initiative) với hợp tác JournalismAI Vì Google muốn nhà báo học cơng nghệ Machine Learning? Trí tuệ nhân tạo tác động đến ngành công nghiệp giới Nếu nhìn vào ngành cơng nghiệp báo chí, truyền thơng, thấy nhiều tịa soạn báo triển khai kỹ thuật AI học máy khác để tự động tạo báo quy mơ lớn Ở đây, tịa soạn sử dụng AI / ML để phát triển khán giả, xây dựng lịng trung thành, nắm giữ thơng tin chi tiết liệu tốt tăng tương tác với độc giả Những tòa soạn báo tiếng giới Bloomberg sử dụng công nghệ AI/ ML để tự động trích xuất điểm liệu từ báo cáo thu nhập hàng nghìn cơng ty tháng/quý Công ty VRT News Google làm việc với tổ chức truyền thơng nhà tư vấn báo chí để lên chiến lược cơng cụ AI mang lại lợi ích cho phóng viên cơng việc họ Gã khổng lồ công nghệ tung khóa đào tạo miễn phí học máy trí tuệ nhân tạo để giúp họ quy trình làm việc Theo thời gian, Google cung cấp cho nhà báo cơng cụ liệu tốt Ví dụ, hợp tác với Big Local News Đại học Stanford Pitch Interactive, Google News Initiative xây dựng Trình lập đồ ca nhiễm COVID-19 để giúp nhà báo địa phương dễ dàng nhúng hình ảnh đồ COVID-19 cập nhật vào trang web họ cho người đọc Trong năm tới, cơng nghệ tự động hóa có tác động lớn đến cách nhà báo làm việc Việc học công cụ AI / ML trở thành yếu tố quan trọng quy trình đọc báo cáo định kỳ tự động hóa Khơng để chuẩn bị cho thân nhà báo trước xu tự động hóa tương lai, AI / ML có giá trị to lớn thứ kiểm tra thực tế thu thập thông tin chi tiết từ nguồn liệu khác Việc ứng dụng trí tuệ nhân tạo, học máy thuật tốn tác động sâu sắc đến ngành báo chí Cho dù văn bản, video, âm hay thứ khác, thơng tin biểu thị số để có thơng tin chi tiết sâu sắc Vì vậy, nhà báo cần phải có kiến t hức AI, ML để tận dụng tất công cụ sáng tạo cung cấp nội dung, thông tin tốt cho độc giả Google cho biết đó, nhà báo bắt buộc phải nắm bắt công nghệ, đạt số kiến t hức chuyên môn để sử dụng sản phẩm AI khác Khóa học học máy trở thành phần cơng cụ đào tạo miễn phí Google dành cho tổ chức truyền thông Theo Google, điều thúc đẩy nỗ lực nhà báo phổ biến thông tin quan trọng đến độc giả họ “Đại dịch COVID-19 đưa lại khoảng thời gian khó khăn nhà báo tổ chức tin tức toàn cầu, họ cố gắng đánh giá ảnh hưởng COVID-19 sống Khóa học cơng nghệ AI, ML bổ sung cho thử nghiệm cộng tác báo chí nỗ lực cho thấy khả biến đổi AI học máy việc định hình nhà báo, báo chí tương lai”, Giám đốc Mattia Peretti JournalismAI, tổ chức hàng đầu hoạt động Sáng kiến G oogle News, cho biết Khóa học Machine Learning dành cho nhà báo tập trung vào việc giúp nhà báo hiểu nguyên tắc đằng sau học máy cách nhà báo thực đào tạo mơ hình học máy Các nhà báo đánh giá trường hợp sử dụng công nghệ học máy, thu thập liệu, định dạng liệu, chọn thuật tốn (chẳng hạn Ngơn ngữ tự nhiên Google Cloud AutoML) để xây dựng mơ hình Theo Google, khóa học học máy báo chí hướng tới loại bỏ thành kiến, nguồn gốc thành kiến và ngăn chặn thiên vị mơ hình để nhà báo không đưa tin sai, đưa tin thiên lệch.n C Tài liệu tham khảo: https://analyticsindiamag.com/ https://datajournalism.com/ https://futurism.com 111 Số - Tháng 1/2022 ... học Machine Learning dành cho nhà báo tập trung vào việc giúp nhà báo hiểu nguyên tắc đằng sau học máy cách nhà báo thực đào tạo mơ hình học máy Các nhà báo đánh giá trường hợp sử dụng công nghệ. .. sử dụng công nghệ học máy điều tra năm năm “Các phóng viên, biên tập viên, kỹ sư phần mềm, học giả làm việc - nơi điều kỳ diệu xảy ra” Số - Tháng 1/2022 Khi học máy trở thành công cụ làm báo. .. có số” Học hỏi từ người trước Nếu việc bắt đầu ứng dụng cơng nghệ học máy khó khăn, lợi ích khoa học liệu cộng đồng nguồn mở, Aldern nói Các nhà báo liệu chia 109 Số - Tháng 1/2022 BÁO CHÍ - TRUYỀN