Khảo sát các yếu tố từ vựng trong độ đo phong cách các văn bản báo chí tiếng việt (so sánh với tiếng anh)

211 3 0
Khảo sát các yếu tố từ vựng trong độ đo phong cách các văn bản báo chí tiếng việt (so sánh với tiếng anh)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

IH QU GI TH NH PH H TRƢỜ H MINH V V  NGUYỄN TUYẾT NHUNG KHẢO SÁT CÁC YẾU TỐ TỪ VỰNG TR P Á Á V BẢN BÁO CHÍ TIẾNG VIỆT (SO SÁNH VỚI TIẾNG ANH) LUẬN ÁN TIẾN SĨ NGÔN NGỮ H C SO SÁNH I CHIẾU Thành phố Hồ Chí Minh - năm 2023 IH QU GI TH NH PH H TRƢỜ H MINH V V  NGUYỄN TUYẾT NHUNG KHẢO SÁT CÁC YẾU TỐ TỪ VỰNG TR P Á Á V BẢN BÁO CHÍ TIẾNG VIỆT (SO SÁNH VỚI TIẾNG ANH) Ngành: Ngôn ngữ học so sánh đối chiếu Mã số: 92220241 LUẬN ÁN TIẾN SĨ NGÔN NGỮ H C SO SÁNH NGƯỜI HƯỚNG DẪN KHOA H C: PGS TS inh iền TS Nguyễn Thị Như Ngọc PHẢN BIỆN ỘC LẬP: PGS TS Trịnh Sâm PGS TS Phạm Hữu ức PHẢN BIỆN: PGS TS Lê Kính Thắng PGS TS Phạm Hữu ức TS Huỳnh Thị Hồng Hạnh Thành phố Hồ Chí Minh – năm 2023 I CHIẾU i Lời cảm ơn Tác giả luận án xin gửi lời cảm ơn sâu sắc đến tập thể Giáo viên hướng dẫn: PGS TS inh iền TS Nguyễn Thị Như Ngọc Thầy, Cơ hết lịng hỗ trợ tận tình hướng dẫn cho tác giả luận án từ ngày thực đề tài ngày hơm Bên cạnh đó, giảng kiến thức đến từ Quý Thầy Cô Khoa Ngôn ngữ học, Trường ại học Khoa học xã hội Nhân văn, với Quý Thầy Cô thuộc đơn vị khác Nhà Trường giúp tác giả luận án có tri thức quý báu từ tảng đến chuyên sâu thuộc lĩnh vực Ngôn ngữ học Xử lý Ngơn ngữ Tự nhiên ó viên gạch để đề tài xây dựng, phát triển hoàn thiện Tác giả luận án chân thành gửi lời cảm ơn đến gia đình, đồng nghiệp bạn bè ủng hộ suốt trình tác giả luận án thực đề tài Tất tình cảm quý báu này, tác giả luận án xin ghi lịng tạc dạ, lấy làm động lực để vượt qua khó khăn, trở ngại Một lần nữa, tác giả luận án xin cảm ơn lịng Q Thầy Cơ tất người thân yêu bên cạnh, ủng hộ dành cho em lời khuyên vô giá ii Lời cam đoan Tôi cam đoan cơng trình nghiên cứu đích thân tơi thực Tất hình ảnh, đồ thị, bảng biểu dựa thông tin liệu xác thực Tất ngữ liệu tiếng Việt tiếng Anh có nguồn gốc xuất xứ rõ ràng Tác giả luận án Nguyễn Tuyết Nhung Mục lục Lời cam đoan i Lời cảm ơn ii MỞ ẦU 0.1 Lí chọn đề tài 0.2 Mục đích nghiên cứu câu hỏi nghiên cứu 0.3 ối tượng phạm vi nghiên cứu 0.3.1 ối tượng nghiên cứu 0.3.2 Phạm vi nghiên cứu 0.4 Ngữ liệu, phương pháp công cụ nghiên cứu 0.4.1 Ngữ liệu nghiên cứu 0.4.1.1 Ngữ liệu tiếng Việt 0.4.1.2 Ngữ liệu tiếng Anh 0.4.2 Phương pháp nghiên cứu 11 0.4.3 Công cụ nghiên cứu 12 0.5 Ý nghĩa khoa học thực tiễn 18 0.5.1 Ý nghĩa khoa học 18 0.5.2 Ý nghĩa thực tiễn 19 0.6 Cấu trúc luận án 20 ƢƠ 1: TỔNG QUAN NGHIÊN CỨU V Ơ SỞ LÝ LUẬN 28 1.1 Các cơng trình nghiên cứu yếu tố từ vựng độ đo phong cách tiếng Anh tiếng Việt 28 1.1.1 Các cơng trình nghiên cứu yếu tố từ vựng độ đo phong cách tiếng Anh 28 1.1.2 Các cơng trình nghiên cứu yếu tố từ vựng độ đo phong cách tiếng Việt 35 1.2 Phong cách ngôn ngữ độ đo phong cách 38 1.2.1 Phong cách ngôn ngữ 38 1.2.2 ộ đo phong cách 40 1.2.3 Ứng dụng độ đo phong cách Ngôn ngữ học điều tra 45 1.3 ặc điểm ngôn ngữ viết thuộc chuyên mục ý kiến báo 50 1.4 Từ lớp từ vựng 52 1.4.1 Từ 52 1.4.2 Tiêu chí xác định ranh giới từ 54 1.4.2 Tách từ gán nhãn từ vựng cho khối ngữ liệu 60 1.4.3 Một số lớp từ hệ thống từ vựng tiếng Việt 66 1.5 Các yếu tố từ vựng ộ đo phong cách 55 1.5.1 Phân bố chiều dài từ tính theo ký tự 55 1.5.2 Phân bố chiều dài từ tính theo âm tiết 56 1.5.3 Trung bình chiều dài từ tính theo ký tự 57 1.5.4 Trung bình chiều dài từ tính theo âm tiết 58 1.5.5 ộ phong phú từ vựng 59 1.5.6 Tần số từ tính theo phương pháp thống kê 64 1.5.7 Tần số từ tính theo phương pháp kiểm định thống kê 66 1.6 Tiểu kết 68 CHƯƠNG 2: MỨC ĐỘ ẢNH HƯỞNG CỦA CÁC YẾU TỐ TỪ VỰNG TRONG ĐỘ ĐO PHONG CÁCH CÁC VĂN BẢN BÁO CHÍ TIẾNG VIỆT: TRƯỜNG HỢP CÁC YẾU TỐ TỪ VỰNG THUỘC PHƯƠNG DIỆN HÌNH THỨC 70 2.1 Mức độ ảnh hưởng Phân bố chiều dài từ tính theo ký tự 70 2.2 Mức độ ảnh hưởng Phân bố chiều dài từ tính theo âm tiết 72 2.3 Mức độ ảnh hưởng Trung bình chiều dài từ tính theo ký tự 84 2.4 Mức độ ảnh hưởng Trung bình chiều dài từ tính theo âm tiết 88 2.5 Tiểu kết 90 ƢƠ TR 3: MỨ P Ả Á ƢỞNG CỦA CÁC YẾU TỐ TỪ VỰNG Á V BẢN BÁO CHÍ TIẾNG VIỆT: TRƯỜNG HỢP CÁC YẾU TỐ TỪ VỰNG THUỘC PHƯƠNG DIỆN NỘI DUNG 91 3.1 Mức độ ảnh hưởng ộ phong phú từ vựng 91 3.2 Mức độ ảnh hưởng Tần số từ tính theo phương pháp thống kê 105 3.2.1 Mức độ ảnh hưởng Tần số từ xưng hô 105 3.2.2 Mức độ ảnh hưởng Tần số từ thực thể có tên 109 3.2.3 Mức độ ảnh hưởng Tần số tác tử lập luận 115 3.2.4 Mức độ ảnh hưởng Tần số từ Hán Việt 120 3.2.5 Mức độ ảnh hưởng Tần số từ nước 123 3.2.6 Mức độ ảnh hưởng Tần số từ từ 126 3.2.7 Mức độ ảnh hưởng Tần số thành ngữ 128 3.3 Mức độ ảnh hưởng Tần số từ tính theo phương pháp phân tích tương ứng 134 3.3.1 Mức độ ảnh hưởng Tần số từ xưng hô 134 3.3.2 Mức độ ảnh hưởng Tần số từ thực thể có tên 140 3.3.3 Mức độ ảnh hưởng Tần số tác tử lập luận 145 3.4 Tiểu kết 150 ƢƠ 4: SỰ TƢƠ ỒNG VÀ KHÁC BIỆT VỀ MỨ ƢỞNG CỦA CÁC YẾU TỐ TỪ VỰ Á V TR P ẢNH Á BẢN BÁO CHÍ TIẾNG VIỆT VÀ TIẾNG ANH 152 4.1 Phân bố chiều dài từ tính theo ký tự 157 4.2 Trung bình chiều dài từ tính theo âm tiết 160 4.3 ộ phong phú từ vựng 163 4.4 Tần số từ tính theo phương pháp kiểm định thống kê 170 4.5 Thảo luận 186 4.6 Tiểu kết 186 KẾT LUẬN 188 Tài liệu tham khảo 194 DANH MỤC HÌNH VÀ BIỂU Ồ Trang Hình 0.1 Phần giới thiệu TG mục Góc nhìn Hình 0.2 Thang độ đánh giá mức độ ảnh hưởng YTTV đến nhiệm vụ 16 X DTTG Hình 0.3 Các câu lệnh Python 18 Hình 0.4 Cửa sổ RStudio sử dụng ngơn ngữ lập trình R 19 Hình 0.4a TXH1 nhà báo nữ, sinh từ 1975 trở trước 22 Hình 0.4b TXH1 nhà báo nữ, sinh từ 1975 trở trước VBÂD 24 Hình 1.2 Phân tích nguồn tác giả VBÂD 49 Hình 1.3 Bản Industrial Society and Its Future UN BOMBER đăng 49 The Washington Post The New York Times Hình 1.4 ịnh dạng liệu JSON 57 Hình 1.5 ịnh dạng liệu XML 58 Hình 3.3.1a TXH3 TG nhà báo nữ, sinh từ năm 1975 trở trước 141 Hình 3.3.1b TXH3 TG nữ nhà báo, sinh từ năm 1975 trở trước VBÂD 143 Hình 3.4.2a TTCT TG nữ nhà báo, sinh từ năm 1975 trở trước VBÂD 145 Hình 3.4.2b TTLL TG nữ nhà báo, sinh từ năm 1975 trở trước VBÂD 147 DANH MỤC BẢNG SỐ LIỆU Trang Bảng 1.1 Các số đo độ phong phú từ vựng TTR, W, H, S, K Bảng 0.2 ác YTTV khảo sát đối chiếu luận án Bảng 0.3 Các khối ngữ liệu nhóm VVC_Stylometry Bảng 0.4 Thơng tin VVC_Stylometry Telegraph Columnist Corpus Bảng 0.5 Số lượng lượt thực nghiệm xác định danh tính tác giả 13 Bảng 1.1 Từ vựng văn nghi vấn văn tác giả ứng viên 44 Bảng 1.2 Thang độ đánh giá kết xác định danh tính tác giả 44 Bảng 1.3 Các nhiệm vụ Phân tích nguồn TG PAN tổ chức 48 Bảng 1.4 Các vụ án dân hình có liên quan đến độ đo phong cách 50 Bảng 1.5 Các thực thể có tên thơng dụng 62 Bảng 2.1.1 So sánh PBCDT TG nữ nhà báo X1 84 Bảng 2.1.2 ường cong PBCDT TG 890 X1 85 Bảng 2.1.3 So sánh PBCDT tính theo ký tự TG nữ nhà nghiên cứu X2 88 Bảng 2.1.4 ường cong PBCDT TG 1020 X2 89 Bảng 2.1.5 So sánh PBCDT TG nam nhà báo X3 91 Bảng 2.1.6 ường cong PBCDT TG 403 X3 92 Bảng 2.1.7 So sánh PBCDT TG nam nhà nghiên cứu X4 95 Bảng 2.1.8 ường cong PBCDT TG 1057 X4 97 Bảng 2.1.9 So sánh PBCDT 10 TG thuộc nhóm khác X5 98 Bảng 2.1.10 ường cong PBCDT TG 342 X5 99 Bảng 2.1.11 Tỉ lệ xác PB DT tính theo đơn vị ký tự 102 Bảng 2.2.1 Tỉ lệ xác PB DT tính theo đơn vị âm tiết 103 Bảng 2.3.1 Bảng 2.3.1 So sánh TBCDT TG nữ nhà báo X1 105 Bảng 2.3.2 Tỉ lệ xác PB DT tính theo đơn vị ký tự 107 Bảng 2.4.1 So sánh TBCDT TG nữ nhà nghiên cứu X2 108 Bảng 2.4.2 Tỉ lệ xác PB DT tính theo đơn vị âm tiết 109 Bảng 3.1.1 Số lượng lượt từ, dạng từ, từ xuất lần từ xuất hai 110 lần TG Bảng 3.1.2 ộ phong phú từ vựng TG 111 Bảng 3.1.3 Tỉ lệ xác PPTV 113 Bảng 3.2.1 TXH TG nữ nhà báo 114 Bảng 3.2.2 Tỉ lệ xác tần số TXH1 tính theo thống kê 115 Bảng 3.3.3 Tỉ lệ xác tần số TXH3 tính theo thống kê 116 Bảng 3.2.4 TTCT TG nữ nhà báo 117 Bảng 3.2.5 Tỉ lệ xác tần số TTCT tính theo thống kê 119 Bảng 3.2.6 TTLL nhà báo nữ 119 Bảng 3.2.7 Tỉ lệ xác tần số TTLL tính theo thống kê 121 Bảng 3.2.8 Tỉ lệ xác tần số từ Hán Việt tính theo thống kê 125 Bảng 3.2.9 Tỉ lệ xác tần số từ nước ngồi tính theo phương pháp 128 thống kê Bảng 3.2.10 Tỉ lệ xác tần số từ tính theo thống kê 132 Bảng 3.2.11 Tỉ lệ xác tần số thành ngữ tính theo thống kê 136 Bảng 3.3.1 Bốn viết chọn phân tích tươn ứng TG 342 137 Bảng 3.3.2 Bốn viết chọn phân tích tương ứng TG 129 138 Bảng 3.3.3 Bốn viết chọn phân tích tương ứng TG 49 138 Bảng 3.3.4 Tỉ lệ xác tần số TXH1 tính theo phương pháp phân 139 tích tương ứng Bảng 3.3.5 Tỉ lệ xác tần số TXH3 tính theo phương pháp phân 144 tích tương ứng Bảng 3.3.6 Tỉ lệ xác tần số TT T tính theo phân tích tương ứng 146 Bảng 3.3.7 Tỉ lệ xác tần số TTLL tính theo phân tích tương ứng 148 Bảng 4.1 Tỉ lệ xác phân bố chiều dài từ theo ký tự tiếng Việt 150 tiếng Anh Bảng 4.2 Tỉ lệ xác phân bố chiều dài từ tính theo âm tiết tiếng 154 Việt tiếng Anh Bảng 4.3 Tỉ lệ xác độ phong phú từ vựng tiếng Việt tiếng Anh 156 Bảng 4.4 Những từ có tần số cao TG sử dụng 157 VVC_Stylometry Bảng 4.5 Tỉ lệ xác tần số từ tính theo kiểm định thống kê tiếng Việt tiếng Anh 160 186 Những tranh luận rơi vào ba góc độ khác nhau, nằm vị trí giao thoa phân tích nguồn TG điều tra tội phạm: (1) quan điểm phương pháp nghiên cứu phù hợp có liên quan đến khoa học; (2) khái niệm giả định lý thuyết chủ yếu đến từ ngành ngôn ngữ học; (3) ý kiến khác liên quan đến vai trò chuyên gia, giá trị chứng minh, việc đánh giá báo cáo kết tìm khung lý thuyết tương ứng Những nội dung cho thấy Phong cách trắc học có yếu tố pháp lý Ngơn ngữ học điều tra xem ngành khoa học hình Theo đó, cơng trình nghiên cứu P mở rộng cho ba nội dung với mức độ khác Trong trường hợp tìm nguồn TG, tự động X DTTG nhiệm vụ tiến hành ngành khoa học máy tính, vừa có hội lại vừa có thách thức Một mặt, phương pháp hỗ trợ dẫn dắt máy tính cho thấy tiềm việc áp dụng hướng tiếp cận định lượng Mặt khác, điều địi hỏi phải có cân nhắc áp dụng phương pháp bối cảnh điều tra tội phạm xử lý liệu tội phạm Giá trị phân tích thống kê nhiệm vụ xác định danh tính TG ln nhận đồng thuận cao cộng đồng nghiên cứu khoa học: thống kê củng cố thêm độ tin cậy kết phân tích cách độc lập, ý nghĩa dạng cho phép ―đánh giá giá trị minh chứng độ đo định lượng‖ (Ishihara, 2017, tr 68) ác nhà nghiên cứu có quan điểm khác nằm cách kết hợp phân tích ngơn ngữ phân tích thống kê mức độ áp dụng phân tích thống kê Cả hai hướng tiếp cận nhằm phân tích phong cách viết TG Trong đó, phân tích phong cách sử dụng lặp lại yếu tố ngôn ngữ, lý giải ý nghĩa tần số dạng lẫn vắng mặt chúng Một khác biệt lớn quan điểm khác khái niệm phong cách sử dụng phương pháp tính tốn định lượng với phương pháp định tính Bằng việc khảo sát khái niệm phong cách khác nhà nghiên cứu đưa ra, ta suy luận mà nhà nghiên cứu tin họ đạt từ kết phân tích phong cách viết TG Những đạt phát biểu kết luận văn nguồn TG văn iểm khác biệt thứ hai hai hướng tiếp cận định lượng định tính lại khơng nằm lượng hóa đặc trưng ngơn ngữ mà nằm cách xác định chúng Trong hướng tiếp cận định 187 lượng gọi hướng tiếp cận tự động, YTTV thường xác định trước P sử dụng, P này, ví dụ PPTV Luận án phát triển tảng liên ngành, kế thừa phát huy mạnh từ phân ngành thuộc ngành Ngôn ngữ học, thống kê học điều tra hình Nội dung luận án có phạm vi rộng lớn, liên quan đến nhiều lĩnh vực chuyên môn, nghiên cứu kết hợp hai hướng tiếp cận: hướng tiếp cận định tính dựa miêu tả ngơn ngữ hướng tiếp cận định lượng dựa tính tốn Vì vậy, luận án sử dụng P để thực nhiệm vụ X DTTG Việc X DTTG không khảo sát vài YTTV bề mặt, mà phải xem xét cách toàn diện mức độ ảnh hưởng YTTV mà TG sử dụng ể trả lời hai câu hỏi nghiên cứu cách hiệu quả, mơ hình nghiên cứu xây dựng tảng Ngôn ngữ học định lượng, Ngôn ngữ học khối liệu với hỗ trợ công cụ tự động việc lưu trữ xử lý liệu Trước hết, luận án tập trung vào nhiệm vụ X DTTG từ góc độ ngơn ngữ học định lượng, bắt đầu định nghĩa khái niệm ―phong cách ngôn ngữ‖, ―độ đo phong cách‖, ―yếu tố từ vựng‖ giải thích khác biệt loại nhiệm vụ cụ thể mà nhà nghiên cứu P gặp xác định nguồn TG, nhiệm vụ: X DTTG, xác minh TG, xác định thông tin TG, bắt chước phong cách viết gây nhiễu phong cách viết Ngồi ra, luận án trình bày khác biệt hướng tiếp cận định tính hướng tiếp cận định lượng tự động nhiệm vụ X DTTG Những nội dung thảo luận lý thuyết minh họa vụ án ngồi nước có áp dụng P để làm manh mối phá án mức độ khác Với câu hỏi nghiên cứu thứ nhất, luận án khảo sát 79 YTTV bốn nhóm P khác nhau: nhóm độ đo chiều dài từ (gồm bốn yếu tố: PBCDT tính theo ký tự, PBCDT tính theo âm tiết, TBCDT tính theo ký tự, TBCDT tính theo âm tiết); nhóm độ đo liên quan đến PPTV (gồm số: TTR, H, S, W K); nhóm độ đo tần số từ 11 TXH, 11 TTCT 11 TTLL, lớp từ: từ Hán Việt, từ nước ngoài, từ mới, thành ngữ (khi tính theo thống kê bản); nhóm độ đo tần số từ 11 TXH, 11 TTCT 11 TTLL (khi tính theo kiểm định thống kê) Kết khảo sát khối ngữ liệu tiếng Việt VV _Stylometry sau: 188 (1) Các yếu tố thành công tần số TXH1, TXH3, TTCT TTLL (khi tính theo kiểm định thống kê, cụ thể theo phương pháp phân tích tương ứng dựa khoảng cách chi-squared) Với tỉ lệ xác cao, nghĩa tỉ lệ X DTTG xác phải 75%, yếu tố có mức độ ảnh hưởng lớn đến P tiếng Việt iều nghĩa chúng ưu tiên áp dụng nhiệm vụ X DTTG (2) Các yếu tố nằm mức cao, nghĩa tỉ lệ X DTTG xác đạt 50%, bao gồm TBCDT tính theo âm tiết, PPTV (chỉ số TTR, W K), tần số lớp từ vựng đánh dấu sắc thái phong cách từ Hán Việt, từ nước ngoài, từ mới, thành ngữ (khi tính theo thống kê bản) Với tỉ lệ xác cao, yếu tố có mức độ ảnh hưởng lớn đến P tiếng Việt iều nghĩa chúng ưu tiên áp dụng việc X DTTG, sau nhóm YTTV thành cơng mức cao (3) Các yếu tố nằm mức thấp, nghĩa tỉ lệ X DTTG xác 25%, bao gồm ba yếu tố cịn lại nhóm chiều dài từ, gồm PBCDT tính theo đơn vị ký tự, PB DT tính theo đơn vị âm tiết, TBCDT tính theo đơn vị ký tự; hai số PPTV liên quan đến từ xuất lần từ xuất hai lần (chỉ số H S), tần số TXH1, TXH3, TTCT, TTLL (khi tính theo thống kê bản) Với tỉ lệ xác thấp, yếu tố có mức độ ảnh hưởng đến tiếng Việt P iều nghĩa chúng có chút tiềm năng, nhiên không nên ưu tiên áp dụng việc X DTTG (4) Trong số 79 YTTV khảo sát, khơng có yếu tố mức thấp iều có nghĩa khơng có yếu tố khơng có tiềm việc xác định X DTTG, tỉ lệ xác có khác biệt lớn yếu tố phương pháp tính tốn (5) Nhìn chung, với yếu tố (ví dụ tần số TXH1), tỉ lệ xác phương pháp kiểm định thống kê cao so với phương pháp thống kê (6) Ngoài ra, xét số lượng TG, nhìn chung, lượt thực nghiệm TG kết X DTTG xác Xét thơng tin TG, nhìn chung, kết cao thường trường hợp X DTTG cho TG ứng viên thuộc 189 nhóm xã hội học khác nhau, kết thấp thường trường hợp TG nữ nhà nghiên cứu Với câu hỏi nghiên cứu thứ hai, để đối chiếu mức độ ảnh hưởng 10 YTTV P tiếng Anh với P tiếng Việt, luận án sử khối ngữ liệu tiếng Anh có tính chất đối sánh: Telegraph Columnist Corpus (Grieve, 2007) Việc đối chiếu mức độ ảnh hưởng YTTV tiếng P ngữ liệu tiếng Việt ngữ liệu nh có ý nghĩa lớn Kết quả, luận án nhận thấy có điểm tương đồng khác biệt sau: (7) iểm tương đồng: PPTV khơng có nhiều ý nghĩa hai ngôn ngữ, tần số TXH1, TXH3 tần số TTLL (khi tính theo kiểm định thống kê) yếu tố hiệu để X DTTG Ngồi ra, mức độ xác tăng số lượng TG ứng viên giảm Kết cao thường thuộc trường hợp tối thiểu, có hai TG ứng viên Liên quan đến phong cách ngôn ngữ văn thuộc TG văn thuộc TG khác nhau: tiếng Việt lẫn tiếng Anh, qua thực nghiệm cho thấy độ chênh phong cách ngôn ngữ văn thuộc TG thường nhỏ nhiều so với độ chênh phong cách ngôn ngữ văn thuộc TG khác Do đó, dù TG có tác phẩm với chủ đề khác nhau, thời gian viết khác nhau, ngữ vực thể loại văn khác nhau, so với phong cách ngôn ngữ tác phẩm TG khác chúng đảm bảo tính qn vài khía cạnh Hay nói cách khác, nhiệm vụ X DTTG thực cho miền khác (cross-domain), ví dụ khác thể loại văn bản, khác chủ đề, khác ngữ vực, v.v (8) iểm khác biệt: Qua nhiều lượt thực nghiệm, luận án tìm số điểm khác biệt đáng ý sau: Về PBCDT tính theo ký tự: yếu tố ảnh hưởng đến tiếng Việt đạt mức lớn đến P P tiếng Anh Kết PBCDT tính theo ký tự cho thấy độ xác tăng lên tăng chiều dài từ Do đó, đối chiếu tiếng Anh tiếng Việt, độ xác yếu tố tiếng nh cao tiếng Việt 190 Về TBCDT tính theo âm tiết: yếu tố có ảnh hưởng lớn đến tiếng Việt không ảnh hưởng nhiều đến P P tiếng Anh Về lớp từ: Trong tiếng Anh, thực từ yếu tố không hiệu việc X DTTG, tiếng Việt, thực từ chứng minh yếu tố hiệu quả, thể qua tỉ lệ xác mức cao (khi tính theo kiểm định thống kê) cao (khi tính theo thống kê bản) tiểu loại danh từ riêng số từ, phần thể qua tỉ lệ xác lớp từ đánh dấu điệu tính phong cách từ Hán Việt, từ nước ngoài, từ mới, thành ngữ (trong lớp từ này, tuyệt đại đa số thực từ) (9) Về ngữ liệu nghiên cứu: việc xây dựng khối ngữ liệu VVC_Stylometry với nhiều khía cạnh tương đồng với Telegraph Columnist Corpus Grieve (2007), luận án xem cơng trình nghiên cứu quy mơ lớn đối chiếu mức độ ảnh hưởng YTTV P tiếng Việt tiếng Anh thông qua mức độ xác chúng lượt thực nghiệm X DTTG Với nguồn ngữ liệu này, nhà nghiên cứu tiếp cận nguồn ngữ liệu đáng tin cậy, thích nhiều thơng tin hữu ích Luận án rõ trường hợp X TTG số lượng văn khảo sát bị hạn chế khách quan (điều thường xảy cơng tác điều tra thực tế), nhà phân tích cần phải cẩn trọng việc đưa kết luận nguồn TG Giải pháp tối ưu cho tình sử dụng đồng thời nhiều YTTV khác nhau, gồm YTTV thuộc phương diện hình thức lẫn phương diện nội dung, gồm YTTV thuộc lớp từ loại lớp từ đánh dấu sắc thái phong cách, gồm phương pháp thống kê kiểm định lẫn thống kê ó vậy, độ tin cậy tăng lên đáng kể so với việc khảo sát riêng lẻ YTTV phương pháp tính tốn (10) Ngồi ra, luận án đề xuất quy trình chung cho việc giải vụ việc liên quan đến X DTTG cho văn tiếng Việt Có thể nói, việc X DTTG cho VBÂD hồn tồn thực tiếng Việt Như vậy, YTTV với tỉ lệ xác chúng việc X DTTG đánh giả cách tồn diện Luận án tìm tập hợp YTTV có tỉ lệ xác mức cao đảm bảo lực xác định TG 191 ngưỡng tiêu chuẩn tăng lên để đảm bảo hiệu lực tình pháp lý, ví dụ điều tra tội phạm Do đó, TG luận án đề xuất quy trình áp dụng để góp phần đưa manh mối giải vụ án liên quan đến VBÂD, nặc danh mạo danh Về hạn chế, kích cỡ ngữ liệu khơng phải yếu tố P , kích cỡ ngữ liệu lớn kết đạt cải thiện Bên cạnh đó, có số nhà nghiên cứu cho độ phức tạp nhiệm vụ nghiên cứu lớn quy mơ khối ngữ liệu phải lớn Vì P so sánh VBÂD với văn TG ứng viên, nên ngữ liệu đầu vào gồm VBÂD lẫn văn TG ứng viên Nói chung, phong cách viết TG đại diện nhiều văn để tăng thêm xác suất kiểu sử dụng từ ngữ mẫu nghiên cứu đặc điểm riêng cá nhân TG Một hạn chế khác liên quan đến ngữ liệu dùng để đối chiếu YTTV độ đo phong cách tiếng Việt tiếng Anh Cụ thể luận án lựa chọn hai nguồn ngữ liệu có mức độ tương đồng cao, số lượng văn TG lẫn số lượng từ văn VV _Stylometry Telegraph Columnist Corpus Ngồi ra, dù biết ảnh hưởng yếu tố thời gian đến chủ đề văn bản, chi phối bối cảnh xã hội, kinh tế, trị đến quan điểm TG điều tránh khỏi, nhiên việc lựa chọn ngữ liệu tiếng nh tương thích với ngữ liệu tiếng Việt VV _Stylometry điều kiện chuyên mục Góc nhìn đời năm 2014 thử thách lớn Hướng phát triển tương lai thực nghiệm nguồn ngữ liệu tiếng Việt lớn hơn, việc đối chiếu ngơn ngữ địi hỏi hai nguồn ngữ liệu Việt Anh phải tương đồng nhiều khía cạnh tốt: chủ đề, thời gian, mục đích giao tiếp, đối tượng giao tiếp, chí kích cỡ ngữ liệu Ngồi ra, khung nghiên cứu thông dụng cho việc kiểm định thuật tốn nhiệm vụ X DTTG tập ứng viên đóng, tức cho trước mẫu nghiên cứu gồm văn tham chiếu nhóm nhỏ xác định gồm TG ứng viên, nhiệm vụ đặt xác định người có nhiều khả TG văn chưa biết nguồn TG Nhiệm vụ X DTTG gặp nhiều thử thách trường hợp độ dài văn ngắn, văn có chủ đề thể loại khác Trong thực tế, 192 TG thực văn gây tranh cãi lúc nằm danh sách TG ứng viên, hay gọi trường hợp tập ứng viên mở Mỗi trường hợp Phong cách trắc học Ngôn ngữ học điều tra, nguyên tắc, thuộc thể loại khác Theo quan điểm khơng thể có loại hướng tiếp cận cho việc phân tích thể loại văn xuất hệ thống pháp lý khác Tính chất cá biệt hóa tình thách thức việc đồng phương pháp nghiên cứu làm cho Phong cách trắc học Ngôn ngữ học điều tra trở thành phân ngành Ngơn ngữ học ứng dụng có tính đặc thù Trong phần Inferring the Criminal’s Identity sách Criminal Semiotics (Danesi, 2014, tr 71) có nói phạm vi hiệu lực nhiệm vụ xác định thông tin tội phạm: It is a contributory technique, like semiotics itself, that can assess scenarios as being likely or not, on the basis of known personality traits, situational features, statistics, and other tools of inference ( ây kỹ thuật mang tính đóng góp vào cơng tác điều tra, giống ngành Ký hiệu học, đánh giá tình hình mức độ nào, dựa sở thơng tin có đặc điểm tính cách, đặc trưng tình huống, thống kê, cơng cụ suy luận khác) Nói cách khác, khơng có phương pháp phân tích văn phạm tội Trong trường hợp, nhà nghiên cứu phải xác định tình nói cách cẩn thận, nghiên cứu liệu, quan sát tượng xảy ra, thiết lập giả thuyết không giả thuyết nghiên cứu, lựa chọn công cụ ngôn ngữ học cơng cụ khác phù hợp để tìm dấu vết mà văn phạm tội để lại, phân tích liệu cách khách quan, hệ thống xác, đồng thời đến kết luận dựa kết thu Phương pháp nghiên cứu sử dụng phải dựa sở khoa học, lặp lại tái tạo nhà nghiên cứu khác để đáp ứng tiêu chuẩn để tòa án chấp nhận Ngồi tảng kiến thức chun mơn ngơn ngữ, thống kê học chí chuyên môn công tác điều tra, nhà nghiên cứu Phong cách trắc học Ngơn ngữ học điều tra địi hỏi phải có kỹ quan sát tính sáng tạo khoa học để phát dấu vết, chuyển hóa thành chứng ngơn ngữ hỗ trợ tòa án việc đưa định xác Tóm lại, luận án đánh giá mức độ ảnh hưởng YTTV đến P tiếng Việt để tìm yếu tố giúp cho nhiệm vụ X DTTG xác hiệu ồng thời, luận án đối chiếu mức độ ảnh hưởng YTTV 193 đến P tiếng nh để thấy tương đồng khác biệt hai ngơn ngữ, góp phần mở rộng kiến thức P tiếng Việt so với ngôn ngữ khác giới Luận án nhằm mục đích đáp ứng yêu cầu đổi Phong cách trắc học Với vai trị cơng trình nghiên cứu khoa học, luận án trình bày kết tìm dựa quy mơ thực nghiệm lớn với nguồn ngữ liệu đảm bảo độ tin cậy để làm tảng cho hướng phát triển Nếu khắc phục hạn chế trên, toán tự động X DTTG văn tiếng Việt có nhiều bước phát triển mạnh mẽ Trên sở đó, cơng tác điều tra gặt hái nhiều thành công hơn, đặc biệt kỷ nguyên công nghệ thông tin 194 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt Diệp Quang Ban (2012) Giao tiếp diễn ngôn Cấu tạo văn bản, (Tái lần 2), NXB Giáo dục Việt Nam ỗ Hữu Châu (1997) Các bình diện từ từ tiếng Việt NXB HQG Hà Nội ỗ Hữu Châu (1997) Từ vựng - ngữ nghĩa tiếng Việt (In lần thứ hai) NXB HQG Hà Nội ỗ Hữu hâu, Bùi Minh Toán (2011) ại cương ngôn ngữ học - tập (Tái lần thứ sáu) NXB Giáo dục Việt Nam Bùi Minh Toán chủ biên (2017) Hư từ tiếng Việt bình diện ngữ nghĩa, ngữ pháp, ngữ dụng NXB HQG Hà Nội Cao Xuân Hạo (2017) Tiếng Việt - Sơ thảo ngữ pháp chức (Tái lần 1) NXB Khoa học xã hội Mai Ngọc Chừ, Vũ ức Nghiệu, Hoàng Trọng Phiến (2008) Cơ sở Ngôn ngữ học tiếng Việt (Tái lần thứ chín) NXB Giáo dục Nguyễn ức Dân, ặng Thái Minh (1999) Thống kê Ngôn ngữ học - số ứng dụng NXB Giáo dục Nguyễn ức Dân (2004) Ý ngôn ngoại Ngôn ngữ 2(177), 1-10 Nguyễn ức Dân (2018) Lơgích Tiếng Việt NXB HQG TPHCM Nguyễn Văn Dững (2016) Hướng cho báo chí mơi trường truyền thơng số (Nhìn từ trường hợp báo chí Việt Nam) Lý luận trị 6, 96-101 inh iền (2018) Ngôn ngữ học khối liệu (Sách chuyên khảo) NXB HQG TPHCM Nguyễn Thiện Giáp (2016) Từ vựng học tiếng Việt NXB HQG Hà Nội Nguyễn Hịa (2008) Phân tích diễn ngơn Một số vấn đề lý luận phương pháp (Tái lần 2) NXB HQG TPHCM Nguyễn Thái Hòa (1997) Dẫn luận Phong cách học NXB Giáo dục inh Trọng Lạc (1994) 99 phương tiện biện pháp tu từ tiếng Việt, (Tái lần 9) NXB Giáo dục inh Trọng Lạc (1994) Phong cách học văn NXB Giáo dục inh Trọng Lạc (1997) Phong cách học tiếng Việt NXB HQG Hà Nội inh Trọng Lạc & Nguyễn Thái Hòa (2009) Phong cách học tiếng Việt NXB Giáo dục Thanh Lan (2018) Một đề xuất thuật ngữ gọi tên từ loại bước phân định từ loại tiếng Việt (The proposal of the terminology defining parts of speech and the steps to delimit parts of speech in Vietnamese) Tạp chí Từ điển học Bách khoa thư Viện hàn lâm Khoa học xã hội Việt Nam ISSN 1859-3135, Số (54), 7/2018, 12 – 18 195 Lê Văn Lý (1971) Sơ thảo ngữ pháp Việt Nam Trung tâm học liệu Sài Gòn Trần ại Nghĩa (2004) Ngữ pháp đại từ 'nó' thơ Năm chúc Tế Xương Ngôn ngữ số 3(178), 75 – 76 Hoàng Phê (chủ biên) (2003) Từ điển tiếng Việt, Tái lần thứ 7, NXB Nẵng Hoàng Phê (chủ biên) (2022) Từ điển tiếng Việt, NXB Hồng ức Thản (1988) Từ ngôn ngữ chung đến ngôn ngữ nghệ thuật, NXB Khoa học Xã hội Bùi Khánh Thế cộng (2001) Mấy vấn đề tiếng Việt đại NXB HQG TPHCM ù ình Tú (1983) Phong cách đặc điểm tu từ tiếng Việt, NXB ại học Trung học Chuyên nghiệp Nguyễn Như Ý cộng (2001) Từ điển giải thích thuật ngữ Ngơn ngữ học NXB Giáo dục Trung tâm Ngôn ngữ học Tính tốn (Computational Linguistics Center) Website: www.clc.hcmus.edu, ại học Khoa học Tự nhiên – HQG TPHCM Ủy ban Khoa học xã hội Việt Nam (1983) Ngữ pháp tiếng Việt NXB Khoa học Xã hội VnExpress.Tin vụ án giết người Hải Dương nhất: ao Tài Năng, kẻ đốt xác chủ nợ Hải Dương gây án nào? (vnexpress.net) Truy cập ngày 14/9/2022 196 Tài liệu tiếng nƣớc Abbasi, A., Chen, H., (2008) Writeprints: a stylometric approach to identity-level identification and similarity detection in cyberspace ACM Trans Inf Syst 26(2) DOI: 10.1145/1344411.1344413 Afroz, S., Brennan, M., & Greenstadt, R (2012) Detecting Hoaxes, Frauds, and Deception in Writing Style Online, IEEE Symposium on Security and Privacy Baayen, H R (2001) Word Frequency Distributions Kluwer Academic Press, Dordrecht Barlow, M (2013) Individual differences and usage-based grammar International Journal of Corpus Linguistics 18(4), 443–478, DOI: 10.1075/ijcl.18.4.01bar, E-ISSN 1569–9811 John Benjamins Publishing Company Biber, D & Conrad, S (2009) Register, genre, and style Cambridge University Press Biber, D , Johansson, S., Leech, G N., Conrad, S., Finegan, E (2021) Grammar of Spoken and Written English ISBN 978 90 272 6047 (e-book), 978 90 272 0796 (Hb) Amsterdam / Philadelphia: John Benjamins Publishing Company Brezina, V (2018) Statistics in Corpus Linguistics: A Practical Guide Cambridge: Cambridge University Press Brunet, E (1978) Vocabulaire de Jean Girandoux: Structure et évolution Paris: Slatkine Burke, M (2014), The Routledge Handbook of Stylistics Routledge Burrows, J (2002) ‗Delta‘: a Measure of Stylistic Difference and a Guide to Likely Authorship, Literary and Linguistic Computing 17(3), 267-287 Centre for Forensic Text Analysis - Aston University (2020) [Online] Available: https://www.aston.ac.uk/research/forensic-linguistics/forensic-text-analysis (Access 8/9/2021) Chaski, C (2005) Who’s at the keyboard? Authorship attribution in digital evidence investigations, IJDE 4(1) Chaski, C (2005) Forensic Science and Law: Investigative Applications in Criminal, Civil and Family Justice In Wecht, C H.; Rago, J T (eds.) CRC Press ISBN 978-1-4200-5811-6 Chaski, C (2013) Best practices and admissibility of forensic author identification J Law Policy 21(2), 333 – 376 Chomsky, N (1996) Reflection on Language Resonance, Journal of Social Science 3, 85 – 104 Coulthard, M., Johnson, A (2007) An Introduction to Forensic Linguistics: Language in Evidence London: Routledge Coulthard, M., Johnson, A (2010) A Handbook of Forensic Linguistics: Language in Evidence London: Routledge 197 Coupland, N (2007) Style: language variation and identity Cambridge: Cambridge University Press Daelemans W (2013) Explanation in computational stylometry, Computational Linguistics and Intelligent Text Processing, 7817 Lecture Notes in Computer Science, 451 – 462 Daelemans, W et al (2019) Overview of PAN 2019: bots and gender profiling, celebrity profiling, cross-domain authorship attribution and style change detection, in Crestani, F et al (eds) Experimental IR Meets Multilinguality, Multimodality, and Interaction, 402 – 416 Springer Deschamps, R (2017) Correspondence Analysis for Historical Research with R, The Programming Historian https://programminghistorian.org Accessed 10 October 2021 FBI (2008) FBI 100: The Unabomber http://www.fbi.gov ccessed 10 October 2021 Fialho, O & Zyngier, S (2014) Quantitative methodological approaches to stylistics In Burke, M Stylistics: From classical rhetoric to cognitive neuroscience Routledge Grant, T (2007) Quantifying evidence in forensic authorship analysis, International Journal of Speech Language and the Law, 14(1), 1–25 Grant, T (2008) Approaching questions in forensic authorship analysis, in J Gibbons and M.T Turell (eds), Dimensions of Forensic Linguistics, Amsterdam: John Benjamins, 215 – 29 Grant, T (2010) Txt 4n6: Idiolect free authorship analysis? in M Coulthard and A Johnson (eds), 508 – 522 Gries, S (2019) Quantitative Corpus Linguistics with R: A Practical Introduction.London: Routledge Grieve, J (2007) Quantitative authorship attribution: An evaluation of techniques Literary and Linguistic Computing 22(3) 251 – 270 DOI: 10.1093/llc/fqm020 Ho, Y (2011) Corpus Stylistics in Principles and Practice A Stylistic -Exploration of John Fowles’ The Magus New York: Continuum Ho, N L et al (2020) Identifying Authors Based on Stylometric Measures of Vietnamese texts, Proceedings of the 34th Pacific Asia Conference on Language, Information and Computation, 447 – 452 Holmes, D (1991) Vocabulary richness and the prophetic voice Literary and Linguistic Computing 6(4), 259–268 DOI: 10.1093/llc/6.4.259 Holmes, D (1992) A stylometric analysis of Mormon scripture and related texts Journal of Royal Statistical Society Series A (Statistics in Society) 155(1), 91– 120 DOI: 10.2307/2982671 198 Holmes, D (1995) The Federalist revisited: new directions in authorship attribution Literary and Linguistic Computing 10(1), 111–127 Holmes, D (1997) Stylometry, its origins, development and aspirations Session entitled ―The State of Authorship Atribution Studies‖ in Rudman, J., Holmes, D., Tweedie F & Baayen, H R (chairs) ACH-ALLC ’97 Joint International Conference for the Association for Computers and the Humanities and the Association for Literary and Linguistic Computers, Ontario, Canada Honoré, A (1979) Some simple measures of richness of vocabulary Association for Literary and Linguistic Computing Bulletin 7(2), 172 – 177 Juola, P (2007) Authorship Attribution, Foundations and Trends Information Retrieval 1(3), 233 – 334, DOI: 10.1561/1500000005 Juola, P (2013) Stylometry and immigration: A case study Journal of Law and Policy 21(2), 287–298 Juola, P., Mikros, G K & Vinsick, S (2018): Correlations and Potential CrossLinguistic Indicators of Writing Style, Journal of Quantitative Linguistics, DOI: 10.1080/09296174.2018.1458395 Koppel, M., Schler, J., Bonchek-Dokow, E (2007) Measuring differentiability: unmasking pseudonymous authors J Mach Learn Res 8(6), 1261 – 1276 Koppel, M., Schler, J (2003) Exploiting stylistic idiosyncrasies for authorship attribution, in IJCAI’03 Workshop on Computational Approaches to Style Analysis and Synthesis, 69 – 72 Koppel, M., Schler, J., Argamon, S (2009) Computational Methods in Authorship Attribution Journal of the Association for Information Science and Technology 60(1), 9–26, DOI: 10.1002/asi.v60:1 Koppel, M., Schler, J., Argamon, S., Winter, Y (2012) The ―fundamental problem‖ of authorship attribution Engl Stud 93(3), 284–291 Labov, W (2010) Principles of linguistic change, vol 3: Cognitive and cultural factors Oxford: Wiley-Blackwell ISBN 978-1-4443-2788-5 Lakoff G., Wehling E., (2012) The Little Blue Book: The Essential Guide to Thinking and Talking Democratic New York: Free Press Laramée, F D (2018) Introduction to stylometry with Python, Programming Historian 7, DOI: 10.46430/phen0078 Lee, J J., Cho, H Y., Park, H R., (1999) N-gram-based indexing for Korean text retrieval Inf Process Manage 35(4), 427–441 McCarth, R., O'Sullivan, J (2020) Who wrote Wuthering Heights? Digital Scholarship in the Humanities 36(2), 383–391 DOI:10.1093/llc/fqaa031 McEnery, T., & Hardie, A (2011) Corpus linguistics: Method, theory and practice Cambridge: Cambridge University Press McMenamin (2002) Forensic Linguistics Advances in Forensic Stylistics CRC Press 199 McMenamin (2010) Forensic stylistics Theory and practice of forensic stylistics, in M Coulthard and A Johnson (eds), 487–507 Mealand, D L (1995) Correspondence Analysis of Luke Literary and Linguistic Computing 10, 85-98 Mendenhall, T.C (1887) The Characteristic Curves of Composition, Science 9(214), 237-249 Mosteller, F (1987) A Statistical Study of the Writing Styles of the Authors of the Federalist Papers, Proceedings of the American Philosophical Society 131(2), 132-140 Oakes, M P (2014) Literary Detective Work on the Computer Philadelphia: John Benjamins PAN (2019) Cross-Domain Authorship Attribution 2019 [Online] Available: https://pan.webis.de Accessed 8/9/2021 Pinker, S (2014) The Sense of Style London: Penguin Books Rudman J (1998) The state of authorship attribution studies: some problems and solutions Comput Humanit 31(4), 351–365 Rygl J (2017) Advanced Techniques of Natural Language Processing NLP Centre, FI MU, Brno Saferstein, R (2019) Forensic Science from the Crime Scene to the Crime Lab Pearson Savoy, J (2017), Analysis of the style and the rhetoric of the American presidents over two centuries Glottometrics 38(1), 55–76 Savoy, J (2018) Analysis of the style and the rhetoric of the 2016 US presidential primaries Digit Scholarsh Humanit 33(1), 143–159 Savoy, J (2020) Machine Learning Methods for Stylometry, Springer Nature Switzerland AG DOI: 10.1007/978-3-030-53360-1 Sichel, H S (1975) On a distribution law for word frequencies Journal of the American Statistical Association 70, 542–547 Smith J A., Kelly C., (2002) Stylistic constancy and change across literary corpora: using measures of lexical richness to date works Comput Humanit 36(4), 411–430 Sproat, R (1992) Morphology and Computation Cambridge: The MIT Press Stamatatos E., Fakotakis N., Kokkinakis G (2000) Text genre detection using common word frequencies, Proceedings of the 18th conference on Computational linguistics - Volume 2, 808–814 Stamatatos, E (2008) A Survey of Modern Authorship Attribution Method, Journal of the American Society for Information Science and Technology 60(3), 538–556 DOI: 10.1002/asi.2100 Stamatatos, E et al (2018) Overview of PAN 2018: author identification, author profiling, and author obfuscation In: Bellot, P et al (eds.) CLEF 2018 LNCS 11018, 267–285 Springer, Cham DOI: 10.1007/978-3-319-98932-725 200 Tausczik, Y R., Pennebaker, J W (2010) The psychological meaning of words: LIWC and computerized text analysis methods Journal of Language Society Psychology 29(1), 24–54 Thomas, (2019) Opinion columns In Vos, P V and Hanusch, F (General Editors), Dimitrakopoulou, D., Geertsema-Sligh M and Sehl, A (Associate Editors) The International Encyclopedia of Journalism Studies John Wiley & Sons, Inc DOI: 10.1002/9781118841570.iejs0212 Tweedie, F J., Baayen, R H., (1998) How variable may a constant be? Measures of lexical richness in perspective Computing Humanity 32(5), 323–352 Wales, K (2003) A Dictionary of Stylistics (Third Edition) Routledge Wimmer, G., & Altmann, G (1999) On vocabulary richness Journal of Quantitative Linguistics 6(1), 1–9 Wright, D (2017) Using word n-grams to identify authors and idiolects A corpus approach to a forensic linguistic problem International Journal of Corpus Linguistics 22(2), 212-241, John Benjamins E-ISSN 1569–9811 DOI: 10.1075/ijcl.18.4.01bar Yang, Y., Pederson, J O (1997) A comparative study of feature selection in text categorization, in Proceedings International Conference on Machine Learning New York: The ACM Press, 412–420 Yule, G (1944) The statistical study of literary vocabulary Cambridge: Cambridge University Press

Ngày đăng: 13/11/2023, 15:31

Tài liệu cùng người dùng

Tài liệu liên quan