Trên cơ sở tham khảo các công trình nghiên cứu của Simino và Short (2004), Mahlberg (2013, 2016), Ho (2011), bài viết giới thiệu những vấn đề chung nhất của phong cách học khối liệu (PCH KL) – một lĩnh vực nghiên cứu mới của phong cách học phương Tây đương đại. Bài viết gồm bốn phần chính: định nghĩa, cách tiếp cận và phương pháp nghiên cứu, những công trình nghiên cứu tiêu biểu, thế mạnh và giới hạn của PCH KL.
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH HO CHI MINH CITY UNIVERSITY OF EDUCATION TẠP CHÍ KHOA HỌC JOURNAL OF SCIENCE KHOA HỌC XÃ HỘI VÀ NHÂN VĂN SOCIAL SCIENCES AND HUMANITIES ISSN: 1859-3100 Tập 15, Số (2018): 81-95 Vol 15, No (2018): 81-95 Email: tapchikhoahoc@hcmue.edu.vn; Website: http://tckh.hcmue.edu.vn NHỮNG VẤN ĐỀ CƠ BẢN CỦA PHONG CÁCH HỌC KHỐI LIỆU Nguyễn Thế Truyền* Khoa Ngữ văn – Trường Đại học Sư phạm TP Hồ Chí Minh Ngày nhận bài: 21-5-2018; ngày nhận sửa: 07-7-2018; ngày duyệt đăng: 24-8-2018 TÓM TẮT Trên sở tham khảo cơng trình nghiên cứu Simino Short (2004), Mahlberg (2013, 2016), Ho (2011), viết giới thiệu vấn đề chung phong cách học khối liệu (PCH KL) – lĩnh vực nghiên cứu phong cách học phương Tây đương đại Bài viết gồm bốn phần chính: định nghĩa, cách tiếp cận phương pháp nghiên cứu, cơng trình nghiên cứu tiêu biểu, mạnh giới hạn PCH KL Từ khóa: phong cách học khối liệu, phân tích định lượng, phân tích định tính, cách tiếp cận dựa vào khối liệu, cách tiếp cận dẫn khối liệu ABSTRACT Basic issues of corpus stylistics Based on the work of Simino and Short (2004), Mahlberg (2013, 2016), and Ho (2011), this paper introduces the most common issues of corpus stylistics – a new study area of contemporary Western stylistics The paper has four main sections, including the definition, approach and research methodology, typical research works, strengths and limitations of corpus stylistics Keywords: corpus stylistics, quantitative analysis, qualitative analysis, corpus-based approach, corpus-driven approach Khái niệm phong cách học khối liệu Trong khoảng thời gian năm đầu kỉ XXI đến nay, với phát triển ngôn ngữ học khối liệu (corpus linguistics), người ta thường nói đến “bước ngoặt khối liệu” phong cách học (“corpus turn” in stylistics) (Leech & Short, 2007, p.286) Thuật ngữ “corpus stylistics” (phong cách học khối liệu – PCH KL) từ xuất với đời phân ngành phong cách học mới, hay theo cách nhìn nhận khác, phương pháp luận nghiên cứu phong cách học đương đại Theo Mahlberg thuật ngữ “corpus stylistics” phổ biến gần đây, ứng dụng phương pháp nghiên cứu với trợ giúp máy tính để phân tích văn văn chương có truyền thống lâu liên quan với tin học văn chương (literary computing) phong cách học máy tính (computational stylistics) (Mahlberg, 2016, p.144) * Email: nguyenthetruyen2004@yahoo.com 81 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 Hiện có số vấn đề định nghĩa khái niệm PCH KL Hoặc cách định nghĩa PCH KL hẹp phân tích văn văn chương sử dụng kĩ thuật ngôn ngữ học khối liệu PCH KL “quan tâm tới việc ứng dụng phương pháp khối liệu vào nghiên cứu văn chương miêu tả ngôn ngữ liên quan với đánh giá văn chương” (Mahlberg, 2013, p.5) Theo cách định nghĩa PCH KL, đơn giản ngôn ngữ học khối liệu với đối tượng nghiên cứu khác (văn chương tương phản với ngôn ngữ phi văn chương) Thực ra, từ trước đến nay, phong cách học (bao gồm kiểu khối liệu phi khối liệu) không quan tâm tới phân tích văn chương Vì thế, định nghĩa PCH KL nghiên cứu ngôn ngữ học khối liệu ngôn ngữ văn chương thu hẹp chấp nhận được” (McIntyre, 2015, p.61) Một cách hiểu khác: “Phong cách khối liệu ứng dụng lí thuyết, mơ hình, khung lí luận phong cách học vào phân tích khối liệu” (McIntyre, 2015, p.61) Cách hiểu McIntyre có phần lướt qua vai trị hệ phương pháp ngơn ngữ học khối liệu PCH KL, vấn đề PCH KL dựa công cụ lí thuyết kĩ thuật ngơn ngữ học khối liệu để nghiên cứu vấn đề liên quan đến phong cách ngôn ngữ PCH KL nối kết nguyên lí ngơn ngữ học khối liệu với phong cách học phong cách học văn chương PCH KL định vị ngữ cảnh rộng khoa học nhân văn kĩ thuật số (digital humanities) (Mahlberg, 2016, p.214) Ba thành tố tạo nên diện mạo PCH KL là: (1) Các khối liệu văn điện tử; (2) Máy tính phần mềm xử lí định lượng; (3) Đích nghiên cứu phong cách học Nếu có hai thành tố đầu ngơn ngữ học khối liệu, có hai thành tố sau phong cách học máy tính Như nhiều người biết, phong cách học truyền thống tìm kiếm cách giải thích nghiêm ngặt văn thủ pháp phân tích thủ cơng với ngữ liệu rời, dung lượng nhỏ Cịn PCH KL, ngữ liệu dùng để phân tích khối liệu văn điện tử có dung lượng thường hàng chục vạn từ trở lên (gồm nhiều văn hoàn chỉnh, trích đoạn dài văn lớn) xử lí tự động bán tự động chương trình máy tính Xử lí định lượng để đến kết nghiên cứu phong cách học đường lập luận quy nạp khái quát hóa theo xác suất (probabilistic generalization), mà PCH KL “sự khái quát hóa từ khối văn dung lượng lớn” (McIntyre, 2015, p.59) Cách tiếp cận định lượng nhấn mạnh tầm quan trọng chứng ngơn ngữ địi hỏi cách phân tích phong cách học khách quan khoa học Trong cách xử lí định lượng có phong cách học cách xử lí định lượng dựa khối liệu phần mềm máy tính, cách xử lí tối ưu cả, theo nhiều 82 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền nhà phong cách học máy tính “sự quan sát thơng thường người nắm bắt tiến trình nhiều nhân tố đặc điểm khác tạo nên phong cách, nghiên cứu dựa quan sát khơng có trợ giúp thiết bị kĩ thuật dễ bị ảnh hưởng thiên kiến người quan sát” (Steward, 2006, p.1758) Khối liệu “giúp xem xét tượng ngôn ngữ từ điểm nhìn số liệu tần số liên hệ mơ hình (trong văn bản, tập hợp văn bản)” (Mahlberg, 2013, p.7) Như vậy, PCH KL giúp xử lí vấn đề văn dung lượng lớn khoảng thời gian ngắn Nó mang lại tính khách quan mà nhà phong cách học tìm kiếm PCH KL giúp xác nhận phủ nhận nhận định trực giác thẩm tra nhận định phê bình văn học Nó cịn giúp đặc tính văn mà phân tích thủ cơng bỏ sót sức người giải Theo số nhà nghiên cứu, có ba kiểu PCH KL: (1) Dùng công cụ ngôn ngữ học khối liệu kĩ thuật phân tích để kiểm nghiệm (test) nhận định phê bình văn chương; (2) Dùng mơ hình phong cách học để tạo thông tin dán nhãn (cho khối liệu), sau phân tích kết cách dùng khung lí luận phong cách học; (3) Nghiên cứu phong cách học truyền cảm hứng từ khối liệu Về tư cách PCH KL, có tác giả xem phân ngành phong cách học, có tác giả xem phương pháp luận nghiên cứu hay hướng tiếp cận, đơn giản xem lĩnh vực nghiên cứu phong cách học Cách tiếp cận, phương pháp kĩ thuật nghiên cứu 2.1 Cách tiếp cận Giống ngôn ngữ học khối liệu, PCH KL có hai hướng tiếp cận cách tiếp cận dựa vào khối liệu (corpus-based approach) cách tiếp cận dẫn khối liệu (corpus-driven approach) Cách tiếp cận dựa vào khối liệu bắt đầu với giả định mơ hình ngơn ngữ có, trường hợp này, kĩ thuật khối liệu dùng chủ yếu để kiểm nghiệm xác nhận mơ hình tồn tại; đó, cách tiếp cận dẫn khối liệu trao ưu tiên cho khối liệu tìm kiếm phạm trù mơ hình ngơn ngữ sở kiểu mẫu xuất liệu (Mahlberg, 2013, p.13) Hai cách tiếp cận có vai trị riêng chúng nghiên cứu phong cách học (vai trò kiểm nghiệm vai trị khám phá) Tùy theo mục đích nghiên cứu mà nhà phong cách học lựa chọn cách tiếp cận cho phù hợp với cơng việc 2.2 Phương pháp nghiên cứu PCH KL sử dụng hai phương pháp nghiên cứu (a) phân tích so sánh định lượng, (b) phối hợp phân tích định lượng phân tích định tính 83 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 2.2.1 Phân tích so sánh định lượng Theo Mahlberg “Phong cách học văn chương quan tâm đến chức nghệ thuật văn ấn tượng mà văn tạo ý nghĩ người đọc Trọng tâm cách dùng ngơn ngữ đặc biệt Những hình thể đặc biệt hình thức nghĩa nghiên cứu tốt văn đơn lẻ trích đoạn văn bản, phong cách học văn chương nghĩa liên hệ chất với phương pháp đọc sâu (close reading)” (Mahlberg, 2014, p.382) Nói rộng phong cách học truyền thống, phương pháp nghiên cứu phân tích định tính thủ cơng Khi chuyển từ phong cách học truyền thống sang PCH KL phương pháp nghiên cứu phong cách học có dịch chuyển từ định tính sang định lượng, ưu tiên nhiều cho phương pháp định lượng Trong PCH KL, phân tích định lượng bao gồm phạm vi rộng (rộng ngôn ngữ học khối liệu hay phong cách học máy tính, trắc học phong cách1) từ từ vựng, ngữ pháp, tu từ, đến diễn ngơn… nói chung tất phương diện ngơn ngữ khảo sát máy tính nhằm tìm đặc điểm phong cách tác giả, giai đoạn lịch sử hay biến thể chức Cơng việc định lượng thường dựa vào tính có sẵn phần mềm ngôn ngữ học khối liệu hay trắc học phong cách để thực tự động, dán nhãn thủ cơng sau nhờ máy tính xử lí (bán tự động) Với trình độ kĩ thuật máy tính phần việc thủ cơng nghiên cứu phong cách khối liệu tương đối nhiều Vì so sánh tảng nghiên cứu phong cách học nên phân tích định lượng PCH KL gắn liền với so sánh định lượng Trong PCH KL, khối liệu dùng để phân tích định lượng gọi khối liệu đích (target corpus; hay gọi khối liệu mẫu – sample corpus), khối liệu dùng để đối chứng gọi khối liệu tham chiếu (referenced corpus) trường hợp khối liệu tổng quát Trong trường hợp khối liệu tham chiếu ngang cấp với khối liệu đích thường gọi khối liệu so sánh (comparative corpus) hay khối liệu đối chiếu (contrastive corpus) Theo Mahlberg “Điều cốt yếu phân tích PCH KL so sánh khn hình cụ thể hay văn cụ thể với liệu tham chiếu” (Mahlberg, 2014, p.388) Việc so sánh trường hợp cụ thể với mẫu tổng quát toàn thể (được thể khối liệu tham chiếu) liên quan đến khái niệm “lệch chuẩn” (deviation) dùng phong cách học để đo đạc khn hình sáng tạo tác giả văn văn chương giải thích hiệu lạ hóa (foregrounding) Theo Ho “Những tượng bật tần số thấy văn so với văn khác xác định “chỉ dấu phong cách” (style maker) cho văn Tỉ lệ cao tượng ngôn ngữ stylometry, stylometrics stylostatistics (thống kê học phong cách); tạm dịch trắc học phong cách, với nghĩa khoa học đo đạc để xác định phong cách 84 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền xuất xuất lại văn văn chương biểu thị nhấn mạnh thẩm mĩ Chúng đưa lại cho văn tính chất độc đáo phong cách (Ho, 2011, p.6) Những “chỉ dấu phong cách” vật chuyển tải nghĩa dấu vết mã bị dấu kín văn Một số dấu phong cách có điều khiển có ý thức tác giả số dấu phong cách khác lại dùng cách vô thức 2.2.2 Phối hợp phân tích định lượng với phân tích định tính PCH KL túy nghiên cứu định lượng văn chương văn loại nói chung Nó “vẫn cách tiếp cận phong cách học định tính (qualitative stylistic approach) nghiên cứu ngôn ngữ văn chương, kết hợp với ủng hộ kĩ thuật phương pháp định lượng dựa khối liệu” (Ho, 2011, p.10) Như PCH KL, “định lượng thống kê phải luôn sử dụng phương tiện mục đích, để xác nhận để bác bỏ phân tích dựa trực giác (intuition-based analysis) chúng ta” (Ho, 2011, p.11) Quan điểm chung nhà nghiên cứu phương pháp nghiên cứu PCH KL phải phối hợp chặt chẽ phân tích định lượng phân tích định tính, phương pháp phân tích định tính gốc rễ, cịn phương pháp phân tích định lượng cơng cụ để thẩm tra hay củng cố kết phương pháp định tính Như Carter nhận định: “Phân tích PCH KL thủ tục phương pháp luận khách quan mà khâu tốt tiến trình giải thích chủ quan hướng dẫn”2 Phân tích PCH KL phải không trọng nhân tố định lượng văn đích, mà phải cịn nhạy cảm với phương diện văn cần thiết để có phân tích định tính nhiều Đi theo hướng tiếp cận này, theo Simino Short, “Đã có số cơng trình nghiên cứu thú vị kết hợp cách nhuần nhuyễn cơng việc phân tích định tính văn cụ thể với việc phân tích dựa khối liệu” phân tích định tính văn “trung tâm lĩnh vực phân tích phong cách học” (Simino & Short, 2004, p.7) Một vấn đề đặt vai trò trực giác phân tích PCH KL Milic cho rằng, phương pháp nghiên cứu phong cách học “bắt đầu với trực giác” kết thúc với “dữ liệu cụ thể”3 Trực giác phong cách học có tác dụng đặt giả thuyết, ý tưởng phân tích Cơng việc cịn lại nhà nghiên cứu “phát triển thao tác hóa trực giác phong cách học”4 PCH KL cần phải kết hợp “kĩ thuật phân tích dựa khối liệu với cách tiếp cận dựa nhiều vào trực giác” (Simino & Short, 2004, p.8) Một tương tác hữu hiệu hai đường hướng nghiên cứu phải không dẫn tới hi sinh Carter R 2010 ‘Methodologies for stylistic analysis: Practices and pedagogies’ Dẫn theo: Mahlberg, 2014, p.379 Milic L 1967 A quantitative approach to the style of Jonathan Swift The Hague: Mouton Dẫn theo: Steward, 2006, p.1758 Van Peer W 1989 ‘Quantitative studies of literature: a critique and an outlook’ Computers and the Humanities 23 (4/5) Dẫn theo: Ho, 2011, p 205 85 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 tính nghiêm ngặt phương pháp luận khoa học, đại, tinh tế trực giác5 nhạy cảm não người Một kết hợp chặt chẽ phương pháp định tính phương pháp định lượng PCH KL giúp đạt cấp độ cao hiểu biết tác phẩm văn chương liệu lựa chọn Sự kết hợp hai phương pháp nguyên lí hạt nhân phong cách học dòng chủ lưu 2.3 Kĩ thuật nghiên cứu PCH KL sử dụng số kĩ thuật nghiên cứu mang tính chất đặc trưng Sau viết giới thiệu số kĩ thuật định lượng (thực tự động) mà PCH KL thường sử dụng Một số kĩ thuật vốn có sẵn ngơn ngữ học khối liệu hay trắc học phong cách + Wordlist (danh sách từ): xác định danh sách tất từ dùng khối liệu tần số chúng Nếu khối liệu tồn tác phẩm tác giả Wordlist vốn từ tác giả + Keywords (từ khóa): xác định từ xuất với tần số nhiều hay so với khối liệu tham chiếu Keywords nói lên khuynh hướng nghệ thuật lựa chọn chủ đề, đề tài hay phong cách tác giả, phong cách thể loại biến thể chức Có ba loại từ khóa tên riêng, từ chức từ nội dung Trong đó, theo số tác giả, từ chức có nhiều giá trị nghiên cứu phong cách tác giả, từ nội dung xuất phụ thuộc nhiều vào đề tài chủ đề văn Keywords máy tính tự động tạo cách so sánh danh sách từ (Wordlist) khối liệu đích khối liệu tham chiếu Vì khối liệu tham chiếu xem cung cấp chuẩn (norm), nên “từ khóa từ có tần số lệch so với chuẩn” (Mahlberg & McIntyre, 2011, p.207), lệch chuẩn quan tâm nghiên cứu phong cách học nơi mà khái niệm “lạ hóa” dùng để miêu tả hiệu hình thành từ lệch chuẩn ngơn ngữ Việc nghiên cứu từ khóa so sánh với chuẩn khối liệu tham chiếu giúp nhận diện tượng ngôn ngữ mang đặc điểm phong cách có giá trị cho phân tích định tính sâu Từ khóa, theo Mahlberg McIntyre, “cần xem dấu hiệu việc xây dựng giới hư cấu nút bấm chủ đề tiểu thuyết” (Mahlberg & McIntyre, 2011, p.207) + Concordance (chỉ mục): Liệt kê tất ngữ cảnh xuất từ ngữ cần phân tích Concordance cho phép biết tất câu có từ ngữ cần phân tích, xếp theo thứ tự ABC từ bên trái hay bên phải từ cần phân tích Concordance giúp nhà “Một mối quan tâm lớn phong cách học kiểm tra xác nhận tính hợp lệ trực giác phân tích chi tiết, phong cách học đối thoại người đọc văn chương nhà quan sát ngơn ngữ, thấu hiểu, khơng hồn tồn khách quan, mục đích Phân tích ngơn ngữ không thay cho trực giác người đọc, mà Spitzer gọi cú nhấp chuột (click) tâm trí, thúc đẩy, điều khiển, định hình trực giác vào cách hiểu ” (Leech & Short, 2007, p.4) 86 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền nghiên cứu dễ dàng hình dung mơ hình cần thiết qua ngữ cảnh xuất Trọng tâm việc phân tích mục khn mẫu mang tính chức ngữ cảnh số thống kê tần số Văn bản, khối liệu, đọc theo chiều ngang, văn khối liệu, qua trình diễn chọn lọc mục, đọc theo chiều dọc (Mahlberg, 2013, p.7) Phân tích mục “bổ sung truyền sức mạnh cho việc đọc sâu văn bản” (Mahlberg, 2013, p.8) Chẳng hạn dùng Concord WordSmith Tools để gọi đường mục chữ “quyền” Tuyên ngôn độc lập, có kết Hình Hình Các ngữ cảnh xuất chữ “quyền” “Tun ngơn độc lập”, phân tích phần mềm WordSmith Tools Các đường mục Hình cho thấy chữ “quyền” Tuyên ngôn độc lập xuất tất 18 lần (số liệu góc bảng, bên trái) Trong 18 lần xuất đó, Tun ngơn độc lập trực tiếp gián tiếp nói quyền cá nhân, dân tộc, quốc gia, chúng ta, kẻ địch: quyền sống, quyền sung sướng, quyền bình đẳng, quyền tự do, quyền độc lập, quyền lợi, quyền, đặc quyền, dân quyền, nhân quyền; xuất nhiều quyền tự (4 lần), quyền độc lập (3 lần) Quan sát từ bên trái chữ “quyền”, thấy xuất chữ mang tính chất khẳng định “quyền”, chữ nêu tâm “quyền” Còn thực dân Pháp, Tun ngơn độc lập khẳng định “xóa bỏ tất đặc quyền” (đường mục thứ 7) Vì thế, diễn đạt theo cách khác, gọi Tun ngơn độc lập “Tuyên ngôn quyền” + Cluster6 (chuỗi từ lặp lại): xác định chuỗi từ lặp lại khối liệu (chuỗi từ hay từ, từ, chuỗi từ, 10 từ) Chuỗi từ lặp lại phản ánh phong cách ngôn ngữ nhân vật, tác giả, thời đại, phản ánh công thức, khuôn mẫu diễn đạt cluster: gọi n-gram lexical bundle 87 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 biến thể chức Chuỗi từ dài tần số xuất thấp Sự khác biệt chuỗi từ chỗ chúng xuất hay nhiều tác phẩm thể loại khác + Sentence length (độ dài câu): thống kê tổng số lượng câu khối liệu độ dài câu (tính theo đơn vị từ) Thơng tin cho người nghiên cứu biết khuynh hướng cấu tạo câu tác giả hay lĩnh vực giao tiếp (dài, trung bình hay ngắn) Chẳng hạn, phân tích độ dài câu hai văn The Last Leaf (Chiếc cuối cùng, O Henry) Declaration of Independence (Tuyên ngôn độc lập Hợp chủng quốc Hoa Kì), có kết sau: Hình Tần số độ dài câu “The Last Leaf” so sánh với “Declaration of Independence”, phân tích phần mềm Signature Qua đồ thị Hình 2, thấy tổng số câu truyện ngắn The Last Leaf 180 câu độ dài câu ổn định, phần lớn mức ngắn (1 đến 12 từ) Trong Declaration of Independence có 46 câu, biên độ thay đổi lớn diễn liên tục, độ dài chủ yếu mức trung bình dài (11 đến 37 từ) + Key semantic domain (miền ngữ nghĩa chìa khóa): xác định miền ngữ nghĩa quan trọng, bật khối liệu đích (tác phẩm hay loạt tác phẩm cần nghiên cứu) Miền ngữ nghĩa (semantic domain) trường đặc trưng từ liên hệ chặt chẽ với mặt từ vựng văn Ví dụ: hoa, cây, quang hợp thuộc miền ngữ nghĩa thực vật Miền ngữ nghĩa phần mềm Wmatrix tạo cách tự động Sau đó, miền ngữ nghĩa chìa khóa Wmatrix tạo sở so sánh miền ngữ nghĩa khối liệu đích với khối liệu tham chiếu (chẳng hạn so sánh với phần văn xuôi hư cấu khối liệu quốc gia Anh – BNC) Như vậy, miền ngữ nghĩa chìa khóa hiểu miền ngữ nghĩa trội so với khối liệu tham chiếu Miền ngữ nghĩa chìa khóa gợi tuyến chủ đề, liên hệ phát triển cốt truyện giúp cho người nghiên cứu có định hướng phân tích nội dung hay cách thức biểu tác phẩm 88 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền Các kĩ thuật định lượng vừa liệt kê số nhà phong cách học gọi “bảng liệt kê mục cần kiểm tra” (checklist) PCH KL (Mahlberg & McIntyre, 2011, p.206), hay nói cách khác đối tượng khảo sát PCH KL Những cơng trình nghiên cứu tiêu biểu Trong phần này, chúng tơi giới thiệu cơng trình tiêu biểu PCH KL (đã in thành sách) bàn vấn đề chung đến vấn đề chuyên biệt PCH KL, xuất từ 2004 đến 2013 3.1 Corpus Stylistics and Dickens’s Fiction (Phong cách học khối liệu tiểu thuyết Dickens) Tác giả sách Michaela Mahlberg (Đại học Nottingham, Anh), Routledge xuất năm 2013, dày 221 trang Sách vừa giới thiệu chung PCH KL, vừa nghiên cứu trường hợp tiểu thuyết Dickens Mục đích sách “khám phá mối quan hệ tập hợp ngôn ngữ với phần đóng góp chúng tạo hiệu mà văn có người đọc” (Mahlberg, 2013, p.6) Cách tiếp cận sách cách tiếp cận dẫn khối liệu khối liệu dùng để khảo sát chủ yếu khối liệu không dán nhãn Phần mềm sử dụng WordSmith Tools, phiên 5.0 Khối liệu đích 23 tác phẩm Dickens, có 15 tiểu thuyết Khối liệu đối chiếu: 29 tiểu thuyết 18 tác giả kỉ XIX Nội dung chủ yếu sách phân tích chuỗi từ lặp lại (cluster) mà Dickens thường khai thác dấu nghĩa chức văn Mahlberg tập trung phân tích chuỗi từ từ, từ lặp lại tác phẩm Dickens, as if he, I don’t know what, you don’t mean to say, his hands in his pockets, young lady with black phương diện: danh xưng, lời nói nhân vật, ngơn ngữ thể, lời bình luận người trần thuật, thời gian nơi chốn Chẳng hạn theo Mahlberg, chuỗi từ lặp lại lời nói nhân vật nêu lên công thức lịch (am delighted to see you), thông tin thương lượng (you don’t mean to say), đối đầu (what you want here), chiếm giữ lượt lời (I was going to say) Chúng mang hiệu hài hước diễn tả lặp lại hay hành động theo thói quen nhân vật Những chuỗi từ liên quan đến kĩ thuật ngoại (externalisation techniques) xây dựng nhân vật Dickens Cơng trình Corpus Stylistics and Dickens’s Fiction tác phẩm tiên phong việc dùng hệ phương pháp ngôn ngữ học khối liệu để làm rõ mối tương quan khuôn mẫu diễn đạt với nghĩa chức tổ chức văn bản, với việc miêu tả nhân vật, xây dựng giới hư cấu phong cách ngôn ngữ tác giả 89 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 3.2 “Corpus stylistics: speech, writing and thought presentation in a corpus of English writing” (Phong cách học khối liệu: Việc miêu tả lời nói ý nghĩ qua khối liệu tiếng Anh) Cơng trình (Elena Simino Mick Short, Đại học Lancaster, Anh; Routlege xuất năm 2004, dày 256 trang) ứng dụng phương pháp luận khối liệu để khám phá kiểm nghiệm khn mẫu trình bày lời nói ý nghĩ (của nhân vật) ba thể loại văn xuôi hư cấu, tin báo, tiểu sử/tự truyện Trước vào nghiên cứu cụ thể, tác giả giới thiệu cấu trúc khối liệu hệ thống thích (dán nhãn)7 khối liệu mà họ phát triển Theo đó, khối liệu mà hai nhà nghiên cứu dùng để khảo sát gồm 120 mẫu văn bản, dài tổng cộng 258 348 từ văn viết tiếng Anh kỉ XX, chia làm ba phần cho ba thể loại trần thuật vừa nói Khác với Mahlberg (2013), khối liệu nghiên cứu hai nhà nghiên cứu khối liệu có dán nhãn Cách tiếp cận hai tác giả cách tiếp cận dựa vào khối liệu (corpus-based approach) xuất phát điểm họ mơ hình lí thuyết Leech Short (1981)8 việc miêu tả lời nói ý nghĩ nhân vật văn xuôi tự Khối liệu hai tác giả dùng để kiểm nghiệm cải biên mơ hình Leech Short Theo Simino Short ngơn ngữ học khối liệu, việc thích khối liệu cho tượng ngơn ngữ cấu tạo từ, từ loại, số phạm trù ngữ nghĩa thường thực cách tự động (do máy tính tham chiếu file liệu chứa thơng tin có sẵn tự động gắn nhãn cho kiện ngôn ngữ tương ứng xuất khối liệu) Tuy nhiên số phạm trù ngôn ngữ phức tạp, trừu tượng mà khơng có tiêu chuẩn hình thức xác định phải thực việc dán nhãn cách thủ công bán tự động Cho nên, hai tác giả cho biết, phong cách học, để thích (dán nhãn) khối liệu, trước hết, nhà phong cách học phải xây dựng hệ thống phân loại cho phạm trù mà nghiên cứu Bước kiểm nghiệm hoàn thiện hệ thống phân loại số mẫu thí điểm Bước thứ ba xây dựng nguyên tắc đạo công cụ cho việc dán nhãn Bước thứ tư dán nhãn thủ công bán tự động Trong trường hợp hai tác giả Simino Short dán nhãn thủ công (nhưng hai tác giả hi vọng tương lai có người sáng chế phần mềm dán nhãn tự động cho việc nghiên cứu này) Việc dán nhãn khác so với công việc tương tự ngôn ngữ học khối liệu sản phẩm lẫn tiến trình đối tượng nghiên cứu tượng diễn ngôn cấp độ cao phức tạp (Simino & Short, 2004, p.26) Việc nhận diện đối tượng cần dán nhãn phải đặt môi trường văn cụ thể sở tham chiếu yếu tố tinh tế dụng học ngữ cảnh annotation or tagging Leech G and Short M.1981 Style in Fiction, London: Longman Dẫn theo: Simino & Short, 2004, p 90 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền 3.3 “Corpus Stylistics in Principles and Practice” (Phong cách học khối liệu: Nguyên lí thực tiễn) Tác giả sách Yufang Ho (Đại học Huddersfield, Anh), Continuum xuất năm 2011, dày 254 trang Mục đích sách khám phá khác biệt phong cách hai phiên tiểu thuyết hậu đại, siêu trần thuật The Magus (Pháp sư) nhà văn John Fowles (Anh) qua phân tích, so sánh hai in (1966 1977) Sách gồm ba phần Phần I: Những nguyên lí chung Những vấn đề quan trọng nhất, có tính chất tảng PCH KL Ho giới thiệu chương Phần II: PCH KL thực tiễn – phân tích so sánh The Magus Phần II gồm sáu chương với nội dung quan trọng như: đo lường mức độ tương đương phiên bản; so sánh mật độ mơ hình ngơn ngữ hình tượng; khác biệt phong cách The Magus phiên Phần mềm dùng để đo lường mức độ tương đương văn hai in The Magus (bản sửa chữa lại) TESAS/Crouch9 Wcopyfind10 nhằm tìm thay đổi hai phiên vấn đề liên quan đến phong cách lựa chọn Ngoài ra, phần mềm Wmatrix tác giả dùng để thực “việc so sánh ngôn ngữ vĩ mô cấp độ ngữ nghĩa”, để kiểm nghiệm giả thuyết liên quan đến “điểm nhìn trần thuật” “sự phóng chiếu giới văn bản” hai phiên (Ho, 2011, p.200) Phần mềm WordSmith Tools Ho dùng để kiểm nghiệm giả thuyết thay đổi ngơn ngữ hình tượng11 hai phiên Cách làm Ho dùng Concordance phát liệu ngôn ngữ liên quan (dựa tiêu chuẩn hình thức mà người phân tích xác lập), sau trích dẫn, xếp trình diễn cách thức để người phân tích dễ dàng phát mơ hình ngơn ngữ hình tượng Phần III: Những vấn đề sâu PCH KL Trong phần này, tác giả cho biết để chọn dùng cách tiếp cận PCH KL nghiên cứu văn chương nói chung, có số nguyên tắc tiên quyết, đó: “PCH KL gắn bó với quan tâm tối đa nghiên cứu thống kê định lượng phong cách Nhà nghiên cứu phải có hiểu biết công cụ thống kê hiểu biết sâu sắc liệu ngôn ngữ mà họ quan sát; phải ghi khắc lịng thống kê học sai lạc phương pháp truyền thống phong TESAS/Crouch vốn công cụ xây dựng để nghiên cứu việc tái sử dụng văn lĩnh vực báo chí (Ho, 2011, p.201) 10 Wcopyfind: phần mềm phát đạo văn cách so sánh điểm tương tự văn bản, Louis Bloomfield, Đại học Virginia, xây dựng vào năm 2002 (Ho, 2011, p.79) 11 Ngơn ngữ hình tượng q trừu tượng, phức tạp lĩnh vực khó giải công việc định lượng (Ho, 2011, p.202) 91 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 cách Như Ardat (1986)12 rằng: công việc thống kê phục vụ cho phong cách học với ba điều kiện sau: (a) lúc dùng phương tiện mục đích; (b) lúc khám phá có hiệu lực thực tiễn hiệu thẩm mĩ nhấn mạnh tác dụng nghệ thuật; (c) lúc liệu quan sát thỏa đáng phương diện định tính định lượng13 Nguyên tắc cuối thách thức lớn phát triển thao tác hóa trực giác phong cách học, cách phát triển phương pháp đáng tin cậy định lượng làm bật cân phân tích định tính định lượng Và cách tiếp cận hợp khoa học thực nghiệm với nghệ thuật thông diễn học” (Ho, 2011, p.204-205) Cách tiếp cận Ho cơng trình cách tiếp cận dựa vào khối liệu để kiểm nghiệm nhận định nhà phê bình The Magus 3.4 “Historical corpus stylistics” (Phong cách học khối liệu lịch sử) Cơng trình “Historical corpus stylistics” Patrick Studer (Đại học Zurich, Thụy Sĩ), Nhà xuất Continuum, 2008, dày 267 trang, theo hướng nghiên cứu khối liệu lịch đại Cơng trình nghiên cứu phong cách báo chí tác phẩm truyền thơng đại chúng qua giai đoạn lịch sử diễn ngơn báo chí đại thời kì đầu Mục đích sách “đưa nhận thức thấu đáo nguyên tắc phong cách tảng diễn ngơn báo chí cách vạch đặc điểm thể loại truyền thơng thời kì đầu ngun lí biến đổi phương tiện truyền thơng đại chúng” (Studer, 2008, p.1) Khối liệu để phân tích xuất phẩm báo chí tiếng Anh kỉ XVIII XIX, in Luân Đôn, chủ yếu lấy từ nguồn liệu kĩ thuật số ZEN Khoa tiếng Anh, Trường Đại học Zurich (Thụy Sĩ) sưu tập Phong cách, cơng trình này, xem xét theo quan điểm lịch đại phong cách học lịch sử kết hợp với phương pháp phân tích khối liệu dựa vào trợ giúp máy tính Trọng tâm nghiên cứu sách “nhận diện phân tích thực nghiệm nhân tố phong cách đóng vai trị tích cực việc truyền bá thay đổi phong cách diễn ngơn báo chí giai đoạn đầu” (Studer, 2008, p.2), mà khái niệm then chốt “sự lạ hóa phong cách” (stylistic foregrounding) Cơng trình nhấn mạnh việc xem xét mối tương quan ngữ cảnh (bao gồm nhân tố văn hóa, thể chế, xã hội, kĩ thuật bối cảnh thông tin) với đổi phong cách (lệch vi phạm quy ước chuẩn phong cách) phát triển công cụ PCH KL tinh tế phục vụ cho việc phân tích mối liên hệ Cơng trình Studer bàn tiêu chuẩn sưu tập khối liệu lịch đại (diachronic corpus) phục vụ cho nhu cầu nghiên cứu phong cách học 12 Ardat, 1986 “Stylostatistics: pros and cons in theory and application” Dẫn theo: Ho, 2011, p.204 Tức cần nắm vững “những nguyên tắc có tính chất phương pháp luận kết hợp quan sát ngôn ngữ với đánh giá văn chương” (Mahlberg, 2013, p.6) 13 92 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền Cơng trình Studer xem thuộc dạng “nghiên cứu phong cách học truyền cảm hứng từ khối liệu” mặt kĩ thuật, tác giả không dùng phần mềm công cụ máy tính để xử lí thơng tin cách mà nhà PCH KL thường làm, mà dùng thống kê thủ công Thế mạnh giới hạn 4.1 Thế mạnh phong cách học khối liệu Thế mạnh lớn dễ dàng thấy việc dùng phương pháp khối liệu nghiên cứu phong cách học có kết thơng tin định lượng rõ ràng, nhanh chóng, xác, thông tin không dễ dàng (hoặc nào) thu phân tích thủ cơng Với khối liệu lớn cực lớn (hàng chục triệu từ trở lên), việc phân tích thủ cơng gần bất lực (ít từ phương diện định lượng), PCH KL phát huy mạnh Bên cạnh đó, kết định lượng máy tính thực liệt kê, lưu trữ định dạng dễ dàng truy xuất, tính tốn, hiển thị kiểm chứng Một mạnh khác PCH KL liệu định lượng làm bật tượng ngơn ngữ mà người đọc không nhận thức dung lượng lớn văn Máy tính dấu vết ngơn ngữ mà óc người bỏ sót Ngồi ra, PCH KL dựa chứng ngôn ngữ trung thực, khách quan máy móc xử lí nên tránh cách phân tích thủ cơng bị ảnh hưởng nhiều thiên kiến người phân tích Phương pháp luận khối liệu phong cách học không đơn giản dùng để xác nhận (hay phủ nhận) giả thuyết ban đầu người nghiên cứu; cịn gợi giả thuyết Xuất phát từ “điểm không” ban đầu, cách dùng phần mềm máy tính xử lí khối liệu, nhà phong cách học phát ý tưởng nghiên cứu, từ tìm thêm chứng để chứng minh giả thuyết khối liệu lớn thơng qua phân tích định tính cách vận dụng khái niệm kĩ thuật cao phong cách học 4.2 Giới hạn phong cách học khối liệu Phương pháp khối liệu nói chung tập trung vào hình thức tượng ngơn ngữ phân tích cung cấp thơng tin định lượng xuất mối quan hệ chúng văn bản, nên phương diện nghĩa, chức tượng ngôn ngữ không đề cập (hoặc trọng) Vì “sự tập trung vào hình thức bề mặt văn mà PCH KL bị cho dẫn trở lại tranh luận phong cách học bị nghi ngờ giá trị thông tin định lượng14 phân tích văn bản” (Mahlberg, 2016, p.140) Đó “giới hạn việc ứng dụng tiêu chuẩn ngôn ngữ bề mặt để đo lường nội dung 14 “Kết tỉm thấy số lạnh lẽo, xa lạ với lĩnh vực khoa học nhân văn” (Ardat, 1986, “Stylostatistics: pros and cons in theory and application”, dẫn theo: Ho, 2011, p.11) 93 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Tập 15, Số (2018): 81-95 văn bản”, việc dùng tiêu chuẩn hình thức15 có nguy “đo lường đo lường được” (Ho, 2011, p.84) Cấp độ cao bình diện trừu tượng tổ chức ngơn ngữ, khó định lượng Vì vậy, có “nhiều khuynh hướng kháng cự tất nghiên cứu văn chương mang tính thực nghiệm, tốn học kĩ thuật hóa thủ pháp máy tính cách tiếp cận định lượng dường phá hủy tính văn chương thực văn hình ảnh thu nhỏ cách tiếp cận phi nhân văn văn chương” (Ho, 2011, p.9) Một thách thức cho phát triển PCH KL chưa có cơng cụ xác lập mặc định chun dùng cho nó, khơng phải vay mượn từ ngơn ngữ học khối liệu, trắc học phong cách số chuyên ngành kĩ thuật Mặt khác, nhà phong cách học phải biết thiết kế dán nhãn cho khối liệu chuyên dụng vào nghiên cứu vấn đề chuyên biệt phong cách học, đơn giản sử dụng lại nguồn khối liệu có sẵn Một vấn đề khác hầu hết học giả nghiên cứu văn chương không hiểu nguyên tắc, kĩ thuật thống kê họ không thực tin tưởng dùng để giải vấn đề văn chương Do “cách đào tạo phương pháp truyền thống nghiên cứu khoa học nhân văn (nặng phán đốn trực giác phân tích thủ cơng), người thực hành phong cách học khơng có kĩ trang bị thứ cần thiết cho việc dùng hiệu máy vi tính nghiên cứu họ” (Wynne, 2006, p.10453) Kết luận Trong nghiên cứu ngôn ngữ, đặc biệt lĩnh vực phong cách học, máy móc khơng thể thay óc người, chúng công cụ hỗ trợ Kĩ thuật khối liệu khơng thể thay hồn tồn cho phân tích phong cách học thủ cơng Chạy mục tạo danh mục từ khóa, tự chưa phải phân tích PCH KL tạo kĩ thuật tân tiến cho nghiên cứu phong cách, khơng phải giải pháp cho vấn đề phong cách học Cũng phương pháp luận nghiên cứu nào, PCH KL có sở trường sở đoản riêng Điều quan trọng phải biết ứng dụng chỗ Phân tích PCH KL phong cách học truyền thống phải cộng tác bổ sung cho Nếu “khơng có tảng lí thuyết quan tâm giải thích việc ứng dụng phương pháp khối liệu cho văn cụ thể đưa đến kết quan sát ngây thơ” (Mahlberg, 2016, p.153) 15 Vấn đề then chốt việc định lượng công cụ máy tính dấu hiệu hình thức (formal criteria) để máy tính nhận diện Cho nên, vấn đề chìa khóa PCH KL tìm dấu hiệu hình thức tượng phong cách học trừu tượng phức tạp để máy tính xử lí 94 TẠP CHÍ KHOA HỌC - Trường ĐHSP TPHCM Nguyễn Thế Truyền Tuyên bố quyền lợi: Tác giả xác nhận hồn tồn khơng có xung đột quyền lợi TÀI LIỆU THAM KHẢO Ho Y (2011) Corpus Stylistics in Principles and Practice New York: Continiuum Leech G & Short M (2007) Style in fiction: a linguistic introduction to English fictional prose (Second edition) London: Pearson/Longman Louw B & Milojkovic M (2016) Corpus Stylistics as Contextual Prosodic Theory and Subtext Amsterdam and Philadelphia: John Benjamins Mahlberg M (2013) Corpus Stylistics and Dickens’s Fiction London and New York: Routledge Mahlberg M (2014) Corpus stylistics In: Burke Michael (ed.) The Routledge Handbook of Stylistics London: Routledge, 378–392 Mahlberg M (2016) Corpus stylistics In: Sotirova V (ed) The Bloomsbury Companion to Stylistics London and New York: Bloomsbury, 139-156 Mahlberg M & McIntyre D (2011) A case for corpus stylistics: Ian Fleming’s Casino Royale English Text Construction, vol 4, no 2, 204-227 McIntyre D (2015) Towards an intergrated corpus stylistics Topics in Linguistics, 16(1), 59-68 Semino E & Short M (2004) Corpus stylistics: speech, writing and thought presentation in a corpus of English writing London: Routledge Steward L (2006) Computational stylistics In: Brown K (ed) Encyclopedia of language and linguistics.pdf New York: Elsevier, 1757-1764 Studer P (2008) Historical Corpus Stylistics: Media, Technology and Change London and New York: Continuum Wales K (1989) A Dictionary of Stylistics London and New York: Longman Wynne M (2006) Stylistics: Corpus approaches In: Brown K (ed) Encyclopedia of language and linguistics.pdf New York: Elsevier, 10451-10455 95 ... ngữ học khối liệu PCH KL, vấn đề PCH KL dựa cơng cụ lí thuyết kĩ thuật ngôn ngữ học khối liệu để nghiên cứu vấn đề liên quan đến phong cách ngơn ngữ PCH KL nối kết ngun lí ngôn ngữ học khối liệu. .. chứng ngơn ngữ địi hỏi cách phân tích phong cách học khách quan khoa học Trong cách xử lí định lượng có phong cách học cách xử lí định lượng dựa khối liệu phần mềm máy tính, cách xử lí tối ưu cả,... tích kết cách dùng khung lí luận phong cách học; (3) Nghiên cứu phong cách học truyền cảm hứng từ khối liệu Về tư cách PCH KL, có tác giả xem phân ngành phong cách học, có tác giả xem phương pháp