Văn học - Tin tức máy TÂY TIẾN

3 135 0
Văn học - Tin tức máy TÂY TIẾN

Đang tải... (xem toàn văn)

Thông tin tài liệu

Văn học - Tin tức máy TÂY TIẾN tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớn về tất cả các lĩnh v...

1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Xuân Sơn TỔNG HỢP QUAN ĐIỂM DỰA TRÊN MÔ HÌNH THỐNG KÊVÀ ỨNG DỤNG VÀO KHAI PHÁ QUAN ĐIỂM TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2011 2 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Xuân Sơn TỔNG HỢP QUAN ĐIỂM DỰA TRÊN MÔ HÌNH THỐNG KÊVÀ ỨNG DỤNG VÀO KHAI PHÁ QUAN ĐIỂM TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHÍNH QUY Ngành : Công nghệ thông tin Cán bộ hướng dẫn: Th.S Nguyễn Thu Trang Cán bộ đồng hướng dẫn: CN. Nguyễn Tiến Thanh HÀ NỘI - 2011 3 Lời cảm ơn Lời đầu tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc tới PGS.TS Hà Quang Thụy, ThS. Nguyễn Thu Trang và CN. Nguyễn Tiến Thanh đã tận tình hướng dẫn tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi cũng xin gửi lời cảm ơn tới CN. Vũ Tiến Thành, CN. Trần Bình Giang và các anh chị, các bạn sinh viên tại phòng thí nghiệm KT-Sislab đã hỗ trợ tôi rất nhiều trong quá trình thực hiện khóa luận. Tôi xin gửi lời cảm ơn tới các bạn trong lớp K52CB và K52CHTTT đã ủng hộ và khích lệ tôi trong suốt thời gian học tập tại trường. Tôi chân thành cảm ơn các thầy, cô đã tạo cho tôi những điều kiện thuận lợi giúp tôi học tập và nghiên cứu tại trường Đại học Công Nghệ. Xin cảm ơn sự hỗ trợ từ đề tài QG.10.38trong thời gian tôi thực hiện khóa luận. Cuối cùng, tôi muốn gửi lời cảm ơn vô hạn tới gia đình, bạn bè, những người thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn! Sinh Viên Vũ Xuân Sơn 4 Tóm tắt nội dung Khai phá quan điểm trên miền tin tức là một lĩnh vực mới, nhận được nhiều sự quan tâm trong những năm gần đây, và đánh dấu một bước phát triển trong khai phá văn bản (text mining).Khai phá văn bản hướng tới việc phân tích ngữ nghĩa, giúp máy móc thực sự “hiểu” nội dung văn bản nói và quan điểm của người viết như thế nào (ví dụ: khen/chê) trong văn bản đó. Nhu cầu một máy tìm kiếm quan điểm được đặt ra đáp ứng nhu cầu tìm kiếm quan điểm người dùng. Máy tìm kiếm quan điểm nhận đầu vào là một truy vấn từ người dùng và kết TÂY TIẾN VẺ ĐẸP THIÊN NHIÊN TÂY TIẾN DỮ DỘI, HÙNG VĨ – Nỗi nhớ: chơi vơi (bâng khuâng miên man) Lòng người xa Tây Tiến sống hồi niệm – Sông Mã: nhân chứng lịch sử chứng kiến buồn vui đời lính Mãnh liệt cuộn trào trường ca rừng già chảy vào thơ ng hoài niệm – Các địa danh: Sài Khao, Mường Lát, Mường Hịch, Pha Luông, Mai Châu gợi miền rừng núi hùng vĩ, làng heo hút hoang sơ Thể tình yêu nước – Dốc dựng đứng chinh phục ý chí người: + Câu thơ bị bẻ gãy để tạo hình dung độ cao dựng đứng + Ngắt nhịp ¾ phân định rạch ròi hướng lên xuống + Từ ngữ khúc khuỷu, thăm thẳm, heo hút: gợi độ cao, độ sâu cảm giác hút tầm mắt người, không giới hạn cuối + Vượt lên qua khúc khuỷu, thăm thẳm đoàn quân tưởng đỉnh mây heo hút – Tiếng thác nước gầm thét thị oai sức mạnh hoang sơ năng, tiếng gầm cọp dấu chân ơng Ba mươi thấp thống đêm vắng dội, bí hiểm, man rợ khúc nhạc tấu chốn oai linh – Tâm hồn người lính Tây Tiến: + khó khăn gian khổ chặng đường hành quân vượt dốc + gương mặt dăi dầu sương gió gục lên súng mũ bỏ quên đời THƠ MỘNG TRỮ TÌNH – Khơng khí hội hè rộn ràng vui vẻ: + Người lính chiêm ngưỡng say sưa mà đa tình trước vẻ đẹp phương xa xứ lạ + Không gian ngập tràn ánh sáng lấp lánh quyến rũ + Cô gái đẹp từ vóc dáng đến trang phục mềm mại e ấp theo điệu múa tiếng khèn rộn ràng mà tình tứ lên man điệu – Khơng gian sương khói lăng mạn: + không gian sông nước rộng lớn, cảnh thưa thớt, thấp thống bóng người bóng hoa + Chiều mơng lung sương, hồn lau phảng phất, người ẩn dáng, hoa thấy điệu đong đưa… + Vẽ mộng mơ cảnh vật, hư ảo hồi niệm, tinh tế tình cảm – Tâm hồn người lính Tây Tiến: + Bay bổng ngất ngây trước người cảnh + Những đêm liên hoan chất men say làm hồn thơ thăng hoa khiếnTây Tiến trở thành vẻ đẹp mềm mại trữ tình, tha thiết nhớ + tự hỏi ng nh có nhớ, có thấy bâng khuâng lưu luyến + tâm tính người gửi xơn xao nỗi niềm hồn lau nẻo + Có ý chí nghị lực: chinh phục bến bờ đỉnh núi lại có phát đặc Hồi niệm tinh tế mà sâu nặng, biệt độ cao (súng ngửi trời) tếu bâng khng tình u khơng nói táo vui đùa hết tác giả + Bay bổng lãng mạn: Nhà pha luông mưa xa khơi Câu thơ toàn đối lập với câu thơ mang trắc liên tiếp trước tạo cảm giác nhẹ nhàng bay bổng thư thái chưa có vượt dốc đèo thực trải qua + Nhớ nhung cảm giác bình yên Tây Bắc khói lam chiều mùi hương nếp xơi nồng nàn quyến rũ VẺ ĐẸP CỦA TƯỢNG ĐÀI NGƯỜI LÍNH TÂY TIẾN BI TRÁNG – Ngoại hnh: gân guốc, lạ hóa (khơng mọc tóc) sốt rét rừng, rừng thiêng nước độc, gian khổ thiếu thốn, thuốc men khơng có, (da xanh màu lá) tiều tụy Nhưng mang tư vô oai phong lẫm liệt (dữ oai hùm) mang sức mạnh Việt Nam từ ngàn xưa trận với chí khí lẫm liệt vơ song – Hi sinh: gục lên súng mũ, bỏ quên đời, áo bào thay chiếu anh đất Dọc đường Tây Tiến nấm mồ vô danh: rải rác biên cương mồ viễn xứ Áo bào: sang trọng hóa hi sinh lính Tây Tiến kiểu chí làm trai dặm nghìn da ngựa trân trọng yêu thương mang cảm hứng lãng mạn, nhìn chủ nghĩa anh hùng cổ điển Sự hi sinh vô danh thầm lặng lớn lao đáng kính phục LÃNG MẠN – Nội tâm: Đêm mơ Hà Nội dáng kiều thơm: hào hoa Tây Tiến, lăng mạn bay bổng Tây tiến, sức mạnh Tây Tiến Bên cạnh tinh thần sục sôi chiến đấu có khoảng trời tâm tưởng mộng ước với dáng hình người đẹp Những giấc mơ chấp chới dáng kiều thơm trở thành động lực để giúp người lính vượt qua khó khăn, gian khổ lời thúc giục họ tiến lên phía trước lại sợi dây thiêng liêng niềm tin mang họ vượt qua bom đạn trở –Lí tưởng khát vọng lên đường: Chiến trường chẳng tiếc đời xanh khát vọng dâng hiến, xả thân mang hào khí thời đại ÂM HƯỞNG LĂNG MẠN VÀ BI TRÁNG LĂNG MẠN Khái niệm: – Cảm hứng lăng mạn cảm hứng thể “tơi” đầy tình cảm trí tưởng tượng phong phú, bay bổng – Bài thơ mang cảm hứng lãng mạn thường tô đậm phi thường, có khả gây ấn tượng mạnh mẽ Nó thường xuyên sử dụng thủ pháp đối lập Biểu hiện: – Cả thơ nỗi nhớ nồng nàn nhân vật trữ tình Từ “nhớ” nhắc tới nhiều lần Hình ảnh thơ phần lớn hình ảnh kí ức – Trí tưởng tượng phong phú nhân vật trữ tình tạo cho thơ nhiều hình ảnh độc đáo: “sương lấp”, “súng ngửi trời”, “thác gầm thét”, “sông Mă gầm lên khúc độc hành”… – Nhiều hình ảnh gây ấn tượng mạnh mẽ vẻ đẹp hùng vĩ, dội thiên nhiên Tây Bắc với dốc cao, núi đứng, thác dữ, mưa lớn…; Vẻ thơ mộng trữ tnh với “hồn lau”, “chiều sương”, “hoa đong đưa” dòng nước lũ – Tâm hồn mộng mơ, lãng mạn người lính Tây Tiến: Say mê ngắm vẻ đẹp thiên nhiên đường hành quân, hào hứng tổ chức đêm lửa trại, giữ tim hình ảnh kiều nữ duyên dáng, lịch chốn Hà thành – Sử dụng triệt để thủ pháp đối lập: đối thanh, đối tính cách… BI TRÁNG Khái niệm: – Bi tráng buồn đau mà không bi lụy, mạnh mẽ, rắn rỏi, gân guốc Biểu hiện: – Có hình ảnh nhắc tới nhiều lần như: dốc cao, vực sâu, thú dữ, dịch bệnh…thậm chí chết Nói tới chết mà khơng bi lụy, ngược lại cn mang đầy khí phách ngang tàng, hào hùng: “Áo bào thay chiếu anh đất Sông Mã gầm lên khúc độc hành” – Nhiều chi tiết nói can trường, mạnh mẽ, sẵn sàng đương đầu với thử thách, coi chết nhẹ tựa lông hồng, theo đuổi đến lí tưởng mà minh chọn “Chiến trường chẳng tiếc đời xanh” Ôn thi đại học môn văn –phần 11 Đề bài: Phân tích bài thơ Tây Tiến của Quang Dũng (Muốn phân tích hay cần hiểu được hoàn cảnh ra đời của bài thơ Tây Tiến) Bài làm 1: Tôi đã được nghe nhiều về bài thơ Tây Tiến của Quang Dũng nhưng gần đây mới được thưởng thức trọn vẹn cả bài thơ. Và tự như một thỏi nam châm bằng chất nhạc kỳ diệu, bằng hòa khí cách mạng sôi nổi…Tây Tiến đã cuốn hút tôi một cách khác thường. Ra đời từ những năm đầu kháng chiến chống Pháp, cùng một đề tài người lính với Nhớ của Nguyên Hồng, Đồng chí của Chính Hữu, nhưng Tây Tiến của Quang Dũng vẫn có một gương mặt riêng thật khó quên, mang đậm hào khí lãng mạn của một thời, gắn với một giai đoạn lịch sử đấu tranh anh dũng của dân tộc. Tây Tiến không có một sáng tạo gì khác thường, đốt xuất mà vẫn là sự tiếp tục của dòng thơ lãng mạn nhưng đã được tác giả thổi vào một hồn thơ rất mới và rất trẻ khác hẳn với những tiếng thơ bi lụy, não nùng trước đó. Tây Tiến nhắc nhở một thời gian khổ và oanh liệt của lịch sử đất nước nhưng được thể hiện theo cách riêng đặc đắc qua ngòi bút Quang Dũng với tâm trạng cụ thể: nỗi nhớ đồng đội trong đoàn quân Tây Tiến. Chính niềm thương nhớ máu thịt và niềm tự hào chân thành của Quang Dũng về những người đồng đội của ông là âm hưởng chủ đạo của bài thơ, khiến cho người đọc cảm động sâu xa. Bài thơ mở đầu bằng nỗi nhớ da diết, trải rộng cả không gian và thời gian mênh mông. Sông Mã xa rồi Tây Tiến ơi! Nhớ về rừng núi nhớ chơi vơi. Tác giả nhớ về những ngày ở Tây Tiến, nhớ những người đồng đội và nỗi nhớ ấy đã thốt lên thành lời gọi. Văn học ta có nhiều câu thơ diễn tả nỗi nhớ…nhưng “nhớ chơi vơi” thì có lẽ Quang Dũng là người đầu tiên mạnh dạn sử dụng. Nỗi nhớ ấy gợi xa về cả không gian, thời gian và tầm cao nữ, nỗi nhớ như có dáng hình bềnh bồng, bềnh bồng. Quang Dũng viết bài thơ này khi mới xa đoàn quân Tây Tiến, xa mà không hẹn ước, không biết ngày gặp lại. Cảm giác về thời gian trải dài tạo nên nỗi “nhớ chơi vơi”, bâng khuâng khó tả. Rồi cứ thế, nỗi nhớ đồng đội ấy lan tỏa, thấm đượm nồng nàn trên từng câu thơ, khổ thơ. Có lẽ nói bài thơ được xây dựng trên cảm hứng thương nhớ triền miên với bao kỷ niệm chống chất, ào ạt xô tới: Sài Khao sương lấp đoàn quân mỏi. Mường Lát hoa về trong đêm hơi. Sài Khao, Mường Lát, những địa danh rất Tây Bắc cũng góp phần gợi nỗi nhớ chơi vơi. Hình ảnh Tây Bắc được hiện lên trong câu thơ thật mịt mù và cải mệt mỏi của đoàn quân như lẫn vào sương. Bên cạnh cái gian khổ lại có một cái rất thơ, dường như huyền thoại: Mường Lát hoa về trong đêm hơi. Câu thơ rất độc đáo, hoa về chứ không phải hoa nở, đêm hơi chứ không phải là đêm sương. Hoa hiện ra mờ mờ trong sương, trong màn sương vẫn cảm thấy hoa. Câu thơ đẹp, huyền ảo, lung linh quá! Đọc đến đây, cái “mỏi” của đoàn quân dường như đã tan biến hết. Quang Dũng thật tài tình khi viết một câu thơ hầu hết là thanh bằng nhẹ nhàng, lâng lâng, chơi vơi như sương, như hoa, như hồn người, khác với: Dốc lên khúc khuỷu dốc thăm thẳm Heo hút cồn mây súng ngửi trời. Những câu thơ giàu chất tạo hình như vẽ lại được cả chặng đường hành quân đầy gian khổ, khó khăn. Tác giả không viết súng chạm trời mà là “súng ngửi trời” rất sinh động, nghịch ngợm, thông minh, hóm hỉnh. Ngàn thước lên cao ngàn thước xuống Nhà ai Pha Luông mưa xa khơi Câu thơ ngắt nhịp ở giữa gợi hình ảnh dốc rất cao, rất dài nhưng ngay sau đó lại là một câu thơ toàn vần bằng. Xuân Diệu trước đây cũng chỉ viết được hai câu toàn vần bằng mà ông rất tâm đắc: Sương nương theo trăng ngừng lưng trời Tương tư nâng lòng lên chơi vơi. Còn Quang Dũng trong Tây Tiến đã có khá nhiều câu thơ hầu hết là Ôn thi đại học môn văn –phần 12 Đề bài: Phân tích bài thơ Tây Tiến của Quang Dũng BÀI LÀM 2: “Có một bài ca không bao giờ quên…” Có một bài ca như thế. Cũng có những năm tháng không bao giờ quên, không phai mờ trong ký ức của nhiều thế hệ đã qua, hôm nay và mai sau. Đó chính là những ngày tháng kháng chiến chống Pháp, khi toàn dân tộc bước vào cuộc kháng chiến trường kỳ với tất cả sức lực, niềm say mê. Chúng ta vừa qua nạn đói, vừa giành được độc lập thì thực dân Pháp trở lại xâm lược. Dấu ấn của nạn đói năm 45 vẫn còn, rất đậm, trong mỗi người Việt Nam. Tự do hay trở về cuộc đời cũ? Đấy là câu hỏi day dứt bao người. Theo tiếng gọi của tự do, những người nông dân, công nhân, học sinh, những người mẹ, người chị tham gia kháng chiến, tạo nên hào khí dân tộc của một thời đại. Trong những năm tháng đáng nhớ ấy, văn học dù chưa dám nói là đã ghi lại trọn vẹn bộ mặt đất nước, nhưng cũng đã ghi lại được hào khí của một thời với hình ảnh bao người mà hình ảnh trung tâm là người chiến sỹ cụ Hồ. Bài thơ Tây Tiến của Quang Dũng cũng ra đời trong hoàn cảnh chung đó. Bài thơ sáng tác tại Phù Lưu Chanh năm 1948 khi Quang Dũng đã chuyển đơn vị. Nhưng những ngày tháng sống và chiến đấu ở đoàn quân Tây Tiến là những kỷ niệm khó quên nên nỗi nhớ Tây Tiến da diết, cồn cào trong lòng tác giả. Toàn bài thơ là một nỗi nhớ. Tác giả nhớ về cuộc sống gian khổ, nhớ về kỷ niệm những đêm liên hoan, về cái âm u hoang dã của rừng núi và in đậm nhất là nỗi nhớ của người lính Tây Tiến. Ra đi kháng chiến khi còn là thanh niên, học sinh Hà Nội. Quang Dũng cũng như đồng đội tác giả trở thành người lính. Kỷ niệm làm người lính Tây Tiến đã xa mà lại gần, để khi trở lại, tác giả phải bật lên: Sông Mã xa rồi Tây Tiến ơi! Câu thơ kết thúc bằng dấu chấm than cùng với âm hưởng của vần ơi, tạo nên xúc cảm lớn. Hành ảnh đó là tiếng nói của Quang Dũng vang vọng dến đoàn quân Tây Tiến? Không! Đó là tiếng long của tác giả “Xa rồi Tây Tiến ơi” nhưng tấm lòng thì vẫn thiết tha lắm! Âm hưởng câu thơ có sức vọng làm cho tiếng lòng của Quang Dũng như xoáy sâu vào tâm hồn người đọc. Người đọc rung theo những xúc cảm do câu đầu mang lại để đến với nỗi nhớ Tây Tiến: Nhớ về rừng núi nhớ chơi vơi Nỗi nhớ mới lạ lùng làm sao? “Nhớ chơi vơi!” Hình như trong ca dao ta cũng bắt gặp: Ra về nhớ bạn chơi vơi Nỗi nhớ “chơi vơi” là nỗi nhớ không định hình, khó nắm bắt đã diễn tả bằng lời. Nỗi nhớ ấy bao la, bát ngát lại có chiều sâu. Nói muốn tràn ra khỏi không gian để xoáy vào lòng người. Một người ngoài cuộc hẳn không thể có nỗi nhớ ấy. Chỉ có Quang Dũng với nỗi lòng của mình mới có nỗi nhớ ấy mà thôi. Với tấm lòng tha thiết thì hẳn nỗi “nhớ chơi vơi” là điều hoàn toàn có lý. Cũng sử dụng vần “ơi!” câu thơ có sức lan tỏa rộng. Vần “ơi” lan ra theo nỗi nhớ “chơi vơi” của tác giả. Thông thương thường khi nhớ về một điều gì, người ta thường nhớ đến những kỷ niệm đẹp để lại dấu ấn không quên. Quang Dũng nhớ đầu tiên là nhớ về rừng núi. Nhớ về rừng núi… Rừng núi là nơi xưa kia tác giả cùng đồng đội đã cùng sống, cùng chiến đấu. Rừng núi in đậm bao nỗi khổ, bao niềm vui nối buồn của người chiến sỹ. Hơn ai hết, tác giả là người trong cuộc, tác giả nhớ về rừng núi, những khó khăn gian khổ mà mình đã từng nếm trải: Sài Khao sương lấp đoàn quân mỏi. Mường Lát hoa về trong đêm hơi Dốc lên khúc khuỷu dốc thăm thẳm Heo hút cồn mấy súng ngửi trời Ngàn thước lên cao ngàn thước xuống Nhà ai Pha Luông mưa xa khơi. Mặc dù cuộc sống gian khổ không phải điều nhà thơ chú trọng phác họa nhưng trước mắt ta vẫn hiện ra cái khắc nghiệt của rừng núi. Nhà thơ Tố Hữu đã từng có những câu thơ: Năm mươi sáu ngày đêm ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHAN THỊ THUẬN TRÍCH CHỌN SỰ KIỆN TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHAN THỊ THUẬN TRÍCH CHỌN SỰ KIỆN TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT Ngành : Công nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số : 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS NGUYỄN TRÍ THÀNH HÀ NỘI - 2014 i LỜI CẢM ƠN Trƣớc tiên, tôi xin đƣợc gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Thầy giáo, TS. Nguyễn Trí Thành đã tận tình chỉ bảo; hƣớng dẫn; động viên và giúp đỡ tôi trong suốt quá trình thực hiện luận văn tốt nghiệp. Tôi xin gửi lời cảm ơn tới Thầy giáo, PGS. TS. Hà Quang Thuỵ ngƣời đã tận tình giúp đỡ, cổ vũ, và góp ý cho tôi trong suốt thời gian tôi nghiên cứu và làm việc tại phòng thí nghiệm Công nghệ Tri thức (Knowledge Technology Laboratory - KTLab). Tôi xin gửi lời cảm ơn tới các anh chị, các bạn sinh viên tại phòng thí nghiệm Công nghệ Tri thức (KTLab) – Trƣờng Đại học Công nghệ đã hỗ trợ tôi rất nhiều trong quá trình thực hiện luận văn. Cuối cùng, tôi muốn gửi lời cảm ơn tới gia đình và bạn bè, những ngƣời thân yêu luôn bên cạnh: quan tâm; động viên tôi trong suốt quá trình học tập và thực hiện luận văn tốt nghiệp này. Tôi xin chân thành cảm ơn! Hà Nội, ngày 20 tháng 6 năm 2014 Học viên Phan Thị Thuận ii LỜI CAM ĐOAN Tôi xin cam đoan giải pháp trích chọn sự kiện trong văn bản tin tức tiếng Việt đƣợc trình bày trong luận văn này do tôi thực hiện dƣới sự hƣớng dẫn của TS. Nguyễn Trí Thành. Tôi đã trích dẫn đầy đủ các tài liệu tham khảo, công trình nghiên cứu liên quan ở trong nƣớc và quốc tê. Tất cả những tham khảo từ các nghiên cứu liên quan đều đƣợc nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo trong luận văn. Hà Nội, tháng 6 năm 2014 Tác giả luận văn Phan Thị Thuận iii MỤC LỤC DANH MỤC CÁC HÌNH vi DANH MỤC CÁC BẢNG vi MỞ ĐẦU vii Chƣơng 1. GIỚI THIỆU ĐỀ TÀI 1 1.1. BÀI TOÁN TRÍCH CHỌN THÔNG TIN TRONG VĂN BẢN 1 1.2. TỔNG QUAN VỀ SỰ KIỆN 1 1.2.1. Định nghĩa sự kiện 3 1.2.2. Trích chọn sự kiện 3 1.3. TRÍCH CHỌN SỰ KIỆN TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT 4 1.3.1. Bài toán trích chọn sự kiện vụ tai nạn 4 1.3.2. Phát hiện sự kiện 6 1.3.3. Trích chọn sự kiện 6 1.4. Ý NGHĨA CỦA BÀI TOÁN TRÍCH CHỌN SỰ KIỆN VỤ TAI NẠN 7 1.4.1. Ý nghĩa khoa học 7 1.4.2. Ý nghĩa thực tiễn 7 1.5. KẾT LUẬN 8 Chƣơng 2. MỘT SỐ PHƢƠNG PHÁP TIẾP CẬN 9 2.1. PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN TẬP LUẬT (RULE – BASED) 9 2.1.1. Luật cú pháp (lexico-syntactic patterns) 10 2.1.2. Luật ngữ nghĩa (lexico-semantic patterns) 11 2.1.3. Hình dạng và biểu diễn của tập luật (Form and Representation of Rules) 11 iv 2.2. PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN HỌC MÁY 15 2.3 PHƢƠNG PHÁP TIẾP CẬN KẾT HỢP LUẬT VÀ HỌC MÁY 17 2.5. TỔNG KẾT 18 Chƣơng 3. ĐỀ XUẤT MÔ HÌNH TRÍCH CHỌN SỰ KIỆN VỤ TAI NẠN 19 3.1. CÁC ĐẶC TÍNH CỦA SỰ KIỆN VỤ TAI NẠN 19 3.2. PHÁT BIỂU BÀI TOÁN 19 3.3. MÔ HÌNH PHÁT HIỆN VÀ TRÍCH CHỌN SỰ KIỆN VỤ TAI NẠN 21 3.3.1. Phƣơng pháp đề xuất 21 3.3.2. Mô hình phát hiện và trích chọn sự kiện vụ tai nạn 22 3.4. GIẢI QUYẾT BÀI TOÁN PHÁT HIỆN SỰ KIỆN VÀ BÀI TOÁN TRÍCH CHỌN SỰ KIỆN VỤ TAI NẠN 23 3.4.1. Bài toán 1- Pháp hiện sự kiện vụ tai nạn (pha 1) 23 3.4.1.1. Phát biểu bài toán 23 3.4.1.2. Xây dựng tập luật 24 3.4.1.3. Xây dựng mô hình phân lớp 28 3.4.2. Bài toán 2- Trích chọn sự kiện vụ tai nạn (pha 2) 29 3.4.2.1. Phát biểu bài toán 29 3.4.2.2. Trích chọn thời gian 30 3.4.2.3. Trích chọn địa điểm 32 3.4.2.4. Trích chọn số thương vong 32 3.4.2.5. Trích chọn phương tiện gây tai nạn 33 3.5. TỔNG KẾT 34 Chƣơng 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ 36 v 4.1. MÔI TRƢỜNG VÀ CÁC CÔNG CỤ SỬ DỤNG THỰC NGHIỆM 36 4.2. XÂY DỰNG TẬP DỮ LIỆU 37 4.2.1. Thu thập dữ liệu 37 4.2.2. Tiền xử lý dữ liệu 37 4.3. ĐÁNH GIÁ QUÁ TRÌNH PHÁT HIỆN SỰ KIỆN 37 4.3.1. Đánh giá bộ lọc dữ liệu 37 4.3.2. Đánh giá quá Trích chọn sự kiện trong văn bản tin tức tiếng Việt Phan Thị Thuận Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 01 04 Người hướng dẫn: TS. Nguyễn Trí Thành Năm bảo vệ: 2014 Keywords. Hệ thống thông tin; Trích chọn thông tin; Văn bản tiếng Việt Content Trích chọn thông tin (Information Extraction - IE), đặc biệt là trích chọn sự kiện (Event Extraction - EE) là một lĩnh vực con trong khai phá dữ liệu (Data Mining - DM). Những năm gần đây, trích chọn sự kiện đã thu hút nhiều sự quan tâm từ các nhà khoa học trên thế giới và đã thu được nhiều kết quả trong thực tế. Trích chọn sự kiện có thể áp dụng vào nhiều miền dữ liệu khác nhau như kinh tế, văn hóa, y tế, xã hội (chẳng hạn như thông tin về các vụ tai nạn giao thông), chính trị, Theo những con số thống kê trên các trang báo điện tử về con số tai nạn hàng năm, như: thông tin đăng trên báo điện tử http://binhduong.gov.vn, sáng 03 – 01-2013, Chính phủ tổ chức “Hội nghị trực tuyến tổng kết công tác trật tự an toàn giao thông năm 2012 và triển khai nhiệm vụ năm 2013” do Phó Thủ tướng Chính phủ Nguyễn Xuân Phúc chủ trì. Trong hội nghị, Ủy ban An toàn giao thông ATGT Quốc gia đã thống kê: năm 2012, cả nước xảy ra 36.376 vụ tai nạn giao thông, làm chết 9.838 người, bị thương 38.060 người. Cũng theo báo điện tử http://hanoimoi.com.vn, ngày 31-12- 2013, Phó Thủ tướng Chính phủ, Chủ tịch Ủy ban ATGT Quốc gia Nguyễn Xuân Phúc đã chủ trì hội nghị trực tuyến với các bộ, ngành, địa phương nhằm tổng kết công tác bảo đảm trật tự ATGT năm 2013 và triển khai nhiệm vụ năm 2014. Theo thống kê của Ủy ban ATGT Quốc gia, năm 2013 cả nước đã xảy ra 29.385 vụ tai nạn giao thông (TNGT), làm chết 9.369 người, bị thương 29.500 người. Từ các con số thống kê tai nạn giao thông hàng năm, chúng ta thấy số vụ tai nạn còn rất cao, đi cùng với nó là con số tử vong và số thương vong là rất lớn. Mặt khác, bản tin vụ tai nạn được cập nhật khá đầy đủ và mang tính thời sự trên các báo điện tử. Hơn nữa, trích chọn sự kiện đang rất phát triển, chúng ta có thể sử dụng trích chọn sự kiện để trích chọn thông tin hữu ích từ các bản tin vụ tai nạn, kết quả của quá trình này sẽ được thống kê thành các con số hữu ích giúp các nhà quản lý và người dân tham gia giao thông đúng cách. Đó cũng là lý do, tác giả chọn và nghiên cứu đề tài“Trích chọn sự kiện trong văn bản tin tức tiếng Việt” miền dữ liệu khai thác là sự kiện vụ tai nạn. Chi tiết luận văn được chia thành 4 chương: Chương 1. Giới thiệu đề tài Chương này trình bày cơ bản về bài toán trích chọn sự kiện trong bối cảnh bùng nổ thông tin trên Internet. Hơn nữa nêu lên được ý nghĩa khoa học, ý nghĩa thực tiễn, ứng dụng của đề tài trích chọn sự kiện vụ tai nạn giao thông trên miền văn bản tiếng Việt. Chương 2.Một số phương pháp tiếp cận Chương này tập trung trình bày các phương pháp tiếp cận cho bài toán trích chọn sự kiện đó là, phương pháp tiếp cận dựa trên tâp luật, phương pháp tiếp cận dựa trên học máy, phương pháp tiếp cận kết hợp luật và học máy, trong mỗi phương pháp đều có nhận xét hữu ích. Từ đó, luận văn sẽ chỉ ra phương pháp phù hợp cho bài toán trích chọn sự kiện vụ tai nạn. Chương 3. Đề xuất mô hình trích chọn sự kiện vụ tai nạn Chương này, phát biểu và mô tả mô hình tổng thể cho bài toán trích chọn sự kiện vụ tai nạn. Sau đó, phát biểu, mô tả mô hình chi tiết và cách giải quyết cho hai bài toán: phát hiện sự kiện và trích chọn sự kiện. Chương 4. Thực nghiệm và đánh giá Chương này, luận văn mô tả quá trình thực nghiệm và đánh giả kết quả đề xuất dựa trên hai bài toán, đó là: bài toán phát hiện sự kiện và bài toán trích chọn sự kiện. Ba độ đo được sử dụng trong pha phát hiện sự kiện là ... phục LÃNG MẠN – Nội tâm: Đêm mơ Hà Nội dáng kiều thơm: hào hoa Tây Tiến, lăng mạn bay bổng Tây tiến, sức mạnh Tây Tiến Bên cạnh tinh thần sục sơi chiến đấu có khoảng trời tâm tưởng mộng ước với... bỏ quên đời, áo bào thay chiếu anh đất Dọc đường Tây Tiến nấm mồ vô danh: rải rác biên cương mồ viễn xứ Áo bào: sang trọng hóa hi sinh lính Tây Tiến kiểu chí làm trai dặm nghìn da ngựa trân trọng... đèo thực trải qua + Nhớ nhung cảm giác bình yên Tây Bắc khói lam chiều mùi hương nếp xôi nồng nàn quyến rũ VẺ ĐẸP CỦA TƯỢNG ĐÀI NGƯỜI LÍNH TÂY TIẾN BI TRÁNG – Ngoại hnh: gân guốc, lạ hóa (khơng

Ngày đăng: 08/11/2017, 21:25

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan