ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim

37 422 0
ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN KHOA: KHOA HỌC MÁY TÍNH  TIỂU LUẬN PHƯƠNG PHÁP NGUYÊN CỨU KHOA HỌC TRONG TIN HỌC ỨNG DỤNG VÀO VIỆC XÂY DỰNG PHƯƠNG PHÁP TRẢ LỜI CÁC TRUY VẤN TIẾNG VIỆT CHO HỆ THỐNG TÌM KIẾM THƯ VIỆN PHIM Giảng viên hướng dẫn : GS.TSKH HOÀNG KIẾM Sinh viên thực hiện: - NGUYỄN KHẮC MẪN _ CH1101102 - NGÔ NGỌC THƠ _ CH1101139 Lớp : CH06 TP Hồ Chí Minh, tháng năm 2012 Lời cảm ơn Trước tiên, nhóm chúng em xin cảm ơn thầy GS TSKH Hoàng Kiếm tạo điều kiện cho nhóm tiếp xúc với phương pháp luận sáng tạo khoa học nói chung tin học nói riêng Mơn học cung cấp kiến thức cách sáng tạo, định hướng tư lập luận đắn để vận dụng tri thức vào trình làm việc với khoa học Những kiến thức cần thiết thành viên lớp chuẩn bị trình làm tốt nghiệp, sau làm việc mơi trường khoa học Nhóm dành cảm ơn đến thành viên lớp tạo mơi trường học thuận lợi q trình tiếp thu giảng Một lần nữa, nhóm chúng em xin chân thành cảm ơn tận tình truyền đạt kiến thức thầy Kính chúc thầy mạnh khỏe, tiếp tục đạt nhiều thắng lợi nghiên cứu khoa học công giảng dạy Học viên: Nguyễn Khắc Mẫn - Ngô Ngọc Thơ NHẬN XÉT ……………………………………………………………………………………… …………………………………………………………………….……………………… ………………………………………………………….………………………………… ……………………………………………….…………………………………………… …………………………………….……………………………………………………… ………………………….………………………………………………………………… ……………….…………………………………………………………………………… …….………………………………………………………………………………….…… …………………………………………………………………………….……………… ………………………………………………………………….………………………… ……………………………………………………….…………………………………… …………………………………………….……………………………………………… ………………………………….………………………………………………………… ……………………….…………………………………………………………………… …………….……………………………………………………………………………… ….………………………………………………………………………………….……… ………………………………………………………………………….………………… ……………………………………………………………….…………………………… …………………………………………………….……………………………………… ………………………………………….………………………………………………… ……………………………….…………………………………………………………… …………………….……………………………………………………………………… ………….………………………………………………………………………………… ……………………………………………………………………………….…………… …………………………………………………………………….……………………… ………………………………………………………… PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Mục Lục: CHƯƠNG 1: CƠ SỚ LÝ THUYẾT CHO CÁC NGHIÊN CỨU KHOA HỌC .3 I VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT 1.1 Khái niệm 1.2 Phân loại 1.3 Các tình vấn đề .3 1.4 Các phương pháp phát vấn đề khoa học .4 1.5 Phương pháp giải vấn đề theo khoa học phát minh, sáng chế .4 II CÁC BƯỚC TIẾN HÀNH MỘT CƠNG TRÌNH NGHIÊN CỨU KHOA HỌC .6 2.1 Thế nghiên cứu khoa học 2.2 Các tiêu chí cần đáp ứng nghiên cứu khoa học 2.3 Trình tự bước cần tiến hành nghiên cứu khoa học 2.4 Các khó khăn gặp phải cách khắc phục 2.5 Những điều nên không nên nghiên cứu khoa học 12 CHƯƠNG 2: PHÂN TÍCH Q TRÌNH PHÁT TRIỂN CỦA NGHÀNH CÔNG NGHIỆP GAME & VIỆC ỨNG DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC TRONG ĐÓ 16 I SƠ LƯỢC Q TRÌNH PHÁT TRIỂN CỦA NGÀNH CƠNG NGHIỆP GAME 16 1.1 Khái niệm video game 16 1.2 Lịch sử phát triển ngành công nghiệp game 17 II PHÂN TÍCH CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC ĐƯỢC ÁP DỤNG TRONG Q TRÌNH PHÁT TRIỂN CỦA NGÀNH CƠNG NGHIỆP GAME 18 2.1 Nguyên lý phân nhỏ 18 2.2 Nguyên tắc kết hợp 19 2.3 Nguyên tắc vạn 19 III ÁP DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC KỸ THUẬT TRONG VẬN HÀNH GAME 20 3.1 Nguyên tắc thực sơ 20 3.2 Nguyên tắc dự phòng 20 3.3 Nguyên tắc linh động 21 3.4 Nguyên tắc biến hại thành lợi 21 Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC CHƯƠNG 3: ỨNG DỤNG CƠ SỞ LÝ THUYẾT NGHIÊN CỨU KHOA HỌC VÀO CÔNG VIỆC NGHIÊN CỨU THỰC TIỄN CỦA BẢN THÂN 22 I GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU 22 1.1 Mục tiêu đề tài 22 1.2 Phạm vi nghiên cứu 22 1.3 Nội dung nghiên cứu 23 1.4 Những đóng góp 23 1.5 Mơ hình kiến trúc hệ thống xây dựng 24 II ÁP DỤNG CÁC NGUYÊN LÝ NGHIÊN CỨU KHOA HỌC TRONG QUÁ TRÌNH NGHIÊN CỨU 25 2.1 Nguyên lý phân nhỏ 25 2.2 Nguyên lý thực sơ 26 2.3 Nguyên lý linh động 27 2.4 Nguyên lý hoạt động theo chu kỳ 28 2.5 Nguyên lý phản hồi 30 Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC CHƯƠNG 1: CƠ SỚ LÝ THUYẾT CHO CÁC NGHIÊN CỨU KHOA HỌC I VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT 1.1 Khái niệm Vấn đề khoa học (scientific problem) gọi vấn đề nghiên cứu (research problem) câu hỏi nghiên cứu câu hỏi đặt người nghiên cứu đứng trước mâu thuẫn tính hạn chế tri thức khoa học có với yêu cầu phát triển tri thức trình độ cao 1.2 Phân loại Nghiên cứu khoa học tồn hai vấn đề : - Vấn đề chất vật tìm kiếm - Vấn đề phương pháp nghiên cứu để làm sáng tỏ lý thuyết thực tiễn vấn đề thuộc lớp thứ 1.3 Các tình vấn đề Có ba tình : Có vấn đề , khơng có vấn đề, giả vấn đề cho hình đây: Hình 1.1: Sơ đồ phân loại Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC 1.4 Các phương pháp phát vấn đề khoa học Có sáu phương pháp: 1) Tìm kẻ hở, phát vấn đề 2) Tìm bất đồng 3) Nghĩ ngược lại quan niệm thông thường 4) Quan sát vướng mắc thực tiễn 5) Lắng nghe lời kêu ca phàn nàn 6) Cảm hứng : câu hỏi xuất quan sát kiện 1.5 Phương pháp giải vấn đề theo khoa học phát minh, sáng chế 1.5.1 Có phương pháp:  Dựng Vepol đầy đủ  Chuyển sang Fepol  Phá Vepol  Xích Vepol  Liên trường 1.5.2 Có 40 thủ thuật:  Nguyên lý phân nhỏ  Nguyên lý “tách khỏi”  Nguyên lý phẩm chất cục  Nguyên lý (phản) bất đối xứng  Nguyên lý kết hợp  Nguyên lý vạn  Nguyên lý “chứa trong”  Nguyên lý phản trọng lượng  Nguyên lý gây ứng suất (phản tác động) sơ Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC  Nguyên lý thực sơ  Nguyên lý dự phòng  Nguyên lý đẳng  Nguyên lý đảo ngược  Nguyên lý cầu (tròn) hóa  Nguyên lý linh động  Nguyên lý giải (tác động) “thiếu” “thừa”  Nguyên lý chuyển sang chiều khác  Sử dụng dao động học  Nguyên lý hoạt động theo chu kỳ  Nguyên lý liên tục tác động có ích  Ngun lý “vượt nhanh”  Nguyên lý biến hại thành lợi  Nguyên lý quan hệ phản hồi  Nguyên lý sử dụng trung gian  Nguyên lý tự phục vụ  Nguyên lý chép  Nguyên lý “rẻ’ thay cho “đắt”  Thay sơ đồ (kết cấu) học  Sử dụng kết cấu khí lỏng  Sử dụng vỏ dẻo màng mỏng  Sử dụng vật liệu nhiều lỗ  Nguyên lý thay đổi màu sắc  Nguyên lý đồng  Nguyên lý phân hủy tái sinh phần  Thay đổi thơng số hóa lý đối tượng  Sử dụng chuyển pha Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC  Sử dụng nở nhiệt  Sử dụng chất ôxy hóa mạnh  Thay đổi độ trơ  Sử dụng vật liệu hợp thành (composite) II CÁC BƯỚC TIẾN HÀNH MỘT CƠNG TRÌNH NGHIÊN CỨU KHOA HỌC 2.1 Thế nghiên cứu khoa học Nghiên cứu khoa học hoạt động tìm kiếm, xem xét, điều tra thử nghiệm để phát chất vật, giới tự nhiên xã hội, để sáng tạo phương pháp phương tiện kỹ thuật cao hơn, giá trị 2.2 Các tiêu chí cần đáp ứng nghiên cứu khoa học Một nghiên cứu khoa học cần đáp ứng tiêu chísau đây: - Phát điều quy luật đặc tính tự nhiên xã hội - So sách hai nhiều tượng tự nhiên xã hội để giống khác chúng - Tìm kiếm phương pháp để giải khó khăn, trục trặc cản trở phát triển tự nhiên xã hội - Thay đổi lợi dụng tượng tự nhiên xã hội để phục vụ tốt cho người môi trường xung quanh - Nghiên cứu tượng / công việc xảy / thực khứ để rút học cho tương lai - Dự đoán tương lai để có hành động phù hợp Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC 2.3 Trình tự bước cần tiến hành nghiên cứu khoa học Hình 1.2 Thứ tự bước thực tiến hành nghiên cứu khoa học Bước 1: Mơ tả khó khăn thực tế Trong thực tế gặp khó khăn lúc cần tiến hành nghiên cứu khoa học với mục đích giải khó khăn Vậy nói việc mơ tả khó khăn gặp phải mở đầu cho nghiên cứu Bước 2: Tổng quan nghiên cứu liên quan Đây thời gian tìm hiểu xem vấn đề dự định nghiên cứu nghiên cứu học giả khác chưa, mức độ qua học điều hay tránh việc lặp lại nghiên cứu trước Bước 3: Xác định mục tiêu nghiên cứu Mục tiêu nghiên cứu dự định đặt để giải khó khăn bước Nghiên cứu viên phải bám theo mục tiêu đề Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Một game có thuơng hiệu lâu đời có lẽ Microsoft Flight Simulator (game mơ lái máy bay) lần đầu phát hành vào năm 1982 với tên Quân đội Mỹ sử dụng game mô thục tế ảo để làm tập huấn luyện, với phát triển số lớn phần hỗ trợ bay khác lái máy bay cảnh sát, máy bay chiến đấu, máy bay y tế Một ví dụ khác game giới ảo (Second Life) sử dụng số đơn vị phủ Mỹ (vd:NOAA, NASA, JPL), trường đại học (vd:Đại học Ohio, MIT) cho giáo dục chương trình học tập từ xa kinh doanh (như IBM, Cisco Systems) cho họp huấn luyện III ÁP DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC KỸ THUẬT TRONG VẬN HÀNH GAME Sau số áp dụng nguyên lý sáng tạo khoa học kỹ thuật vận hành game online 3.1 Nguyên tắc thực sơ Trong quy trình làm game trước release game thị trường thường game chạy thử nghiệm qua giai đoạn anpha, beta, close beta Trong giai đoạn có số lượng hạn chế số lượng người chơi tham gia vào game chơi thử Nếu có vấn đề game gamer phản hồi với nhà phát hành game để khắc phục Mục đích q trình nhằm đảm bảo game chạy ổn định trước vận hành thức 3.2 Ngun tắc dự phịng Trong q trình vận hành sản phẩm game trực tuyến thường lượng liệu thông tin người chơi game lớn, người vận hành game phải thường xuyển thực việc lưu lại thông tin cách định kì nhằm đảm bảo liệu người dùng khơng bị có cố xảy Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 20 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC 3.3 Nguyên tắc linh động Các lỗi phần mềm không phát người kiểm tra phần mềm tồn phát hành thức game Điều thường hay xảy phần lớn trục trặc xuất điều kiện bất thường game, coi nhỏ để sửa lại, game phải phát triển nhanh để kịp thời hạn phát hành Các trục trặc lỗi nhỏ hình ảnh lỗi nghiêm trọng xóa hoàn toàn phần lưu game gây cố chạy game Phần lớn trường hợp nhà phát hành tung cập nhật(hay gọi patch- vá lỗi) để sửa trục trặc Đơi khi, trục trặc lại có lợi cho người chơi, chúng thường gọi exploits-khám phá 3.4 Nguyên tắc biến hại thành lợi Gian lận game liên quan đến mã gian lận điểm ẩn giấu thực hiên trình làm game, mã chỉnh sửa làm bên thứ ba, người chơi khám phá lỗi phần mềm Việc chỉnh sửa tạo điều kiện gian lận phần cứng người đào tạo phần mềm Gian lận thường làm game dễ việc cung cấp số lượng khơng hạn chế tài ngun game, ví dụ vũ khí, máu, đạn dược hay loại khác; khả đặc biệt xuyên tường Các loại gian lận khác cho phép truy cập tới cấp độ chơi theo cách thơng thường cung cấp tính bất thường hay gây cười, thay đổi màu sắc hiển thị hình ảnh game Qua phân tích ví dụ điển hình phát triển ngành cơng nghiệp game thấy nguyên tắc phương pháp sáng tạo khoa học dùng cách rộng rãi phổ biến đặc biệt công nghệ thông tin Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 21 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC CHƯƠNG 3: ỨNG DỤNG CƠ SỞ LÝ THUYẾT NGHIÊN CỨU KHOA HỌC VÀO CÔNG VIỆC NGHIÊN CỨU THỰC TIỄN CỦA BẢN THÂN I GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU Tên đề tài: PHƯƠNG PHÁP TRẢ LỜI CÁC TRUY VẤN TIẾNG VIỆT CHO HỆ THỐNG TÌM KIẾM THƯ VIỆN PHIM 1.1 Mục tiêu đề tài Đề tài nhằm mục tiêu nghiên cứu phương pháp trả lời truy vấn tiếng Việt cho hệ thống tìm kiếm thư viện phim Phương pháp trả lời truy vấn tiếng Việt thiết lập sở xây dựng qui tắc cú pháp định nghĩa theo DCG (Definite Clause Grammar) để phân tích cấu trúc cú pháp câu hỏi tiếng Việt, từ xác định thông tin mà câu hỏi cần truy vấn để tạo câu trả lời dựa cấu trúc cú pháp câu hỏi có liên quan 1.2 Phạm vi nghiên cứu Để thực mục tiêu nghiên cứu đề tài, giới hạn phạm vi nghiên cứu nội dung sau: - Các dạng câu truy vấn tiếng Việt: có cấu trúc câu đơn, hỏi trực tiếp, thuộc dạng sau: o Dạng câu hỏi đúng/sai o Dạng câu hỏi thông tin o Dạng câu hỏi yêu cầu liệt kê thông tin đối tượng - Lĩnh vực ứng dụng: thông tin phim chẳng hạn như: tên phim, đạo diễn, diễn viên … Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 22 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC 1.3 Nội dung nghiên cứu Nội dung nghiên cứu đề tài tập trung chủ yếu vào việc làm để phân tích, xử lý câu truy vấn tiếng Việt dạng ngôn ngữ tự nhiên, cụ thể bao gồm nội dung sau: - Cách lấy thông tin: o Nghiên cứu việc rút trích thơng tin phim website o Chuyển đổi thơng tin rút trích thành dạng Ontology - Cách biểu diễn thơng tin phim máy tính: o Sử dụng Ontology để lưu trữ thông tin phim o Các thao tác với Ontology: tạo ontology, câp nhật, truy vấn - Cách phân tích, xử lý câu truy vấn ngôn ngữ tự nhiên (tiếng Việt): o Nghiên cứu ngữ pháp DCG để phân tích câu truy vấn o Nghiên cứu cách xử lý câu truy vấn phân tích DCG, sau phát sinh câu truy vấn SPARQL từ ngữ pháp DCG phân tích để truy vấn Ontology - Cách phát sinh câu trả lời dựa vào kết truy vấn Ontology, câu truy vấn người sử dụng 1.4 Những đóng góp Từ nghiên cứu nhóm đưa giải pháp cho mơ hình tìm kiếm tìm kiếm dựa ngữ nghĩa câu, cần làm cho máy tính có khả hiểu ý nghĩa câu truy vấn từ thực tìm kiếm thơng tin phù hợp với câu truy vấn - Vê mặt thực tiễn: cung cấp search engine gần gũi, thân thiện với người sử dụng Người sử dụng nhập vào câu truy vấn nhận muốn, khơng trước phải tốn thời gian cho việc sàng lọc thông tin tìm kiếm Nguyễn Khắc Mẫn _ Ngơ Ngọc Thơ 23 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC - Về mặt nghiên cứu khoa học: đưa mơ hình xử lý cho câu truy vấn tiếng Việt dạng ngơn ngữ tự nhiên Mơ hình giải tốn làm máy tính hiểu câu truy vấn dạng ngôn ngữ tự nhiên 1.5 Mơ hình kiến trúc hệ thống xây dựng Hình 3.1 Mơ hình kiến trúc hệ thống Hinh 3.1 mơ hình xử lý câu truy vấn tiếng việt cho thư viện phim mà nhóm xây dựng q trình nghiên cứu, mơ hình cho phép người dùng (user) nhập vào câu truy vấn tiếng việt dạng ngơn ngữ tự nhiên để tìm kiếm thơng tin phim cần thiết Ví dụ: Câu hỏi: “ai diễn viên phim chịm tình u?” Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 24 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Trả lời:“(Có tất kết quả) tào mẫn lợi, mã tuấn vỹ, dương di, tạ thiên hoa: diễn viên phim chịm tình u” Sau sâu vào thành phần cụ thể để thấy rõ việc áp dụng nguyên lý sáng tạo khoa học II ÁP DỤNG CÁC NGUYÊN LÝ NGHIÊN CỨU KHOA HỌC TRONG QUÁ TRÌNH NGHIÊN CỨU 2.1 Nguyên lý phân nhỏ Áp dụng nguyên lý phân nhỏ, nhóm phân chia hệ thống truy vấn thành module nhỏ, module đảm nhiệm vai trị Trong mơ hình 3.1 thấy hệ thống chia nhỏ thành lớp: - Giao diện người dùng: Nơi trực tiếp tương tác với người sử dụng, tiếp nhận yêu cầu cần xử lý - Bộ phân tích câu truy vấn: Các câu truy vấn tiếng Việt dạng ngôn ngữ tự nhiên sau người sử dụng nhập vào qua phân tích câu truy vấn, phận có nhiệm vụ phân tích câu cho cú pháp tương ứng - Bộ chuyển đổi cú pháp: Từ cú pháp có sau q trình phân tích phân tích câu truy vấn, thuật tốn chuyển đổi áp dụng để chuyển cú pháp dạng câu truy vấn ontology – ngôn ngữ SPARQL - Ontology phim: nơi lữu trữu liệu thơng tin phim xem sở liệu hệ thống - Bộ phát sinh câu trả lời: nơi phát sinh câu trả lời dựa vào câu truy vấn tiếng Việt thông tin có từ việc thực truy vấn ontology Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 25 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC 2.2 Nguyên lý thực sơ Áp dụng nguyên lý thực sơ xây dựng mơ hình phân tích câu truy vấn Hình sơ đồ thiết kế phân tích câu truy vấn: Hình 3.2 Sơ đồ q trình xử lý câu truy vấn tiếng Việt dạng ngôn ngữ tự nhiên Một câu truy vấn tiếng việt trước chuyển thành cấu trúc ngữ pháp DCG phải trải qua bước tiền xử lý câu truy vấn Các bước thực trình tiền xử lý: - Loại bỏ khoảng trắng dư thừa - Chuyển chữ hoa dạng chữ thường - Thay kí tự đặc biệt dấu phẩy, dấu hai chấm, dấu chấm phẩy… thành chuỗi đại diện - Biến đổi chuỗi thành dạng danh sách từ đơn Kết trình cho danh sách từ đơn câu truy vấn Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 26 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Phân tích cú pháp DCG dựa vào qui tắc cú pháp định nghĩa DCG để phân tích xác định cấu trúc cú pháp câu hỏi 2.3 Nguyên lý linh động Áp dụng nguyên lý linh động phận tích, chuyển đổi ngữ pháp sang ngơn ngữ truy vấn SPARQL, thuật toán thành phần trung giản để chuyển đổi ngữ pháp có từ phân tích câu truy vấn Thuật toán chuyển đổi cú pháp nhận chuỗi input cú pháp để xác định đâu thành phần cần truy vấn, đâu thành phần liệu, cuối chuyển thành phần dạng câu truy vấn SPARQL Sơ đồ thiết kế chuyển đổi cú pháp: Hình 3.3 Sơ đồ khối q trình chuyển đổi cú pháp sang SPARQL Ví dụ: Input Output thuật toán chuyển đổi Giả sử có câu truy vấn sau: “ dương di diễn viên phim chịm tình u ? ” Input Output thuật toán chuyển đổi ngữ pháp Input Output Cây cấu trúc ngữ pháp Câu truy vấn SPARQL formal2(formal2( SELECT ?Đạo_diễn interrogative(nil), WHERE unrelated_defined_objects(unrelated_ { defined_object(film(plural(nil), input(input_term(chịm), :có_đạo_diễn_là input(input_term(sao), ?Đạo_diễn input(input_term(tình), } input(input_term(u)))))))))), related_interrogative_objects(r_rela ted_interrogative_object(relation(re lation_film_director(verb_have(có), director_term(đạo, diễn),verb_be(là))), unrelated_interrogative_objects(unre lated_interrogative_object(w_directo r(who(ai)))))), interrogative(nil))) 2.4 Nguyên lý hoạt động theo chu kỳ Để đảm bảo cho Ontology phim cập nhật mở rộng liên tục, rút trích liệu web thực việc thu thập liệu phim từ web site internet, từ cập nhật vào ontology Hoạt động chương trình web crawler (trong phạm vi đề tài giới hạn liệu phim) Bộ rút trích đến duyệt trang web site phim để rút trích thơng tin phim, sau tự động chuyển thơng tin rút trích vào Ontology phim Mơ hình thiết kế: Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 28 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Hình 3.4 Sơ đồ khối q trình rút trích liệu Ví dụ: Các thơng tin cần rút trích: Dữ liệu rút trích từ trang http://movie.zing.vn/ Bộ thư viện html parser hỗ trợ việc phân tích trang web Bộ thư viện jdom hỗ trợ đọc ghi xml file Cụ thể, thông tin phim rút trích bao gồm thơng tin sau: - Url địa liên kết đến phim internet - Tên tiếng Việt phim - Tên tiếng Anh phim - Đạo diễn - Diễn viên - Nhà sản xuất Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 29 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC - Quốc gia - Độ dài - Ngày phát hành - Đánh giá 2.5 Thể loại Giới thiệu, nội dung phim Nguyên lý phản hồi Quá trình xử lý cuối phát sinh câu trả lời dựa vào câu truy vấn tiếng Việt thơng tin có từ việc thực truy vấn ontology Chẳng hạn, câu truy vấn “Ai đạo diễn phim chịm tình u ?” cần trả lời đơn giản “Từ Ngộ An” Tuy nhiên, để tăng tính tự nhiên thân thiện với người dùng, kết có từ truy vấn ontology thông qua phát sinh câu trả lời cho câu trả lời tự nhiên Ví dụ với câu truy vấn “Ai đạo diễn phim chịm tình u” thay đơn trả kết “Từ Ngộ An” thơng qua phát sinh câu trả lời người sử dụng nhận kết “Phim chòm tình u có đạo diễn Từ Ngộ An” Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 30 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC TÀI LIỆU THAM KHẢO Các tài liệu tiếng Anh: [1] Dang Tuan Nguyen, Ha Quy-Tinh Luong “Document searching system based on natural language query processing for Vietnam Open Courseware library”, International Journal of Computer Science Issues (IJCSI), pp 7-13, Vol 6, No 2, November 2009 ISSN (online): 1694-0784, ISSN (print): 1694-0814 [2] Fernando C N Pereira Stuart M Shieber, “Prolog and Natural-Language Analysis (Digital Edition)”, ISBN 0-9719777-0-4 (Microtome’s website: www.mtome.com) [3] Fernando C N Pereira and David H D Warren (Department of Artificial Intelligence, University of Edinburgh), “Definite Clause Grammars for Language Analysis – A Survey of the Formalism and a Comparison with Augmented Transition Networks”, presented at Artif Intell., 1980, pp.231-278 [4] Patrick Blackburn, Johan Bos, Kristina Striegnitz , “Learn Prolog now”, 2011 Các tài liệu tiếng Việt: [5] Slide _ Phương pháp nghiên cứu khoa học tin học _ GS.TSKH Hoàng Kiếm [6] Phương pháp luận sáng tạo khoa học – kỹ thuật giải vấn đề định (giáo trình tóm tắt) _ Phan Dũng [7] Phương pháp nghiên cứu khoa học _ TS Đinh Tuấn Hải [8] Lương Q Tịnh Hà, “Xây dựng cơng cụ tìm kiếm tài liệu học tập truy vấn ngôn ngữ tự nhiên kho học liệu mở Tiếng Việt”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại Học Công nghệ thông tin, Đại học quốc gia TP Hồ Chí Minh, 2009 Nguyễn Khắc Mẫn _ Ngơ Ngọc Thơ 31 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC [9] Nguyễn Vũ Huy, “Một số phương pháp kỹ thuật nâng cao hiệu xử lý dạng câu hỏi tiếng Việt đơn giản cho cơng cụ tìm kiếm thư viện học liệu mở”, Khóa luận tốt nghiệp đại học, hệ Cử nhân Tài năng, ngành Khoa học máy tính, Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP Hồ Chí Minh, 2010 [10] Nguyễn Văn Lễ, “Tìm kiếm thơng tin theo ngữ nghĩa: ứng dụng lĩnh vực du lịch”, Luận văn Thạc sỹ ngành Truyền liệu mạng máy tính, Học Viện Cơng nghệ Bưu Viễn thơng, 2011 [11] Nguyễn Đình Liên, “Phương pháp xử lý số dạng câu hỏi tiếng Việt cho cơng cụ tìm kiếm thư viện điện tử”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Đại học Lạc Hồng, 2011 [12] Vũ Thị Phương, “Cơng cụ tìm kiếm thơng tin lịch trình chuyến du lịch truy vấn tiếng Việt”, Khóa luận tốt nghiệp Đại học ngành Khoa học máy tính, Trường Đại học Cơng nghệ Thơng tin, Đại học Quốc gia TP Hồ Chí Minh [13] Lý Thiên Trang, “Mơ hình cơng cụ tìm kiếm truy vấn tiếng Việt ứng dụng cho thư viện trường đại học”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP Hồ Chí Minh, 2009 [14] Tơ Hoài Việt, "Xây dựng hệ thống học linh hoạt với tương tác người dùng cho toán so khớp ontology", Luận văn Thạc sỹ, ngành Khoa học máy tính, Đại học Khoa Học Tự Nhiên, Đại học Quốc gia TP Hồ Chí Minh, 2009 Các tài liệu internet: [15] HTML Parser : http://htmlparser.sourceforge.net/ [16] Protégé : http://protege.stanford.edu/ [17] SWI-Prolog: http://www.swi-prolog.org/ Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 32 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC [18] http://www.amzi.com/manuals/amzi/pro/ref_dcg.htm [19] http://en.wikipedia.org/wiki/Definite_clause_grammar [20] http://en.wikipedia.org/wiki/SPARQL Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 33 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 34 ... CÁC TRUY VẤN TIẾNG VIỆT CHO HỆ THỐNG TÌM KIẾM THƯ VIỆN PHIM 1.1 Mục tiêu đề tài Đề tài nhằm mục tiêu nghiên cứu phương pháp trả lời truy vấn tiếng Việt cho hệ thống tìm kiếm thư viện phim Phương. .. kiến trúc hệ thống xây dựng Hình 3.1 Mơ hình kiến trúc hệ thống Hinh 3.1 mơ hình xử lý câu truy vấn tiếng việt cho thư viện phim mà nhóm xây dựng trình nghiên cứu, mơ hình cho phép người dùng... câu truy vấn o Nghiên cứu cách xử lý câu truy vấn phân tích DCG, sau phát sinh câu truy vấn SPARQL từ ngữ pháp DCG phân tích để truy vấn Ontology - Cách phát sinh câu trả lời dựa vào kết truy

Ngày đăng: 27/08/2014, 18:22

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan