Tìm kiếm thông tin dựa trên ngữ cảnh

52 6 0
Tìm kiếm thông tin dựa trên ngữ cảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

giáo dục đào tạo trờng đại học bách khoa hà nội - luận văn thạc sĩ khoa học TìM KIếM THÔNG TIN dựa ngữ cảnh ngành : công nghệ THÔNG TIN m số:23.04.3898 BùI KHáNH LINH Ngời h−íng dÉn khoa häc : TS Vị TUỸT TRINH Hµ Nội 2010 Mẫu vỏ đĩa CD luận văn thạc sĩ khoa học NGữ CảNH TRONG TìM KIếM THÔNG TIN ngành : công nghệ THÔNG TIN m số:23.04.3898 BùI KHáNH LINH Hà Nội 2010 Tỡm kim thụng tin theo ngữ cảnh LỜI CAM ĐOAN Tôi – Bùi Khánh Linh - cam đoan Luận văn cơng trình nghiên cứu thân hướng dẫn TS Vũ Tuyết Trinh Các kết nêu Luận văn trung thực, khơng phải chép tồn văn cơng trình khác Hà Nội, ngày tháng năm Tác giả Luận văn Bùi Khánh Linh Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh MỤC LỤC MỤC LỤC DANH MỤC HÌNH DANH MỤC BẢNG LỜI NÓI ĐẦU CHƯƠNG 1.TỔNG QUAN CỦA MỘT HỆ THỐNG TÌM KIẾM THÔNG TIN 1.1 Định nghĩa hệ tìm kiếm thơng tin .7 1.2 Các khái niệm xử lý văn .11 1.2.1 Từ khóa, thuật ngữ 11 1.2.2 Từ dừng (Stop Words) .11 1.2.3 Độ đồng nghĩa từ 12 1.2.4 Từ đồng âm: .12 1.2.5 Trọng số thuật ngữ 13 1.2.6 Độ liên quan văn 14 Các phương pháp biểu diễn văn 14 1.3 1.3.1 Phân tích văn .14 1.3.2 Mơ hình Boolean .15 1.3.3 Mơ hình Vector 18 1.3.3.1 Biểu diễn văn mô hình vector .19 1.3.3.2 Biểu diễn vector thưa .19 1.3.3.3 Biểu diễn mơ hình tần số 22 CHƯƠNG MƠ HÌNH BIỂU DIỄN VÀ KHAI THÁC THÔNG TIN NGỮ CẢNH 2.1 25 Mơ hình ngữ cảnh 25 2.1.1 Mục đích mơ hình ngữ cảnh .25 2.1.2 Các phương pháp tiếp cận mơ hình ngữ cảnh 28 Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thông tin theo ngữ cảnh 2.2 Ngữ cảnh hệ thống thông tin 28 2.3 Mơ hình ngữ cảnh theo u cầu 29 2.4 Các kỹ thuật tìm kiếm có liên quan 32 2.4.1 SAIMOTION 32 2.4.2 Tower .36 CHƯƠNG 3.SO SÁNH VÀ ĐÁNH GIÁ 40 3.1 So sánh với yêu cầu 40 3.2 So sánh SaiMotion TOWER .42 3.3 Đánh giá 45 KẾT LUẬN VÀ ĐỊNH HƯỚNG PHÁT TRIỂN 47 TÀI LIỆU THAM KHẢO 48 Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh DANH MỤC HÌNH Hình 1.1 Quy trình tìm kiếm thơng tin Hình 1.2 Tập hợp qdnf 16 Hình 1.3 Biểu diễn văn mơ hình vector 19 Hình 1.4 Biểu diễn vector khơng gian văn 22 Hình 2.1 Ba cấp mơ hình 26 Hình 2.2 Lưu lượng thông tin ngữ cảnh SaiMotion 33 Hình 2.3 Context Typology 34 Hình 2.4 Các kỹ thuật mơ hình ngữ cảnh 35 Hình 2.5 Kiến trúc Tower 37 Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh DANH MỤC BẢNG Bảng 1.1 Đại số Boolean 15 Bảng 1.2 Biểu diễn câu truy vấn q 17 Bảng 1.3 Ví dụ biểu diễn vector thưa 20 Bảng 2.1 Thuộc tính ngữ cảnh nhận thức 38 Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh LỜI NĨI ĐẦU Trong vài thập kỷ gần đây, mạng Internet làm cho giới nhỏ lại Là thư viện khổng lồ, mạng Internet cho phép truy xuất lấy thông tin từ đâu, khoảng cách địa lý Tuy nhiên, bùng nổ Internet, đạt biệt phát triển với tốc độ nhanh chóng với số lượng lớn trang web làm cho việc tìm kiếm thơng tin trở nên khó khăn Số lượng máy chủ Internet tăng lên ngày, công nghệ dịch vụ dựa tảng Internet phát triển với mức độ chóng mặt Vì vậy, việc tìm kiếm thu thơng tin phù hợp, xác Internet khó khăn Chính lý đó, cần thiết phát triển hệ thống tìm kiếm thơng tin với mục đích hỗ trợ người sử dụng tìm kiếm thơng tin xác Internet vấn đề quan trọng đặt Với mục đích tìm hiểu hệ thống tìm kiếm thơng tin xác hơn, tác giả chọn “Ngữ cảnh tìm kiếm thông tin” làm đề tài nghiên cứu cho luận văn thạc sỹ Dựa yêu cầu đề tài, luận văn tốt nghiệp giải mục tiêu sau: Tìm hiểu sở lý thuyết tìm kiếm thơng tin Tìm hiểu nghiên cứu mơ hình biểu diễn khai thác thơng tin ngữ cảnh Từ đánh giá đưa đề xuất Về mặt bố cục, luận văn gồm ba chương với nội dung sau: Chương 1: Giới thiệu lý thuyết tìm kiếm thơng tin Chương 2: Giới thiệu mơ hình biểu diễn khai thác thông tin ngữ cảnh Chương 3: So sánh đánh giá mơ hình đưa đề xuất Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh CHƯƠNG TỔNG QUAN CỦA MỘT HỆ THỐNG TÌM KIẾM THƠNG TIN 1.1 Định nghĩa hệ tìm kiếm thơng tin Ngày Internet trở nên quen thuộc với nhiều người, thuật ngữ tìm kiếm thơng tin xuất từ sớm thơng tin văn bản, hình ảnh âm thanh… Phổ biến tìm kiếm văn bản, đặc biệt hệ tìm kiếm thông tin Đôi khi, thuật ngữ dùng tồn q trình từ việc xử lý văn tới phân lớp tìm kiếm văn Trong kho thơng tin vơ tận Internet với hệ tìm kiếm thơng tin cơng cụ tìm kiếm thơng tin hiệu mà người sử dụng cần Người sử dụng ln mong muốn phải có cơng cụ để lần truy cập vào Internet họ lấy thơng tin cần thiết tìm kiếm Một hệ tìm kiếm thơng tin phần mềm dùng để lưu trữ quản lý thông tin nằm tài liệu, giúp người sử dụng tìm kiếm thông tin mà họ quan tâm Hệ thống không giống hệ trả lời câu hỏi, cịn phải tồn vị trí tài liệu chứa thơng tin cần thiết Một số tài liệu tìm kiếm thỏa mãn yêu cầu người sử dụng gọi tài liệu phù hợp tài liệu có liên quan Một hệ tìm kiếm hồn hảo tìm đưa tài liệu liên quan mà không đưa tài liệu không liên quan, nhiên hệ thống khơng tồn thể tìm kiếm không đầy đủ mức độ liên quan phụ thuộc vào quan điểm chủ quan người Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thơng tin theo ngữ cảnh Tìm kiếm thơng tin nói chung phải giải vấn đề biểu diễn, lưu trữ, tổ chức truy cập đến mục thông tin Việc tổ chức biểu diễn thông tin giúp người sử dụng dễ dàng truy cập thông tin mà họ quan tâm Nhưng để tìm kiếm đặc điểm thơng tin theo yêu cầu người sử dụng công việc dễ dàng, đặc biệt với sở liệu khổng lồ đa dạng Do vậy, hệ tìm kiếm thơng tin hồn chỉnh ln có ba môđun sau: Môđun lập mục tài liệu Mơđun tìm kiếm mục tài liệu theo câu truy vấn người sử dụng Mơđun xếp kết tìm kiếm u cầu tìm kiếm Tập thơng tin IRS Xử lý biểu diễn truy vấn Đối sánh Biểu diễn yêu cầu truy vấn IRS Dữ liệu Xử lý biểu diễn lưu trữ Biểu diễn tài liệu IRS Dữ liệu Hình 1.1 Quy trình tìm kiếm thơng tin Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 Tìm kiếm thông tin theo ngữ cảnh đại diện cho nội dung chứa hệ thống SAiMotion Việc xác định từ xa mơ hình ngữ cảnh cho phép lựa chọn thơng tin thích hợp ngữ cảnh người dùng 2.4.2 Tower Ngữ cảnh SaiMotion sử dụng để cải thiện việc cung cấp thông tin cho người sử dụng, Tower ngữ cảnh sử dụng để cung cấp cho thành viên nhóm với cấu trúc chung Một frame chung định hướng trong trình tìm kiếm địa chỉ, kích thích tự phát trao đổi thơng tin người tìm kiếm thơng tin Tower môi trường nhằm cung cấp loại thông tin nhận thức Hoạt động người dùng nối với cảm biến khác điện tử môi trường vật lý Bộ cảm biến điện tử phát thông tin người dùng đăng nhập, ứng dụng người dùng sử dụng, tài liệu người sử dụng mở Cảm biến giới vật chất cảm biến âm thanh, cảm biến video, cổng hồng ngoại giúp nắm bắt thông tin người người dùng Thơng tin sau trình bày môi trường điện tử môi trường vật lý Trong số nhận thức môi trường điện tử bao gồm môi trường đa người dùng 3D hiển thị người dùng avatar văn bản, cửa sổ pop-up Toàn hệ thống Tower bao gồm thành phần hình 2.5: Bộ cảm biến chụp để giúp nhận biết hoạt đông người sử dụng, kiện dựa Internet sở hạ tầng thông báo lưu trữ, quản trị, phân phối kiện đạt được, không gian mô đun tự động tạo cập nhật môi trường 3D nhiều người sử dụng đại diện cho thông tin tạo nhóm, Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 36 Tìm kiếm thơng tin theo ngữ cảnh hành động tượng trưng cho mô-đun tạo hình avatar người sử dụng theo hành động mơi trường đa người dùng 3D Hình 2.5 Kiến trúc Tower Trong Tower môi trường ngữ cảnh thực phần mở rộng kiện sở hạ tầng thông báo (ENI) Các kiện sở cho việc xử lý thông tin nhận thức thông tin bối cảnh Tower Các kiện tạo cảm biến, liên kết, chia sẻ tài liệu vật phẩm khác môi trường điện tử vật lý Các kiện mô tả chuỗi cặp giá trị thuộc tính Các cảm biến gửi kiện chụp tới máy chủ ENI Máy chủ ENI lưu trữ quản lý liện Mơ-đun ngữ cảnh vị trí mô-đun máy chủ ENI chịu trách nhiệm xử lý ngữ cảnh Các mơđun ngữ cảnh phân tích đặc tính kiện so sánh đặc tính với ngữ cảnh mơ tả sở liệu ngữ cảnh Nếu tất vài đặc tính phù hợp, mơ-đun ngữ cảnh gắn đặc tính ngữ cảnh cho kiện đến Mặt khác việc phân tích đặc tính mơ-đun Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 37 Tìm kiếm thơng tin theo ngữ cảnh kiện người dùng tạo thông qua hành vi cụ thể cố gắng đưa ngữ cảnh công việc người sử dụng tương ứng Hệ thống sau so sánh ngữ cảnh công việc người dùng với ngữ cảnh kiện xuất cung cấp cho người dùng thông tin quan trọng thời, máy chủ ENI gửi kiện tương ứng với số người dùng Cả hai mô tả ngữ cảnh xuất phát từ ngữ cảnh sở liệu mô tả ngữ cảnh công việc mô-đun trạng thái đại diện cặp thuộc tính hay giá trị Ta có thuộc tính ngữ cảnh mơ tả sau: Thuộc tính Mơ tả Context-nam Tên ngữ cảnh Context-admin Người người tạo ngữ cảnh Context-member Thành viên ngữ cảnh Context-location Địa điểm vật lý liên quan đến ngữ cảnh Context-artefact Ngữ cảnh nhân tạo Context-app Ứng dụng ngữ cảnh Context-event Sự kiện liên quan tới ngữ cảnh Context-acl Danh sách điều khiển truy cập ngữ cảnh Context-env Ngữ cảnh liên quan Bảng 2.1 Thuộc tính ngữ cảnh nhận thức Các thuộc tính sử dụng để mơ tả ngữ cảnh nhận thức Ví dụ, ngữ cảnh nhận thức định nghĩa cho dự án sau chứa tên dự án, người quản trị, người tạo trì ngữ cảnh nhận thức; tên thành viên dự án, địa điểm, ứng dụng, loại kiện đọc, viết, xóa, Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 38 Tìm kiếm thơng tin theo ngữ cảnh danh sách kiểm sốt truy cập có chứa quyền truy cập thông tin liên quan đến dự án mối quan hệ với ngữ cảnh nhận thức khác Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 39 Tìm kiếm thơng tin theo ngữ cảnh CHƯƠNG SO SÁNH VÀ ĐÁNH GIÁ Trước tiên so sánh kỹ thuật hai mơ hình SaiMotion Tower với yêu cầu nêu phần 3.1 So sánh với yêu cầu Yêu cầu 1: Cơ cấu tổ chức mơ hình ngữ cảnh xác định kích thước ngữ cảnh có liên quan Điều SaiMotion phụ thuộc nhiều ontology có sẵn dựa kiến thức người tạo mơ hình ngữ cảnh Trong nhiều tình cách tổ chức tốt phát lỗi theo thời gian Mơ hình ngữ cảnh Tower tạo người dùng hệ thống tự động Mơ hình ngữ cảnh tạo người dùng giống SaiMotion, trường hợp thứ hai mơ hình tự động tạo ngữ cảnh bỏ sót số kích thước theo ngữ cảnh có lợi ln cập nhật thơng qua hệ thống tự động Yêu cầu 2: Trong ngữ cảnh chung tăng cường hệ thống thông tin, ngữ cảnh có kiến thức để liên kết đến thơng tin sinh sử dụng q trình phục hồi thơng tin, trường hợp hai phương pháp tiếp cận Sự khác biệt thông tin ngữ cảnh SaiMotion thông tin lưu trữ kho trung tâm, thơng tin ngữ cảnh Tower thơng tin gắn với các thuộc tính thơng tin ngữ cảnh Yêu cầu 3: Thông tin ngữ cảnh sử dụng cho yêu cầu tìm kiếm thông tin chung hệ thống Cả hai hệ thống đáp ứng yêu cầu Yêu cầu 4: Tìm kiếm thơng tin theo ngữ cảnh độc lập hay kết hợp với Cả hai hệ thống đáp ứng yêu cầu Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 40 Tìm kiếm thơng tin theo ngữ cảnh u cầu 5: Ngữ cảnh phải tự động thừa nhận, nhiên, hệ thống nên cho phép người sử dụng cung cấp thông tin ngữ cảnh thời điểm Cả hai phương pháp ngữ cảnh tự động thừa nhận Tuy nhiên, hệ thống SaiMotion yêu cầu người sử dụng cung cập thông tin ngữ cảnh, trạng thái tại, hệ thống Tower điều phụ thuộc vào việc xử lý tự động Yêu cầu 6: Hệ thống xem xét tất phần phù hợp ngữ cảnh kết hợp, trình bày chúng thành khối thống nhất, chặt chẽ mặt thông tin Cả hai phương pháp đáp ứng yêu cầu Trong Tower, người dùng có quyền tự xác định xem thông tin với đầy đủ ngữ cản khác nên hiển thi riêng biệt hay báo Yêu cầu 7: Mô hình ngữ cảnh cho phép tự động xếp hạng ngữ cảnh theo độ quan trọng thông tin trả ngữ cảnh cá nhân có liên quan tới người dùng Cả hai phương pháp đáp ứng yêu cầu Yêu cầu 8: Người sử dụng thông báo với kiện có liên quan đến người dùng (như thông báo tần số, thông báo kênh) Trong SaiMotion thông tin cung cấp thông tin bổ sung để thêm vào kết tìm kiếm người sử dụng Trong Tower người dùng tự xác định làm để thơng tin họ muốn trình bày u cầu 9: Các mơ hình giúp trì mơ hình ngữ cảnh mơ hình góp phần làm rõ ràng việc nâng cao chất lượng truy cập thông tin tăng hiệu làm việc Các mơ hình SaiMotion nỗ lực cao vấn đề kết đối sánh xác cao Trong Tower, mơ hình nỗ lực thấp đơi chế tự động kết hợp nên độ xác thấp SaiMotion Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 41 Tìm kiếm thơng tin theo ngữ cảnh Yêu cầu 10: Các chi phí thời gian giúp phát ngữ cảnh lấy thơng tin có liên quan đến ngữ cảnh cách hợp lý nhỏ Cả hai hệ thống đạt yêu cầu 3.2 So sánh SaiMotion TOWER Để so sánh hai phương pháp tiếp cận, sử dụng phép đo sau: Mô hình kỹ thuật sử dụng, tính liên tục ngữ cảnh, đánh giá độ tương tự, cách kích hoạt ngữ cảnh, mục đích mơ hình ngữ cảnh, trách nhiệm mơ hình, kết mơ hình, nguồn u cầu cho tìm kiếm tính xác mơ hình Ta có bảng sau: Feature SaiMotion TOWER Mơ hình kỹ thuật sử Dựa Ontology Dựa cặp giá trị dụng thuộc tính Tính liên tục ngữ Cấu hình động kích Liên tục cảnh thước theo ngữ cảnh Đánh giá độ tương tự Phụ thuộc vào ngữ So sánh gí trị thuộc cảnh phát triển mơ tả tính Cách kích hoạt ngữ Các ngữ cảnh tương Người dùng nhập vào cảnh tự phép đo độ hay loại bỏ ngữ cảnh tương tự ngưỡng dựa vào kết hợp giá trị thuộc tính Mục đích mơ hình Cải thiện việc cung cấp Nâng cao nhận thức ngữ cảnh thơng tin nhóm tình làm việc Trách nhiệm mô Phân công vai trị Mơ hình phân bố hình Kết mơ hình Cao Thấp Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 42 Tìm kiếm thơng tin theo ngữ cảnh Nguồn tìm kiếm Cao Thấp Tính xác mơ Cao Thấp hình Mơ hình kỹ thuật: SaiMotion dựa kỹ thuật ontology để tổ chức mơ hình ngữ cảnh, Tower sử dụng các cặp giá trị thuộc tính cho cặp mơ hình có nội dung kích thước khăc Tính liên tục ngữ cảnh: Trong ngữ cảnh SaiMotion cấu hình động kích thước nội dung Một cấu hình đại diện cho ngữ cảnh đơn lẻ Cấu hình kích thước ngữ cảnh kết hợp với liên kết với thông tin mà đưa vào lưu trữ Trong Tower ngữ cảnh đối tượng liên tục tạo quản trị viên Ngữ cảnh thêm vào hay loại bớt hoạt đông thường ngày thành viên Đánh giá độ tương tự: SaiMotion đánh giá độ tương tự ngữ cảnh dựa độ chức quan trọng biện pháp tương tự kết hợp với thước đo khoảng cách cho cá nhân Tower sử dụng biện pháp tương tự đơn giản dựa số lượng phù hợp với kích thước thuộc tính bên cá nhân Cách kích hoạt ngữ cảnh: SaiMotion sử dụng ngữ cảnh tương tự phép đo độ tương tự ngưỡng định Tower sử dụng ngữ cảnh xác định trước Người dùng nhập vào ngữ cảnh tập hợp kích thước ngữ cảnh phù hợp với kích thước định sẵn ngữ cảnh Vì sử dụng ngữ cảnh cách đồng thời Mục đích mơ hình ngữ cảnh: SaiMotion sử dụng kỹ thuật mơ hình ngữ cảnh để kết hợp kiến thức ngữ cảnh với thông tin để cải thiện quy Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 43 Tìm kiếm thơng tin theo ngữ cảnh trình cung cấp thơng tin Trong Tower, mục đích mơ hình ngữ cảnh để nâng cao nhận thức người sử dụng tương tự với việc tạo điều kiện thuận lợi trao đổi thông tin phối hợp nhóm với Trách nhiệm mơ hình: Ngữ cảnh SaiMotion trì mơ hình hợp xếp chung vai trị Trong Tower người sử dụng tự tạo ngữ cảnh định tập kích thước sử dụng ngữ cảnh Kết mơ hình: Mơ hình SaiMotion sử dụng cấu trúc phức tạp (tontologies) địi hỏi chi phí cao Tower dựa vào cấu trúc giá trị thuộc tính mà mơ hình chi phí thấp Tower tự động hỗ trợ ngữ cảnh tự động sinh phát triển Nguồn tìm kiếm: Các biện pháp tương tự SaiMotion kết hợp mức độ quan trọng phép đo khoảng cách riêng biệt Tower đơn giản đếm số kích thước phù hợp Chi phí để lấy bối cảnh tương tự SaiMotion cao nhiều so với Tower Tính xác mơ hình: SaiMotion có tính xác cao việc tìm kiếm thơng tin so với Tower Trong việc tìm kiếm thơng tin, hai phương pháp tiếp cận SAiMotion Tower kết hợp bổ sung cho Sự kết hợp SaiMotion Tower cho phép lập mơ hình cách tồn diện hỗ trợ đầy đủ cho người tìm kiếm thông tin Trong SaiMotion tổ chức miền sở nội dung, nhân, mơ hình thơng tin vật lý, Tower mô tả thông tin mô dự án liên quan Cả hai hệ thống SaiMotion Tower tạo liên kết với thông tin ngữ cảnh kiến thức kiện xảy thời điểm, thông tin Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 44 Tìm kiếm thông tin theo ngữ cảnh dễ sử dụng hỗ trợ cho người tìm thơng tin sau Cả hai hệ thống cho phép ngữ ngữ cảnh lấy thông tin sở SaiMotion cho phép người dùng cung cấp thông tin rõ ràng ngữ cảnh Thơng tin sử dụng hệ thống để kết hợp cải thiện ngữ cảnh người dùng Hệ thống Tower cung cấp loạt số giúp cho việc trình bày thơng tin ngữ cảnh Chúng sử dụng để thể thông tin mà bắt nguồn từ ngữ hồn cảnh khác liên quan tới tình cụ thể người dùng 3.3 Đánh giá Việc sử dụng ngữ cảnh quan trọng ứng dụng tương tác Nó đặc biệt quan trọng cho ứng dụng mà người sử dụng ngữ cảnh thay đổi liên tục, chẳng hạn hai máy tính cầm tay nơi Chúng ta sử dụng ngữ cảnh tạo thuận lợi cho việc xây dựng ngữ cho ứng dụng Với phong phú ngôn ngữ, hiểu biết chung mà người nói chuyện với họ sử dụng thơng tin ẩn tình huống, ngữ cảnh để tăng thông tin cho hội thoại Người dùng cung cấp đầu vào cho máy tính cách đơn Vậy làm cách để phát triển ứng dụng việc cung cấp ngữ cảnh cho máy tính làm cho ứng dụng nhận biết đáp ứng với ngữ cảnh tương tác máy tính người Ngữ cảnh nhận thức làm tương tác người máy dễ dàng Chúng ta phát triển ứng dụng ngữ cảnh nhận thức cách thu thập thông tin ngữ cảnh qua phương tiện tự động, nhà thiết kế ứng dụng có quyền định thơng tin liên quan Điều loại bỏ việc người dùng phải cung cấp thông tin cụ thể Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 45 Tìm kiếm thơng tin theo ngữ cảnh Việc tăng khả di động thiết bị tạo tình nơi người sử dụng ngữ cảnh Người dùng muốn họ truy cập dịch vụ thông tin nơi mà họ cần Để đáp ứng yêu cầu ta cần phải có dịch vụ để thích ứng cách thích hợp để hỗ trợ tốt cho tương tác Ngữ cảnh tìm kiếm thơng tin cần thiết sử dụng cho có hiệu Việc sử dụng có hiệu ứng dụng thơng ngữ cảnh máy tính cịn vấn đề Một số nhà nghiên cứu cố gắng để phân loại ứng dụng nhận biết ngữ cảnh tính năng, bao gồm ngữ cảnh cảm biến, ngữ cảnh thích ứng, tăng phát theo ngữ cảnh (khả kết hợp liệu kỹ thuật số với ngữ cảnh người dùng) Những ý tưởng kết hợp áp dụng cho việc trình bày thơng tin dịch vụ cho người sử dụng, tự động thực gắn ngữ cảnh để tìm kiếm thơng tin Trong lĩnh vực này, thông tin theo ngữ cảnh chứng minh hữu ích thực với yêu cầu truy vấn Tìm kiếm thơng tin theo ngữ cảnh vấn đề khó khăn tìm kiếm thơng tin Thường tìm kiếm thơng tin đơn theo cách dựa mơ hình ngơn ngữ thống kê, kết hợp câu truy vấn với tài liệu sau xếp hạng văn Việc sử dụng ngữ cảnh tìm kiếm thơng tin giúp cải thiện kết tìm kiếm Một giải pháp phổ biến sử dụng thông tin phản hồi liên quan (Rocchio 1971), nhiên hiệu thông tin phản hồi liên quan giới hạn thực tế Đối với nhu cầu tìm kiếm thơng tin phức tạp, người sử dụng cần phải sửa đổi truy vấn nhiều lần để thông tin vừa ý Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 46 Tìm kiếm thơng tin theo ngữ cảnh KẾT LUẬN VÀ ĐỊNH HƯỚNG PHÁT TRIỂN Các kết đạt Sau thời gian dài tìm hiểu nghiên cứu, với hướng dẫn TS Vũ Tuyết Trinh, tác giả đạt số kết sau: • Tìm hiểu tốn Tìm kiếm thơng tin (khái niệm, ứng dụng) vấn đề lý thuyết liên quan đến • Tìm hiểu số mơ hình biểu diễn khai thác thơng tin theo ngữ cảnh từ đưa đánh giá nhận xét Định hướng phát triển đề tài Mặc dù đạt số kết định trên, nhiên thời gian tới, tác giả dự định tiếp tục nghiên cứu, phát triển đề tài theo định hướng sau: • Nghiên cứu sâu mơ hình biểu diễn khai thác thơng tin ngữ cảnh • Xây dựng thử nghiệm hệ thống giúp tìm kiếm thơng tin theo ngữ cảnh Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 47 Tìm kiếm thơng tin theo ngữ cảnh TÀI LIỆU THAM KHẢO [1] Hồ Hữu Thắng (2002), Thực giao diện web cho hệ thống tìm kiếm thơng tin có cấu trúc, Luận văn Thạc sỹ chuyên thành xử lý thông tin truyền thông, Đại học Bách Khoa Hà Nội [2] Đinh Phương Thu (2004), Phân lớp văn Tiếng Việt theo mơ hình xác suất, Luận văn tốt nghiệp Thạc sỹ Công nghệ thông tin, trường Đại học Bách Khoa Hà Nội [3] Mai Ngọc Chừ; Vũ Đức Nghiệu & Hồng Trọng Phiến, Cơ sở ngơn ngữ học tiếng Việt Nxb Giáo dục, H., 1997 [4] Hồng Anh Việt (2006), Tìm Phân tích cú pháp Tiếng Việt, Đồ án tốt nghiệp Đại học Bách Khoa Hà Nội [5] Tom Gross, Roland Klemke, Context modelling for information retrieval-requirement and approaches [6] Gareth J.F Jones, Peter.Brown, The role of context in Information Retrieval [7] David Vallet, Miriam Fernández, Pablo Castells, Phivos Mylonas, and Yannis Avrithis, Personalized Information Retrieval in Context [8] Context Modelling, Chris Briton – 2006 [9] Introduction to Information Retrieval, Christopher D.Mainning, Cambridge University [10] Anind K.Dey and Gregory D Abowd, Towards a Better Understanding of Context and Context-Awareness Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 48 Tìm kiếm thơng tin theo ngữ cảnh TÓM TẮT LUẬN VĂN Luận văn trọng vào nội dung sau đây: Nghiên cứu lý thuyết tốn tìm kiếm thơng tin: Khái niệm, ứng dụng vấn đề liên quan đến toán (Biểu diễn văn bản, nguồn ngữ liệu liệu cần thiết…) Nghiên cứu mục đích mơ hình ngữ cảnh Những tác động bối cảnh việc tìm kiếm thơng tin Nghiên cứu số mơ hình hoạt động khai thác thơng tin theo ngữ cảnh mà từ để so sánh, phân tích, đánh giá kiến nghị Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 49 Tìm kiếm thơng tin theo ngữ cảnh ABSTRACT OF THESIS This thesis aims at these main points: Research the theory of Information Retrieval: Concept, Application and other related problems (text representation, linguistic sources needed…) Studing and purposing of the context model The effects of context in finding information Studing some performance models and exploitation of contextual information from which to compare, analyze, evaluate and make recommendations Học viên thực hiện: Bùi Khánh Linh – Lớp CH 2007-2009 50 ... biệt thông tin ngữ cảnh SaiMotion thông tin lưu trữ kho trung tâm, thơng tin ngữ cảnh Tower thơng tin gắn với các thuộc tính thơng tin ngữ cảnh Yêu cầu 3: Thông tin ngữ cảnh sử dụng cho u cầu tìm. .. cận thơng tin tải ngữ cảnh dựa theo cách có nghĩa, người sử dụng xem ngữ cảnh, duyệt lấy thông tin ngữ cảnh tương ứng Yêu cầu 3: Thông tin ngữ cảnh sử dụng cho u cầu tìm kiếm thơng tin chung... gắn ngữ cảnh để tìm kiếm thơng tin Trong lĩnh vực này, thơng tin theo ngữ cảnh chứng minh hữu ích thực với u cầu truy vấn Tìm kiếm thơng tin theo ngữ cảnh vấn đề khó khăn tìm kiếm thơng tin Thường

Ngày đăng: 28/02/2021, 00:16

Tài liệu cùng người dùng

Tài liệu liên quan