Nới lỏng truy vấn người dùng

76 3 0
Nới lỏng truy vấn người dùng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

PHẠM THỊ THU THỦY BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - LUẬN VĂN THẠC SĨ KHOA HỌC CÔNG NGHỆ THÔNG TIN NGÀNH : CÔNG NGHỆ THÔNG TIN NỚI LỎNG TRUY VẤN HƯỚNG NGƯỜI DÙNG PHẠM THỊ THU THỦY KHÓA 2006 - 2008 Hà Nội 2009 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - LUẬN VĂN THẠC SĨ KHOA HỌC NỚI LỎNG TRUY VẤN HƯỚNG NGƯỜI DÙNG NGÀNH : CÔNG NGHỆ THÔNG TIN MÃ SỐ:23.04.3898 PHẠM THỊ THU THỦY Người hướng dẫn khoa học : TS NGUYỄN KIM ANH Hà Nội 2009 Mục lục Danh mục hình minh họa Danh mục từ viết tắt Danh mục từ viết tắt LỜI CẢM ƠN .5 Mở đầu Giới thiệu hệ thống thông tin cộng tác .6 Chương - Tổng quan nới lỏng truy vấn .10 1.1 Khái niệm nới lỏng hình thức nới lỏng 10 1.2.Phân cấp khái niệm – sở tri thức nới lỏng 13 1.3.Nới lỏng truy vấn dựa vào phân cấp khái niệm .15 Chương - Nới lỏng truy vấn theo cách tiếp cận KAH KAD .19 2.1.Phân cấp trừu tượng tri thức KAH 19 2.2.CSDL trừu tượng tri thức KAD .23 2.2.1.Sơ đồ quan hệ KAD 23 2.2.2.Quá trình tổng quát hóa KAD 27 2.2.3.Q trình chi tiết hóa KAD 28 2.3.Nới lỏng truy vấn với KAD .28 2.3.1.Nới lỏng điều kiện chọn với phép so sánh .29 2.3.2.Nới lỏng điều kiện chọn chứa giá trị trừu tượng .32 2.3.3.Nới lỏng điều kiện nối .35 2.3.4.Nới lỏng thực thể .39 2.4 Mơ hình profile người dùng 42 2.4.1 Mục đích mơ hình người dùng 42 Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 2.4.2 Các loại liệu profile người dùng 45 Chương – Nới lỏng truy vấn có mức ưu tiên theo ngữ cảnh 50 3.1 Giới thiệu mơ hình lưu trữ mức ưu tiên theo ngữ cảnh .50 3.2 Mơ hình logic cho ngữ cảnh mức ưu tiên 52 3.2.1 Ví dụ 52 3.2.2 Mơ hình ngữ cảnh 53 3.2.3 Các mức ưu tiên theo ngữ cảnh 54 3.2.4 Các mức ưu tiên cho tham số ngữ cảnh phân cấp 57 3.3 Lưu trữ mức ưu tiên 58 3.4 Lưu trữ truy vấn có nhận thức ngữ cảnh 60 3.5 Nới lỏng ngữ cảnh có phân cấp 63 3.6 Giải thuật phân giải ngữ cảnh truy vấn 65 Kết luận định hướng phát triển đề tài 70 Kết luận 70 Định hướng phát triển đề tài 71 Tài liệu tham khảo .73 Phạm Thị Thu Thuỷ - Cao học CNTT – Khố 06-08 Danh mục hình minh họa Hình – Hình ảnh phân cấp khái niệm .14 Hình – Tổng hóa khái niệm .15 Hình – Chi tiết hóa khái niệm 16 Hình – Nguyên lý nới lỏng 17 Hình – Minh hoạ KAH 20 Hình – Các quan hệ KAD .26 Hình – Tổng qt hóa KAD 27 Hình 8– Chi tiết hóa KAD .28 Hình – Phân cấp thuộc tính số .34 Hình 10 – Phân cấp liên kết 36 Hình 11 – Mơ hình phân cấp thực thể .39 Hình 12 – Phân cấp ngữ cảnh 53 Hình 13 – Biểu diễn điểm số quan tâm người dung Sach theo phân cấp tham số giai_doan_hoc 57 Hình 14 – Cây ngữ cảnh 60 Hình 15 – Cây ngữ cảnh truy vấn minh họa .63 Hình 16 – Một ví dụ Profile 67 Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 Danh mục từ viết tắt Từ viết tắt Tiếng Việt Tiếng Anh CQA Hỏi đáp cộng tác Cooperative query answering CSDL Cơ sở liệu Database KAH Phân cấp trừu tượng tri thức Knowledge Abstraction Hierachy KAD Cơ sở liệu trừu tượng tri thức Knowledge Abstraction Database CNPM Công nghệ phần mềm HTTT Hệ thống thông tin Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 LỜI CẢM ƠN Trong trình thực luận văn, em xin chân thành cảm ơn giúp đỡ thầy cô Khoa Công nghệ Thông tin - Trường Đại Học Bách Khoa Hà Nội, đặc biệt hướng dẫn tận tình TS Nguyễn Kim Anh để em hồn thành đề tài Em xin cảm ơn anh chị em lớp cao học Công nghệ Thơng tin khố 20062008 giúp em q trình học tập, thực hồn thành luận văn Cuối em xin gửi lời cảm ơn đến thầy cô, tác giả tài liệu tham khảo mà em sử dụng trình thực đề tài Luận văn chắn không tránh khỏi nhiều sai sót Em mong thầy thơng cảm, bảo tạo điều kiện để em hoàn thiện thêm mặt nội dung Em xin chân thành cảm ơn! Hà Nội, 3/2009 Học viên thực hiện: Phạm Thị Thu Thủy Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 Mở đầu Giới thiệu hệ thống thông tin cộng tác Trong thời đại bùng nổ thơng tin, khơng cịn xa lạ với hệ thống thông tin cỡ lớn, lưu trữ khối lượng liệu khổng lồ có khả phục vụ nhiều người dùng thời điểm Mục tiêu hàng đầu đặt cho hệ thống : Cung cấp công cụ khai thác liệu thuận tiện hiệu cho người dùng Đây nhiệm vụ không dễ dàng, đối tượng phục vụ hệ thống người dùng phổ thơng Đó người khơng đào tạo nhiều tin học, khơng có đủ kiến thức miền ứng dụng khai thác Điều dẫn đến tình trạng người dùng gặp nhiều khó khăn diễn đạt yêu cầu hệ thống, khơng có khả hiểu xử lý kết mà hệ thống trả Giải pháp cho vấn đề xuất ngày hồn thiện hệ thống thơng tin đại Đó hệ thống bổ sung nhiều tri thức, đủ thân thiện để trợ giúp người dùng diễn đạt yêu cầu, đủ thông minh để trả kết dễ hiểu chứa đựng nhiều thông tin bổ sung hữu ích … Nhiều hệ thống cịn có khả giao tiếp với người dùng ngơn ngữ tự nhiên : Người dùng đưa vào yêu cầu ngôn ngữ tự nhiên, hệ thống phản hồi ngôn ngữ tự nhiên Tất thành tựu làm tăng đáng kể hiệu q trình tìm kiếm khai thác thơng tin Những hệ thống gọi hệ thống thông tin cộng tác với người dùng Điều làm nên tính cộng tác hệ thống ? Như nói, người dùng phổ thơng người gặp phải nhiều khó khăn diễn đạt yêu cầu cho hệ thống Những u cầu khơng xác dẫn tới câu trả lời không thỏa đáng Các hệ thống cộng tác cần có khả phân tích câu truy vấn, phát nguyên nhân dẫn tới kết không mong đợi phản hồi lại cho người dùng Bên cạnh việc đưa câu trả lời truy vấn thông thường, hệ Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 thống cộng tác cần cung cấp thêm thông tin bổ sung, chẳng hạn gợi ý mở rộng phạm vi tìm kiếm, kết tiềm ẩn, phép phân loại hay số tổng hợp, thống kê Thế hệ hỏi đáp cộng tác (CQA)? Mặc dù ngôn ngữ truy vấn sử dụng công cụ thuận tiện cho việc lấy thông tin từ sở liệu (CSDL) người dùng ngày có nhu cầu tiếp cận hướng hỏi đáp có tính cộng tác, thơng minh hơn, hướng tiếp cận hiểu mục đích qua câu truy vấn cung cấp thơng tin bổ sung hữu ích trích chọn câu trả lời Tuy nhiên, hướng tiếp cận có lại có hạn chế đa dạng câu truy vấn, điều khiển nới lỏng truy vấn qua tương tác với người dùng trì tri thức chúng khơng thể trích chọn đủ tri thức ngữ nghĩa từ CSDL để hỗ trợ cho việc tìm kiếm thơng tin hiệu Để khắc phục hạn chế sử dụng hệ hỏi đáp cộng tác để nới lỏng phạm vi tìm kiếm điều kiện truy vấn gốc cung cấp câu trả lời lân cận xấp xỉ Vấn đề hỏi đáp cộng tác biểu diễn mối quan hệ tương đồng giá trị liệu, điều cần thiết cho việc nới lỏng truy vấn hỗ trợ suy luận đối tượng CSDL Hướng tiếp cận hỏi đáp công tác dùng cho việc cung cấp câu trả lời lân cận xấp xỉ thích hợp cho truy vấn với câu trả lời xác nới lỏng truy vấn Hướng tiếp cận có mục tiêu sau: Hỗ trợ người dùng mức chuyên gia việc tìm kiếm thông tin, thể yêu cầu họ với loại truy vấn cộng tác theo thành thạo họ Hướng tiếp cận cho phép câu truy vấn trừu tượng khái niệm áp đặt chúng vào mức khái niệm cao dựa bối cảnh người sử dụng, không quan tâm đến tri thức lược đồ CSDL chi tiết Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 Cung cấp thước độ độ thích hợp để giúp người dùng xác định mức ưu tiên câu trả lời kết truy vấn Đến cuối cùng, cần phép đo mối quan hệ ngữ nghĩa giá trị liệu Do có phép đo nên người dùng lấy kết truy vấn có xếp Thực việc điều khiển nới lỏng truy vấn tinh vi linh hoạt qua tương tác người dùng Người dùng có khả điều chỉnh mức nới lỏng truy vấn đưa phản hồi tương tác với hệ thống họ thỏa mãn với kết truy vấn Tạo điều kiện thuận lợi cho việc sáng tạo trì tri thức ngữ nghĩa cần thiết cho việc nới lỏng truy vấn Tuy nhiên, lượng thông tin mở rộng khơng có nghĩa phù hợp với người dùng Để thơng tin có giá trị việc cá nhân hóa truy vấn cần thiết để đưa thơng tin thích hợp với người dùng Nhìn chung, để đạt tính cá nhân hóa người dùng thể mức ưu tiên họ mảng liệu cụ thể cách rõ ràng thể ẩn Kết câu truy vấn tìm kiếm xếp theo mức ưu tiên người dùng cụ thể Nội dung luận văn đưa giải pháp cho vấn đề mở rộng kết tìm kiếm hệ thống thơng tin cộng tác, chủ đạo vấn đề mở rộng kết tìm kiếm đưa kết hướng người dùng cụ thể Để giải việc mở rộng kết tìm kiếm luận văn đề xuất phương pháp dựa kỹ thuật gọi nới lỏng truy vấn Đây kỹ thuật có khả nới lỏng ràng buộc câu truy vấn, sinh câu trả lời có phạm vi rộng Còn vấn đề hướng người dùng giải qua khái niệm mức ưu tiên profile người dùng, mức ưu tiên theo ngữ cảnh kỹ thuật nới lỏng truy vấn mức ưu tiên theo ngữ cảnh Luận văn đề cập tới khái niệm nguyên lý nới lỏng chương 1, đưa cách tiếp cận để thực kỹ thuật nới lỏng chương 2, đề cập Phạm Thị Thu Thuỷ - Cao học CNTT – Khố 06-08 60 Để tính tốn mức ưu tiên kết tập từ mức ưu tiên đơn giản cần lưu trọng số sử dụng việc tính tốn Các trọng số lưu bảng có mục đích đặc biệt AggScores(wC1,…,wCk,Ak+1) GIá trị cho tham số ngữ cảnh wCi trọng số cho điểm số quan tâm tương ứng giá trị Ak+1 cho biết người dùng cho trọng số Ví dụ bảng AggScores có thuộc tinh Giai_doan_hoc_weight, Khoang_thoi_gian_weight, Tam_trang_weight SinhVien Một ghi bảng có thẻ (0.6,0.3,0.1,30) 3.4 Lưu trữ truy vấn có nhận thức ngữ cảnh Trong phần này, tìm hiểu lược đồ cho việc lưu lại kết truy vấn thực ngữ cảnh cụ thể, kết sử dụng lại truy vấn say Cây ngữ cảnh Giả sử mơi trường ngữ cảnh CEX có n tham số ngữ cảnh {C1 , C , , C n } Một cách để lưu mức ưu tiên kết tập sử Hình 14 – Cây ngữ cảnh Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 dụng ngữ cảnh: 61 Mỗi người dùng có Chiều cao tối đa ngữ cảnh số lượng tham số ngữ cảnh cộng Mỗi tham số ngữ cảnh ánh xạ đến mức có thêm mức cho mức Giả sử tham số ngữ cảnh C i ánh xạ đến mức i Một đường dẫn ngữ cảnh thể trạng thái ngữ cảnh, ví dụ việc gán giá trị cho tham số ngữ cảnh Ở nút lá, lưu trữ ids, ví dụ ids Sach, dọc theo điểm số kết tập chúng cho trạng thái ngữ cảnh liên kết cho đường dẫn từ gốc dến chúng Thay lưu trữ giá trị điểm số kết tập cho tất ids để lưu trữ có hiệu lưu trữ top-k id (khóa), id k nhóm có điểm số kết tập cao đường dẫn dẫn đến chúng Việc cho phép cung cấp cho người dùng câu trả lời nhanh với nhóm liệu phù hợp với truy vấn họ Cây ngữ cảnh sử dụng để lưu trữ mức ưu tiên kết tập tính tốn kết truy vấn trước, kết sử dụng truy vấn sau Do đó, câu ngữ cảnh xây dựng sau lần truy vấn nhận thức ngữ cảnh tính tốn Mỗi nút khơng phải nút mức k chứa phần tử có dạng [key, pointer], key c kj ∈ dom(C k ) giá trị tham số ngữ cảnh C k xuất truy vấn ngữ cảnh trước Con trỏ phần tử trỏ đến nút mức thấp (mức k + 1) chứa tất giá trị phân biệt tham số ngữ cảnh (tham số C k +1 ) có xuất truy vấn ngữ cảnh với c kj Thêm vào key lấy giá trị đặc biệt any, điều có nghĩa thiếu đặc tả tham số ngữ cảnh liên kết truy vấn (như việc sử dụng ký tự đặc biệt ‘*’) Tóm lại, ngữ cảnh cho n tham số ngữ cảnh thỏa mãn thuộc tính sau: • Đó đồ thị khơng vịng có hướng với nút gốc • Có nhiều n+1 mức, mức n mức tương ứng với tham số ngữ cảnh mức cuối mức Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 62 • Mỗi nút khơng phải nút mức k chứa phần tử có dạng [key, pointer], key key ∈ dom(C k ) với vài giá trị c k có xuất truy vấn key=any Khơng có phần tử nút chứa giá trị khóa Con trỏ trỏ đến nút mức k+1 có phần tử có giá trị khóa xuất câu truy vấn với khóa mức • Mỗi nút lưu trữ tập trỏ đến liệu thứ tự theo điểm số chúng Query1: tốt/nghỉ hè/HTTT Query2: không tốt/nghỉ hè/HTTT Query3: tốt/thi học kỳ/HTTT Query4: không tốt/nghỉ hè/Đại cương Query5: tốt/nghỉ hè/* Tốt Thi học kỳ HTTT any HTTT HTTT Đại cương Top_k Top_k Top_k Top_k Nghỉ hè Top_k Nghỉ hè Không tốt Phạm Thị Thu Thuỷ - Cao học CNTT – Khố 06-08 63 Hình 15 – Cây ngữ cảnh truy vấn minh họa Hình tập trạng thái ngữ cảnh thể câu truy vấn trước Giả sử có tham số ngữ cảnh gán mức sau: tam_trang gán cho mức đầu tiên, khoang_thoi_gian mức thứ hai giai_doan_hoc mức thứ Nút lưu id top-k Sach, top-k điểm số kết tập cao Cây ngữ cảnh cung cấp cách hiệu để tìm kiếm top-k kết thích hợp với truy vấn mức ưu tiên Khi truy vấn đặt ra, kiểm tra xem có tồn trạng thái ngữ cảnh thích hợp ngữ cảnh hay khơng Nếu có tìm kiếm đến top-k kết từ nút liên kết Ngược lại, tính toán câu trả lời chèn thêm trạng thái ngữ cảnh mới, gồm đường dẫn top-k kết quả, vào Do vậy, truy vấn đơn giản cắt ngang ngữ cảnh từ gốc đến 3.5 Nới lỏng ngữ cảnh có phân cấp Mỗi truy vấn kết hợp với nhiều trạng thái ngữ cảnh Ví dụ trạng thái ngữ cảnh câu truy vấn trạng thái thời thời điểm đưa câu truy vấn Mục đích chung phép xếp kết truy vấn dựa mức ưu tiên liên kết với ngữ cảnh truy vấn đó.Thường ngữ cảnh truy vấn q cụ thể để phù hợp với mức ưu tiên có sẵn Để xử lý điều này, xem xét tới nới lỏng phân cấp hướng thay giá trị thuộc tính ngữ cảnh giá trị tương ứng mức trừu tượng khác Các trạng thái ngữ cảnh có liên quan khác tạo cách nới lỏng nhiều thuộc tính ngữ cảnh Chúng ta trình bày thuật toán dùng để nhận dạng mức ưu tiên mà trạng thái ngữ cảnh chúng phù hợp với ngữ cảnh nới lỏng truy vấn Thuật toán sử dụng biểu diễn dựa tiền tố cho tập trạng thái ngữ cảnh câu truy vấn mức ưu tiên Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 64 Mỗi câu truy vấn nâng cấp với thông tin ngữ cảnh Chúng ta giả sử ngữ cảnh truy vấn thể qua mô tả ngữ cảnh ghép Thông thường ngữ cảnh kết hợp với truy vấn ngữ cảnh xung quanh người dùng thời điểm đưa câu truy vấn Bên cạnh ngữ cảnh ẩn này, câu truy vấn tăng tính rõ ràng với mơ tả ngữ cảnh phép câu truy vấn có tính chất thăm dị Ví dụ: “ Trong kỳ nghỉ với gia đình mùa hè tơi nên thăm nơi Athens (trong thời tiết tốt)?” Cho Pc tập trạng thái ngữ cảnh tương ứng với profile P cho trước Qc tập trạng thái ngữ cảnh tương ứng với truy vấn Q Chúng ta quan tâm tới việc tính tốn tập Pc ∩ Qc trả lại mức ưu tiên tương ứng Có khả tập Pc ∩ Qc rỗng mức ưu tiên kết hợp với phần tử khơng đủ để thu cá nhân hóa hiệu cho truy vấn Hơn nữa, khơng thể ngữ cảnh truy vấn cách xác Do đó, quan tâm tới cách nới lỏng truy vấn ngữ cảnh Đầu tiên, tập trung vào việc nới lỏng mô tả tham số ngữ cảnh Để làm điều này, đưa toán tử nới lỏng Một tham số ngữ cảnh phân cấp nới lỏng lên cách thay thể giá trị giá trị tổng quát nới lỏng xuống cách thay giá trị tập giá trị chi tiết Để xác định mức độ nới lỏng phân cấp, định nghĩa khoảng cách mức sau: Định nghĩa (khoảng cách mức) Cho mức Li , L j , khoảng cách chúng d H (Li , L j ) xác định sau: Nếu tồn đường dẫn phân cấp Li , L j d H (Li , L j ) số lượng nhỏ cạnh kết nối Ngược lại, Li , L j d H (Li , L j ) = ∞ Phạm Thị Thu Thuỷ - Cao học CNTT – Khố 06-08 65 Một mơ tả tham số ngữ cảnh nới lỏng lên cách cho tham số lấy giá trị tổng quát hơn, tức lấy giá trị mức cao phân cấp Định nghĩa (CoD nới lỏng lên) Cho mô tả tham số ngữ cảnh cod (C i ) : C i ∈ S , tham số C i , up(cod (C i ), r ) biểu thức C i ∈ S ' , S’ = {v’| v’ = level (v ' ) anclevel (v ) (v ), v ∈ S d H (level (v), level (v' ) ) = r Chúng ta gọi r độ sâu nới lỏng Ví dụ up((giai_doan_hoc ∈ {HTTT}), 1) {CNTT}, up((giai_doan_hoc ∈ {HTTT}), 2) {ChuyenNganh} Tương tự mô tả tham số ngữ cảnh nới lỏng lên: Định nghĩa (Cod nới lỏng xuống) Cho mô tả tham số ngữ cảnh cod (C i ) : C i ∈ S , tham số C i , down(cod (C i ), r ) biểu thức C i ∈ S ' , S’ = {v’| v’ = level (v ' ) desclevel (v ) (v ), v ∈ S d H (level (v), level (v' ) ) = r Ví dụ down((giai_doan_hoc ∈ {CNTT}), 1) tập giá trị {CNPM, HTTT} Cuối tham số ngữ cảnh nới lỏng bên cạnh cách thay nhiều giá trị thuộc mức phân cấp 3.6 Giải thuật phân giải ngữ cảnh truy vấn Một câu hỏi đặt tham số ngữ cảnh ngữ cảnh truy vấn nới lỏng (độ sâu nới lỏng tương ứng r bao nhiêu) để tập tham số đủ lớn PC phù hợp với trạng thái ngữ cảnh truy vấn nới lỏng Chúng ta gọi vấn đề Phân giải ngữ cảnh nới lỏng Chúng ta giả sử hệ thống (hoặc người dùng) kết hợp giá trị k với truy vấn để rõ mức ưu tiên phù hợp từ profile Một cách cụ thể, cho truy vấn Q mô tả ngữ cảnh codQ , tìm k mức ưu tiên PC mà phù hợp với tập trạng thái ngữ cảnh codQ Chỉ cần có k mức ưu tiên nới lỏng số mô tả tham số ngữ cảnh codQ cách sử dụng chiều sâu nới lỏng lớn cách từ từ Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 66 Các cấu trúc liệu: Để lưu trữ tham số theo ngữ cảnh P, sử dụng cấu trúc liệu gọi profile Cho PC tập trạng thái ngữ cảnh tất mơ tả ngữ cảnh có P Vấn đề lưu trữ profile trạng thái ngữ cảnh PC từ có đường dẫn xác cho trạng thái ngữ cảnh s ∈ PC Một cách chi tiết, profile cho PC đồ thị khơng kín có hướng với nút gốc đơn n +1 mức Mỗi mức n mức tương đương với tham số ngữ cảnh Để đơn giản ta giả sử tham số ngữ cảnh C i ánh xạ tới mức i Mỗi nút nút mức k trì phần tử dạng [key, pointer], key ∈ edom(C k ) với số giá trị c k giá trị xuất trạng thái s ∈ PC Khơng có phần tử nút chứa giá trị khóa giống Con trỏ trỏ đến nút mức k+1 có phần tử với giá trị khóa thuộc edom(C k +1 ) có trạng thái s với key Mỗi nút trì phần [attr_clause,int_score] mức ưu tiên liên kết với phần (trạng thái ngữ cảnh) dẫn đến Một ví dụ Profile: Nghỉ hè tốt all tốt all all Đại cương all HTTT HTTT Attr_clause Int_score Attr_clause Int_score Attr_clause Int_score Attr_clause Int_score Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 67 Hình 16 – Một ví dụ Profile Cho QC tập trạng thái ngữ cảnh xuất phát từ mô tả codQ truy vấn Q Các trạng thái ngữ cảnh QC biểu diễn dạng cấu trúc liệu tương tự profile, gọi truy vấn, có đường dẫn xác từ đến trạng thái s ∈ QC Thuật toán phân giải ngữ cảnh nới lỏng Đầu vào: Cây profile có nút gốc RP n+1 mức, truy vấn có nút gốc RQ n mức, k mức ưu tiên mong muốn Đầu ra: Tập liệu ResultSet có dạng (attr_name=attr_value, int_score) mô tả đường dẫn trạng thái ngữ cảnh tương tự với trạng thái ngữ cảnh tìm kiếm (các trạng thái truy vấn) SN, SN’ tập cặp nút, nút liên quan đến giá trị khoảng cách Khởi tạo: SN = {(RQ , RP ,0)}, SN ' = { } Begin Distance=0 while ResultSet nhỏ k for level i=0 to n-1 for cặp sn ∈ SN , với sn=(q_node, p_node, dist) ∀x ∈ q _ node ∀y ∈ p _ node if dist + d (x, y ) ≤ dis tan ce then if i < n − then SN ' = SN '∪{( x → child , y → child , dist + d ( x, y ))} else if i = n − then Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 68 attr _ clause = y → child attr _ clause int_ score = y → child int_ score Re sultSet = Re sultSet ∪ (attr _ clause, int_ score ) end if end if end for SN=SN’ SN’={} end for distance++ end while End Đầu tiên mơ tả giải thuật tìm kiếm trạng thái profile mà giống trạng thái câu truy vấn Cụ thể cho profile mà nút gốc RP truy vấn có nút gốc RQ , Giải thuật trả lại nút profile có mặt đường dẫn trạng thái ngữ cảnh phù hợp với trạng thái ngữ cảnh truy vấn Cây profile có n+1 mức Một tham số ngữ cảnh gán cho mỗi mức n mức đầu tiên, mức cuối liên kết mức ưu tiên lại Tương ứng truy vấn có n mức, mức dành cho tham số ngữ cảnh Đầu tiên theo chiều rộng để tìm kiếm cặp nút thuộc mức Mỗi cặp chứa nút truy vấn nút profile Khởi tạo cặp nút mức (i=0) (RQ , RP ) Mỗi giá trị nút truy vấn RQ tương đương với giá trị nút profile RP nên tạo thêm cặp nút (R Q → child , R P → child ) Cặp mức (i +1) Khi kiểm tra giá trị cặp mức cụ thể kiểm tra nút tạo mức tiếp tục Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 69 Kết chương: Chương đề cập đến khái niệm ngữ cảnh, mơ hình cách lưu trữ mức ưu tiên theo ngữ cảnh người dùng Bên cạnh chương nói đến việc áp dụng toán nới lỏng nêu chương cho việc nới lỏng truy vấn mức ưu tiên theo ngữ cảnh Việc áp dụng mức ưu tiên theo ngữ cảnh làm tăng tính cá nhân hóa hệ thống, giúp hệ thống có tính cộng tác cao với người sử dụng, không giúp người sử dụng tìm thơng tin họ cần mà cịn cung cấp thơng tin thỏa mãn sở thích, ưu tiên họ Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 70 Kết luận định hướng phát triển đề tài Kết luận Nâng cao hiệu khai thác liệu thông qua việc đẩy mạnh tương tác với người sử dụng yêu cầu gần bắt buộc hệ thống thông tin Luận văn nghiên cứu phương pháp có khả thực phần yêu cầu Nội dung luận văn xoay quanh vấn đề xử lý câu truy vấn, bao gồm nới lỏng số điều kiện truy vấn để cung cấp thông tin mở rộng cho người dùng, xử lý câu truy vấn cho hướng người dùng hơn, quan tâm đến mức ưu tiên người dùng ngữ cảnh cu thể, áp dụng toán nới lỏng vào việc nới lỏng ngữ cảnh câu truy vấn Nhìn chung, luận văn đạt số kết sau : Thứ nhất, phương pháp giải toán nới lỏng truy vấn theo hướng tiếp cận gom nhóm khái niệm, khai thác nguồn tri thức từ phân cấp khái niệm Phương pháp tỏ có hiệu liệu định tính có khả phân loại cao Đối với liệu định lượng, sử dụng kỹ thuật thống kê sử dụng tri thức chuyên gia miền để tiến hành phân loại, sau đó, coi liệu liệu định tính khác Thứ hai, luận văn giải nhược điểm phương pháp gom nhóm khái niệm trước đây, cách sử dụng phân cấp trừu tượng tri thức KAH, kiểu phân cấp có bổ sung thơng tin miền cho khái niệm Đồ án cách tổ chức nguồn tri thức vào CSDL gọi KAD Cách tổ chức có ưu điểm lớn, sử dụng cho CSDL, áp dụng cho miền ứng dụng khác Việc tiến hành khai thác tri thức lưu trữ KAD đề cập cách chi tiết Thứ ba, luận văn đề cập tới mơ hình nới lỏng hướng người dùng hệ cộng tác Mỗi người dùng mơ hình hóa dạng profile, luận văn đề cập đến mức ưu tiên người dùng ngữ cảnh cụ thể Xây dựng cách lưu Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 71 trữ mức ưu tiên người dùng hệ CSDL quan hệ, đưa việc áp dụng phương thức nới lỏng (tổng quát hóa, chi tiết hóa) cho ngữ cảnh truy vấn Các vấn đề giúp hệ thống cung cấp cho người dùng liệu thích hợp từ lượng khổng lồ thông tin CSDL Bên cạnh kết đạt được, luận văn tồn số vấn đề chưa giải : • Việc nới lỏng truy vấn dựa phân cấp khái niệm tiến hành theo chiều thẳng đứng, vậy, nới lỏng với mức độ cao kết thu loãng, tức mức độ liên quan kết mở rộng với kết ban đầu Nói chung mức độ liên quan kết phụ thuộc vào việc xây dựng phân cấp khái niệm Phân cấp tốt phân cấp mà khái niệm gom nhóm với gần mặt ngữ nghĩa Biện pháp khắc phục sử dụng phân cấp tốt kết hợp nhiều phương pháp nới lỏng với Định hướng phát triển đề tài Để hoàn thiện thêm sở lý thuyết khả ứng dụng, đề tài cần mở rộng theo số yêu cầu sau • Trước hết, hệ thống cần trang bị thêm khả sản sinh tự động phân cấp khái niệm, bao gồm phân cấp thuộc tính số lẫn phi số Có nhiều nghiên cứu vấn đề này, hầu hết cho kết tương đối khả quan Tuy nhiên, để nguồn tri thức phân cấp thực có ích, cần can thiệp chuyên gia việc điều chỉnh gán nhãn cho khái niệm phân cấp • Hệ thống dừng lại việc đánh giá mức độ quan trọng thuộc tính người dùng dựa vào mức ưu tiên theo ngữ cảnh.Trong tương lai cần xây dựng hệ thống có khả khai thác nhiều thông tin từ người dùng sở thích, nhu cầu, thao tác Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 72 người dùng vào hệ thống để làm tăng tính cộng tác tính cá nhân hóa người dùng hệ thống Ngồi ra, hệ thống kết hợp thêm số hướng tiếp cận nới lỏng khác tiếp cận mờ (chẳng hạn mờ hóa khái niệm phân cấp), tiếp cận khoảng cách ngữ nghĩa (ví dụ để giải tình trạng kết “lỗng” nới lỏng mức cao, sử dụng khoảng cách ngữ nghĩa khái niệm để hỗ trợ định nới lỏng) Kết hợp mở rộng kết theo chiều thẳng đứng với mở rộng theo chiều ngang (thêm thuộc tính bổ trợ) số hình thức trả lời truy vấn thông minh khác để đem lại hiệu cao cho việc khai thác liệu Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 73 Tài liệu tham khảo Tài liệu tham khảo tiếng Anh: [1].S.-Y Hud, K.-H Moon, H Lee A data abstraction approach for query relaxation, 2000 [2].Wesley W.Chu CoBase : A scalable and extensible cooperative information system [3].Wesley W.Chu, Hua Yang, Gladys Chow A cooperative database system for query relaxation [4].Terry Gaasterland, Parke Godfrey, Jack Minker Relaxation as a platform for cooperative answering [5].Anna Putnam The relaxation manager for XML query relaxation [6].Chen Li Answering approximate queries efficiently [7] Kostas Stefanidis, Evaggelia Pitoura, and Panos Vassiliadis Modeling and Storing Context-Aware Preferences [8] Kostas Stefanidis, Evaggelia Pitoura, and Panos Vassiliadis On Supporting Context-Aware Preferences in Relational Database Systems [9] Giuseppe Amato and Umberto Straccia User Profile Modeling and Applications to Digital Libraries [10] Hamza Hydri Syed, Periklis Andritsos Weigh your Preferences! Towards using hierarchies for building personal libraries [11] Arthur H van Bunningen, Ling Feng, and Peter M G Apers Using Description Logics to Model Context Aware Query Preferences [12] Kostas Stefanidis, Evaggelia Pitoura and Panos Vassiliadis On Relaxing Contextual Preference Queries [13].Chokri Ben Necib, Johann Christoph Freytag Using ontologies for database query refomulation [14].Chokri Ben Necib, Johann Christoph Query processing using ontologies [15].Chen Li Answering approximate queries efficiently [16].Ullas Nambiar, Subbarao Kambhampati Mining approximate functional dependencies and concept similarities to answer imprecise queries [17].Farah Benamara, Patrick Saint Dizier Advanced relaxation for cooperative question answering [18].Cuppens, Demolombe Cooperative answering : A methodology to provide intelligent access to databases [19].Michael Barg, Raymond K.Wong Efficient query relaxation for semistructured data Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 74 [20].Troels Andreasen, Henning Christiansen Flexible query answering systems modelled in metalogic programming [21].Yue Huang Intelligent query answering by knowledge discovery techniques [22].Fuliang Weng, Heather Pon-Barry, Sebastian Varges Interactive question answering and constraint relaxation in spoken dialogue systems [23].Eric Sung Parser for relaxation-enabled XML query language (RLX query) [24].Christian Cárdenas Parsing and preprocessing of RLX query for XML query relaxation [25].Rares Vernica Relaxing Join and Selection Queries [26].Jawei Han, Yongjian Fu Dynamic generation and refinement of concept hierarchies for knowledge discovery in database [27].Philip Resnik Using information content to evaluate semantic similarity in a taxonomy [28] Daniela Florescu XML Query Processing Tài liệu tham khảo tiếng Việt: [29].TS.Nguyễn Kim Anh Phép dịch truy vấn ngôn ngữ tự nhiên thành truy vấn SQL sử dụng văn phạm ngữ nghĩa [30].TS.Nguyễn Kim Anh, Phạm Thị Thu Hồi Truy vấn ngơn ngữ tự nhiên khơng hồn chỉnh CSDL quan hệ [31].TS.Nguyễn Kim Anh Phép dịch truy vấn logic thành truy vấn SQL hệ truy vấn ngôn ngữ tự nhiên Phạm Thị Thu Thuỷ - Cao học CNTT – Khoá 06-08 ... CSDL Khi nới lỏng truy vấn? Câu hỏi cần đưa nên nới lỏng câu truy vấn người dùng để trở thành câu truy vấn tổng quát Đầu tiên phải trả lời câu truy vấn người dùng có yêu cầu Nếu câu truy vấn khơng... .6 Chương - Tổng quan nới lỏng truy vấn .10 1.1 Khái niệm nới lỏng hình thức nới lỏng 10 1.2.Phân cấp khái niệm – sở tri thức nới lỏng 13 1.3 .Nới lỏng truy vấn dựa vào phân cấp... phương pháp có tính cộng tác, gọi nới lỏng để mở rộng truy vấn CSDL chương trình logic Phương pháp nới lỏng mở rộng phạm vi truy vấn cách nới lỏng ràng buộc ẩn truy vấn Các ràng buộc bảo gồm loại

Ngày đăng: 27/02/2021, 23:48

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan