Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 80 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
80
Dung lượng
742,95 KB
Nội dung
Đại Học Quốc Gia Thành Phố Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐÀO QUỐC PHƯƠNG XÂY DỰNG QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN TRÊN WEB CÓ NGỮ NGHĨA Chuyên ngành: Khoa học Máy tính LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 11 năm 2007 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : TS Quản Thành Thơ Cán chấm nhận xét : TS Dương Tuấn Anh Cán chấm nhận xét : TS Nguyễn Văn Cường Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 30 tháng năm 2008 ĐẠI HỌC QUỐC GIA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc oOo - Tp HCM, ngày 05 tháng 11 năm 2007 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Đào Quốc Phương Giới tính : Nam ;/ Nữ Ngày, tháng, năm sinh : 25/06/1979 Nơi sinh : Tp.HCM Chuyên ngành : Khoa học Máy tính Khoá : 2005 1- TÊN ĐỀ TÀI : XÂY DỰNG QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN TRÊN WEB CÓ NGỮ NGHĨA 2- NHIỆM VỤ LUẬN VĂN : - Xây dựng quan hệ ngữ nghĩa lớp thực thể - Xây dựng quan hệ ngữ nghĩa thực thể có tên 3- NGÀY GIAO NHIỆM VỤ : 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : TS Quản Thành Thơ Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN (Họ tên chữ ký) QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) TS Quản Thành Thơ TS Đinh Đức Anh Vũ Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày 05 tháng 11 năm 2007 Đào Quốc Phương Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa LỜI CẢM ƠN Tơi xin gởi lời cảm ơn chân thành sâu sắc đến TS Quản Thành Thơ, người Thầy tận tình hướng dẫn tơi suốt q trình từ đại học tới cao học tạo điều kiện để tơi hồn thành luận văn Tơi xin cảm ơn gia đình động viên tạo điều kiện tốt để tơi tiếp tục theo đuổi việc học tập nghiên cứu Tôi trân trọng dành tặng thành luận văn cho Cha Mẹ Nhờ công lao dưỡng dục Người mà chúng có thành ngày hơm Con xin hứa tiếp tục cố gắng phấn đấu để vươn cao Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa TĨM TẮT LUẬN VĂN Sự đời ý tưởng Web có ngữ nghĩa (Semantic Web), hệ Web giúp máy tính hiểu xử lý tài liệu Web cách hiệu Tuy nhiên vấn đề nhà khoa học quan tâm tảng Web có ngữ nghĩa làm để nhúng ngữ nghĩa vào tài liệu Web Muốn vậy, vấn đề cần giải rút trích tự động ngữ nghĩa tài liệu Web thích lại ngữ nghĩa vào tài liệu Trong tài liệu, thực thể có tên đề cập đến tạo nên phần quan trọng cho ngữ nghĩa tài liệu Nói cách khác, để nắm ngữ nghĩa tài liệu trước hết cần nắm ngữ nghĩa thực thể có tên tài liệu mối quan hệ thực thể có tên với Tuy nhiên việc xây dựng mối quan hệ thực thể có tên cịn lĩnh vực nghiên cứu gần đây, trước hướng nghiên cứu tập trung vào việc trích rút ngữ nghĩa từ tài liệu văn thô xây dựng mối quan hệ ngữ nghĩa từ với Có thể đề cập đến số phương pháp dùng để xây dựng mối quan hệ ngữ nghĩa từ tài liệu : phương pháp neo chặt (anchoring), phương pháp phân cụm (clustering), phương pháp xét đồng xuất từ khoá (co-occurence of keywords), phương pháp khai phá luật kết hợp (Association Rule Mining) Liệu có khả thi áp dụng phương pháp vào việc xây dựng mối quan hệ thực thể có tên Web có ngữ nghĩa Xuất phát từ yêu cầu trên, đề tài đặt số mục tiêu sau: tìm hiểu phương pháp xây dựng mối quan hệ ngữ nghĩa hai đối tượng tài liệu văn bản, dựa phương pháp đề xuất sử dụng vào việc xây dựng mối quan hệ ngữ nghĩa thực thể có tên Web ngữ nghĩa, kiểm tra kết đưa kết luận tính hiệu phương pháp Trải qua trình nghiên cứu, kết Luận văn phân tích ưu điểm điểm lưu ý áp dụng phương pháp việc tìm mối quan hệ thực thể có tên, phương pháp tính xuất đồng thời (co-occurence) hai đối tượng dùng việc xây dựng mối quan hệ ngữ nghĩa lớp thực thể, phương pháp tính hệ số tương quan (correlation) dùng Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa việc xây dựng mối quan hệ ngữ nghĩa thực thể có tên thuộc lớp phương pháp khai phá luật kết hợp (Association Rule Mining) dùng việc xây dựng mối quan hệ ngữ nghĩa thực thể có tên thuộc lớp khác Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN TÓM TẮT LUẬN VĂN DANH MỤC HÌNH .7 DANH MỤC BẢNG Chương GIỚI THIỆU ĐỀ TÀI 1.1 Giới thiệu 1.2 Cấu trúc luận văn 11 Chương CƠ SỞ LÝ THUYẾT VỀ WEB NGỮ NGHĨA , THỰC THỂ CÓ TÊN VÀ ONTOLOGY 13 2.1 Khái niệm Web ngữ nghĩa 13 2.2 Thực thể có tên 14 2.3 Tìm hiểu Ontology 15 2.4 Ngôn ngữ biểu diễn Ontology 17 2.5 Mối quan hệ thực thể có tên 18 Chương TỔNG THUẬT CÁC CƠNG TRÌNH NGHIÊN CỨU LIÊN QUAN 20 3.1 Các hướng nghiên cứu liên quan 20 3.2 Vấn đề đặt luận văn 23 Chương XÂY DỰNG MỐI QUAN HỆ GIỮA CÁC LỚP THỰC THỂ TRONG ONTOLOGY 27 4.1 Mối quan hệ lớp thực thể ontology 27 4.2 Phương pháp tính dựa xuất đồng thời 28 4.3 Tạo ma trận co-occurence lớp 29 4.4 Kết thực nghiệm Ontology VN-KIMO 30 Chương XÂY DỰNG MỐI QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN THUỘC CÙNG MỘT LỚP 34 Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa 5.1 Mối quan hệ thực thể có tên thuộc lớp 34 5.2 Phương pháp tính hệ số tương quan 35 5.3 Kết thực nghiệm Ontology VN-KIMO 38 Chương XÂY DỰNG MỐI QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN THUỘC CÁC LỚP KHÁC NHAU 42 6.1 Khái niệm luật kết hợp 42 6.2 Bài toán khai phá luật kết hợp 43 6.3 Giải thuật Apriori 45 6.4 Hiện thực toán khai phá luật kết hợp 46 6.5 Kết thực nghiệm 49 Chương TỔNG KẾT – ĐÁNH GIÁ 53 7.1 Tổng kết 53 7.2 Những đóng góp luận văn 54 7.3 Hướng phát triển 54 TÀI LIỆU THAM KHẢO 56 Phụ lục Mối quan hệ lớp 60 Phụ lục Mối quan hệ thực thể có tên lớp 64 Phụ lục Mối quan hệ thực thể có tên thuộc lớp khác 67 Phụ lục Bảng đối chiếu Thuật ngữ Anh - Việt 76 Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa DANH MỤC HÌNH Hình 2.1 Mơ hình ontology mối quan hệ ontology .16 Hình 2.2 Ngơn ngữ biểu diễn ontology .17 Hình 2.3 Mối quan hệ thực thể có tên 19 Hình 3.1 Mơ hình xử lý hệ thống xây dựng mối quan hệ 24 Hình 3.2 Mẫu tập tin chứa thơng tin thực thể có tên 24 Hình 3.3 Thơng tin lớp thực thể « Con_người » 25 Hình 3.4 Thơng tin mối quan hệ « có_thủ_đơ » 26 Hình 4.1 Mơ hình hệ số Link-Strength .29 Hình 6.1 Mơ hình dùng ARM tìm mối quan hệ thực thể có tên thuộc lớp khác 49 Đào Quốc Phương Trang Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Lớp A Lớp B LinkStrength Tư_vấn_thương_mại_và_đầu_tư Hội_chợ_triển_lãm 0.526316 Truyền_thơng Con_người 0.524272 An_ninh_an_tồn Thang_máy_và_băng_tải 0.519231 Nông_nghiệp_và_lâm_nghiệp Lương_thực_thực_phẩm_chế_biến 0.51073 Công_ty Quốc_gia 0.500984 Thắng_cảnh_suối Thung_lũng 0.5 Nước Trắc_địa_bản_đồ 0.5 Đào Quốc Phương Trang 63 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Phụ lục Mối quan hệ thực thể có tên lớp Tập liệu thứ : khảo sát 350 trang Web tin tức xét thực thể có tên “Việt Nam” thuộc lớp “Quốc_gia” có hệ số ngưỡng Correlation 0.2 Thực thể X Thực thể Y Correlation Việt Nam Mỹ 0.40263 Việt Nam Trung Quốc 0.362256 Việt Nam Singapore 0.326644 Việt Nam Brunei 0.313715 Việt Nam Kenya 0.305599 Việt Nam Iraq 0.303246 Việt Nam Pháp 0.299629 Việt Nam Nhật 0.298521 Việt Nam Đan Mạch 0.288631 Việt Nam Nhật Bản 0.281427 Việt Nam Malaysia 0.27699 Việt Nam Nga 0.274402 Việt Nam Đức 0.25875 Việt Nam Thái lan 0.256848 Việt Nam nước Mỹ 0.255899 Việt Nam Hàn Quốc 0.254903 Việt Nam Ireland 0.248053 Việt Nam Greenland 0.239104 Việt Nam Saudi Arabia 0.235721 Việt Nam Albania 0.235721 Đào Quốc Phương Trang 64 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Cũng tập liệu thứ khảo sát thực thể có tên “Kasim Hồng Vũ” thuộc lớp “Con_người” có hệ số ngưỡng Correlation 0.7 Thực thể X Thực thể Y Correlation Kasim Hoàng Vũ Phạm Quỳnh Anh Kasim Hoàng Vũ Đan Trường Kasim Hoàng Vũ Lam Trường Kasim Hoàng Vũ Ưng Hoàng Phúc Kasim Hoàng Vũ Mỹ Tâm Kasim Hoàng Vũ Nguyễn Đức Trung Kasim Hoàng Vũ Thanh Thảo Tập liệu thứ hai : khảo sát 1053 trang Web tin tức khảo sát thực thể có tên “Việt Nam” thuộc lớp “Quốc_gia” có hệ số ngưỡng Correlation 0.5 Thực thể X Thực thể Y Correlation Việt Nam Mỹ 0.895348 Việt Nam Trung Quốc 0.84742 Việt Nam Pháp 0.842355 Việt nam Nga 0.839893 Việt Nam Nhật Bản 0.821515 Việt Nam Nhật 0.787244 Việt Nam Campuchia 0.748614 Việt nam Singapore 0.718273 Việt Nam Hàn Quốc 0.705264 Việt Nam Australia 0.704581 Việt Nam Ba Lan 0.669204 Việt Nam Japan 0.656745 Việt Nam Áo 0.628325 Việt Nam Pakistan 0.601136 Đào Quốc Phương Trang 65 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Thực thể X Thực thể Y Correlation Việt Nam Hà Lan 0.579503 Việt Nam Mexico 0.572042 Việt Nam Bulgaria 0.54446 Việt Nam Italy 0.54225 Việt Nam Thái Lan 0.537383 Việt Nam England 0.535064 Việt Nam New Zealand 0.525433 Việt Nam Tây Ban Nha 0.51599 Việt Nam Ethiopia 0.513835 Việt Nam Lào 0.508685 Cũng tập liệu thứ hai khảo sát thực thể có tên “Hồng Nhung” thuộc lớp “Con_người” có hệ số ngưỡng Correlation 0.7 Thực thể X Thực thể Y Correlation Hồng Nhung Thanh Lam 0.924079 Hồng Nhung Mỹ Linh 0.902515 Hồng Nhung Trần Thu Hà 0.883711 Hồng Nhung nhạc sĩ Thanh Tùng 0.882448 Hồng Nhung nhạc sĩ Trịnh Công Sơn 0.866256 Hồng Nhung Thanh Lam 0.843122 Hồng Nhung Lam Trường 0.824661 Hồng Nhung nhạc sĩ Dương Thụ 0.819758 Hồng Nhung nhạc sĩ Lê Minh Sơn 0.817894 Hồng Nhung Mỹ Tâm 0.801717 Hồng Nhung Bảo Yến 0.751903 Hồng Nhung Hồ Quỳnh Hương 0.727346 Đào Quốc Phương Trang 66 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Phụ lục Mối quan hệ thực thể có tên thuộc lớp khác Tập luật kết hợp sinh tập liệu thứ (gồm 350 trang Web), giá trị ngưỡng : độ hỗ trợ 5% độ tin cậy 50% Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Báo Người Lao Động Bộ Văn hóa,Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,Quận 36.13% 100.00% Bộ Văn hóa,Quận Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,TPHCM 36.13% 100.00% Võ Văn Tần Báo Người Lao Động,Quận 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,Bộ Văn hóa 36.13% 100.00% Báo Người Lao Động,Bộ Văn hóa Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,Võ Văn Tần 36.13% 100.00% TPHCM Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải TPHCM 36.13% 100.00% Báo Người Lao Động TPHCM,Võ Văn Tần 36.13% 100.00% Trần Thanh Hải,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần Quận 36.13% 100.00% Quận 3,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Quận TPHCM 36.13% 100.00% TPHCM Quận 36.13% 100.00% Quận Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải Quận 36.13% 100.00% Quận Võ Văn Tần 36.13% 100.00% Võ Văn Tần Quận 36.13% 100.00% Đào Quốc Phương Trang 67 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Báo Người Lao Động TPHCM,Trần Thanh Hải Độ hỗ trợ Độ tin cậy 36.13% 100.00% Báo Người Lao Động,Trần Thanh TPHCM Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,TPHCM 36.13% 100.00% Báo Người Lao Động,TPHCM Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động Trần Thanh Hải,Võ Văn Tần 36.13% 100.00% Trần Thanh Hải,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,Võ Văn Tần 36.13% 100.00% TPHCM,Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% TPHCM,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần TPHCM 36.13% 100.00% Báo Người Lao Động,TPHCM Võ Văn Tần 36.13% 100.00% Võ Văn Tần Báo Người Lao Động,TPHCM 36.13% 100.00% Báo Người Lao Động,TPHCM Trần Thanh Hải 36.13% 100.00% TPHCM Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Trần Thanh Quận Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,Quận 36.13% 100.00% Báo Người Lao Động,Quận Trần Thanh Hải 36.13% 100.00% Hải Quận 36.13% 100.00% Quận 3,Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Quận 3,Võ Văn Tần 36.13% 100.00% Quận Báo Người Lao Động,Võ Văn Tần 36.13% 100.00% Võ Văn Tần Báo Người Lao Động,Quận 36.13% 100.00% Báo Người Lao Động,Trần Thanh Đào Quốc Phương Trang 68 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Báo Người Lao Động,Quận Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần Quận 36.13% 100.00% Quận 3,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động TPHCM,Trần Thanh Hải 36.13% 100.00% Quận 3,TPHCM Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động,TPHCM Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần Trần Thanh Hải 36.13% 100.00% Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Trần Thanh Hải Báo Người Lao Động,Trần Thanh Võ Văn Tần Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,Võ Văn Tần 36.13% 100.00% Báo Người Lao Động Trần Thanh Hải,Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Trần Thanh TPHCM Hải 36.13% 100.00% Báo Người Lao Động,Võ Văn Tần TPHCM 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,TPHCM 36.13% 100.00% Võ Văn Tần Báo Người Lao Động,TPHCM 36.13% 100.00% TPHCM Báo Người Lao Động,Võ Văn Tần 36.13% 100.00% Báo Người Lao Động TPHCM,Võ Văn Tần 36.13% 100.00% TPHCM,Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% Hải TPHCM 36.13% 100.00% Báo Người Lao Động,TPHCM Quận 36.13% 100.00% TPHCM,Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Quận Báo Người Lao Động,Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Trần Thanh Đào Quốc Phương Trang 69 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Báo Người Lao Động Quận 3,Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động,Quận TPHCM 36.13% 100.00% TPHCM Báo Người Lao Động,Quận 36.13% 100.00% Quận Báo Người Lao Động,TPHCM 36.13% 100.00% Báo Người Lao Động Quận 3,TPHCM 36.13% 100.00% Võ Văn Tần Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải,Võ Văn Tần TPHCM 36.13% 100.00% Võ Văn Tần TPHCM 36.13% 100.00% Trần Thanh Hải Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Quận Võ Văn Tần 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa 36.13% 100.00% Bộ Văn hóa Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Quận 36.13% 100.00% Quận Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động TPHCM 36.13% 100.00% TPHCM Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Võ Văn Tần 36.13% 100.00% Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% Bộ Văn hóa Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Võ Văn Tần 36.13% 100.00% Báo Người Lao Động Trần Thanh Hải 36.13% 100.00% Đào Quốc Phương Trang 70 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy TPHCM Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động TPHCM 36.13% 100.00% Quận Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Quận 36.13% 100.00% Võ Văn Tần Báo Người Lao Động 36.13% 100.00% Quận 3,TPHCM Báo Người Lao Động 36.13% 100.00% Báo Người Lao Động Quận 3,Võ Văn Tần 36.13% 100.00% Quận 3,Trần Thanh Hải Báo Người Lao Động 36.13% 100.00% Hải Quận 36.13% 100.00% Báo Người Lao Động,Quận Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải Báo Người Lao Động,Quận 36.13% 100.00% Báo Người Lao Động Quận 3,Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động,TPHCM Quận 36.13% 100.00% Báo Người Lao Động,Quận TPHCM 36.13% 100.00% TPHCM Báo Người Lao Động,Quận 36.13% 100.00% Quận Báo Người Lao Động,TPHCM 36.13% 100.00% Báo Người Lao Động Quận 3,TPHCM 36.13% 100.00% Hải 36.13% 100.00% Hải Bộ Văn hóa 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,TPHCM 36.13% 100.00% Báo Người Lao Động,Bộ Văn hóa TPHCM 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,Trần Thanh Hải 36.13% 100.00% Báo Người Lao Động Bộ Văn hóa,Võ Văn Tần 36.13% 100.00% Báo Người Lao Động,Trần Thanh Báo Người Lao Động,Trần Thanh Quận Báo Người Lao Động,Trần Thanh Đào Quốc Phương Trang 71 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Báo Người Lao Động Bộ Văn hóa,Quận 36.13% 100.00% Quận 3,Võ Văn Tần TPHCM 36.13% 100.00% Quận TPHCM,Trần Thanh Hải 36.13% 100.00% TPHCM Quận 3,Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải Quận 3,TPHCM 36.13% 100.00% Quận 3,TPHCM Trần Thanh Hải 36.13% 100.00% Quận 3,Trần Thanh Hải TPHCM 36.13% 100.00% TPHCM,Trần Thanh Hải Quận 36.13% 100.00% Quận TPHCM,Võ Văn Tần 36.13% 100.00% TPHCM Quận 3,Võ Văn Tần 36.13% 100.00% Quận 3,TPHCM Võ Văn Tần 36.13% 100.00% TPHCM,Võ Văn Tần Quận 36.13% 100.00% Quận Trần Thanh Hải,Võ Văn Tần 36.13% 100.00% Trần Thanh Hải Quận 3,Võ Văn Tần 36.13% 100.00% Võ Văn Tần Quận 3,Trần Thanh Hải 36.13% 100.00% Quận 3,Trần Thanh Hải Võ Văn Tần 36.13% 100.00% Quận 3,Võ Văn Tần Trần Thanh Hải 36.13% 100.00% Trần Thanh Hải,Võ Văn Tần Quận 36.13% 100.00% TPHCM Trần Thanh Hải,Võ Văn Tần 36.13% 100.00% Trần Thanh Hải TPHCM,Võ Văn Tần 36.13% 100.00% Võ Văn Tần TPHCM,Trần Thanh Hải 36.13% 100.00% TPHCM,Trần Thanh Hải Võ Văn Tần 36.13% 100.00% TPHCM,Võ Văn Tần Trần Thanh Hải 36.13% 100.00% Võ Văn Tần Quận 3,TPHCM 36.13% 100.00% Bộ Văn hóa,TPHCM Trần Thanh Hải 36.13% 100.00% Đào Quốc Phương Trang 72 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy TPHCM,Trần Thanh Hải Bộ Văn hóa 36.13% 100.00% Báo Người Lao Động,Mỹ TPHCM 7.80% 100.00% Bộ Văn hóa,Mỹ Trần Thanh Hải 7.80% 100.00% Mỹ,TPHCM Bộ Văn hóa 7.80% 100.00% Mỹ,Trần Thanh Hải Báo Người Lao Động 7.80% 100.00% Báo Người Lao Động,Mỹ Trần Thanh Hải 7.80% 100.00% Mỹ,Võ Văn Tần Quận 7.80% 100.00% Mỹ,TPHCM Báo Người Lao Động 7.80% 100.00% Mỹ,Trần Thanh Hải Bộ Văn hóa 7.80% 100.00% Mỹ,Quận TPHCM 7.80% 100.00% Mỹ,TPHCM Quận 7.80% 100.00% Mỹ,Quận Trần Thanh Hải 7.80% 100.00% Bộ Văn hóa,Mỹ Võ Văn Tần 7.80% 100.00% Mỹ,Quận Võ Văn Tần 7.80% 100.00% Mỹ,Võ Văn Tần Báo Người Lao Động 7.80% 100.00% Mỹ,TPHCM Trần Thanh Hải 7.80% 100.00% Mỹ,Trần Thanh Hải TPHCM 7.80% 100.00% Mỹ,Trần Thanh Hải Quận 7.80% 100.00% Báo Người Lao Động,Mỹ Võ Văn Tần 7.80% 100.00% Báo Người Lao Động,Mỹ Bộ Văn hóa 7.80% 100.00% Bộ Văn hóa,Mỹ Báo Người Lao Động 7.80% 100.00% Báo Người Lao Động,Mỹ Quận 7.80% 100.00% Mỹ,Quận Báo Người Lao Động 7.80% 100.00% Báo Người Lao Động,Mỹ TPHCM 7.80% 100.00% Mỹ,TPHCM Báo Người Lao Động 7.80% 100.00% Đào Quốc Phương Trang 73 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Mỹ,Trần Thanh Hải Báo Người Lao Động 7.80% 100.00% Mỹ,Võ Văn Tần Bộ Văn hóa 7.80% 100.00% Báo Người Lao Động,Mỹ Quận 7.80% 100.00% Mỹ,TPHCM Võ Văn Tần 7.80% 100.00% Mỹ,Võ Văn Tần Báo Người Lao Động 7.80% 100.00% Báo Người Lao Động,Mỹ Võ Văn Tần 7.80% 100.00% Báo Người Lao Động,Mỹ Trần Thanh Hải 7.80% 100.00% Mỹ,Quận Bộ Văn hóa 7.80% 100.00% Mỹ,Quận Báo Người Lao Động 7.80% 100.00% Bộ Văn hóa,Mỹ Quận 7.80% 100.00% Mỹ,Võ Văn Tần TPHCM 7.80% 100.00% Báo Người Lao Động,Mỹ Bộ Văn hóa 7.80% 100.00% Bộ Văn hóa,Mỹ Báo Người Lao Động 7.80% 100.00% Mỹ,Võ Văn Tần Trần Thanh Hải 7.80% 100.00% Mỹ,Trần Thanh Hải Võ Văn Tần 7.80% 100.00% TTO Hàn Quốc 7.51% 86.67% Hàn Quốc TTO 7.51% 68.42% Seoul Hàn Quốc 5.49% 100.00% Thủ tướng Tony Blair Triều Tiên 5.49% 95.00% Triều Tiên Thủ tướng Tony Blair 5.49% 90.48% Đào Quốc Phương Trang 74 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Tập luật kết hợp sinh tập liệu thứ hai (gồm 1053 trang Web), giá trị ngưỡng : độ hỗ trợ 10% độ tin cậy 50% Nhóm thực thể có tên X Nhóm thực thể có tên Y Độ hỗ trợ Độ tin cậy Cống Quỳnh Q.1 23,11% 100% Q.1 Cống Quỳnh 23,11% 98,78% Thanh niên Online Cống Quỳnh 20,53% 100% Thanh niên Online Công ty TNHH Truyền thông 20,53% 100% Việt Nam Thanh niên Online Cống Quỳnh, Q.1 20.53% 100% Thanh niên Online Q.1, Công ty TNHH Truyền 20.53% 100% thông Việt Nam Thanh niên Online Cống Quỳnh, Công ty TNHH 20.53% 100% Truyền thông Việt Nam Cống Quỳnh Thanh niên Online 20,53% 88,84% Công ty TNHH Truyền thông Thanh niên Online 20.53% 88,84% Việt Nam Đào Quốc Phương Trang 75 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Phụ lục Bảng đối chiếu Thuật ngữ Anh - Việt Các thuật ngữ chuyên ngành: Thuật ngữ Tiếng Anh Thuật ngữ Tiếng Việt RDF, RDFS Ngôn ngữ mô tả siêu liệu Named entity Thực thể có tên Ontology Mơ hình thể Semantic Web Web có ngữ nghĩa Semantic Relation Mối quan hệ ngữ nghĩa Co-occurrence Sự đồng xuất Correlation Mối liên hệ tương quan Association Rule Mining Khai phá luật kết hợp Concept Khái niệm Entity Thực thể Taxonomic-relation Quan hệ phân cấp Nontaxonomic-relation Quan hệ không phân cấp Đào Quốc Phương Trang 76 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc - LÝ LỊCH KHOA HỌC I LÝ LỊCH SƠ LƯỢC Họ tên : Đào Quốc Phương _Nguyên quán : Nam Hà Ngày tháng năm sinh : 25 / 06 /1979 Nơi sinh : Tp.Hồ Chí Minh Địa liên lạc : 51 / 98 Cao Thắng P3, Q3, Tp.Hồ Chí Minh II QUÁ TRÌNH ĐÀO TẠO ĐẠI HỌC Chế độ học : Chính quy Thời gian học : từ 05 / 09 / 1997 đến 05 / 09 /2002 Nơi học : Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Ngành học : Khoa học máy tính Tên luận văn tốt nghiệp : Xây dựng chương trình quản lý siêu thị Internet Ngày nơi bảo vệ : 07 / 2002 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Người hướng dẫn : KS Hồ Văn Quân TRÊN ĐẠI HỌC Cao học từ 05 / 09 / 2005 đến 05 / 03 /2009 Trường Đại Học Bách Khoa Tp.HCM Ngành học : Khoa học máy tính Tên luận án tốt nghiệp : Xây dựng quan hệ thực thể có tên Web ngữ nghĩa Ngày nơi bảo vệ : 30 / 01 / 2008 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Người hướng dẫn : TS Quản Thành Thơ III Q TRÌNH CƠNG TÁC Thời gian 09 / 2002 – 08 / 2004 Cơng việc nơi cơng tác Lập trình viên cơng ty TNHH phần mềm GENSOFT 09 /2004 đến Giảng viên Trường Cao Đẳng Kinh Tế TP.HCM Đào Quốc Phương Trang 77 ... 41 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Chương XÂY DỰNG MỐI QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN THUỘC CÁC LỚP KHÁC NHAU Chương trình bày kỹ thuật xây dựng mối quan hệ thực thể có tên. .. Trang 36 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa - Một thực thể “x” có mối liên hệ với thực thể có tên “z1” lớp thực thể Z, tương tự thực thể “x” có mối liên hệ với thực thể có tên “k2”... 33 Xây dựng quan hệ thực thể có tên Web có ngữ nghĩa Chương XÂY DỰNG MỐI QUAN HỆ GIỮA CÁC THỰC THỂ CÓ TÊN THUỘC CÙNG MỘT LỚP Trong chương này, phần đầu chương giới thiệu mối quan hệ thực thể có