Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
384,55 KB
Nội dung
1 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG PHẠM KHÁNH THIỆN ỨNGDỤNGSEMANTICWEBĐỂXÂYDỰNGHỆTHỐNGTRACỨUTHÔNGTINVỀVĂNHÓATÂYNGUYÊN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2011 2 Công trình ñược hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS Võ Trung Hùng Phản biện 1 : Phản biện 2 : . Luận văn sẽ ñược bảo vệ trước Hội ñồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày …. tháng … năm ……. Có thể tìm hiểu luận văn tại: • Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng • Trung tâm học liệu Đại học Đà Nẵng 3 MỞ ĐẦU 1. Lý do chọn ñề tài Web 2.0 là một bước ñột phá về công nghệ và ñã ñạt ñược những thành tựu rất ñáng kể trong việc nâng cao tính tương tác cũng như ñẩy nhanh tốc ñộ xử lý ñáp ứng yêu cầu của người dùng. Tuy nhiên trong xã hội thôngtin ñương ñại nhu cầu của người dùng không dừng lại ở việc cải thiện tốc ñộ mà còn phải cải thiện chất lượng xử lý của trang web theo yêu cầu ngày càng nâng cao. Web 3.0 (Semantic web) ra ñời nhằm ñáp ứng những yêu cầu về chất lượng ñó. Với ñặc ñiểm chính là nâng cao khả năng chia sẻ tài nguyên và tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Vì vậy Semanticweb ñã ñi sâu vào phân tích và ñịnh hướng dữ liệu ñồng thời hỗ trợ phát triển ứngdụngSemanticweb mở rộng trên nhiều lĩnh vực khác nhau. Một trong những lĩnh vực thế mạnh của Semanticweb là xử lý và tìm kiếm thông tin. Việc phân tích và ñịnh hướng nội dung lưu trữ cho phép ta chúng ta xâydựng những cơ sở dữ liệu phục vụ tìm kiếm chính xác hơn. Mặc khác, việc máy tính có thể “hiểu” ñược dữ liệu sẽ giúp tìm ñược nhiều thôngtin có liên quan ñến nội dung cần tìm. Khu vực TâyNguyên hiện nay có nhiều dân tộc cùng chung sống. Đây không chỉ là ñịa bàn chiến lược về kinh tế, chính trị, an ninh quốc phòng mà còn là khu vực có hệthống di sản vănhóa vật thể và phi vật thể phong phú, ñộc ñáo mang ñậm bản sắc vănhóa của các tộc người thiểu số. Cùng với việc ñầu tư phát triển kinh tế - xã hội, nâng cao ñời sống cho ñồng bào các dân tộc, công tác bảo tồn và phát huy những giá trị vănhóa của các dân tộc Tây nguyên, một trong bảy vùng vănhóa 4 lớn của ñất nước cũng ñang ngày càng ñược quan tâm. Song, hiện nay VHTN hầu hết ñược lưu giữ trong bảo tàng, trong sách, tài liệu, không ñược nhiều người biết ñến, trong khi nhu cầu giao lưu văn hóa, kinh tế, xã hội giữa các dân tộc, vùng miền là nhu cầu thường xuyên, lâu dài. Ngày nay, với sự phát triển của CNTT, các dịch vụ web ngày càng trở nên phổ biến thì việc xâydựnghệthốngtracứuthôngtinvề VHTN là ñiều cần làm và cần có một hệthốngwebthông minh hơn nhằm phục vụ cho việc tìm hiểu về VHTN, rút ngắn khoảng cách thôngtin giữa ñồng bằng và miền núi, giữa các dân tộc, ñồng thời giới thiệu bản sắc vănhóa vùng Tâynguyên ñến với ñông ñảo người dân trên mọi miền tổ quốc và cả thế giới. Với những lí do trên tôi chọn ñề tài “Ứng dụngSemanticweb ñể xâydựnghệthốngtracứuthôngtinvề VHTN”. 2. Mục ñích nghiên cứu Mục ñích chính của ñề tài là kết hợp giữa việc nghiên cứu công nghệ Semanticweb với nhu cầu khai thác những thôngtinvềvănhóa khu vực TâyNguyên của người dùng. Đề tài phát triển theo hướng nâng cao chất lượng tìm kiếm tracứuthôngtinvềvănhóa của các dân tộc Tây Nguyên. Xác ñịnh những yêu cầu của công việc là thực hiện ñể xâydựng một trang Semanticweb ta thấy cần phải nghiên cứu và thực hiện các công việc sau: Về mặt thuyết, trước tiên ta cần tìm hiểu Semantic web. Tìm hiểu và chọn những công cụ ñể phát triển một cách hiệu quả nhất. Sau ñó ta cần phải ñưa ra ñược những ñiểm mờ và phân tích giải quyết nó ñể khi tiến hành xâydựng sẽ không gặp phải sự cố không mong ñợi. Về mặt phát triển ứngdụng ta cần xâydựng một trang web ñể ứngdụngtracứuvềvănhóa của các dân tộc Tây Nguyên. Chương trình phải ñáp ứng ñúng hai yêu cầu cốt lõi ñó là tìm kiếm chính xác hơn và tùy chọn tìm kiếm nhiều dữ liệu liên quan hơn. 3. Đối tượng và phạm vi nghiên cứu 5 - Tìm hiểu các lý thuyết vềSemanticWeb và VHTN. - Tìm hiểu, nghiên cứu các phương pháp xâydựng và lưu trữ dữ liệu trong Semantic Web, các công cụ dùng ñể thực hiện triển khai hệthống thành chương trình như Visual Studio, các ngôn ngữ lập trình, các gói thư viện mở rộng. - Đề tài tập trung vào nghiên cứu và ứngdụngSemanticweb vào lĩnh vực quản lý các thôngtinvề VHTN. Đồng thời xâydựng một chương trình minh họadùng ñể tìm kiếm các thôngtinvề VHTN. 4. Phương pháp nghiên cứuĐể thực hiện ñề tài này chúng tôi kết hợp hai nhóm phương pháp nghiên cứu chính, ñó là: - Phương pháp nghiên cứu lý thuyết. - Phương pháp nghiên cứu thực tế. 5. Ý nghĩa khoa học và thực tiễn của ñề tài - Về mặt khoa học, ñề tài nghiên cứu tiếp cận với công nghệ mới về xử lý thôngtin của Semantic Web. Nghiên cứu ñề xuất hướng phát triển một ứngdụng ñảm bảo tính chính xác thông tin. - Về mặt thực tiễn, ứngdụng thành quả của công nghệ thôngtin vào lĩnh vực văn hóa. Việc xâydựnghệthốngtracứuthôngtinvề VHTN có ý nghĩa hết sức thiết thực trong việc tìm hiểu, nghiên cứu và gìn giữ bản sắc vănhóa các dân tộc vùng Tây Nguyên. 6. Cấu trúc của luận văn Nội dung của luận văn ñược chia thành 3 chương: Chương 1: Tổng quan vềSemantic Web. Chương 2: Giải pháp xâydựngứngdụngSemantic Web. Chương 3: Phát triển ứng dụng. 6 CHƯƠNG 1: TỔNG QUAN VỀSEMANTICWEB Trong chương này chúng tôi giới thiệu tổng quan nhất vềWeb và Semantic web. Quy trình xâydựng một trang Semantic web, trong chương này chúng tôi cũng ñề cập ñến các công cụ hỗ trợ tốt nhất cho lĩnh vực Semanticweb hiện nay cũng như các khái niệm vềvăn hóa, thực trạng và nhu cầu tracứuvề VHTN. 1.1. Semanticweb 1.1.1. Giới thiệu vềSemanticweb 1.1.1.1. World wide web và những hạn chế của nó 1.1.1.2. Sự ra ñời của Semanticweb 1.1.2. Quy trình xâydựngSemanticweb Phần này tôi trình bày mô hình cải tiến của mô hình Noy và McGuinness : (1) Xác ñịnh mục ñích phát triển ontology. (2) Kỹ thuật nắm bắt ontology (ontology capture). (3) Xem xét sử dụng lại các ontology ñang tồn tại. (4) Mã hoá ontology (ontology coding). (5) Cải tiến ontology. (6) Tích hợp các ontology thành phần. (7) Kiểm thử. (8) Duy trì. 1.1.3. Một số ứngdụng có sẵn của Semanticweb 1.1.3.1. Công cụ tìm kiếm Kngine Công cụ tìm kiếm Kngine dùng ñể tìm kiếm theo yêu cầu với việc phân tích ngữ nghĩa. Trang web này ñược chia thành các mục ñể người dùng có thể tìm kiếm trong miền nhỏ hơn, cho kết quả chính xác hơn. 1.1.3.2. Công cụ tìm kiếm Swoogle 7 Đây là công cụ tìm kiếm kết hợp giữa việc thu thập văn bản theo ngữ nghĩa (SWDs). Ứngdụng này khai thác thuật toán PageRank nên mặc dù phải truy xuất trên nhiều miền dữ liệu khác nhau nhưng vẫn có tốc ñộ tương ñối nhanh. 1.1.3.3. Công cụ tìm kiếm Hakia Hakia là công ty công nghệ tìm kiếm ngữ nghĩa. Nhiệm vụ của Hakia là triển khai các giải pháp tìm kiếm ngữ nghĩa ñể ñáp ứng những thách thức của người dùng với hiệu quả kinh doanh cao và chi phí thấp. 1.1.3.4. Trang web microformats. Microformats tập hợp dữ liệu trên các ñịnh dạng sẵn có hiện nay ñể phân tích và tái sử dụng. 1.2. Công cụ và công nghệ liên quan ñến Semanticweb Trong phần này, chúng tôi trình bày sơ lược về các công cụ, công nghệ liên quan ñến Semantic web. 1.2.1. Công cụ xâydựng ontology Protégé 1.2.1.1. Bộ công cụ WebODE 1.2.1.2. Bộ công cụ OilED 1.2.1.3. Bộ công cụ Protégé 1.2.2. Truy vấn trên dữ liệu Semanticweb 1.2.3. Thư viện phát triển ứngdụng 1.2.3.1. Jena – Một Framework của Semanticweb 1.2.3.2. Công cụ hỗ trợ lập trình phát triển Semanticweb trên nền tảng .NET 1.3. VănhóaTâyNguyên 1.3.1. Vănhóa và ñặc trưng VHTN 1.3.1.1. Khái niệm vănhóa 8 Vănhóa là từ thường ñược hiểu theo nghĩa rộng hẹp khác nhau. Trong hoạt ñộng giao tiếp hàng ngày, vănhóa ñược dùng theo nghĩa hẹp ñể chỉ học thức, lối sống. Vănhóa trong ñề tài này ñược hiểu theo nghĩa rộng, ñó là toàn bộ những gì do con người sáng tạo ra có tính giá trị, có thể là vănhoá vật thể, phi vật thể. 1.3.1.2. Đặc trưng VHTN Đặc trưng vănhóa của một dân tộc là những giá trị tiêu biểu về tinh thần và vật chất mà dân tộc ñó ñã tích lũy trong quá trình lịch sử, nó có tính bền vững, có ý nghĩa lâu dài, có giá trị khu biệt. Tâynguyên có nhiều thành phần dân tộc ñang sinh sống, nguồn gốc là các dân tộc thiểu số gồm: Ba Na, Xê ñăng, Gia Rai, Êñê, Giẻ-Triêng, BRâu, Rơ Mâm, K'Ho…, ñời sống của các dân tộc TâyNguyên gắn với nương rẫy, tự cấp tự túc, phụ thuộc nhiều vào thiên nhiên cho nên họ sùng bái các lực lượng thiên nhiên, họ quan niệm những gì liên quan cuộc sống cũng có thần. Từ ñặc ñiểm ñó mà VHTN rất ña dạng và phong phú, với những ñặc trưng ñược chia từng loại như sau: Vănhóa lễ hội, luật tục, kiến trúc, nhạc cụ dân tộc, trang phục, ẩm thực, ngôn ngữ . 1.3.2. Nhu cầu việc tracứu VHTN 1.3.3. Hiện trạng hệthống phục vụ tracứu VHTN Để có cơ sở xâydựnghệthống mới, tôi tiến hành khảo sát hiện trạng hệthống phục vụ tracứu hiện tại theo 2 nguồn thông tin, ñó là nguồn thôngtin trực tiếp các sở VH-TT&DL và qua mạng Google. Kết quả sau khi tiến hành khảo sát thực tế có thể nói chưa có 1 hệthống phục vụ tracứuthôngtin VHTN hoàn hảo và ñầy ñủ thôngtin ñể giúp người sử dụng có thể tracứu mọi lúc mọi nơi một cách nhanh chóng, tiết kiệm chi phí. 9 CHƯƠNG 2: GIẢI PHÁP XÂYDỰNGỨNGDỤNGSEMANTICWEB Trong chương này chúng tôi trình bày các bước tìm hiểu về các yêu cầu của bài toán, phân tích và chọn giải pháp cũng như công nghệ ñể thực hiện bài toán từ ñó ñịnh hướng xâydựng một ứngdụngSemanticweb tiện lợi nhất. 2.1. Giới thiệu bài toán Việc xâydựng một chương trình ứngdụng giải quyết một bài toán thực tế cần thực hiện rất nhiều công việc khác nhau, ta ñi vào công việc ñầu tiên là xác ñịnh các yêu cầu của bài toán. 2.1.1. Yêu cầu bài toán 2.1.1.1. Đặt vấn ñề Đối tượng sử dụng Với nội dung của bài toán này ta thấy ñối tượng sử dụng là những người nghiên cứu, sinh viên các trường ñại học, cao ñẳng, học sinh các trường phổ thông và du khách…Trang web này mong muốn phát triển ñể liên kết với website của bộ VH-TT & DL cũng như website của các tỉnh, Sở VH-TT & DL của các tỉnh trong khu vực Tây Nguyên. Yêu cầu bài toán Bài toán ñặt ra những yêu cầu xâydựng một trang web có chức năng hỗ trợ tìm kiếm thôngtinvề VHTN ñáp ứng các yêu cầu như: - Cho phép người dùng nhập dữ liệu ñộng. - Cho phéo người dùng có thể tùy chọn hướng truy xuất dữ liệu từ dân tộc, lễ lội, nhạc cụ,… - Trang tìm kiếm phải ñáp ứng hai chức năng chính ñó là tìm kiếm theo tên dân tộc và tìm kiếm theo tùy biến. - Tạo các trang webthôngtinvề các dân tộc, kiến trúc, lễ hội, nhạc cụ,… 10 2.1.1.2. Phân tích vấn ñề N ế u theo cá ch l ậ p trì nh v ớ i web 2.0 thì cá c thôngtin liên quan ñế n m ộ t dân t ộ c có th ể bao g ồ m nh ữ ng thôngtin nh ư “l ễ h ộ i”, “trang ph ụ c”, “ki ế n trúc”,… Nhì n t ổ ng quá t ta th ấ y cá ch nà y t ươ ng ñố i ổ n nh ư ng xé t chi ti ế t h ơ n ta th ấ y r ằ ng d ữ li ệ u củ a cá c bả ng thôngtin liên quan r ấ t khó có th ể thay ñổ i. D ữ li ệ u quan h ệ gi ữ a cá c dân t ộ c cũ ng là m ộ t v ấ n ñề . V ớ i yêu c ầ u phé p ng ườ i dù ng thêm b ớ t cá c quan h ệ , ñ i ề u nà y cũ ng lạ i r ấ t khó th ự c thi v ớ i cá c h ệ quả n trị c ơ s ở d ữ li ệ u tr ướ c ñ ây. T ừ nh ữ ng khó kh ă n trên tôi ñư a ra g iả i phá p ñó là s ử dụ ng công ngh ệ Semanticweb ñể giả i quy ế t bà i toá n. Công ngh ệ Semanticweb v ớ i ñặ c ñ i ể m l ư u tr ữ d ữ li ệ u d ướ i ñị nh dạ ng XML và mô hình d ữ li ệ u thông minh nên vi ệ c l ư u tr ữ d ữ li ệ u có tí nh tù y bi ế n cao và h ỗ tr ợ tìm ki ế m nhanh, thôngtin ch ấ t l ượ ng h ơ n. V ớ i công vi ệ c xá c ñị nh là phá t tri ể n m ộ t trang Semanticweb tôi xây d ự ng ứ ng d ụ ng g ồ m 2 ph ầ n chính ñ ó là xây d ự ng ontology và thi ế t k ế xây d ự ng trình duy ệ t thông minh ñể hi ể n th ị k ế t qu ả . Ontology Trong ph ầ n này chúng ta xây d ự ng các l ớ p, các thu ộ c tính t ạ o nh ữ ng m ố i quan h ệ ñồ ng c ấ p và phân c ấ p theo nh ữ ng chu ẩ n ñ ã ñượ c ñị nh ngh ĩ a b ở i t ổ ch ứ c W3C và c ả nh ữ ng ñị nh ngh ĩ a m ớ i riêng bi ệ t cho ch ươ ng trình. Trình duyệt web Ph ầ n trình duy ệ t ta không xây d ự ng m ộ t trình duy ệ t m ớ i hoàn toàn ñ áp ứ ng ñầ y ñủ các yêu c ầ u truy c ậ p d ữ li ệ u ở b ấ t k ỳ ontology nào mà ta xây d ự ng trình duy ệ t t ươ ng t ự các ứ ng d ụ ng web nh ằ m hi ể n th ị thôngtin c ơ s ở d ữ li ệ u ñ ã xây d ự ng. 2.1.2. Giải pháp 11 C ấ u trúc c ủ a m ộ t máy tìm ki ế m theo công ngh ệ Semantic web, v ề c ơ b ả n c ũ ng có c ấ u trúc t ươ ng t ự v ớ i m ộ t máy tìm ki ế m thông th ườ ng, bao g ồ m 2 thành ph ầ n chính là giao di ệ n truy v ấ n và ki ế n trúc bên trong. Giao diện truy vấn : - Cho phép người dùng nhập yêu cầu tìm kiếm - Hiển thị kết quả tìm kiếm Phần kiến trúc bên trong : là ph ầ n c ố t lõi c ủ a máy tìm ki ế m bao g ồ m các thành ph ầ n: - Phân tích yêu cầu - Tìm kiếm kết quả cho yêu cầu - Dữ liệu tìm kiếm, mạng ngữ nghĩa S ự khác bi ệ t trong c ấ u trúc c ủ a máy tìm ki ế m ng ữ ngh ĩ a so v ớ i tìm ki ế m thông th ườ ng n ằ m ở ph ầ n ki ế n trúc bên trong, c ụ th ể ở 2 ph ầ n: phân tích câu h ỏ i và t ậ p d ữ li ệ u tìm ki ế m. Mô hình ñượ c ñề xu ấ t trong lu ậ n v ă n cho ứ ng d ụ ng tìm ki ế m ng ữ ngh ĩ a nh ư sau: Hình 2.1. Mô hình ứngdụng tìm kiếm thôngtin 2.1.3. Giải quyết yêu cầu 2.1.3.1. Suy luận dữ liệu Metadata Ontology Search Engine OWLDotNetAPI/SPARQ Web Browser 12 Semanticweb h ỗ tr ợ suy lu ậ n d ữ li ệ u thông minh nh ằ m h ỗ tr ợ vi ệ c suy lu ậ n d ữ li ệ u theo quy t ắ c c ủ a ontology. Ngôn ng ữ Ontology h ỗ tr ợ r ấ t nhi ề u các suy lu ậ n khác nhau. Tuy nhiên, trong gi ớ i h ạ n c ủ a ñồ án này chúng tôi ch ỉ ñư a ra hai lo ạ i hình suy lu ậ n d ữ li ệ u sau: Suy lu ậ n ngang c ấ p là suy lu ậ n d ự a trên cùng m ộ t thu ộ c tính c ủ a hai ñố i t ượ ng quan h ệ . Ví d ụ A là b ạ n c ủ a B thì B c ũ ng là b ạ n c ủ a A. Thu ộ c tính là bạn là thu ộ c tính hai chi ề u. Hình 2.2. Mô tả suy luận ngang cấp trong Semanticweb Suy lu ậ n ng ượ c là cách suy lu ậ n d ự a trên các thu ộ c tính khác nhau c ủ a hai ñố i t ượ ng. Ví d ụ A là b ố c ủ a B thì B là con c ủ a A. Thu ộ c tính là b ố và thu ộ c là con là hai thu ộ c tính ng ượ c nhau. Hình 2.3. Mô tả suy luận ngược trong Semanticweb Ch ươ ng trình h ỗ tr ợ hai Properties c ơ b ả n là Properties ñả o ng ượ c và Properties t ươ ng ñươ ng. Thu ậ t toán Filling s ẽ tìm ki ế m t ấ t c ả các Người A Người B Khai báo thuộc tính là bạn của A và B Suy luận từ dữ liệu khai báo với thuộc tính là bạn của B và A Người A Người B Khai báo thuộc tính là bố của A và B Suy luận từ dữ liệu khai báo với thuộc tính là con của B và A 13 thôngtin ch ư a ñượ c khai báo ñể ñ i ề n ñầ y ñủ thôngtin ph ụ c v ụ yêu c ầ u tìm ki ế m. 2.1.3.2. Các chức năng chính Ch ứ c n ă ng c ơ b ả n c ủ a ứ ng d ụ ng là tìm ki ế m, vi ệ c áp d ụ ng k ỹ thu ậ t tìm ki ế m trên Ontology s ẽ tr ả v ề nh ữ ng k ế t qu ả chính xác h ơ n nh ờ nh ữ ng ư u ñ i ể m v ề l ư u tr ữ d ữ li ệ u RDF so v ớ i d ữ li ệ u truy ề n th ố ng, có cách t ổ ch ứ c d ữ li ệ u ñơ n gi ả n, ñồ ng nh ấ t, c ấ u trúc b ộ ba giúp d ễ truy xu ấ t thôngtin b ở i các h ệ th ố ng suy lu ậ n. Duyệt theo ngữ nghĩa Duy ệ t cây phân c ấ p, theo lo ạ i hình d ị ch v ụ : cung c ấ p cách tìm ki ế m ñị a ñ i ể m theo phân c ấ p trên cây Ontology. Ng ườ i dùng không c ầ n nh ậ p thôngtin tìm ki ế m mà v ẫ n có th ể tìm ki ế m ñượ c tài li ệ u c ầ n thi ế t b ằ ng cách duy ệ t cây theo lo ạ i hình d ị ch v ụ . Tìm kiếm theo từ khóa Cách tìm ki ế m ph ổ bi ế n và có nhu c ầ u nhi ề u nh ấ t là tìm ki ế m theo t ừ khóa. T ừ khóa chính là t ừ g ợ i ý ñể so sánh nó v ớ i các thôngtin c ủ a d ữ li ệ u qua ñ ó s ẽ tìm ra k ế t qu ả c ầ n thi ế t. Tìm kiếm nâng cao H ệ th ố ng ñư a ra m ộ t s ố tùy ch ọ n làm ñ i ề u ki ệ n ng ườ i dùng d ự a vào m ộ t s ố g ợ i ý ñ ó ñể ñư a ra ñ i ề u ki ệ n phù h ợ p v ớ i yêu c ầ u c ủ a mình. S ử d ụ ng cách tìm ki ế m nâng cao s ẽ có k ế t qu ả chính xác h ơ n. 2.2. Các công cụ hỗ trợ 2.2.1. Công cụ xâydựngứngdụng Protégé 2.2.1.1. Đặc ñiểm của Protégé Đ ây là ph ầ n m ề m mi ễ n phí và ñượ c phát tri ể n b ở i tr ườ ng Đạ i h ọ c Stanford và Mark Musen. Ch ứ c n ă ng n ổ i b ậ t nh ấ t c ủ a ph ầ n m ề m này là cho phép ng ườ i dùng s ử dụ ng t ạ o ra các ontology ñể phát tri ể n Semanticweb theo ñ úng chu ẩ n c ủ a ngôn ng ữ W3C OWL. 14 2.2.1.2. Protégé sử dụng giao diện ñồ họa Ph ầ n m ề m h ỗ tr ợ ng ườ i s ử dụ ng l ậ p trì nh t ươ ng tá c b ằ ng giao di ệ n m ộ t cá ch nhanh chó ng, phù h ợ p gi ữ a suy nghĩ củ a ng ườ i l ậ p trì nh và n ộ i dung mà cá c l ớ p Protégé tạ o ra. 2.2.1.3. Protégé phát triển ñể tích hợp các công cụ Protégé cung c ấ p m ộ t s ố ñ i ể m m ở r ộ ng n ơ i các nhà phát tri ể n có th ể ch ủ ñộ ng thêm các thành ph ầ n mà ta th ườ ng g ọ i là plug-ins. 2.2.2. Bộ Visual Studio.Net Visual Studio.NET là m ộ t môi tr ườ ng tích h ợ p tri ể n khai ph ầ n m ề m. Nó ñượ c thi ế t k ế ñể l ậ p ra m ộ t ti ế n trình vi ế t mã, g ỡ r ố i và biên d ị ch thành m ộ t assembly d ễ dàng. Visual Studio.NET có m ộ t ứ ng d ụ ng multiple-document-interface r ấ t tinh vi, qua ñ ó ng ườ i dùng có th ể liên k ế t m ọ i th ứ ñể phát tri ể n ñ o ạ n mã c ủ a mì nh, bao g ồ m: Text Editor : cho phé p vi ế t ñ o ạ n mã C#. Design view editor : nó cho phép ñặ t giao di ệ n ng ườ i dùng và các control d ữ li ệ u truy c ậ p trong d ự án. Các cửa sổ hỗ trợ : cho phép xem và s ử a ñổ i nh ữ ng khía c ạ nh khác nhau trên d ự án. Biên dịch trong lòng môi trường : ñể thay cho vi ệ c ch ạ y trình biên d ị ch C# t ừ dòng l ệ nh. Intergated MSDN help : Visual studio.NET có th ể g ọ i tài li ệ u MSDN. 2.2.3. Thư viện phát triển ứngdụng Trong ph ầ n nà y sẽ trình bày v ề hai công cụ h ỗ tr ợ ng ườ i l ậ p trì nh phá t tri ể n Semanticweb d ự a trên n ề n t ả ng .NET mà tôi ñ ã l ự a ch ọ n ñể th ự c hi ệ n ñề tài. 2.2.3.1. SemWeb 15 SemWeb v ớ i các tính n ă ng c ố t lõi nh ư ñọ c/ghi d ữ li ệ u XML v ớ i b ộ ba RDF, liên t ụ c l ư u tr ữ d ữ li ệ u v ớ i n ề n t ả ng SQL và các truy v ấ n SPARQL c ơ b ả n ñã ñượ c ki ể m nghi ệ m nhi ề u l ầ n. Giấy phép Đ ây là b ả n mã ngu ồ n m ở , ñượ c s ử d ụ ng mi ễ n phí. Đặc ñiểm của Semweb M ộ t s ố ñặ c ñ i ể m n ổ i tr ộ i ñ ó là t ố c ñộ x ử lý và kh ả n ă ng giao ti ế p v ớ i các c ơ s ở d ữ li ệ u liên k ế t ñể truy c ậ p d ữ li ệ u. 2.2.3.2. OwlDotNetApi OwlDotNetApi là m ộ t OWL API v ớ i b ộ phân tích cú pháp vi ế t b ằ ng C# theo công ngh ệ .NET d ự a trên phân tích cú pháp RDF Drive. Hoàn toàn phù h ợ p v ớ i ñặ c ñ i ể m k ỹ thu ậ t c ủ a W3C. Chức năng M ụ c tiêu c ủ a OwlDotNetApi là ñọ c/ghi d ữ li ệ u c ủ a XML d ự a trên ñồ th ị v ớ i các c ạ nh t ươ ng ứ ng v ớ i thu ộ c tính liên k ế t và các ñỉ nh t ươ ng ứ ng v ớ i các nút hay còn g ọ i là các l ớ p. Xu ấ t phát t ừ vi ệ c ñồ th ị hoá n ộ i dung c ủ a d ữ li ệ u nên OwlDotNetApi ñ áp ứ ng ñượ c h ầ u h ế t t ấ t c ả các chu ẩ n mà W3C ñư a ra. Tuy nhiên vi ệ c truy c ậ p d ữ li ệ u không thông qua câu l ệ nh truy v ấ n nên vi ệ c l ậ p trình v ớ i th ư vi ệ n này ch ư a thu ậ n l ợ i v ề th ờ i gian x ử lý. OwlDotNetApi có hai ph ầ n chính là l ớ p ch ứ c n ă ng và l ớ p giao ti ế p. 2.2.3.3. Ví dụ Ph ầ n này s ẽ gi ớ i thi ệ u s ố l ệ nh c ơ b ả n trong th ư vi ệ n này. 16 CHƯƠNG 3: PHÁT TRIỂN ỨNGDỤNG Đ ây là ch ươ ng t ổ ng h ợ p và là câu tr ả l ờ i chính xác nh ấ t ñầ y ñủ nh ấ t cho nh ữ ng gì chúng tôi ñ ã trình bày ở 2 ch ươ ng tr ướ c. 3.1. Mô hình hoạt ñộng của hệthống Ứ ng d ụ ng ñượ c vi ế t trên n ề n web nên vi ệ c qu ả n lý c ậ p nh ậ t, hi ệ u ch ỉ nh thôngtin c ủ a ng ườ i qu ả n tr ị c ũ ng nh ư vi ệ c truy xu ấ t và tìm ki ế m d ữ li ệ u c ủ a ng ườ i dùng ñầ u cu ố i ñề u thông qua m ạ ng internet. Ở ñ ây ng ườ i duy ệ t web ñ óng vai trò trung gian theo s ơ ñồ x ử lý sau: Hình 3.1. Quy trình truy xuất dữ liệu 3.2. Quy trình xâydựngứngdụngĐể thi ế t k ế công c ụ tìm ki ế m ng ữ ngh ĩ a ứ ng d ụ ng trên, lu ậ n v ă n ñề xu ấ t mô hình h ỗ tr ợ vi ệ c tìm g ồ m các công ñ o ạ n sau: - Giai ñoạn 1 : Thiết kế Ontology - Giai ñoạn 2: Xâydựngứngdụng Xử lý truy vấn Hiển thị kết quả Câu truy vấnThôngtintrảvề Ontology Nhận câu truy vấn Gởi yêu cầu Nhận kết quả 17 3.3. Xâydựng ontology Ontology là n ề n t ả ng ñể xây d ự ng d ữ li ệ u cho ứ ng d ụ ng. D ữ li ệ u trên ontology có th ể là n ộ i dungthôngtin c ũ ng có th ể là liên k ế t ñế n các ontology khác có chung k ế t n ố i. Trong n ộ i dung c ủ a ñề tài này chúng tôi ch ỉ ñề c ậ p ñế n v ấ n ñề xây d ự ng thôngtin và s ử d ụ ng l ạ i thôngtin ñ ó theo mô hình Semanticweb mà ch ư a m ở r ộ ng ra các thôngtin trên nh ữ ng ontology có s ẵ n trên internet. 3.3.1. Mô hình biểu diễn Ontology V ớ i m ụ c ñ ích chia nh ỏ thôngtin ñể qu ả n lý chúng tôi ti ế n hành xây d ự ng các ñố i t ượ ng ñượ c phân chia thành các l ớ p, các cá th ể và các m ố i quan h ệ . Trong ontology này t ấ t c ả các thôngtin v ề VHTN s ẽ ñượ c phân rã và l ư u tr ữ d ướ i các d ạ ng khác nhau. 3.3.2. Thực hiện xâydựng HignOnt Vi ệ c xây d ự ng ontology t ươ ng t ự nh ư cách nh ậ p d ữ li ệ u vào c ơ s ở d ữ li ệ u. Phân tích các ñối tượng của ứngdụng tôi chia thành các ñối tượng: - Lớp : DanToc, VanHoa, NgonNgu, NghienCuu - Thuộc tính: CuaDanToc, … - Cá thể: Kinh, BaNa… Hình 3.2. Các phân cấp lớp trong HighlandResource Ontology 18 3.3.2.1. Lớp - Lớp DanToc trong HignOnt dùng ñể lưu các cá thể là các dân tộc thuộc VHTN. Các cá thể dân tộc ñều là con của lớp này. Lớp này là lớp nhỏ nhất và không ñược chia thành các lớp con. - Lớp VanHoa : thể hiện thôngtin các loại hình vănhóa của các dân tộc tây nguyên. Lớp này có thể chứa các cá thể hoặc các lớp con tương ứng với dữ liệu thành phần của VHTN. Trong ñề tài này chúng tôi chia thành các lo ạ i hình v ă n hóa t ươ ng ứ ng v ớ i các l ớ p con nh ư sau: L ớ p KienTruc, L ớ p NhacCu, L ớ p LeHoi . - Lớp NgonNgu thể hiện thôngtin các loại hình ngôn ngữ mà các dân tộc sử dụng hoặc ngôn ngữ của các công trình nghiên cứuvề VHTN. Lớp này không ñược chia nhỏ thành các lớp con. - Lớp nghienCuu mô tả thôngtin của các công trình nghiên cứuvề VHTN. 3.3.2.2. Thuộc tính Các thu ộ c tính th ể hi ệ n m ố i quan h ệ gi ữ a các ñố i t ượ ng d ữ li ệ u (individual) v ớ i nhau ho ặ c quan h ệ v ớ i d ữ li ệ u. Ngôn ng ữ ontology chia thu ộ c tính ra thành hai lo ạ i khác nhau là thu ộ c tính quan h ệ và thu ộ c tính d ữ li ệ u. Trong ứ ng d ụ ng này ta phát tri ể n ứ ng d ụ ng v ớ i các thu ộ c tính sau: Thuộc tính dữ liệu Đ ây là m ộ t s ố thu ộ c tính d ữ li ệ u c ơ b ả n có trong ch ươ ng trình. - Thuộc tính coTieuDe thể hiện một công trình nghiên cứu tiêu ñề cụ thể là gì và ñược quy ñịnh là kiểu dữ liệu chuỗi. - Thuộc tính coNoiDung thể hiện một công trình có thôngtin nội dung xác ñịnh và ñược quy ñịnh kiểu dữ liệu văn bản. - Thuộc tính namXuatBan thể hiện năm xuất bản của công trình nghiên cứu cụ thể. Thuộc tính này kiểu số. 19 - Thuộc tính coTen thể hiện thôngtin tên của một dân tộc, loại nhạc cụ, loại hình kiến trúc…và tên có kiểu dữ liệu là chuỗi. - Thuộc tính diaDiem thể hiện nơi lưu trữ của một công trình nghiên cứu hoặc thôngtin cư trú của một dân tộc. Hình 3.3. Các thu ộ c tính d ữ li ệ u trong ứ ng d ụ ng Thuộc tính quan hệ Đ ây là m ộ t s ố thu ộ c tính quan h ệ c ơ b ả n có trong ch ươ ng trình. - Thuộc tính veDanToc khai báo công trình nghiên cứuvềtâynguyên cụ thể ñang xét có liên quan ñến dân tộc nào. Thuộc tính này thể hiện mối quan hệ giữa một nghiên cứu cụ thể và các dân tộc. - Thuộc tính duaTrenNgonNgu thể hiện mối liên quan giữa công trình nghiên cứu ñó với các ngôn ngữ thể hiện trên các báo cáo, các bài báo liên quan… - Thuộc tính veLoaiHinhVanHoa thể hiện mối quan hệ giữa công trình nghiên cứu ñó về loại hình vănhóa nào. 20 Hình 3.4. Các thu ộ c tính quan h ệ trong ứ ng d ụ ng 3.3.2.3. Cá thể Các cá th ể là các thôngtin chính th ể hi ệ n n ộ i dung d ữ li ệ u c ủ a ứ ng d ụ ng. Trong ứ ng d ụ ng này tôi ch ỉ ñư a ra m ộ t s ố cá th ể tiêu bi ể u cho t ừ ng nhóm l ớ p và th ể hi ệ n ñượ c m ố i quan h ệ gi ữ a các ñố i t ượ ng. - Cá thể DT_Kinh lưu thôngtinvề dân tộc kinh mà ứngdụng cần có liên quan ñến dân tộc này. Người quản trị có thể thêm vào các thôngtin chưa ñược khai báo mà người dùng yêu cầu. - Cá thể NN_Viet lưu thôngtinvề ngôn ngữ Tiếng Việt. Đây là cá thể chứa thôngtin và thể hiện mối quan hệ với các cá thể khác sẽ ñược giới thiệu bên dưới. - Cá thể VH_KT_NhaRong lưu thôngtinvề loại hình vănhóa nhà rông của tây nguyên. Cá thể này là con của lớp Kiến trúc thuộc lớp Văn Hóa. <owl:DanToc rdf:about="#DT_Kinh"> <rdf:type rdf:resource="&owl;Thing"/> <rdfs:label>Dân tộc kinh</rdfs:label> <rdfs:comment>lưu thôngtinvề dân tộc kinh như tên gọi là kinh…</rdfs:comment> <diaDiem>Tất cả vùng miền thuộc ñất nước Việt Nam</diaDiem> </owl: DanToc >