1. Trang chủ
  2. » Kinh Doanh - Tiếp Thị

Nghiên cứu và xây dựng hệ thống tìm kiếm công thức khoa học

26 233 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 642,63 KB

Nội dung

Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG BÙI THỊ THANH THỦY NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG TÌM KIẾM CÔNG THỨC KHOA HỌC Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Footer Page of 126 Header Page of 126 Công trình hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS HUỲNH CÔNG PHÁP Phản biện 1: PGS.TSKH TRẦN QUỐC CHIẾN Phản biện 2: TS HOÀNG THỊ LAN GIAO Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 18 tháng năm 2013 Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng Footer Page of 126 Header Page of 126 MỞ ĐẦU Lý chọn đề tài Trong năm gần đây, với phát triển mạnh mẽ mạng Internet công nghệ Web bùng nổ thông tin số Số lượng người sử dụng lượng thông tin sản sinh mạng Internet gia tăng nhanh tìm thấy thông tin cần thiết có nhu cầu Đặc biệt, lượng thông tin liên quan đến khoa học, phục vụ học tập, nghiên cứu gia tăng nhanh chóng phong phú lĩnh vực Việc khai thác hiệu tài liệu khoa học Web có ý nghĩa quan trọng khoa học kinh tế góp phần đáng kể vào việc cải thiện trình học tập nghiên cứu Nhu cầu tìm kiếm công thức toán học môi trường web lớn chưa có hệ thống đáp ứng, kể nhà cung cấp dịch vụ tiếng Google, Yahoo, Microsoft,… Việc nghiên cứu giải pháp để hỗ trợ soạn thảo, lưu trữ tìm kiếm công thức toán học môi trường web cần thiết Vì chọn đề tài “ Nghiên cứu xây dựng hệ thống tìm kiếm công thức khoa học” Ý tưởng luận văn đề xuất mô hình phù hợp với tiêu chuẩn hành cho phép mô hình hóa, lưu trữ tìm kiếm thuận lợi công thức toán học, hóa học… tài liệu, tài liệu khoa học, web Mục tiêu đề tài Tìm kiếm công thức khoa học hàn lâm Nó phải đối mặt với nhiều vấn đề phức tạp toán học thiếu tiêu Footer Page of 126 Header Page of 126 chuẩn định nghĩa công cụ tìm kiếm khoa học bao gồm tính Để tạo công cụ tìm kiếm khoa học vấn đề sau cần phải giải quyết:  Trích rút nội dung toán học, hóa học … từ tài liệu khoa học  Phân loại văn bình thường ký hiệu khoa học  Lập mục văn khoa học thiết kế thuật toán xếp hạng  Thiết kế ngôn ngữ truy vấn Mục đích để tài đề xuất phương pháp tiếp cận giải gần tất vấn đề nhấn mạnh vào khả sử dụng thực tế Điểm khác biệt công cụ tìm kiếm khoa học trước công cụ tìm kiếm đề xuất luận văn kỹ thuật mục tài liệu khoa học thuật toán xếp hạng Đề xuất hệ thống tìm kiếm thiết kế với kỹ thuật mục mới, lạ Các vấn đề trình bày luận văn:  Vấn đề kết nối tìm kiếm khoa học, trình bày giải pháp lý giải pháp không phù hợp với sưu tập tài liệu lớn  Thiết kế hệ thống tìm kiếm khoa học  Đề xuất kỹ thuật mục ký hiệu khoa học thuật toán xếp hạng  Đề xuất ngôn ngữ truy vấn khoa học  Tổng kết dựa kết đánh giá Footer Page of 126 Header Page of 126 3 Đối tượng nghiên cứu Đối tượng nghiên cứu thực đề tài công cụ hỗ trợ soạn thảo, tiêu chuẩn lưu trữ, phương pháp hiển thị tìm kiếm công thức khoa học Phương pháp nghiên cứu Tìm hiểu lý thuyết soạn thảo, lưu trữ tìm kiếm công thức khoa học văn Nghiên cứu công cụ tìm kiếm khoa học có Tìm hiểu chuẩn MathML để đặc tả công thức toán học, hóa học Dựa lý thuyết nghiên cứu, tiến hành xây dựng ứng dụng soạn thảo công thức, lưu trữ, hỗ trợ tìm kiếm công thức khoa học web, tài liệu khoa học tất định dạng Ý nghĩa khoa học thực tiễn Việc khai thác hiệu tài liệu khoa học Web có ý nghĩa quan trọng khoa học kinh tế góp phần đáng kể vào việc cải thiện trình học tập nghiên cứu Kết đề tài góp phần quan trọng việc xử lý công thức khoa học hệ thống hỗ trợ dạy học qua mạng internet, diễn đàn khoa học… Cấu trúc luận văn Bố cục luận văn tổ chức thành chương Chương 1: Trình bày nghiên cứu tổng quan công cụ tìm kiếm khoa học Chương 2: Được dành để mô tả ứng dụng, xây dựng mô hình tổng quát, đề xuất giải pháp xây dựng môi trường soạn thảo công thức, tiêu chuẩn lưu trữ tìm kiếm công thức khoa học Chương 3: Trình bày triển khai ứng dụng Footer Page of 126 Header Page of 126 CHƯƠNG NGHIÊN CỨU TỔNG QUAN Công thức toán, công thức hóa, công thức vật lý…gọi chung công thức Khoa học Và công thức khoa học biểu diễn dạng toán học Cho nên luận văn này, tập trung sâu vào phân tích công thức toán học 1.1 SOẠN THẢO CÔNG THỨC TOÁN HỌC Với trình soạn thảo văn có chuẩn lưu trữ khác gặp nhiều khó khăn việc hợp văn tạo từ nhiều ứng dụng khác 1.1.1 Định dạng lưu trữ a LaTex LaTex định nghĩa chế độ đặc biệt để soạn thảo công thức toán học Các công thức đưa vào môi trường văn ta tách rời chúng khỏi đoạn văn Phần nội dung toán học đoạn văn soạn thảo dấu \ \ hay $ $ hay \ begin{math} \end{math} b HTML HTML ngôn ngữ đánh dấu thiết kế để tạo nên trang web, nghĩa mẫu thông tin trình bày Word Wide Web c MathML MathML ứng dụng XML để thể ký hiệu công thức toán học với mục đích rộng phương cách trao đổi thông tin toán học máy tính (để hiển thị để tính toán) mục đích hẹp hiển thị tài liệu toán học World Wide Web Nhóm Footer Page of 126 Header Page of 126 toán học W3C đề xuất người nên dần sử dụng ngôn ngữ mạng MathML thiết kế để không hiển thị tốt công thức toán học mà chứa ý nghĩa hiểu nội dung toán học 1.1.2 Biểu diễn soạn thảo Ở đây, tìm hiểu bốn loại văn thường sử dụng - Biểu diễn công thức toán học Microsoft Word - Biểu diễn công thức toán học Website - Biểu diễn công thức toán học OpenOffice.Org - Biểu diễn công thức toán học MathType a Biểu diễn công thức toán học Microsoft Word Ví dụ Microsoft word 2003, để hiển thị công thức , soạn thảo phương trình Editor phải sử dụng đoạn mã sau: { EQ\r(2,x)} Equation Editor (soạn thảo phương trình) trình soạn thảo công thức phát triển Design Science Cho phép người dùng xây dựng phương trình toán học môi trường WYSIWYG, tích hợp tất phiên Microsoft Office b Biểu diễn công thức toán học Website Trang trực tuyến CodeCogs Equation Editor sử dụng ngôn ngữ đánh dấu Latex để soạn thảo công thức toán học Đây trang soạn thảo dạng WYSIWYG hầu hết tất trình duyệt đọc ví Mozilla Firefox, Internet Explorer,… Hiển thị hình ảnh phải nhập đoạn mã sau: \sqrt [x]{2}\ Footer Page of 126 Header Page of 126 c Biểu diễn công thức toán học OpenOffice.Org Đối với OpenOffice.Org, việc tạo công thức toán học trình soạn thảo đơn giản thông qua OpenOffice.Org Math Ta việc sử dụng bảng lựa chọn ký hiệu cần chèn công thức tương ứng với đoạn mã sinh Để hiển thị công thức có đoạn mã tương ứng sau: nroot{2} {x} d Biểu diễn công thức toán học MathType MathType phần mềm thương mại Design Science cho phép tạo ký hiệu toán học để xử lý văn Hỗ trợ ngôn ngữ đánh dấu Tex, Latex, Mathml,…cho nên sử dụng MathType, chuyển công thức khoa học sang dạng chuẩn khác 1.2 TỔNG QUAN VỀ CÔNG CỤ TÌM KIẾM 1.2.1 Khái niệm hệ tìm kiếm thông tin Bản chất trình tìm kiếm thông tin dựa chế “đối sánh” tài liệu lưu trữ hệ thống với yêu cầu tìm kiếm người dùng để tìm kết cho phù hợp 1.2.2 Mô hình hệ tìm kiếm thông tin Các thành phần bao gồm: - Đầu vào: gồm câu truy vấn tài liệu - Đầu ra: Tập hợp đoạn trích hay tài liệu hệ thống đánh giá phù hợp với yêu cầu truy vấn người dùng : - Bộ xử lý: Bao gồm thành phần : Bộ biểu diễn câu truy vấn : Biểu diễn câu truy vấn người dùng Footer Page of 126 Header Page of 126 Bộ biểu diễn tài liệu : Biểu diễn thông tin tài liệu, lập mục phục vụ cho trình tìm kiếm Bộ đối sánh : Đối sánh câu truy vấn thông tin tài liệu xem tài liệu có phù hợp không 1.2.3 Các thành phần hệ tìm kiếm thông tin - Thu thập thông tin web (web crawler) - Lập mục cho tài liệu thu thập - Tìm kiếm 1.3 THỰC TRẠNG TÌM KIẾM CÔNG THỨC KHOA HỌC Hàng này, thường sử dụng chức tìm kiếm tài liệu công việc thực tế tìm kiếm văn dạng chuỗi Vậy tìm kiếm văn dạng công thức sao? Đây vấn đề mà quan tâm quan trọng Công thức định dạng tập tin hình ảnh Vì lý đó, thực trình tìm kiếm giống tìm kiếm chuỗi văn thông thường mà hay sử dụng 1.3.1 CiteSeer Citeseer hệ thống thu thập thông tin liệu mục báo khoa học thu thập từ web dựa nội dung phần trích dẫn báo, sau tổ chức thông tin liệu mục thu thập thành sở liệu, cho phép người dùng tìm kiếm thông tin liệu mục Một số điểm chưa được: - CiteSeer đánh dấu liệu mục với tạp chí chưa có điện tử - CiteSeer chưa xử lý liệu nhập nhằng tác giả tên Footer Page of 126 Header Page 10 of 126 1.3.2 Google Scholar Google Scholar công cụ chuyên tìm kiếm tài liệu nghiên cứu học thuật, bao gồm báo khoa học, tóm tắt khoa học, nghiên cứu sơ bộ, tóm tắt, báo cáo kỹ thuật, luận án, sách v.v… Ưu điểm Google Scholar: - Khả lọc thông tin từ nguồn đáng tin cậy - Tìm kiếm thông tin từ nguồn web mở lẫn web thương mại Do đó, người dùng tìm toàn văn tài liệu nghiên cứu từ nguồn miễn phí mạng Internet tìm thông tin thư mục (biểu ghi) nguồn sở liệu trả tiền - Cung cấp công cụ hỗ trợ việc đánh giá tính đáng tin cậy nguồn tài liệu tìm - Cho phép mở rộng phạm vi tìm kiếm kết tìm 1.3.3 LeActiveMath ActiveMath trang web thông minh - Môi trường học toán học Nội dung ngữ nghĩa tài liệu toán học mã hóa OMDoc Công cụ tìm kiếm nhận biết toán học chuyên dụng phù hợp cho người học toán tìm kiếm toán học mức độ đơn giản Khả sử dụng cho tìm kiếm phức tạp vấn đề khó 1.3.4 MathDex Các tính : - Hỗ trợ tìm kiếm công thứctoán học tìm kiếm văn đơn giản - Hỗ trợ phong phú định dạng đầu vào Footer Page 10 of 126 Header Page 12 of 126 10 CHƯƠNG ĐỀ XUẤT GIẢI PHÁP 2.1 MÔ HÌNH TỔNG QUAN Tóm tắt tính chính: - Nhận biết toán học - Có khả tìm kiếm công thức đồng dạng công thức - Hỗ trợ nội dung lẫn trình bày - Ngôn ngữ truy vấn đơn giản, mở rộng rõ ràng MathML Html Doc Pdf Rtf BỘ CHUYỂN ĐỔI CHỈ MỤC PHẦN MỞ RỘNG TOÁN HỌC Hình 2.1: Thiết kế công cụ tìm kiếm toán học đề nghị Giải pháp đề xuất dựa công cụ tìm kiếm toàn văn Một tài liệu toán học tách thành hai phần khác Footer Page 12 of 126 Header Page 13 of 126 11 - Phần phần văn - Phần thứ hai phần toán học Bằng cách này, tất lợi công cụ tìm kiếm văn đầy đủ sử dụng với khả giới hạn tìm kiếm theo nội dung toán học Một tìm kiếm cho “chứng minh” công thức cho kết tìm kiếm "chứng minh" từ đoạn văn công thức phần toán học Công cụ tìm kiếm đề xuất xem xét ký hiệu toán học số loại siêu liệu quan trọng tài liệu lập mục sử dụng bảng xếp hạng Để khai thác tất tính đề xuất công cụ tìm kiếm toán học thiết kế phần mở rộng công cụ tìm kiếm văn bỏ qua tất chức không liên quan Bằng cách này, tảng lý thuyết giải pháp đề xuất thực công cụ tìm kiếm Hai thay đổi yêu cầu là: - Sự hỗ trợ ngôn ngữ truy vấn toán học đầu vào - Sử dụng liệu toán học xếp hạng tài liệu Các thiết kế phần mở rộng toán học giai đoạn lập mục minh họa hình 2.1 Phần mở rộng toán học trung gian tài liệu toán học phần lập mục 2.2 XÂY DỰNG TỆP CHỈ MỤC Phần quan trọng công cụ tìm kiếm lập mục gần tất vấn đề cần phải giải nằm giai đoạn mục Giai đoạn lập mục chia hai giai đoạn: - Phần bao gồm thuật toán lập mục Footer Page 13 of 126 Header Page 14 of 126 12 Các thuật toán lập mục công cụ tìm kiếm toàn văn phải sử dụng kỹ thuật nhận dạng ngôn ngữ - chịu trách nhiệm phân tích phần văn phân tích chúng cách xác Kỹ thuật tương tự sử dụng công cụ tìm kiếm toán học gọi kỹ thuật nhận dạng công thức Sau công thức nhận dạng biến đổi thành phép biểu diễn riêng bao gồm nhiều từ - Giai đoạn thứ hai xác định xếp hạng kết Thông thường có nhiều kết có liên quan xếp thuật toán xếp hạng Các số liệu thống kê cho thấy người sử dụng công cụ tìm kiếm không nhìn vào hai mươi kết thuật toán xếp hạng quan trọng Có nhiều cấu trúc liệu mục mà sử dụng để lưu trữ liệu (chỉ số nghịch đảo, hậu tố, ngram, cấu trúc cây, ) Các cấu trúc liệu phổ biến số nghịch đảo Cấu trúc cho phép tìm kiếm văn đầy đủ Tất công cụ tìm kiếm văn đầy đủ sử dụng loại cấu trúc liệu Có vài yếu tố quan trọng phải xem xét thiết kế mục: - Các yếu tố phải hợp - Kỹ thuật lưu trữ - Kích thước mục - Tốc độ tra cứu - Duy trì mục theo thời gian - Sai số cho phép Footer Page 14 of 126 Header Page 15 of 126 13 2.2.1 Thuật toán mục Những lý để lựa chọn MathML định dạng hỗ trợ mô tả Chương Nó hỗ trợ trình bày nội dung MathML Ví dụ định dạng tài liệu MathML thể Bảng 2.1 MathML Nội dung MathML Trình diễn a + a b b 2 a Bảng 2.1: Ví dụ đánh dấu MathML đơn giản Định dạng nội dung chép cấu trúc phân cấp công thức toán học chuyển đổi tự nhiên vào Định dạng trình bày tuyến tính mơ hồ (ab có nghĩa a * b) Mỗi công thức toán học bao gồm toán hạng toán tử Các toán tử hàm số với tham số, đối số Toán hạng phân thành nhiều loại:  Hằng số 0, 100, -104,  Hằng số phổ biến không đổi - Π, e (Lưu ý: có vài ký hiệu định nghĩa trước số, có nhiều ký hiệu thường sử dụng có nghĩa khác lĩnh vực toán học khác) Footer Page 15 of 126 Header Page 16 of 126 14 - Toán tử phổ biến biết đến - ∑, ∫ - Biến không xác định –a, F, + + l a n n + b / 1 n Hình 2.2: Cây công thức cho a2 + b2 + ln (1 + / n) Cây công thức – Cấu trúc liệu có kết nối không định hướng, nút có tối đa hai Lá mà có gọi nút tâm Tất nút khác gọi nút Các nút tâm chứa hàm số toán học (+, /, ln, ) Các nút chứa số, số biến Mỗi nút có nhiều công thức toán kết nối với giống số số mũ Độ sâu tất nút phải lưu trữ Ví dụ x + y + 10 / x có ba cấp độ, với +, + nút gốc Nút x, y, / nút 10, x / Độ sâu phải đáp ứng điều kiện cấp độ sâu giao hoán Toán tử - Nút tâm công thức Toán hạng Toán tử - toán tử Những toán tử quan trọng - Tất nút với mức độ sâu thấp Footer Page 16 of 126 Header Page 17 of 126 15 Những toán hạng quan trọng - Tất toán hạng toán tử quan trọng Công thức biểu diễn tiêu chuẩn - Kết thuật toán xếp hạng sử dụng công thức Từ quan điểm toán học, giai đoạn hàm Q xây dựng Miền xác định không gian tất công thức toán học (F) miền giá trị FN: = F1 × F2 ×, , × FN Công thức f1, f2, , fN kết công thức đầu vào Hàm Q định nghĩa: Q: F → FN, Q (f) = Hàm số Q phải đáp ứng điều kiện miền FN: cho tất giá trị i hợp lệ, Fi+1 tổng quát Fi Thuật toán sử dụng phần mở rộng toán học thực bước sau: Đầu vào: Công thức đầu vào – f Đầu ra: f1, f2,….fN, fi – công thức f0 : = f; for i = to N fi : = Qi (f i-1); fi : = xephang (f i); end Thuật toán 1: Thuật toán - Ưu điểm kỹ thuật không cần dấu ngoặc đơn - Ưu điểm thứ hai kỹ thuật cho phép loại tìm kiếm tương tự minh họa ví dụ sau Công thức (a + b) - (c + d) chuyển đổi thành ab + cd + - Giả định khóa công thức ab + cd + sở liệu mục có chứa từ theo thứ tự này: ab +, cd +, - Điều Footer Page 17 of 126 Header Page 18 of 126 16 cho phép tìm kiếm công thức (ab+, cd+) mà không cần biết toán tử chúng a Quy tắc chuyển đổi Danh sách quy tắc chuyển đổi: - Ước tính giá trị mức Ví dụ: + a + → 12 + a - Phép xấp xỉ số Ví dụ: 3,14 = - Hủy bỏ dấu ngoặc sử dụng phép phân phối Ví dụ: a * (b + c) → a * b + b * c - Nhân phân phối Ví dụ: ab a  b *  2 - Chia tử số cho mẫu số riêng Ví dụ : a  b a b   2 - Thay số với biểu tượng const Ví dụ : 74 + a2 +b2 -> const +aconst + bconst Hoặc -> const + a2 + b2 - Thay số chưa biết ẩn số biểu tượng id Ví dụ : a2 - b2 –c2 + 2bc cosα ->id12 - id12 - id12 + 2id1id2cosid3 -> id12 - id22 – id32 + 2id1id2cosid3 -> id12 - id22 – id32 + 2id2id3cosid3 Tên biến khác Tìm kiếm cho x + y a + b R + S Footer Page 18 of 126 Header Page 19 of 126 17 - Quy tắc đơn giản hóa - Ràng buộc biến số toán tử không cần xét đến b Thuật toán xếp hạng Ưu tiên toán tử +, -, *, / Sau thuật toán xếp hạng sử dụng thứ tự này: Hằng số nhỏ Hằng số với thứ tự xác định trước (e, Π, ), đẳng thức sử dụng toán tử ưu tiên Những toán tử biết với thứ tự xác định ( ∫, ln….), đẳng thức sử dụng toán tử ưu tiên Công thức khác xếp theo quy tắc sau: (a) xếp theo toán tử ưu tiên , trước tiên : + x2, thứ hai : - x2 (b) xếp theo việc đếm toán hạng - toán tử với toán hạng khởi đầu (c) toán tử ưu tiên số lượng toán hạng cho hai công thức sau xếp chúng đệ quy theo quy tắc: i ưu tiên cho toán tử khác ii xác công thức chứa số iii công thức chứa nhiều số chung iv công thức chứa nhiều toán tử biết đến v Các trường hợp khác: sử dụng so sánh chuỗi c Chứng minh thuật toán xếp hạng Các thuật toán xếp hạng phải đáp ứng hai điều kiện Footer Page 19 of 126 Header Page 20 of 126 18 - Thứ nhất, hai công thức toán học tương đương với toán hạng hoán vị cách sử dụng giao hoán phải có cách biểu diễn tiêu chuẩn - Và thứ hai, hai công thức không tương đương tương đương với toán hạng khác phải có cách biểu diễn tiêu chuẩn khác d Mô tả thức Một mô tả thức thuật toán: Đầu vào : Đầu vào công thức – f, tập hợp quy tắc biến đổi T1,…,T7 Đầu ra: tập hợp công thức f1, f2, f3, f4, f5 f0: = f; Q1 : = T1,T2; Q2 : = T3,T4, T5; Q3 : = T6; Q4 : = T7; f1: = xephang(f); for i = to fi+1 := xephang ( Q, (fi)); end Thuật toán 2: Thuật toán tổng quát 2.2.2 Xếp hạng kết Vì công cụ tìm kiếm toán học tạo từ xếp hạng Nếu hai tài liệu chứa từ khóa giống cách biểu diễn khác nhau, fi = fj ; i#j; i [0,1] biểu diễn việc xử lý người dùng mối quan hệ thông tin câu truy vấn thông tin tài liệu 2.5.4 Hiển thị kết Giai đoạn tìm kiếm hệ tìm kiếm toán học phải hiển thị tóm tắt nhỏ văn trích từ tài liệu 2.6 ĐÁNH GIÁ Có nhiều cách đo lường khác cho việc đánh giá mức độ xử lý trả kết hệ thống tìm kiếm thông tin Các cách đo lường đòi hỏi tập tài liệu câu truy vấn tập tài liệu đó, giả sử tài liệu liên quan không liên quan đến câu truy vấn Đánh giá dựa thông số: - Độ xác - Độ bao phủ - Kết sai Footer Page 23 of 126 Header Page 24 of 126 22 CHƯƠNG TRIỂN KHAI ỨNG DỤNG 3.1 THIẾT KẾ HỆ THỐNG 3.1.1 Đặc tả hệ thống: Hệ thống gồm modul Module Web Robot Chức thu thập liệu từ trang Web Website Module ConvertFile Công việc module thống lại toàn liệu trước chuyển sang định dạng MathML thực việc lập Chỉ mục (Index) Việc thống bao gồm: - Chuyển toàn định dạng (PDF, DOC, EXCEL ) sang dạng MathML - Chuyển mã trang (TCVN3, VNI, Unicode ) sang bảng mã Windows-CP1258 (Unicode tổ hợp) - Lưu liệu vào CSDL để index Modul Truy vấn 3.1.2 Thiết kế chức hệ thống a Module Web Robot Gồm thành phần sau: - CollectEngine - DomainCollector - DataCollector b Module Convert File - Chuyển định dạng - Chuyển bảng mã - Ghép nối công đoạn chuyển định dạng chuyển mã Footer Page 24 of 126 Header Page 25 of 126 23 3.2 XÂY DỰNG MÔI TRƯỜNG SOẠN THẢO 3.2.1 Giao diện Module Web Robot 3.2.2 Giao diện Module Convert File 3.2.3 Giao diện Module truy vấn Footer Page 25 of 126 Header Page 26 of 126 24 KẾT LUẬN Nhu cầu tìm kiếm tài liệu khoa học, luận văn, đồ án chuyên sâu…là lớn Vì việc nghiên cứu tạo hệ thống tìm kiếm chuyên biệt tài liệu khoa học hoàn thiện, hỗ trợ tốt cho ngôn ngữ tiếng Việt cần thiết Điều có ý nghĩa cao mặt khoa học lẫn thực tiễn Về mặt lý thuyết, trình thực đề tài nghiên cứu môi trường công cụ soạn thảo công thức toán học sử dụng Từ phân tích thực trạng khó khăn người sử dụng Đề xuất thiết kế mục thuật toán xếp hạng cho tìm kiếm công thức khoa học Nghiên cứu tìm hiểu ngôn ngữ đánh dấu MathML Từ đem lại kết khởi đầu cho việc xây dựng hệ thống tìm kiếm công thức khoa học Việt Nam tương lai Về mặt thực tiễn, hệ thống giai đoạn chưa hoàn thiện Nhưng bước đầu xây dựng module tìm kiếm Là sở để phát triển hệ thống tìm kiếm công thức khoa học mong đợi Vì thời gian có hạn nên luận văn, tệp mục xây dựng nhỏ gọn, chưa đầy đủ nên tiến hành tìm kiếm bị giới hạn Dựa vào kết này, nghiên cứu thêm để hoàn chỉnh hệ thống Hướng nghiên cứu xây dựng kho liệu lớn để phục vụ toán tìm kiếm công thức khoa học, tìm kiếm nội dung công thức tìm kiếm chuyên sâu đến tài liệu khoa học có công thức liên quan Footer Page 26 of 126 ... phương pháp hiển thị tìm kiếm công thức khoa học Phương pháp nghiên cứu Tìm hiểu lý thuyết soạn thảo, lưu trữ tìm kiếm công thức khoa học văn Nghiên cứu công cụ tìm kiếm khoa học có Tìm hiểu chuẩn... hành tìm kiếm bị giới hạn Dựa vào kết này, nghiên cứu thêm để hoàn chỉnh hệ thống Hướng nghiên cứu xây dựng kho liệu lớn để phục vụ toán tìm kiếm công thức khoa học, tìm kiếm nội dung công thức tìm. .. cho tìm kiếm công thức khoa học Nghiên cứu tìm hiểu ngôn ngữ đánh dấu MathML Từ đem lại kết khởi đầu cho việc xây dựng hệ thống tìm kiếm công thức khoa học Việt Nam tương lai Về mặt thực tiễn, hệ

Ngày đăng: 06/05/2017, 12:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w