1. Trang chủ
  2. » Luận Văn - Báo Cáo

CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE

110 334 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 110
Dung lượng 5,27 MB

Nội dung

Luận văn, khóa luận tốt nghiệp, báo cáo là sản phẩm kiến thức, là công trình khoa học đầu tay của sinh viên, đúc kết những kiến thức của cả quá trình nghiên cứu và học tập một chuyên đề, chuyên ngành cụ thể. Tổng hợp các đồ án, khóa luận, tiểu luận, chuyên đề và luận văn tốt nghiệp đại học về các chuyên ngành: Kinh tế, Tài Chính Ngân Hàng, Công nghệ thông tin, Khoa học kỹ thuật, Khoa học xã hội, Y dược, Nông Lâm Ngữ... dành cho sinh viên tham khảo. Kho đề tài hay và mới lạ giúp sinh viên chuyên ngành định hướng và lựa chọn cho mình một đề tài phù hợp, thực hiện viết báo cáo luận văn và bảo vệ thành công đồ án của mình.

Page | 1 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE LỜI NÓI ĐẦU 1 1. MỤC TIÊU VÀ Ý NGHĨA CỦA ĐỀ TÀI Máy tính hiện nay đã đóng góp một phần không nhỏ vào đời sống, và đã trở nên phổ dụng. Trong lĩnh vực lưu trữ dữ liệu, chỉ cần một ổ cứng 10x15x3 cm 3 là đã có thể lưu trữ được số lượng sách tương ứng với cả một thư viện sách khổng lồ. Theo đó, là vấn đề tra cứu dữ liệu trong kho dữ liệu như thế. Cũng như việc tổ chức trong thư viện, việc lưu trữ tài liệu điện tử trong máy tính cũng được chia thành các loại sách, và chủ đề lớn khác nhau. Hiện nay xu thế người đọc sách là coi sách là nguồn để tra cứu những vấn đề mình quan tâm, chứ không phải học một kiến thức mới do một cuốn sách mang đến. Vấn đề đặt ra là làm sao tư vấn cho người dùng những cuốn sách nào liên quan nhiều nhất tới chủ đề người dùng yêu cầu (thông qua các từ khóa được nhập) bằng phân tích nội dung và lịch sử truy cập của những người dùng trước. Luận văn này đực thực hiện nhằm đề xuất ra được một phương thức xây dựng hệ thống hỗ trợ tư vấn với các kết quả sau: 1 - Tư vấn hoàn toàn tự động các tài liệu cho người dùng theo từ khóa, lịch sử truy cập của người dùng đó và những người dùng khác và sở thích của họ. Kết quả tư vấn ngày càng chính xác hơn vì hệ thống có phân tích và cập nhật lịch sử truy cập của người dùng. 2 - Giới thiệu tài liệu có độ tương tự nhất định với tài liệu đang nghiên cứu để người dùng lựa chọn tài liệu tiếp theo nghiên cứu. - Hệ thống khảo sát (survey) để thu thập các ý kiến đánh giá của người dùng về sự tương tự của các tài liệu hệ thống gợi ý. Qua đó, càng thu thập nhiều sự đánh giá, kết quả tư vấn cho người dùng càng sát với vấn đề người ta đặt ra hơn. 3 - Người dùng mới không nhất thiết phải đăng ký thông tin với hệ thống. Hệ thống vẫn gợi ý cho người dùng thông qua phân tích nội dung và lịch sử truy Page | 2 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE cập hệ thống. 4 - Đáp ứng các yêu cầu tìm kiếm trên các trang web (tìm kiếm trong site riêng hoặc trên internet). Hệ thống hướng tới việc tìm kiếm và xây dựng cơ sở dữ liệu động từ internet. 0 2. VẤN ĐỀ GIẢI QUYẾT Có 2 phương pháp chủ đạo được dùng trong hệ tư vấn: Phương pháp lọc cộng tác: là phương pháp tập hợp các đánh giá hoặc các quan điểm của người dùng, nhận dạng sự tương đồng giữa các người dùng trên cơ sở các phiên giao dịch của họ. Phiên giao dịch của người dùng được bắt đầu từ khi người dùng đánh từ khóa và có tín hiệu search. Kết thúc phiên làm việc với một từ khóa mới được nhập. Phương pháp lọc cộng tác ước lượng hàm đánh giá R(u,i) của item i với user u dựa trên cơ sở đánh giá R(u’,i) của user u’ cho cùng item i mà trong đó u và u’ là tương tự nhau. Phương pháp lọc cộng tác có các vấn đề như: 5 Sự thưa thớt: thực tế thì vấn đề của người dùng quan tâm (từ khóa) nó chiếm phần rất nhỏ và sự đánh giá sự tương đồng cho tài liệu là rất nhỏ so với rất nhiều tài liệu của hệ thống. Với hệ thống gợi ý trong luận văn này, các đánh giá, các nhận định sẽ được lưu lại dần dần, loại bỏ dần những kết quả không chính xác. 6 Vấn đề tài nguyên mới: Hệ thống không ngừng cập nhật các tài liệu mới cho kho dữ liệu của mình. Mỗi lần thêm một tài liệu mới, hệ thống sẽ tính lại (off-line) là phân tích độ tương đồng về ngữ nghĩa giữa các văn bản (kỹ thuật LSA) để tìm ra tập các láng giềng gần của một cuốn sách. 7 Vấn đề người dùng mới: Như đã đề cập, hệ thống sẽ phân tích và lưu trữ lại lịch sử của tất cả các phiên làm việc, kết hợp phân tích nội dung trong hệ thống để lọc ra sự tương đồng, liên quan chính xác nhất của các tài liệu. Nên hệ Page | 3 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE thống hoàn toàn có thể gợi ý tư vấn cho một người dùng mới. Khi người dùng cung cấp cho hệ thống các sở thích, hệ thống sẽ lọc tiếp theo sở thích đó, để cung cấp kết quả chính xác hơn. Phương pháp lọc dựa trên nội dung: là một giải thuật hướng về nghiên cứu lọc thông tin, phương pháp lọc dựa trên nội dung ước lượng hàm đánh giá R(u,i) của item i với user u được thiết lập dựa trên cơ sở đánh giá R(u,i’) của cùng user u cho item i’ mà trong đó i và i’ là tương tự nhau về mặt nội dung. Nhược điểm chính của phương pháp này là nó giả định các thuật ngữ là độc lập nhau. Trong thực tế, các thuật ngữ thường có liên quan với nhau và hiểu được điều này có thể dẫn đến việc tính độ liên quan tốt hơn. Tính đồng nghĩa: có nhiều cách để chỉ đến một đối tượng, ví dụ: car và automobile 8 • Các sản phẩm tương tự được đối xử theo cách khác nhau 9 • Tăng sự thưa thớt, làm mất tính chất bắc cầu giữa các từ khóa 10 • Sinh ra kết quả có chất lượng thấp Tính nhiều nghĩa của từ: hầu hết các từ đều có nhiều nghĩa, ví dụ: model, python, chip. 11 • Độ chính xác thấp 12 2 3. CÁCH GIẢI QUYẾT 3 Sử dụng phương pháp lọc cộng tác, hệ thống đã đưa ra phương án giải quyết được các nhược điểm của nó như đã trình bầy ở trên. Về sử dụng phương pháp lọc dựa trên nội dung, hệ thống đang sử dụng các phương pháp: 1 3.1 Phân tách tài liệu thành các từ khóa (Filter) 2 Các tài nguyên là các tài liệu được thể hiện dưới dạng văn bản như một Page | 4 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE cuốn sách, tạp chí, hay một bài báo, bài diễn văn điện tử nào đó. Với những tài liệu tiếng Anh, một từ thường có một âm tiết, ta có thể dễ dàng xác định một từ dựa vào dấu cách (space) hoặc dấu câu. Việc phân tách văn bản tiếng anh thành các từ khóa không khó khăn. Với những văn bản tiếng việt, mỗi từ nó có thể có một, hai hoặc nhiều hơn số lượng âm tiết. Việc phân tách thành từ khóa đối với văn bản tiếng việt phải dựa trên từ điển và các thuật toán đọc từ khóa sao cho đúng nghĩa nhất của câu. Thí dụ: Học sinh học sinh học thì hệ thống sẽ tách thành Học sinh, học, sinh học. Sau đó, loại bỏ các từ dừng (Stopword – Những từ mang ý nghĩa cảm thán, đại từ…như anh, bạn, do đó…), những từ không mang nhiều ý nghĩa về nội dung. Bước tiếp theo, dùng kỹ thuật TF-IDF để lọc bỏ bớt số lượng từ khóa của tài liệu. 3.2 Phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analystic-LSA) 3 Kỹ thuật LSA là những lý thuyết và phương thức cho việc trích rút và thể hiện ngữ cảnh sử dụng ngữ nghĩa của từ dựa trên việc tính toán thông kê. Kỹ thuật này cho phép ứng dụng trên một kho dữ liệu văn bản lớn. Ý tưởng cơ bản của kỹ thuật là tổng hợp tất cả các văn cảnh của từ, trong đó, một từ được đưa ra đã và không chỉ định biểu lộ những tập ràng buộc lẫn nhau. Những tập ràng buộc này cho phép xác định sự tương đồng về nghĩa của những từ và tập hợp mỗi từ khác. 4 Tập các từ khóa của các tài liệu của bước phân tích trên được dùng làm đầu vào cho các hàng của ma trận. Theo đó, bộ từ khóa của một tài liệu được dùng làm cột, các tài liệu làm hàng, các cell của ma trận được khởi tạo là tần suất xuất hiện của từ khóa-thuật ngữ đó trong tài liệu. LSA dùng kỹ thuật phân tích giá trị riêng (SVD-singular value decomposition) để giảm bớt để giảm bớt kích thước ma trận thuật ngữ-tài liệu, không gian N-chiều sẽ được giảm bớt xuống một không gian K chiều, K<<N, không gian mới này được gọi là không gian khái niệm. Page | 5 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 5 Sử dụng kết quả bước này, ta thu được tập các tài liệu có sự tương đồng về ngữ nghĩa nhất định với tài liệu xét. Là nguồn quan trọng trong việc đưa ra gợi ý những tài liệu tương tự với tài liệu người dùng đang đọc. 3.3 Phân tích lịch sử truy cập của người dùng 6 Một phiên làm việc của người dùng được đánh dấu bằng việc nhập một từ khóa và nhấn nút search. Các kết quả gợi ý được đưa ra, khi người dùng quyết định chọn một tài liệu (A), hệ thống gợi thống gợi ý các tài liệu có liên quan (dựa vào phân tích LSA trước và phân tích lịch sử phiên làm việc). Khi người dùng chọn một tài liệu (B) tiếp theo trong phần của hệ thống gợi ý để đọc, hệ thống ghi nhận tài liệu B có liên quan nhất trong phiên làm việc đó với tài liệu A. Và cứ thế, hệ thống sẽ cập nhật và đánh giá lại sự liên quan nhất định của các tài liệu qua các phiên làm việc của người dùng. Hệ thống còn đưa ra kỹ thuật khảo sát (survey) để thu thập ý kiến chính xác hơn của người dùng về sự tương đồng của các tài liệu. Hạn chế của phương pháp này, là khi có một tài liệu mới được cập nhật, chỉ số lịch sử truy cập của nó là 0, hoặc một giá trị âm nào đó. Có thể về cơ bản thì nó rất tương đồng với văn bản A trên chẳng hạn, nhưng phải qua nhiều lần, nhiều phiên làm việc thì nó mới đứng đầu trong các văn bản liên quan của A. Page | 6 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 4. CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN VĂN  Cung cấp bộ phân tách văn bản thành các từ khóa với văn bản tiếng Việt và văn bản tiếng Anh. Sử dụng bộ đọc văn bản đầu vào Ifilter để xử lý, kết hợp các file từ điển, file từ stopword để tách dữ liệu được đọc vào thành các từ khóa, đặc trưng cho tài liệu đó.  Kỹ thuật LSA, đánh giá độ tương đồng về mặt ngữ nghĩa giữa các tài liệu dựa trên kỹ thuật xử lý ma trận SVD. Phần này sẽ được trình bày chi tiết trong luận văn còn lại của dự án (Liên lạc với Mr Kiều Văn Cường)  Cung cấp kỹ thuật xử lý lịch sử phiên làm việc của một người dùng, cho phép các kết quả chính xác hơn sau nhiều phiên làm việc.  Đề xuất mô hình và phương thức triển khai cho phần mở rộng dự án, xây dựng hệ thống CSDL động trên Internet và đẩy hết các quá trình xử lý thành on-line (hệ thống như một tool tìm kiếm cho khách hàng. Hệ thống sẽ bắt đầu khi người dùng bắt đầu phiên làm việc) Page | 7 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 5. CÀI ĐẶT 5.1 Tách tài liệu thành các từ khóa. Tìm kiếm dựa trên từ khóa Mô hình này áp dụng cho những lần gợi ý đầu tiên, cho khi người dùng nhập từ khóa. Giải thuật tách từ khóa (chạy off-line): Input: tập tài nguyên là sách, tạp chí, trang thông tin (html) ở các định dạng tài liệu. Output: Tập các từ khóa với rank tương ứng. Quá trình tìm kiếm sẽ ưu tiên với những khóa được lọc ra ở tập khóa có mức độ ưu tiên được đánh giá bằng rank tương ứng của chúng Giải thuật này được thiết kế để chạy offline trong phiên bản đầu tiên này. Quá trình cập nhật tài liệu được người quản trị nhập. Chi phí thời gian cho modul này là khá lớn, một cuốn sách điện tử tầm 200 trang tương ứng là 3 phút cho hệ thống đọc và tách thành từ khóa. Tập văn bản nguồn Tập văn bản đã được phân tách Page | 8 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hình 1: Hình minh họa tập tách văn bản Page | 9 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 5.2 Mô hình tìm tư vấn dựa trên phân tích ngữ nghĩa tiềm ẩn Sau khi tách thành tập các từ khóa, modul này sẽ thực hiện việc cập nhật tiếp các tài liệu liên quan, có độ tương đồng nhất định về nội dung. Mỗi tài liệu sẽ được xác định cùng với nó một tập các tài liệu khác có tương đồng về mặt nội dung. Hình 2: Cấu trúc giải thuật LSA Tập tài liệu (từ khóa) Xử lý LSA (ma trận và giải thuật SVD) Tập các tài liệu liên quan tới 1 tài liệu Cập nhật CSDL (dữ liệu tài liệu liên quan ) Page | 10 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 5.3 Mô hình tư vấn dựa trên lịch sử phiên truy cập của người dùng Kế thừa từ các hệ thống học thông minh, từ các phiên làm việc của người dùng, hệ thống sẽ tự động cập nhật để chính xác hơn những thông tin có trong cơ sở dữ liệu để phục vụ cho những lần tư vấn sau đó. Có rất nhiều mô hình khai thác trên lĩnh vực người dùng. Trong đồ án này, tôi chỉ khai thác trên khía cạnh sở thích và lịch sử các phiên làm việc của người dùng. Khi người dùng đăng ký thông tin, hệ thống ghi nhận ở tài khoản của họ, thông tin về các lĩnh vực người dùng quan tâm để lọc các kết quả tìm kiếm. Tại phiên làm việc của người dùng, khi người dùng click vào một tài liệu mà hệ thống đưa ra để gợi ý cho tài liệu đang đọc, hệ thống sẽ cập nhật hệ số tương quan giữa 2 tài liệu đó, phục vụ cho các kết quả tư vấn ở lần tiếp theo. Nhận và tiền xử lý query Câu truy vấn Xử lý query, tạo kết quả trả Tài liệu chứa từ khóa trong query Tài liệu có liên quan với tài liệu kết quả Truy vấn CSDL (tài liệu) Tập tài liệu Các tài liệu liên quan Cập nhật tài liệu liên quan Hiển thị kết quả ra browser Tài liệu trả về Xử lý tác thao tác người dùng [...]...CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Page | 11 Hình 3: Quy trình truy vấn 6 GIAO DIỆN TRANG CHỦ CHƯƠNG TRÌNH CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hình 4: Giao diện chính trang chủ chương trình Page | 12 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE PHẦN I: VẤN ĐỀ VÀ THỰC TRẠNG... với tài liệu đó Sơ đồ tổng quát giao dịch của hệ thống: CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Page | 17 Query search Phân tích phiên làm việc 1.Truy vấn theo từ khóa 2.Truy vấn theo tài liệu liên quan (LSA + phân tích lịch sử làm việc) Items Databases CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hình 6: Mô hình sơ đồ hệ thống gợi ý cho người dùng... cho người dùng không cần keyword… CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Page | 14 Hình 5: Tìm kiếm thông tin – So sánh gợi ý của người và máy CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Rất nhiều người không có thời gian để lọc ra trong một tệp các cuốn sách Page | 15 được thông tin mình mong muốn Thậm chí trong một cuốn sách dầy tới nghìn trang... viên CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 2.1.2 Các hệ thống recommender tiêu biểu Hệ thống bán hàng trực tuyến m a z o n e Page | 21 Hình 8: Giao diện tìm kiếm của Amazone.com Đầu vào: Tên thiết bị, tên công ty, tên danh mục hay bất cứ từ khóa nào Đầu ra: Gợi ý cho người dùng các sản phẩm hiện có CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE. .. quả tìm được do việc truy vấn bằng các câu truy vấn SQL trong cơ sở dữ liệu CSDL phải được thiết kế sao cho quá trình tìm kiếm là thuận lợi nhất Khi tìm được các kết quả theo mức độ ưu tiên, người dùng sẽ chọn một văn bản nào đó để nghiên cứu Hệ thống phải cung cấp tiếp cho người dùng những tài liệu liên quan tới tài liệu mà họ đang đọc Việc tìm CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI... TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE • Bài hát liên quan : Hệ thống sẽ đưa ra danh sách các bài hát có liên quan gần gũi đến một bài hát cụ thể nào đó để người dùng tham khảo Page | 24 • Giới thiệu các bài hát mới : Hệ thống tư vấn cho người dùng các bài hát mới mà theo dự đoán của hệ thống, đó là các bài hát người dùng sẽ thích nghe CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE. .. hướng tiếp cận khác nhau, chủ yếu là: CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 1 Dựa trên trí tuệ nhân tạo (AI-based): Đây là cách tiếp cận sớm nhất (1960) với những lý thuyết rất hay về mạng ngữ nghĩa, khung ngữ nghĩa và các ý niệm nguyên thủy và các quan Page | 33 hện như IS-A,PART-OF…Tuy nhiên, do hầu hêt các tri thức về ngữ nghĩa trong cách tiếp cận này đều được xây... niên 1990, khi mà công nghệ phát triển mạnh, đã có thể vượt qua được khó khăn của mình, cách tiếp cận này được hồi sinh và phát triển mạnh tới ngày nay Hiện nay, cách tiếp cận dựa trên ngữ liệu kết hợp với tri thức có sẵn là hướng tiếp cận đang được nhiều nhà ngôn ngữ học – máy tính quan tâm CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE 2.3.2 Phân tích ngữ nghĩa tiềm ẩn (LSA)... cùng chung một từ khóa đặc biệt, LSI không yêu cầu một sự phân tích lấy tương xứng để trả về các kết quả hữu dụng Ở những vị trí mà một tìm kiếm theo từ khóa đơn giản sẽ không thực hiện được nếu không có phân tích lấy tương xứng, thì LSI sẽ thường trả về những tài liệu liên quan mà không chứa tất cả những từ khóa đó CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Phương pháp... trả về với đúng cuốn sách cần tìm Ngoài ra, hệ thống còn tư vấn các sản phẩm khác tương tự CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hệ thống tìm kiếm âm nhạc trực tuyến Chacha.vn Page | 23 Hình 10: Giao diện kết quả tìm kiếm của Amazone.com Recommender System của ChaCha.vn là một hệ thống tư vấn âm nhạc độc đáo với nhiều tính năng nổi trội, là công cụ hỗ trợ bạn nghe nhạc . 12 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hình 4: Giao diện chính trang chủ chương trình Page | 13 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE PHẦN. 14 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE Hình 5: Tìm kiếm thông tin – So sánh gợi ý của người và máy Page | 15 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM. lịch sử truy Page | 2 CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG CÔNG NGHỆ TÌM KIẾM TÀI LIỆU ONLINE cập hệ thống. 4 - Đáp ứng các yêu cầu tìm kiếm trên các trang web (tìm kiếm trong site riêng hoặc trên

Ngày đăng: 10/10/2014, 21:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[5] Dinh Dien, Từ tiếng Việt, Vietnam National University, HCMC, Vietnam, 2000 Sách, tạp chí
Tiêu đề: Từ tiếng Việt
[6] Dinh Dien, Hoang Kiem, Nguyen Van Toan, Vietnamese Word Segmentation, The Sixth Natural Language Processing Pacific Rim Symposium, Tokyo, Japan 2001, pp749-756 Sách, tạp chí
Tiêu đề: Vietnamese Word "Segmentation, "The Sixth Natural Language Processing Pacific Rim Symposium,Tokyo, Japan 2001, "pp
[13] PTS. Vương Tất Đạt . Logich hình thức. Trường Đại học Sư Phạm Hà Nội 1 Sách, tạp chí
Tiêu đề: Logich hình thức
[14] Đặng Thị Hưởng. Semantics, TP.Hồ Chí Minh 1997 (Tài liệu lưu hành nội bộ) Sách, tạp chí
Tiêu đề: Semantics
[15]. Trương Gia Vinh. Những bài giảng Cơ sở Ngôn ngữ học. BXB Đại Học mở Bán công TP.HCM.(Tài liệu lưu hành nội bộ) Sách, tạp chí
Tiêu đề: Những bài giảng Cơ sở Ngôn ngữ học. BXB Đại Họcmở Bán công TP.HCM
[16]. Nguyễn Thiện Giáp (chủ biên) Dẫn luận Ngôn ngữ học. NXB Giáo dục. 2000 Sách, tạp chí
Tiêu đề: Dẫn luận Ngôn ngữ học
Nhà XB: NXB Giáo dục. 2000
[17]. Trần Văn Cơ . Ngôn ngữ. Đại học sư phạm TP.Hồ Chí Minh.1986 Sách, tạp chí
Tiêu đề: Ngôn ngữ
[18]. Roderick A. Jacobs. English syntax. A Grammar for English language professionals. Oxford American English Sách, tạp chí
Tiêu đề: English syntax. A Grammar for English languageprofessionals
[19]. A.S. Hornby. Guide to patterns and usage in English. Second edition Sách, tạp chí
Tiêu đề: Guide to patterns and usage in English
[1] Cải tiến giải thuật CYK cho bài toán phân tích cú pháp tiếng Việt -Đinh ThịPhương Thu, Huỳnh Quyết Thắng, Hoàng Vĩnh Sơn Khác
[2] Gán nhãn từ loại cho tiếng Việt dựa trên văn phong - Nguyễn Quang Châu, Phan Thị Tươi, Cao Hoàng Trụ Khác
[3] Kết hợp xử lý ngôn ngữ tự nhiên và mạng Kohonen để nâng cao khả năng gom cụm văn bản tiếng Việt -Đỗ Phúc, Mai Xuân Hùng, Nguyễn Thị Kim Phụng Khác
[4] A case study of the probabilistic tagger QTAG for Tagging Vietnamese Texts Nguyen Thi Minh Huyen,Vu Xuan Luong, Le Hong Phuong Khác
[7] Automata and Formal Language. An Introduction – Dean Kelley – Prentice Hall, Englewood Cliffs, New Jersey 07632 Khác
[8] Compilers : Principles, Technique and Tools - Alfred V.Aho, Jeffrey D.Ullman - Addison - Wesley Publishing Company, 1986 Khác
[9] Compiler Design – Reinhard Wilhelm, Dieter Maurer - Addison - Wesley Publishing Company, 1996 Khác
[10] Design of Compilers : Techniques of Programming Language Translation - Karen A. Lemone - CRC Press, Inc, 1992 Khác
[11] Modern Compiler Implementation in C - Andrew W. Appel - Cambridge University Press, 1997 Khác
[12] Hoàng Văn Hành.1997. Ngữ nghĩa học – Các khuynh hướng và phương Khác

HÌNH ẢNH LIÊN QUAN

Hình  2: Cấu trúc giải thuật LSA - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 2: Cấu trúc giải thuật LSA (Trang 9)
Hình  3:  Quy trình truy vấn - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 3: Quy trình truy vấn (Trang 11)
Hình  7: Sơ đồ tổng quát hệ thống - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 7: Sơ đồ tổng quát hệ thống (Trang 20)
Hình  8: Giao diện tìm kiếm của Amazone.com - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 8: Giao diện tìm kiếm của Amazone.com (Trang 21)
Hình  9: Giao diện kết quả trả lại - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 9: Giao diện kết quả trả lại (Trang 22)
Hình  10: Giao diện kết quả tìm kiếm của Amazone.com - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 10: Giao diện kết quả tìm kiếm của Amazone.com (Trang 23)
Hình  11: Sơ đồ cấu trúc từ của Nguyễn Tài Cẩn - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 11: Sơ đồ cấu trúc từ của Nguyễn Tài Cẩn (Trang 28)
Hình  12: Giao diện tìm kiếm của Google - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 12: Giao diện tìm kiếm của Google (Trang 38)
Hình  13: Giao diện tìm kiếm Yahoo - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 13: Giao diện tìm kiếm Yahoo (Trang 39)
Hình  14 Giao diện tìm kiếm Ask Jeeves - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 14 Giao diện tìm kiếm Ask Jeeves (Trang 40)
Hình  15: Giao diện tìm kiếm All the web - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 15: Giao diện tìm kiếm All the web (Trang 41)
Table 4: Bảng một số ví dụ về cấu trúc lưu trữ từ điển - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
able 4: Bảng một số ví dụ về cấu trúc lưu trữ từ điển (Trang 63)
Hình  23: Biểu đồ tiến trình chức năng tìm kiếm - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 23: Biểu đồ tiến trình chức năng tìm kiếm (Trang 68)
Hình  26: Biểu đồ tiến trình chức năng thêm mới tài liệu - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 26: Biểu đồ tiến trình chức năng thêm mới tài liệu (Trang 70)
Hình  25: Biểu đồ cộng tác - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 25: Biểu đồ cộng tác (Trang 70)
Hình  27:  Biểu đồ tiến trình chức năng sửa tài liệu - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 27: Biểu đồ tiến trình chức năng sửa tài liệu (Trang 71)
Hình  28:Biểu đồ tiến trình chức năng xóa tài liệu - Biểu đồ cộng tác: - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 28:Biểu đồ tiến trình chức năng xóa tài liệu - Biểu đồ cộng tác: (Trang 72)
Hình  30: Use-Case quản lý tác giả - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 30: Use-Case quản lý tác giả (Trang 73)
Hình  32: Biểu đồ tiến trình sửa tác giả - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 32: Biểu đồ tiến trình sửa tác giả (Trang 75)
Hình  33: Biểu đồ tiến trình xóa tác giả - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 33: Biểu đồ tiến trình xóa tác giả (Trang 75)
Hình  39: Biểu đồ công tác quản lý  NXB - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 39: Biểu đồ công tác quản lý NXB (Trang 79)
Hình  41: Biểu đồ tiến trình thêm mới user - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 41: Biểu đồ tiến trình thêm mới user (Trang 80)
Hình  45: Biểu đồ cộng tác quản lý user - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
nh 45: Biểu đồ cộng tác quản lý user (Trang 83)
Bảng các thực thể chính - CÔNG NGHỆ GIẢI HÓA NGỮ NGHĨA TRONG VIỆC TÌM KIẾM TÀI LIỆU ONLINE
Bảng c ác thực thể chính (Trang 83)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w