Là mӝt tұp dӏch vө chӭa tӕi thiӇu các dӏch vө chӍ mөc, tìm kiӃm và duyӋt;

Một phần của tài liệu báo cáo đề tài xây dựng thư viện số (Trang 40)

các dӏch vө chӍ mөc, tìm kiӃm và duyӋt; XH là mӝt cӝng đӗng NSD thư viӋn sӕ.

±|

2. Phân tích chi tiӃt các phương pháp chӍ mөc tài liӋu văn bҧn trong DL: phương pháp chӍ mөc tӋp đҧo văn bҧn trong DL: phương pháp chӍ mөc tӋp đҧo IFID và phương pháp chӍ mөc ký sӕ SFID, so sánh 2 phương pháp chӍ mөc, rút ra quy luұt chӍ mөc tài liӋu trong DL:Ӣ hҫu hӃt ӭng dөng, IF thӵc hiӋn tӕt hơn SF trong phҥm vi cӫa cҧ hai kích thưӟc chӍ mөc và tӕc đӝ truy vҩn. IF nén chҳc chҳn là phương pháp chӍ mөc hӳu ích nhҩt mӝt CSDL lӟn các tài liӋu văn bҧn có đӝ dài có thӇ thay đәi. Phân tích các mô hình nén toàn cөc và mô hình nén cөc bӝ hyperbol, tӯ đó, đӅ xuҩt mô hình nén cөc bӝ Bernoulli và nén nӝi suy đӕi vӟi IFID dӵa vào các phương pháp xác suҩt và thӕng kê toán hӑc, phương pháp mã hóa, phương pháp nén dӳ liӋu.

±m

3. Phân tích chi tiӃt mô hình tìm kiӃm thông tin kinhđiӇn dӵa vào truy vҩn Boole BQ hiӋn đang đưӧc sӱ điӇn dӵa vào truy vҩn Boole BQ hiӋn đang đưӧc sӱ dөng trong hҫu hӃt các hӋ thư viӋn, chӍ ra nhưӧc điӇm cӫa truy vҩn BQ. Tӯ đó, luұn án đӅ xuҩt mӝt mô hình tìm kiӃm văn bҧn dӵa vào truy vҩn xӃp hҥng RQ có đánh giá hiӋu suҩt dӵa vào đӝ chính xác P và đӝ phөc hӗi R.

4. Phân tích chi tiӃt các giҧi thuұt kinh điӇn: giҧi thuұt đҧo danh sách móc nӕi và giҧi thuұt đҧo dӵa vào sҳp đҧo danh sách móc nӕi và giҧi thuұt đҧo dӵa vào sҳp xӃp, chӍ ra hҥn chӃ cӫa chúng là chӍ thích hӧp vӟi các CSDL tài liӋu văn bҧn cӥ nhӓ và vӯa. Tӯ đó, luұn án đӅ xuҩt hai giҧi thuұt trӝn nhiӅu đưӡng tҥi chӛ dӵa vào sҳp xӃp và giҧi thuұt phân chia dӵa vào văn bҧn phù hӧp vӟi CSDL tài liӋu văn bҧn cӥ lӟn trong DL.

±`

1. Nghiên cӭu các phương pháp chӍ mөc và tìm kiӃm ҧnh; và tìm kiӃm ҧnh;

2. Nghiên cӭu các phương pháp chӍ mөc và tìm kiӃm video; và tìm kiӃm video;

3. Nghiên cӭu các phương pháp chӍ mөc và tìm kiӃm audio; và tìm kiӃm audio;

4. Nghiên cӭu bài toán tóm tҳt

và trích rút tài liӋu văn bҧn trong DL.

±±

Chân thành cám ơn !

Một phần của tài liệu báo cáo đề tài xây dựng thư viện số (Trang 40)