Ký hi u: fraXemChiTiet
Màn hình này đ c g i khi ng i dùng mu n xem thông tin chi ti t v s liên quan c a m t câu h i v i 1 tài li u c th .
ng t i màn hình xem k t qu đánh giá (fraKq_DanhGia) , nh n vào DocID c a tài li u mu n xem (b i vì trên màn hình fraKq_DanhGia, tblTaiLieuPhucHoi chi th hi n các DocID c a tài li u đ c tr v ), ch ng trình s hi n th màn hình xem chi ti t này.Thông tin chi ti t g m có : n i dung c a câu h i,n i dung c a tài li u liên quan đ n câu h i đó, đ t ng quan c a câu h i v i tài li u và thông tin tài li u và câu h i đó đ c l p ch m c
Lu n v n : ánh giá các h th ng tìm ki m thông tin
Chi ti院t tài li羽u
Chi ti院t tài li羽u
Thông tin chi ti院t
Tài li羽u: DocID= ... Aóng màn hình Câu h臼i: …. A瓜 t逢挨ng quan :…... Tぢ Trいng sえ Tぢ Trいng sえ Di n gi i: STT Tên Lo i ki u Ý ngh a
1 lblSim Lable t ng quan gi a câu h i và tài li u
2 lblTopID Lable Ch s (topicID) c a tài li u 3 txtCauHoi textbox th hi n n i dung c a câu h i đó 4 tblIndex_CauHoi table Th hi n n i dung ch m c c a câu
h i
5 lblDocID Lable Ch s ID c a tài li u 6 txtTaiLieu textbox N i dung tài li u
7 tblIndex_TaiLieu table N i dung ch m c c a tài li u 8 btnDong Button óng màn hình 3 7 1 2 4 6 5 8
Lu n v n : ánh giá các h th ng tìm ki m thông tin 3.3.2.6.13.Màn hình so sánh h th ng (TH_SoSanhHT) Ký hi u: fraSoSanhHT Di n gi i: STT Tên Lo i ki u Ý ngh a 1 lstHT ListBox Danh sách h th ng IR
2 btnChon Button ch n m t h th ng bên danh sách h th ng
3 btnBo Button b m t h th ng bên danh sách h th ng
đã ch n
4 lstHTChon ListBox Danh sách h th ng đã đ c ch n
5 th hi n th đ th c a các h th ng đã ch n 6 btnDong Button óng màn hình 6 1 4 2 3 5
Lu n v n : ánh giá các h th ng tìm ki m thông tin
3.3.2.7. Thi t k h th ng l p đ i t ng
3.3.2.7.1.Các l p đ i t ng x lý
a) CFormat:
Ý ngh a :
nh ngh a c u trúc các thông s c n thi t đ đ nh d ng tài li u và câu h i
Mô t :
C u trúc thông s đnh d ng:
STT Tên Lo i ki u Ý ngh a
1 oldTag Ki u chu i Th c c n chuy n đ i
2 newTag Ki u chu i Th m i (t th c đ i sang th m i) 3 Content Ki u chu i N i dung c a th c
4 oldId Ki u chu i Th t c a th c trong file xml c 5 newId Ki u chu i Th t c a th m i trong file xml m i 6 haveAttr Ki u logic Th m i đó có thu c tính hay không? 7 attrArray M ng
CFormat
N u th m i có thu c tính thì attrArray s l u danh sách các thu c tính (Thu c tính có c u trúc d ng th : tên thu c tính (t ng ng v i tên th m i- newTag)), th t ng ng v i thu c tính trên (oldTag) b) CDocument: Ý ngh a
nh ngh a c u trúc c a tài li u đ l u tr các giá tr n i dung c a các th (ho c section) c a tài li u
Lu n v n : ánh giá các h th ng tìm ki m thông tin
STT Tên Lo i ki u Ý ngh a
1 DocID Ki u chu i docID c a tài li u 2 Title Ki u chu i tiêu đ c a tài li u 3 Content Ki u chu i N i dung c a tài li u 4 Date Ki u chu i Ngày t o tài li u 5 Author Ki u chu i Tác gi c a tài li u 6 News Ki u logic Ngu n g c c a tài li u
c) CTopic: Ý ngh a:
nh ngh a c u trúc c a tài li u đ l u tr các giá tr n i dung c a các th (ho c section) c a câu h i
Mô t :
STT Tên Lo i ki u Ý ngh a
1 TopID Ki u chu i docID c a câu h i 2 Title Ki u chu i N i dung c a câu h i 3 Description Ki u chu i Chú thích c a câu h i
4 Narrative Ki u chu i N i dung yêu c u liên quan c a câu h i
d) CHeThongIR: Ý ngh a:
nh ngh a c u trúc h th ng IR
Mô t :
STT Tên Lo i ki u Ý ngh a
1 strTenHT Ki u chu i Tên h th ng IR 2 strID Ki u chu i ID c a h th ng IR
3 NgayKiemTra Ki u chu i Ngày ti n hành ki m tra h th ng IR 4 Rtrungbinh Ki u chu i bao ph trung bình
Lu n v n : ánh giá các h th ng tìm ki m thông tin
5 Ptrungbinh Ki u chu i chính xác trung bình
6 fP M ng s th c chính xác trung bình t i 11 đi m chu n c a đ bao ph e) CKetQua: Ý ngh a: nh ngh a c u trúc đ nh d ng c a file k t qu tr v c a h th ng IR (file k t qu tar3 v c a h th ng IR chính là b ng liên quan th c t )
Mô t : STT Tên Lo i ki u Ý ngh a 1 TopicID Ki u chu i Th t ng ng v i TopicID 2 DocID Ki u chu i Th t ng ng v i DocID 3 ThuocTinh_TopicID Ki u chu i Tên thu c tính t ng ng v i TopicID n u th t ng ng v i TopicID có thu c tính 4 ThuocTinh_DocID Ki u chu i Tên thu c tính t ng ng v i DocID n u th t ng ng v i DocID có thu c tính 5 TagSim Ki u chu i Th t ng ng v i similarity (th Similarity) 6 ThuocTinh_Sim Ki u chu i Tên thu c tính t ng ng v i Similarity n u th t ng ng v i Similarity có thu c tính
Lu n v n : ánh giá các h th ng tìm ki m thông tin
f) CRelevant: Ý ngh a
nh ngh a c u trúc s liên quan c a tài li u t i v trí th t n c a danh sách các tài li u tr v c a m t câu h i
Thông tin v đ chính xác và đ bao ph t i v trí th n s đ c l u trong m ng c u trúc CRelevant đ th c hi n n i suy tính đ chính xác t i 11 đi m chu n c a đ bao ph (tính P (r) , v i r có giá tr là 0.0, 0.1 ,0.2 ,0.3 ,0.4, 0.5 , 0.6 , 0.7, 0.8, 0.9, 1.0)
Mô t :
STT Tên Lo i ki u Ý ngh a
1 DocID Ki u chu i docID c a câu h i t i v trí th t n 2 bRelevant Ki u logic Tài li u t i v trí n có liên quan hay
không? 3 fPrecision Ki u s th c chính xác c a tài li u t i v trí n 4 fRecall Ki u s th c bao ph c a tài li u t i v trí n g) CIndex: Ý ngh a: nh ngh a c u trúc đnh d ng các file index tr v c a h th ng IR Mô t : STT Tên Lo i ki u Ý ngh a
1 ID Ki u chu i ID c a câu h i ho c tài li u đ c l p ch m c
2 word Ki u chu i T có ngh a xu t hi n trong câu h i ho c tài li u
Lu n v n : ánh giá các h th ng tìm ki m thông tin nguyên h) XL_XML : S đ l p: Mô t : Ph ng th c: TranslateXML
o Ý ngh a: chuy n đ i c u trúc c a m t file xml sang c u trúc file xml khác o Tham s đ u vào: STT Tên Lo i ki u Ý ngh a 1 Format Ki u m ng CFormat m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó
2 newFile Ki u chu i file xml m i bao g m c đ ng d n 3 oldPathFile Ki u chu i đ ng d n file xml c
4 oldFile Ki u chu i tên file xml c
Ghi chú:
Tham s format có ki u m ng CFormat v i:
newTag : là tên th trong file xml m i t ng ng v i oldTag oldTag là các th trong file xml c
newId: là th t c a th m i trong file xml m i oldTag: là th t c a th c
haveAttr: th m i c n t o có thu c tinh hay không?, n u có l u thu c
XL_XML
Lu n v n : ánh giá các h th ng tìm ki m thông tin
Ví d : có file xml nh sau:
<DOCUMENT> nút g c (có th t =0)
<DOC> nút k g c (có th t c b ng 1) <DOCID> “ 1 “ <DOCID>
<TITLE> “Thanh niên Vi t Nam” <TITLE> </DOC>
</DOCUMENT>
i sang file xml có c u trúc nh sau: <DOCUMENT>
<DOC DOCID=”1”>
<TITLE> “Thanh niên Vi t Nam” <TITLE> </DOC>
</DOCUMENT>
nh ngh a m ng format nh sau: CFormat[] f=new CFormat[3]; f[0]=new CFormat(); f[0].oldId=f[0].newId=0; f[0].newTag="TAILIEU"; f[0].oldTag="DOCUMENT"; f[0].haveAttr=false; f[1]=new CFormat(); f[1].newId=f[1].oldId=1; f[1].newTag="TL"; f[1].oldTag="DOC"; f[1].haveAttr=true; f[1].attrArray=new CFormat[1]; f[1].attrArray[0]=new CFormat();
Lu n v n : ánh giá các h th ng tìm ki m thông tin f[1].attrArray[0].newTag="ID"; f[2]=new CFormat(); f[2].newId=f[2].oldId=2; f[2].newTag="CHUDE"; f[2].oldTag="TITLE"; o K t qu tr v : STT Tên Lo i ki u Ý ngh a 1 kq Ki u s nguyên K t qu tr v đ xác nh n chuy n đ i thành công hay th t b i
o Mô t thu t toán:
- Tìm newTag c a nút g c trong m ng format (nút g c là nút có th t newId=0) , d a vào khai báo c a m ng format (newTag) t o nút g c cho file xml m i
- c file xml c d a vào oldPathFile và oldFile: g i ph ng th c ReadXML c a l p LT_XML
- Tìm v trí c a nút k g c trong m ng format(nút k g c là nút có oldId=1) =>idxroot
- L y danh sách các nút k g c ( th oldTag) =>Nodes - G i nodelen là chi u dài c a danh sách Nodes
- L p i=0 -> i=nodelen - B t đ u l p i
Ki m tra xem format[idxroot] có thu c tính hay không: (format[idxroot].haveAttr ?)
N u có thu c tính
(duy t t t c các thu c tính c a nút k g c đ gán n i dung cho nó) - V i m i thu c tính:
Lu n v n : ánh giá các h th ng tìm ki m thông tin
- xem thu c tính c a nút k g c có oldTag là gì, n u có oldTag =”” có ngh a là t o m i thu c tính, n u oldTag !=”” : đ c n i dung c a oldTag gán váo format[idxroot].Content
Ng c l i không có thu c tính
- T o n i dung cho các ph n t format[k] (k!=idxroot) (chú ý: nút k g c format[idxroot] không ch a n i dung)
- ki m tra xem t ng ph n t trong m ng format khác v i format[idxroot] có thu c tính hay không
- N u ph n t format[k] có thu c tính : đ c n i dung th t ng ng v i thu c tính đó (oldTag) và ghi nh n n i dung vào format[k].attrArray[j].Content
Sau khi gán n i dung cho các th m i trong m ng format : - S p x p th t m ng format theo th t t ng d n c a newId - T o node cho file xml m i
- Cu i l p i đã ánh x xong các node c a file xml c sang file xml m i
k) XL_Text: S đ l p:
Mô t :
Ph ng th c : TranslateText
o Ý ngh a:
đ i c u trúc c a m t file xml sang c u trúc file text khác v i các th c a file xml t ng ng v i các section c a file text
o Tham s đ u vào:
STT Tên Lo i ki u Ý ngh a
XL_XML
Lu n v n : ánh giá các h th ng tìm ki m thông tin
1 format Ki u m ng CFormat
m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó
2 newFile Ki u chu i file xml m i bao g m c đ ng d n 3 oldPathFile Ki u chu i đ ng d n file xml c
4 oldFile Ki u chu i tên file xml c
o K t qu tr v : STT Tên Lo i ki u Ý ngh a 1 kq Ki u s nguyên K t qu tr v đ xác nh n chuy n đ i thành công hay th t b i o Thu t toán:
- Tìm newTag c a nút g c trong m ng format (nút g c là nút có th t newId=0) , d a vào khai báo c a m ng format (newTag) t o nút g c cho file xml m i
- c file xml c d a vào oldPathFile và oldFile: g i ph ng th c ReadXML c a l p LT_XML
- Do file text m i không có khái ni m th g c ch c n nh ng th ch a d li u - L y danh sách các nút có th là format[0].oldTag =>Nodes (format[0] là
nút k g c trong file xml c (không k nút g c)) - G i strNoiDung l u gi n i dung c a file text - G i nodelen là chi u dài c a danh sách Nodes - L p k=0 ->k=nodelen
B t đ u l p i
V i m i ph n t format[i]:
- ki m tra xem format[i].oldTag =”” hay không ?
Lu n v n : ánh giá các h th ng tìm ki m thông tin
strNoiDung = strNoiDung + format[i].newTag + “ký t xu ng dòng”
o N u khác r ng :
- l y n i dung c a th có tên là format[i].oldTag gán vào n i dung c a section m i : format[i].Content
strNoiDung = strNoiDung + format[i].newTag + “ký t xu ng dòng” + format[i].Content + “ký t xu ng dòng”
Cu i l p i
- Ghi lên file text : g i ph ng th c WriteText(strNoiDung,newFile) c a l p LT_Text
- G i k t qu th c hi n thành công hay th t b i cho ch ng trình
l) XL_Doc S đ l p:
Mô t :
Thu c tính:
STT Tên Lo i ki u Ý ngh a
1 Doc_Path Ki u chu i ng d n c a t p tài li u c a ch ng trình , m c đ nh là t t c các t p d li u s đ c l u t i th m c “coll” c a ch ng trình
2 SO_DOC Ki u s nguyên
S tài li u trong m t file tài li u , m c
đ nh là có 50 tài li u trong m t file tài li u
XL_Doc
Static String Doc_Path="coll"; Static int SO_DOC=50; DinhDangTaiLieu DinhDangTaiLieuText LayDSTaiLieu
Lu n v n : ánh giá các h th ng tìm ki m thông tin
Ph ng th c :DinhDangTaiLieu
o Ý ngh a:chuy n đ i đnh d ng c a t p tài li u , chuy n sang file xml
o Tham s đ u vào:
STT Tên Lo i ki u Ý ngh a 1 format Ki u m ng
CFormat
m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó
2 Path Ki u chu i ng d n đ n th m c ch a t p tài li u đã chuy n đ i
o K t qu tr v :(không có)
o Mô t thu t toán:
- T bi n Doc_Path : duy t t t c các file xml n m trong th m c đó - N u Path=”” : có ngh a là ng i s d ng không nh p v trí file tài
li u m i đã đ c chuy n đ i => l u t t c các file đã chuy n đ i m i vào th m c m c đnh c a ch ng trình
- N u Path != “”: l u các file đã chuy n đ i vào th m c Path
- V i m i file tài li u xml c a ch ng trình : g i ph ng th c TranslateXML c a l p XL_XML th c hi n chuy n đ i và t o file xml m i cho t ng file xml tài li u c
Ph ng th c: DinhDangTaiLieuText
o Ý ngh a:chuy n đ i đnh d ng c a t p tài li u , chuy n sang file text
o Tham s đ u vào:
STT Tên Lo i ki u Ý ngh a 1 format Ki u m ng
CFormat
m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc
Lu n v n : ánh giá các h th ng tìm ki m thông tin
2 Path Ki u chu i ng d n đ n th m c ch a t p tài li u đã chuy n đ i
o K t qu tr v (không có)
o Mô t thu t toán:
- T bi n Doc_Path : duy t t t c các file xml n m trong th m c đó - N u Path=”” : có ngh a là ng i s d ng không nh p v trí file tài
li u m i đã đ c chuy n đ i => l u t t c các file đã chuy n đ i m i vào th m c m c đnh c a ch ng trình
- N u Path != “”: l u các file đã chuy n đ i vào th m c Path
V i m i file tài li u xml c a ch ng trình : g i ph ng th c TranslateText c a l p XL_Text th c hi n chuy n đ i và t o file text m i cho t ng file xml tài li u c
LayDSTaiLieu:
o Ý ngh a:l y danh sách tài li u c a file tài li u b t k d a vào tên file
c a nó
o Tham s đ u vào:
fn (ki u chu i ): là tên file tài li u c n l y
o K t qu tr v :
dsDoc(Ki u m ng CDocument) : l u thông tin c a danh sách tài li u n m trong file tài li u có tên là fn
o Mô t thu t toán:
- c file xml có tên là fn