Màn hình xem chi tit (TH_XemChiTiet)

Một phần của tài liệu Tài liệu Luận văn: XÂY DỰNG BỘ NGỮ LIỆU ĐỂ ĐÁNH GIÁ BẰNG TIẾNG VIỆT VÀ CHƯƠNG TRÌNH TRỢ GIÚP ĐÁNH GIÁ CÁC HỆ TÌM KIẾM THÔNG TIN docx (Trang 136)

Ký hi u: fraXemChiTiet

Màn hình này đ c g i khi ng i dùng mu n xem thông tin chi ti t v s liên quan c a m t câu h i v i 1 tài li u c th .

ng t i màn hình xem k t qu đánh giá (fraKq_DanhGia) , nh n vào DocID c a tài li u mu n xem (b i vì trên màn hình fraKq_DanhGia, tblTaiLieuPhucHoi chi th hi n các DocID c a tài li u đ c tr v ), ch ng trình s hi n th màn hình xem chi ti t này.Thông tin chi ti t g m có : n i dung c a câu h i,n i dung c a tài li u liên quan đ n câu h i đó, đ t ng quan c a câu h i v i tài li u và thông tin tài li u và câu h i đó đ c l p ch m c

Lu n v n : ánh giá các h th ng tìm ki m thông tin

Chi tit tài liu

Chi tit tài liu

Thông tin chi ti院t

Tài li羽u: DocID= ... Aóng màn hình Câu h臼i: …. A瓜 t逢挨ng quan :…... Tぢ Trいng sえ Tぢ Trいng sえ Di n gi i: STT Tên Lo i ki u Ý ngh a

1 lblSim Lable t ng quan gi a câu h i và tài li u

2 lblTopID Lable Ch s (topicID) c a tài li u 3 txtCauHoi textbox th hi n n i dung c a câu h i đó 4 tblIndex_CauHoi table Th hi n n i dung ch m c c a câu

h i

5 lblDocID Lable Ch s ID c a tài li u 6 txtTaiLieu textbox N i dung tài li u

7 tblIndex_TaiLieu table N i dung ch m c c a tài li u 8 btnDong Button óng màn hình 3 7 1 2 4 6 5 8

Lu n v n : ánh giá các h th ng tìm ki m thông tin 3.3.2.6.13.Màn hình so sánh h th ng (TH_SoSanhHT) Ký hi u: fraSoSanhHT Di n gi i: STT Tên Lo i ki u Ý ngh a 1 lstHT ListBox Danh sách h th ng IR

2 btnChon Button ch n m t h th ng bên danh sách h th ng

3 btnBo Button b m t h th ng bên danh sách h th ng

đã ch n

4 lstHTChon ListBox Danh sách h th ng đã đ c ch n

5 th hi n th đ th c a các h th ng đã ch n 6 btnDong Button óng màn hình 6 1 4 2 3 5

Lu n v n : ánh giá các h th ng tìm ki m thông tin

3.3.2.7. Thi t k h th ng l p đ i t ng

3.3.2.7.1.Các l p đ i t ng x lý

a) CFormat:

Ý ngh a :

nh ngh a c u trúc các thông s c n thi t đ đ nh d ng tài li u và câu h i

Mô t :

C u trúc thông s đnh d ng:

STT Tên Lo i ki u Ý ngh a

1 oldTag Ki u chu i Th c c n chuy n đ i

2 newTag Ki u chu i Th m i (t th c đ i sang th m i) 3 Content Ki u chu i N i dung c a th c

4 oldId Ki u chu i Th t c a th c trong file xml c 5 newId Ki u chu i Th t c a th m i trong file xml m i 6 haveAttr Ki u logic Th m i đó có thu c tính hay không? 7 attrArray M ng

CFormat

N u th m i có thu c tính thì attrArray s l u danh sách các thu c tính (Thu c tính có c u trúc d ng th : tên thu c tính (t ng ng v i tên th m i- newTag)), th t ng ng v i thu c tính trên (oldTag) b) CDocument: Ý ngh a

nh ngh a c u trúc c a tài li u đ l u tr các giá tr n i dung c a các th (ho c section) c a tài li u

Lu n v n : ánh giá các h th ng tìm ki m thông tin

STT Tên Lo i ki u Ý ngh a

1 DocID Ki u chu i docID c a tài li u 2 Title Ki u chu i tiêu đ c a tài li u 3 Content Ki u chu i N i dung c a tài li u 4 Date Ki u chu i Ngày t o tài li u 5 Author Ki u chu i Tác gi c a tài li u 6 News Ki u logic Ngu n g c c a tài li u

c) CTopic: Ý ngh a:

nh ngh a c u trúc c a tài li u đ l u tr các giá tr n i dung c a các th (ho c section) c a câu h i

Mô t :

STT Tên Lo i ki u Ý ngh a

1 TopID Ki u chu i docID c a câu h i 2 Title Ki u chu i N i dung c a câu h i 3 Description Ki u chu i Chú thích c a câu h i

4 Narrative Ki u chu i N i dung yêu c u liên quan c a câu h i

d) CHeThongIR: Ý ngh a:

nh ngh a c u trúc h th ng IR

Mô t :

STT Tên Lo i ki u Ý ngh a

1 strTenHT Ki u chu i Tên h th ng IR 2 strID Ki u chu i ID c a h th ng IR

3 NgayKiemTra Ki u chu i Ngày ti n hành ki m tra h th ng IR 4 Rtrungbinh Ki u chu i bao ph trung bình

Lu n v n : ánh giá các h th ng tìm ki m thông tin

5 Ptrungbinh Ki u chu i chính xác trung bình

6 fP M ng s th c chính xác trung bình t i 11 đi m chu n c a đ bao ph e) CKetQua: Ý ngh a: nh ngh a c u trúc đ nh d ng c a file k t qu tr v c a h th ng IR (file k t qu tar3 v c a h th ng IR chính là b ng liên quan th c t )

Mô t : STT Tên Lo i ki u Ý ngh a 1 TopicID Ki u chu i Th t ng ng v i TopicID 2 DocID Ki u chu i Th t ng ng v i DocID 3 ThuocTinh_TopicID Ki u chu i Tên thu c tính t ng ng v i TopicID n u th t ng ng v i TopicID có thu c tính 4 ThuocTinh_DocID Ki u chu i Tên thu c tính t ng ng v i DocID n u th t ng ng v i DocID có thu c tính 5 TagSim Ki u chu i Th t ng ng v i similarity (th Similarity) 6 ThuocTinh_Sim Ki u chu i Tên thu c tính t ng ng v i Similarity n u th t ng ng v i Similarity có thu c tính

Lu n v n : ánh giá các h th ng tìm ki m thông tin

f) CRelevant: Ý ngh a

nh ngh a c u trúc s liên quan c a tài li u t i v trí th t n c a danh sách các tài li u tr v c a m t câu h i

Thông tin v đ chính xác và đ bao ph t i v trí th n s đ c l u trong m ng c u trúc CRelevant đ th c hi n n i suy tính đ chính xác t i 11 đi m chu n c a đ bao ph (tính P (r) , v i r có giá tr là 0.0, 0.1 ,0.2 ,0.3 ,0.4, 0.5 , 0.6 , 0.7, 0.8, 0.9, 1.0)

Mô t :

STT Tên Lo i ki u Ý ngh a

1 DocID Ki u chu i docID c a câu h i t i v trí th t n 2 bRelevant Ki u logic Tài li u t i v trí n có liên quan hay

không? 3 fPrecision Ki u s th c chính xác c a tài li u t i v trí n 4 fRecall Ki u s th c bao ph c a tài li u t i v trí n g) CIndex: Ý ngh a: nh ngh a c u trúc đnh d ng các file index tr v c a h th ng IR Mô t : STT Tên Lo i ki u Ý ngh a

1 ID Ki u chu i ID c a câu h i ho c tài li u đ c l p ch m c

2 word Ki u chu i T có ngh a xu t hi n trong câu h i ho c tài li u

Lu n v n : ánh giá các h th ng tìm ki m thông tin nguyên h) XL_XML : S đ l p: Mô t : Ph ng th c: TranslateXML

o Ý ngh a: chuy n đ i c u trúc c a m t file xml sang c u trúc file xml khác o Tham s đ u vào: STT Tên Lo i ki u Ý ngh a 1 Format Ki u m ng CFormat m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó

2 newFile Ki u chu i file xml m i bao g m c đ ng d n 3 oldPathFile Ki u chu i đ ng d n file xml c

4 oldFile Ki u chu i tên file xml c

Ghi chú:

Tham s format có ki u m ng CFormat v i:

newTag : là tên th trong file xml m i t ng ng v i oldTag oldTag là các th trong file xml c

newId: là th t c a th m i trong file xml m i oldTag: là th t c a th c

haveAttr: th m i c n t o có thu c tinh hay không?, n u có l u thu c

XL_XML

Lu n v n : ánh giá các h th ng tìm ki m thông tin

Ví d : có file xml nh sau:

<DOCUMENT> nút g c (có th t =0)

<DOC> nút k g c (có th t c b ng 1) <DOCID> “ 1 “ <DOCID>

<TITLE> “Thanh niên Vi t Nam” <TITLE> </DOC>

</DOCUMENT>

i sang file xml có c u trúc nh sau: <DOCUMENT>

<DOC DOCID=”1”>

<TITLE> “Thanh niên Vi t Nam” <TITLE> </DOC>

</DOCUMENT>

nh ngh a m ng format nh sau: CFormat[] f=new CFormat[3]; f[0]=new CFormat(); f[0].oldId=f[0].newId=0; f[0].newTag="TAILIEU"; f[0].oldTag="DOCUMENT"; f[0].haveAttr=false; f[1]=new CFormat(); f[1].newId=f[1].oldId=1; f[1].newTag="TL"; f[1].oldTag="DOC"; f[1].haveAttr=true; f[1].attrArray=new CFormat[1]; f[1].attrArray[0]=new CFormat();

Lu n v n : ánh giá các h th ng tìm ki m thông tin f[1].attrArray[0].newTag="ID"; f[2]=new CFormat(); f[2].newId=f[2].oldId=2; f[2].newTag="CHUDE"; f[2].oldTag="TITLE"; o K t qu tr v : STT Tên Lo i ki u Ý ngh a 1 kq Ki u s nguyên K t qu tr v đ xác nh n chuy n đ i thành công hay th t b i

o Mô t thu t toán:

- Tìm newTag c a nút g c trong m ng format (nút g c là nút có th t newId=0) , d a vào khai báo c a m ng format (newTag) t o nút g c cho file xml m i

- c file xml c d a vào oldPathFile và oldFile: g i ph ng th c ReadXML c a l p LT_XML

- Tìm v trí c a nút k g c trong m ng format(nút k g c là nút có oldId=1) =>idxroot

- L y danh sách các nút k g c ( th oldTag) =>Nodes - G i nodelen là chi u dài c a danh sách Nodes

- L p i=0 -> i=nodelen - B t đ u l p i

Ki m tra xem format[idxroot] có thu c tính hay không: (format[idxroot].haveAttr ?)

N u có thu c tính

(duy t t t c các thu c tính c a nút k g c đ gán n i dung cho nó) - V i m i thu c tính:

Lu n v n : ánh giá các h th ng tìm ki m thông tin

- xem thu c tính c a nút k g c có oldTag là gì, n u có oldTag =”” có ngh a là t o m i thu c tính, n u oldTag !=”” : đ c n i dung c a oldTag gán váo format[idxroot].Content

Ng c l i không có thu c tính

- T o n i dung cho các ph n t format[k] (k!=idxroot) (chú ý: nút k g c format[idxroot] không ch a n i dung)

- ki m tra xem t ng ph n t trong m ng format khác v i format[idxroot] có thu c tính hay không

- N u ph n t format[k] có thu c tính : đ c n i dung th t ng ng v i thu c tính đó (oldTag) và ghi nh n n i dung vào format[k].attrArray[j].Content

Sau khi gán n i dung cho các th m i trong m ng format : - S p x p th t m ng format theo th t t ng d n c a newId - T o node cho file xml m i

- Cu i l p i đã ánh x xong các node c a file xml c sang file xml m i

k) XL_Text: S đ l p:

Mô t :

Ph ng th c : TranslateText

o Ý ngh a:

đ i c u trúc c a m t file xml sang c u trúc file text khác v i các th c a file xml t ng ng v i các section c a file text

o Tham s đ u vào:

STT Tên Lo i ki u Ý ngh a

XL_XML

Lu n v n : ánh giá các h th ng tìm ki m thông tin

1 format Ki u m ng CFormat

m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó

2 newFile Ki u chu i file xml m i bao g m c đ ng d n 3 oldPathFile Ki u chu i đ ng d n file xml c

4 oldFile Ki u chu i tên file xml c

o K t qu tr v : STT Tên Lo i ki u Ý ngh a 1 kq Ki u s nguyên K t qu tr v đ xác nh n chuy n đ i thành công hay th t b i o Thu t toán:

- Tìm newTag c a nút g c trong m ng format (nút g c là nút có th t newId=0) , d a vào khai báo c a m ng format (newTag) t o nút g c cho file xml m i

- c file xml c d a vào oldPathFile và oldFile: g i ph ng th c ReadXML c a l p LT_XML

- Do file text m i không có khái ni m th g c ch c n nh ng th ch a d li u - L y danh sách các nút có th là format[0].oldTag =>Nodes (format[0] là

nút k g c trong file xml c (không k nút g c)) - G i strNoiDung l u gi n i dung c a file text - G i nodelen là chi u dài c a danh sách Nodes - L p k=0 ->k=nodelen

B t đ u l p i

V i m i ph n t format[i]:

- ki m tra xem format[i].oldTag =”” hay không ?

Lu n v n : ánh giá các h th ng tìm ki m thông tin

strNoiDung = strNoiDung + format[i].newTag + “ký t xu ng dòng”

o N u khác r ng :

- l y n i dung c a th có tên là format[i].oldTag gán vào n i dung c a section m i : format[i].Content

strNoiDung = strNoiDung + format[i].newTag + “ký t xu ng dòng” + format[i].Content + “ký t xu ng dòng”

Cu i l p i

- Ghi lên file text : g i ph ng th c WriteText(strNoiDung,newFile) c a l p LT_Text

- G i k t qu th c hi n thành công hay th t b i cho ch ng trình

l) XL_Doc S đ l p:

Mô t :

Thu c tính:

STT Tên Lo i ki u Ý ngh a

1 Doc_Path Ki u chu i ng d n c a t p tài li u c a ch ng trình , m c đ nh là t t c các t p d li u s đ c l u t i th m c “coll” c a ch ng trình

2 SO_DOC Ki u s nguyên

S tài li u trong m t file tài li u , m c

đ nh là có 50 tài li u trong m t file tài li u

XL_Doc

Static String Doc_Path="coll"; Static int SO_DOC=50; DinhDangTaiLieu DinhDangTaiLieuText LayDSTaiLieu

Lu n v n : ánh giá các h th ng tìm ki m thông tin

Ph ng th c :DinhDangTaiLieu

o Ý ngh a:chuy n đ i đnh d ng c a t p tài li u , chuy n sang file xml

o Tham s đ u vào:

STT Tên Lo i ki u Ý ngh a 1 format Ki u m ng

CFormat

m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc đó

2 Path Ki u chu i ng d n đ n th m c ch a t p tài li u đã chuy n đ i

o K t qu tr v :(không có)

o Mô t thu t toán:

- T bi n Doc_Path : duy t t t c các file xml n m trong th m c đó - N u Path=”” : có ngh a là ng i s d ng không nh p v trí file tài

li u m i đã đ c chuy n đ i => l u t t c các file đã chuy n đ i m i vào th m c m c đnh c a ch ng trình

- N u Path != “”: l u các file đã chuy n đ i vào th m c Path

- V i m i file tài li u xml c a ch ng trình : g i ph ng th c TranslateXML c a l p XL_XML th c hi n chuy n đ i và t o file xml m i cho t ng file xml tài li u c

Ph ng th c: DinhDangTaiLieuText

o Ý ngh a:chuy n đ i đnh d ng c a t p tài li u , chuy n sang file text

o Tham s đ u vào:

STT Tên Lo i ki u Ý ngh a 1 format Ki u m ng

CFormat

m ng Cformat l u tr c u trúc đnh d ng m i mà file xml m i c n chuy n đ i sang c u trúc

Lu n v n : ánh giá các h th ng tìm ki m thông tin

2 Path Ki u chu i ng d n đ n th m c ch a t p tài li u đã chuy n đ i

o K t qu tr v (không có)

o Mô t thu t toán:

- T bi n Doc_Path : duy t t t c các file xml n m trong th m c đó - N u Path=”” : có ngh a là ng i s d ng không nh p v trí file tài

li u m i đã đ c chuy n đ i => l u t t c các file đã chuy n đ i m i vào th m c m c đnh c a ch ng trình

- N u Path != “”: l u các file đã chuy n đ i vào th m c Path

V i m i file tài li u xml c a ch ng trình : g i ph ng th c TranslateText c a l p XL_Text th c hi n chuy n đ i và t o file text m i cho t ng file xml tài li u c

LayDSTaiLieu:

o Ý ngh a:l y danh sách tài li u c a file tài li u b t k d a vào tên file

c a nó

o Tham s đ u vào:

fn (ki u chu i ): là tên file tài li u c n l y

o K t qu tr v :

dsDoc(Ki u m ng CDocument) : l u thông tin c a danh sách tài li u n m trong file tài li u có tên là fn

o Mô t thu t toán:

- c file xml có tên là fn

Một phần của tài liệu Tài liệu Luận văn: XÂY DỰNG BỘ NGỮ LIỆU ĐỂ ĐÁNH GIÁ BẰNG TIẾNG VIỆT VÀ CHƯƠNG TRÌNH TRỢ GIÚP ĐÁNH GIÁ CÁC HỆ TÌM KIẾM THÔNG TIN docx (Trang 136)

Tải bản đầy đủ (PDF)

(187 trang)