1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu phương pháp xếp hạng kết quả tìm kiếm trên cơ sở dữ liệu bệnh viện 04

62 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 62
Dung lượng 201,88 KB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN VĂN HIỆP NGHIÊN CỨU PHƯƠNG PHÁP XẾP HẠNG KẾT QUẢ TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thơng tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CƠNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Trí Thành Hà Nội - 2015 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nghiên cứu phương pháp xếp hạng kết tìm kiếm sở liệu bệnh viện” cơng trình nghiên cứu tơi Những kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày lại theo cách hiểu Trong q trình làm luận văn, tơi có tham khảo tài liệu có liên quan ghi rõ nguồn tài liệu tham khảo Hà Nội, ngày tháng năm 2015 Học viên Trần Văn Hiệp LỜI CẢM ƠN Lời đầu tiên, em xin trân trọng gửi lời cảm ơn sâu sắc đến thầy giáo PGS.TS Nguyễn Trí Thành - Trường Đại Học Cơng Nghệ, Đại Học Quốc Gia Hà Nội trực tiếp hướng dẫn tận tình giúp đỡ em suốt thời gian thực luận văn Em xin gửi lời cảm ơn chân thành tới tồn thể thầy giáo Trường Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội dạy dỗ, giúp đỡ bảo cho em suốt trình học tập Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới gia đình, bạn bè, đồng nghiệp, người bên cạnh em để động viên, giúp đỡ tạo điều kiện tốt để em hồn thành luận văn Hà Nội, ngày tháng năm 2015 Học viên Trần Văn Hiệp MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG BIẾU MỞ ĐẦU CHƯƠNG 1:TỔNG QUAN VỀ BÀI TOÁN TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN 1.1 Tổng quan 1.1.1 Giới thiệu 1.1.2 Ý nghĩa khoa họ 1.1.3 Tầm quan trọng 1.1.4 Mục đích 1.2 Truy tìm thơng tin 1.2.1 Hệ thống tìm kiế 1.2.2 Các hệ thống th 1.2.3 Các mơ hình tìm 1.2.4 Xếp hạng tài liệ 1.3 Kết luận CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP XẾP HẠNG 2.1 Một số phương pháp tìm kiếm 2.1.1 Mơ hình tìm kiế 2.1.2 Tìm kiếm tương 2.1.3 Độ đo tương tự 2.2 Một số phương pháp xếp hạng 2.2.1 Phương pháp xế 2.2.2 Phương pháp dự 2.2.2.1 Phương pháp xếp hạng Cosine 2.2.2.2 Phương pháp xếp hạng Cosine Short Segments 2.2.2.3 Phương pháp xếp hạng Dice 2.2.2.4 Phương pháp xếp hạng Jaccard 2.2.2.5 Phương pháp xếp hạng Matching 2.2.2.6 Phương pháp Overlap 2.3Kết luận CHƯƠNG 3: ĐỀ XUẤT CẢI TIẾN PHƯƠNG PHÁP XẾP HẠNG 3.1Bài toán ứng dụng 3.1.1 Giới thi 3.1.2 Mơ tả ch 3.1.3 Chức nă 3.1.4 Mơ hình 3.2Phương pháp đề xuất 3.3N-gram áp dụng 3.4Kết luận CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1Dữ liệu thực nghiệm phương pháp đánh giá 4.1.1 Chuẩn b 4.1.2 Phương 4.2Một số kết chạy chương trình 4.2.1 Kết vấn tập liệu loại bệnh 4.2.1.1 Kết tìm kiếm 4.2.1.2 Kết phương pháp xếp hạng 4.2.2 Kết 4.3Kết luận KẾT LUẬN TÀI LIỆU THAM KHẢO DANH MỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT STT Từ viết tắt/thuật ngữ CSDL IDF TF IR DANH MỤC CÁC HÌNH VẼ Hình 2.1 Mơ hình mục ngược Hình 2.2 Minh họa tương tự cosine Hình 3.1 Biểu đồ hoạt động chức tìm kiếm chẩn đốn bệnh Hình 3.2 Mơ hình hệ thống tìm kiếm DANH MỤC CÁC BẢNG BIỂU Bảng 2.1 Giá trị TF-Document 23 Bảng 2.2 Giá trị TF-Document 23 Bảng 2.3 Giá trị TF-Document 23 Bảng 2.4 Giá trị Normalized TF- Document 23 Bảng 2.5 Giá trị Normalized TF- Document 23 Bảng 2.6 Giá trị Normalized TF- Document 23 Bảng 2.7 Giá trị IDF Document 24 Bảng 2.8 Giá trị TF IDF Query 26 Bảng 2.9 Giá trị TF IDF Document 26 Bảng 2.10 Cosine Similarity 27 Bảng 3.1 Danh sách n-gram 39 Bảng 3.2 Kết tìm kiếm truy vấn “bệnh lậu” 39 Bảng 3.3 Kết xếp hạng Jaccard truy vấn “bệnh lậu” 40 Bảng 3.4 Kết xếp hạng Jaccard n-gram truy vấn “bệnh lậu” 41 Bảng 4.1 Thiết kế bảng danh mục ICD 42 Bảng 4.2 Dữ liệu danh mục ICD 42 Bảng 4.3 Kết tìm kiếm truy vấn “viêm họng” 45 Bảng 4.4 Kết xếp hạng Cosine truy vấn “viêm họng” 46 Bảng 4.5 Kết xếp hạng Cosine Short Segments truy vấn “viêm họng” .47 Bảng 4.6 Kết xếp hạng Dice truy vấn “viêm họng” 47 Bảng 4.7 Kết xếp hạng Jaccard truy vấn “viêm họng” 48 Bảng 4.8 Kết xếp hạng Matching truy vấn “viêm họng” 49 Bảng 4.9 Kết xếp hạng Overlap truy vấn “viêm họng” 50 Bảng 4.10 Kết đánh giá xếp hạng MAP 51 Bảng 4.11 Kết so sánh phương pháp xếp hạng 52 Bảng 4.12 Kết đánh giá xếp hạng áp dụng n-gram MAP 52 MỞ ĐẦU Tin học ngày phát triển, thay việc hàng ngày phải viết thông tin hồ sơ lên giấy, thơng tin số hóa lưu trữ máy tính dạng sở liệu thơng qua ứng dụng tin học Lợi ích việc số hóa liệu lưu trữ quản lý tốt hơn, tra cứu, trích xuất thơng tin dễ dàng Thơng tin hồ sơ số hóa ngày nhiều vấn đề đặt để tìm kiếm thơng tin tập hồ sơ hàng nghìn trí đến hàng triệu triệu cách nhanh nhất, hiệu đòi hỏi ứng dụng tin học cần phải xây dựng giải thuật tìm kiếm tối ưu đảm bảo tốc độ tìm kiếm giá trị người dùng cần Đối với lĩnh vực tìm kiếm thơng tin, người dùng tìm kiếm thu kết phù hợp khơng có kết quả, kết trả lượng lớn giá trị phù hợp, người dùng khó dị tìm kết để tìm nhanh kết muốn tìm Theo tâm lý thông thường người dùng xem qua vài chục ghi không đủ thời gian để xem tất kết trả Do xếp hạng kỹ thuật đánh giá giá trị kết tập liệu trả về, xếp hạng độ quan trọng để người dùng dễ dàng nhìn thấy giá trị phù hợp mong muốn Có nhiều hệ thống tìm kiếm cần đến kỹ thuật xếp hạng để cung cấp cho người dùng tìm thấy tài liệu nhanh xếp nhu cầu hệ thống tìm kiếm sở liệu bệnh viện cần tới Đề tài nghiên cứu hướng tới phương pháp xếp hạng Trên sở tìm hiểu nắm vững phương pháp xếp hạng vận dụng vào việc tìm kiếm xếp hạng sở liệu bệnh viện Bố cục luận văn gồm chương: Chương Tổng quan tốn tìm kiếm sở liệu bệnh viện trình bày tổng quan tốn tìm kiếm sở liệu bệnh viện Chương Một số phương pháp xếp hạng trình bày phương pháp xếp hạng, áp dụng công thức ví dụ minh họa thực nghiệm cho phương pháp Chương Đề xuất cải tiến phương pháp xếp hạng trình bày tốn ứng dụng áp dụng phương pháp xếp hạng, cách thức cải tiến phương pháp xếp hạng để đạt kết xếp hạng tốt Chương Thực nghiệm đánh giá thực thi chương trình tìm kiếm áp dụng phương pháp xếp hạng với số liệu thu thập được, so sánh kết phương pháp Đánh giá kết phương pháp để chọn phương pháp xếp hạng tốt CHƯƠNG 1: TỔNG QUAN VỀ BÀI TỐN TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN 1.1 Tổng quan 1.1.1 Giới thiệu Hiện nay, việc tạo sản phẩm Tin Học mang tính đặc thù Việt Nam điều cần phải quan tâm, đặc biệt phần mềm mang lại hiệu làm việc hoạt động mang tính hành Việc quản lý số lượng lớn bệnh nhân thông qua hồ sơ bệnh án, theo dõi tiến trình luân chuyển hồ sơ, việc thống kê y tế cơng việc hành vụ Một số bệnh viện có khối lượng bệnh nhân lớn nơi cần công cụ hỗ trợ Tin học phần cơng cụ ứng dụng tìm kiếm liệu Mỗi người dùng tìm kiếm thu kết phù hợp khơng có kết quả, kết trả lượng lớn giá trị phù hợp, người dùng khó dị tìm kết để tìm nhanh kết muốn tìm Theo tâm lý thơng thường người dùng xem qua vài chục ghi không đủ thời gian để xem tất kết trả Do xếp hạng kỹ thuật đánh giá giá trị kết tập liệu trả về, xếp hạng độ quan trọng để người dùng dễ dàng nhìn thấy giá trị phù hợp mong muốn Vì đề tài nghiên cứu hướng tới phương pháp xếp hạng, đánh giá chọn phương pháp thực tốt Trên sở tìm hiểu nắm vững phương pháp xếp hạng vận dụng vào việc tìm kiếm sở liệu bệnh viện, điển hình tốn xếp hạng chẩn đốn theo danh mục bệnh tật quốc tế Thông thường việc ghi chẩn đốn có tầm quan trọng sau: Quan trọng cho thầy thuốc Giúp thầy thuốc phát triển tư duy, tích cực suy nghĩ lựa chọn chẩn đốn theo logic (Ví dụ: chẩn đốn tử vong cách lười biếng “Sốc khơng hồi phục” Phải suy nghĩ tìm nguyên nhân) Tăng trình độ biện luận lâm sàng trình độ chun mơn Trong tương quan thầy thuốc người bệnh Giúp thầy thuốc lưu tâm tìm hiểu người bệnh nhiều có thêm hội suy nghĩ đến người bệnh, người bệnh tử vong tay Thể y đức người bệnh bệnh Trong tương quan thầy thuốc khoa học Thầy thuốc ghi chẩn đoán - thống theo danh mục mã số bệnh tật quốc tế đóng góp lớn cho khoa học, vì: ghi chẩn đốn liệu có giá trị nghiên cứu khoa học Rất quan trọng thời đại Công Nghệ Thông Tin 41 Kết sử dụng n-gram Độ đo 0.142 0.083 0.083 0.071 0.066 0.066 0 Bảng 3.4 Kết xếp hạng Jaccard n-gram truy vấn “bệnh lậu” 3.4 Kết luận Chương trình bày tốn ứng dụng cụ thể quản lý bệnh viện áp dụng đề tài vào chức nhỏ tìm kiếm chẩn đốn ứng dụng Đề xuất cải tiến phương pháp xếp hạng áp dụng mơ hình n-gram 42 CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ Chương này, tác giả trình bày kết thực nghiệm cài đặt phương pháp xếp hạng trình bày với số liệu thực tế liệu danh mục bệnh tật quốc tế Phần đầu chương, tác giả đưa số liệu cụ thể phương pháp đánh giá kết tìm kiếm Phần thứ hai, tác giả đưa kết thực phương pháp kết đánh giá phương pháp 4.1 Dữ liệu thực nghiệm phương pháp đánh giá 4.1.1 Chuẩn bị liệu thực nghiệm Dữ liệu cần chuẩn bị liệu danh mục bệnh tật quốc tế với số lượng 34111 ghi liệu Sau có liệu chẩn đốn, liệu lưu bảng danh mục ICD bao gồm dịng ghi tương ứng với mã chẩn đốn tên chẩn đoán Bảng danh mục ICD thiết kế sau: STT Tên trường ICDCode ICDName Bảng 4.1 Thiết kế bảng danh mục ICD Ta có bảng liệu sau: ICDCode Z96.693 Z96.698 Z96.7 Z96.8 Z96.81 Z96.89 Z96.9 Z97 Z97.0 Z97.1 … A38 ICD Tha Tồn Tồn Tồn Tồn Tồn Tồn Tồn Tồn Tồn … Sốt Bảng 4.2 Dữ liệu danh mục ICD 4.1.2 Phương pháp đánh giá kết tìm kiếm Mục tiêu việc đánh giá phương pháp để khẳng định phương pháp thực tốt phương pháp việc đạt kết mong muốn 43 (chứ tốt ngẫu nhiên) Để đánh giá hệ thống truy tìm thơng tin, hai tiêu trí sử dụng mức độ xác kết thời gian trả kết hệ thống Trong phần lớn nghiên cứu, việc đánh giá so sánh thực nghiệm hệ thống chủ yếu tập trung vào tiêu chí độ xác kết Để đánh giá chất lượng xếp hạng sử dụng độ đo đánh giá để định lượng độ xác tìm kiếm Độ xác độ đầy đủ [3] Độ xác tỉ lệ văn liên quan số văn trả Precision = # (văn liên quan trả về)/# (văn trả về) Độ đầy đủ tỉ lệ văn liên quan trả tổng số văn liên quan Recall = # (văn liên quan trả về)/# (văn liên quan) Trả Khơng trả Ký hiệu P: độ xác, R: độ đầy đủ ta có cơng thức sau: A P A B Ví dụ: Với truy vấn “Bệnh tả” phương pháp đo Cosine cho văn ngắn Ký hiệu * văn liên quan đến truy vấn Ký hiệu - văn không liên quan đến truy vấn Bệnh tả - Độ 0/(0+1)=0 xác Độ đầy 0/3=0 đủ Độ xác trung bình (average precision - AP) Ký hiệu vị trí văn liên quan danh sách kết quả: K1 , K2 ,…, K R 44 Ví dụ: Với truy vấn “Bệnh tả” ta có Bình qn độ xác trung bình (Mean Average Precision - MAP) Bình qn độ xác trung bình: MAP 11 P@K i Ri Q Trong Ri số văn liệu liên quan với truy vấn qi Ví dụ: Với truy vấn “Bệnh dại” phương pháp đo Cosine cho văn ngắn ta tính AP = Vậy MAP = (AP (“Bệnh tả”) + AP (“Bệnh dại”)) / = (0.59 + 1) / = 0.80 Một hệ thống tìm kiếm thường chạy thử nghiệm nhiều truy vấn Do độ đo đề cập thường tính trung bình tất truy vấn sử dụng cho việc đánh giá phương pháp 4.2 Một số kết chạy chương trình 4.2.1 Kết chạy phương pháp xếp hạng khác cho truy vấn tập liệu loại bệnh Người dùng tìm kiếm ví dụ với truy vấn “viêm họng” Hệ thống tìm kiếm liệu bảng liệu danh mục ICD ghi có chứa từ “viêm” từ “họng” với câu lệnh truy vấn “SELECT * FROM ICD WHERE ICDName LIKE N'%viêm%' AND ICDName LIKE N'%họng%'”, sau thực tính độ đo theo phương pháp xếp hạng, xếp kết trả Dưới kết tìm kiếm kết phương pháp xếp hạng với truy vấn “viêm họng” 4.2.1.1 Kết tìm kiếm Truy vấn: viêm họng A50.03 Viêm họng giang mai bẩm sinh sớm, Viêm quản giang mai bẩm sinh sớm A54.5 Viêm họng lậu cầu J02 Viêm họng cấp J02.0 Viêm họng liên cầu 45 J02.0.-1 Viêm Tấy Lan Toả Vùng Họng J02.8 Viêm họng cấp vi sinh vật xác định khác J02.9 Viêm họng cấp, không xác định J06.0 Viêm họng - quản cấp J31 Viêm mũi, viêm mũi họng viêm họng mãn J31.1 Viêm mũi họng mãn J31.2 Viêm họng mãn Bảng 4.3 Kết tìm kiếm truy vấn “viêm họng” 4.2.1.2 Kết phương pháp xếp hạng Phương pháp xếp hạng Cosine Độ đo Truy vấn: viêm họng A54.5 Viêm họng lậu cầu J02.0 Viêm họng liên cầu J02.0.-1 Viêm Tấy Lan Toả Vùng Họng J06.0 Viêm họng - quản cấp J02.8 Viêm họng cấp vi sinh vật xác địn 46 J31.1 Viêm mũi họng mãn J31.2 Viêm họng mãn J02 Viêm họng cấp J02.9 Viêm họng cấp, không xác định 0.980 J31 Viêm mũi, viêm mũi họng viêm h 0.948 A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm Bảng 4.4 Kết xếp hạng Phương pháp xếp hạng Cosine Short Segments Độ đo Truy vấn: viêm họng 0.707 J02 Viêm họng cấp 0.632 J31.2 Viêm họng mãn 0.577 J31 Viêm mũi, viêm mũi họng viêm h 0.577 J31.1 Viêm mũi họng mãn 0.534 A54.5 Viêm họng lậu cầu 0.534 J02.0 Viêm họng liên cầu 47 0.534 J06.0 Viêm họng - quản cấp 0.5 J02.9 Viêm họng cấp, không xác định 0.471 J02.0.-1 Viêm Tấy Lan Toả Vùng Họng 0.408 A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm 0.408 J02.8 Viêm họng cấp vi sinh vật xác địn Bảng 4.5 Kết xếp hạng Cosine Short Segments truy vấn “viêm họng” Phương pháp xếp hạng Dice Độ đo 0.666 0.571 0.5 0.5 0.444 0.444 0.444 0.4 0.363 0.285 0.285 Truy vấn: viêm họng J02 Viêm họng cấp J31.2 Viêm họng mãn J31 Viêm mũi, viêm mũi họng viêm h J31.1 Viêm mũi họng mãn A54.5 Viêm họng lậu cầu J02.0 Viêm họng liên cầu J06.0 Viêm họng - quản cấp J02.9 Viêm họng cấp, không xác định J02.0.-1 Viêm Tấy Lan Toả Vùng Họng A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm J02.8 Viêm họng cấp vi sinh vật xác địn Bảng 4.6 Kết xếp hạng 48 Phương pháp xếp hạng Jaccard Độ đo Truy vấn: viêm họng 0.5 J02 Viêm họng cấp 0.4 J31.2 Viêm họng mãn 0.333 J31 Viêm mũi, viêm mũi họng viêm h 0.333 J31.1 Viêm mũi họng mãn 0.285 A54.5 Viêm họng lậu cầu 0.285 J02.0 Viêm họng liên cầu 0.285 J06.0 Viêm họng - quản cấp 0.25 J02.9 Viêm họng cấp, không xác định 0.222 J02.0.-1 Viêm Tấy Lan Toả Vùng Họng 0.166 A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm 0.166 J02.8 Viêm họng cấp vi sinh vật xác địn Bảng 4.7 Kết xếp hạng J 49 Phương pháp xếp hạng Matching Độ đo Truy vấn: viêm họng A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm A54.5 Viêm họng lậu cầu J02 Viêm họng cấp J02.0 Viêm họng liên cầu J02.0.-1 Viêm Tấy Lan Toả Vùng Họng J02.8 Viêm họng cấp vi sinh vật xác địn J02.9 Viêm họng cấp, không xác định J06.0 Viêm họng - quản cấp J31 Viêm mũi, viêm mũi họng viêm h J31.1 Viêm mũi họng mãn J31.2 Viêm họng mãn Bảng 4.8 Kết xếp hạng M 50 Phương pháp xếp hạng Overlap Độ đo Truy vấn: viêm họng A50.03 Viêm họng giang mai bẩm sinh sớ bẩm sinh sớm A54.5 Viêm họng lậu cầu J02 Viêm họng cấp J02.0 Viêm họng liên cầu J02.0.-1 Viêm Tấy Lan Toả Vùng Họng J02.8 Viêm họng cấp vi sinh vật xác địn J02.9 Viêm họng cấp, không xác định J06.0 Viêm họng - quản cấp J31 Viêm mũi, viêm mũi họng viêm h J31.1 Viêm mũi họng mãn J31.2 Viêm họng mãn Bảng 4.9 Kết xếp hạng O 51 4.2.2 Kết đánh giá phương pháp với truy vấn khác Kết tính độ xác trung bình truy vấn sau tính bình qn độ xác trung bình ta có bảng kết sau: Độ xác trung bình/Truy vấn Bệnh tả Bệnh dại Bệnh gan Bệnh mắt Tiểu đường Suy thận Vàng da Béo phì Bệnh lậu Bệnh da Cận thị Loạn thị Viêm họng Viêm xoang Bình qn độ xác trung bình/Truy vấn Bảng 4.10 Kết đánh giá xếp hạng MAP 52 Bảng kết so sánh phương pháp xếp hạng sau đánh giá truy vấn sau: STT Phương pháp Jaccard Cosine Short Segm Matching Overlap Dice Cosine Bảng 4.11 Kết so sánh phương pháp xếp hạng Kết tính độ xác trung bình phương pháp xếp hạng áp dụng n- gram truy vấn sau tính bình qn độ xác trung bình ta có bảng kết sau: Độ xác trung bình/Truy vấn Bệnh tả Bệnh dại Bệnh gan Bệnh mắt Tiểu đường Suy thận Vàng da Béo phì Bệnh lậu Bệnh da Cận thị Loạn thị Viêm họng Viêm xoang Bình quân độ xác trung bình/Truy vấn Bảng 4.12 Kết đánh giá xếp hạng áp dụng n-gram MAP 4.3 Kết luận Chương trình bày kết cài đặt đánh giá thử nghiệm với tập liệu cụ thể cho phương pháp: Cosine, Cosine Short Segments, Dice, Jaccard, Matching, Overlap Kết xếp hạng trả thể trực quan qua ứng dụng tìm kiếm Kết thực nghiệm cho thấy phương pháp xếp hạng áp dụng n-gram có kết mong muốn trả tốt 53 KẾT LUẬN Nội dung luận văn trình bày số kết nghiên cứu đạt sau đây: Nghiên cứu cách thức hoạt động hệ thống truy tìm thơng tin nói chung nghiên cứu phương pháp xếp hạng: Cosine, Cosine Short Segments, Dice, Jaccard, Matching, Overlap áp dụng lĩnh vực thống kê y tế Cài đặt thử nghiệm phương pháp liệu thực tế danh mục chẩn đoán bệnh tật quốc tế, đánh giá, so sánh phương pháp để chọn phương pháp thực tốt Kết sử dụng n-gram kết hợp phương pháp xếp hạng, n-gram cho kết xác Ứng dụng luận văn hồn tồn sử dụng với liệu khác ngồi liệu danh mục chẩn đốn bệnh tật quốc tế mà luận văn sử dụng phần thực nghiệm 54 TÀI LIỆU THAM KHẢO Tiếng Việt PGS.TS Đặng Văn Đức (2004-2008), Bài giảng Cơ sở liệu đa phương tiện Zdravko Markov, Daniel T Laroso, Data Mining the Web: Uncovering Patterns in Web Content, Structure, and Usage Teufel (2006, To Appear): Chapter An Overview of evaluation methods n TREC Ad-hoc Information Retrieval and TREC Question Answering In: L Dybkjaer, H Hemsen, W Minker (Eds.) Evaluation of Text and Speech Systems Springer, Dordrecht, The Netherlands Sahami, M., and Heilman, T 2006 A web-base kernel function for measuring the similarity of Short text snippets In Proc of WWW '06 Metzler, D.; Dumais, S.; and Meek, C 2007 Similarity measures for short segments of text In Proc of ECIR-07 Metzler, D., Bernstein , Y., Croft, W.B., Moffat, A., and Zobel, J Similarity measures for tracking information flow In Proceedings of CIKM '05 Christopher D Manning, Prabhakar Raghavan, Hinrich Schütze Introduction to Information Retrieval Cambridge University Press, 2008 https://janav.wordpress.com/2013/10/27/tf-idf-and-cosine-similarity/ ... thống tìm kiếm sở liệu bệnh viện cần tới Đề tài nghiên cứu hướng tới phương pháp xếp hạng Trên sở tìm hiểu nắm vững phương pháp xếp hạng vận dụng vào việc tìm kiếm xếp hạng sở liệu bệnh viện Bố... Chương Tổng quan toán tìm kiếm sở liệu bệnh viện trình bày tổng quan tốn tìm kiếm sở liệu bệnh viện Chương Một số phương pháp xếp hạng trình bày phương pháp xếp hạng, áp dụng cơng thức ví dụ minh... số phương pháp xếp hạng Ngày có nhiều phương pháp xếp hạng nghiên cứu đưa dựa nội dung cấu trúc liệu Đề tài nghiên cứu lựa chọn phương pháp xếp hạng dựa nội dung áp dụng vào tốn tìm kiếm sở liệu

Ngày đăng: 11/11/2020, 22:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w