Cài đặt và thử nghiệm ứng dụng khai phá dữ liệu văn bản trong một bệnh viện:

Một phần của tài liệu Tìm hiểu, xây dựng khai phá dữ liệu văn bản hồ sơ bệnh án của một bệnh viện và ứng dụng phương pháp Bayes trong bộ lọc thư rác tự động (Trang 37)

Mỗi một bệnh viện đều lưu trữ dữ liệu dưới dạng file word, excel, cơ sở dữ liệu,… Trong đó hồ sơ bệnh án của mỗi bệnh nhân được lưu giữ lại để phục vụ cho công tác nghiên cứu về sau.

Tuy nhiên, hàng năm các bệnh viện thường lưu trữ lượng hồ sơ bệnh án của mỗi bệnh nhân rất lớn, tiềm ẩn nhiều thông tin tri thức hữu ích tiềm ẩn mà chúng ta chưa biết đến.

Vì vậy, việc tìm những tri thức tiềm ẩn này trong lượng dữ liệu văn bản hồ sơ bệnh án khổng lồ này là một điều không đơn giản chút nào. Nhưng nhờ kỹ thuật và công nghệ

khai phá dữ liệu nói chung và khai thác dữ liệu văn bản nói riêng thì việc tìm tri thức tiềm ẩn trong lượng dữ liệu này trở nên đơn giản hơn.

KẾT LUẬN

Công nghệ thông tin đã và đang là một trong những lĩnh vực đem lại nhiều lợi ích cho người dùng và không thể thiếu trong nền kinh tế phát triển. Trong đó khai phá dữ liệu và kho dữ liệu là một trong những yếu tố quan trọng cho nhiều ứng dụng trên internet.

Trong quá trình nghiên cứu khai phá dữ liệu các nhà nghiên cứu đã phát minh khai phá dữ liệu văn bản. Khai phá dữ liệu văn bản giúp cho người dùng trích ra, lấy ra các thông tin có ích, chưa được biết đến còn tiềm ẩn trong các kho dữ liệu văn bản lớn trở nên đơn giản, tiết kiệm được thời gian tìm kiếm hơn.

Qua quá trình làm bài thu hoạch môn học này, đã giúp em có cơ hội nghiên cứu kiến thức liên quan trong môn học khai phá dữ liệu và kho dữ liệu, đặc biệt là những kiến thức về khai phá dữ liệu văn bản phục vụ những mục đích khác nhau trong cuộc sống thực tế.

Những kiến thức này chắc chắn sẽ rất bổ ích cho em trong quá trình học tập, nghiên cứu khoa học về sau. Em xin chân thành cảm ơn thầy PGS.TS. Đỗ Phúc đã nhiệt tình giảng dạy, hướng dẫn em hoàn thành bài thu hoạch này và гất mong nhận được sự đóng góp ý kiến của Thầy và các anh chị học viên.

TÀI LIỆU THAM KHẢO



1. Bài giảng khai phá dữ liệu và kho dữ liệu – PGS.TS. Đỗ Phúc. 2. Giáo trình khai phá dữ liệu – PGS.TS. Đỗ Phúc.

3. Trang web http://en.wikipedia.org/wiki/Data_mining.

4. “Text Categorization Using a Hierarchical Topic Dictionary” - Alexander Gelbukh, Grigori Sidorov, Adolfo Guzmán-Arenas.

5. “Machine Learning in Automated Text Categorization” - Fabrizio Sebastiani.

6. http://www.roguewave.com/portals/0/products/imsl-numerical-libraries/c- library/docs/7.0/html/cstat/default.htm?turl=naivebayesanoverview.htm. 7. “Ngư phap tiêng Viêt” – Trung tâm Khoa hoc xa hôi va Nhân văn quôc

gia – Nha xuât ban Khoa hoc va xa hôi – Ha nôi 2000[4] “Information retrieval: standard and AI - based methods” - Ilya Baraev.

Một phần của tài liệu Tìm hiểu, xây dựng khai phá dữ liệu văn bản hồ sơ bệnh án của một bệnh viện và ứng dụng phương pháp Bayes trong bộ lọc thư rác tự động (Trang 37)