1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) ứng dụng tóm tắt dữ liệu cho bài toán phân lớp và dự báo

62 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 62
Dung lượng 3,5 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN TRẦN CÔNG SỰ lu an n va p ie gh tn to ỨNG DỤNG TÓM TẮT DỮ LIỆU CHO BÀI TOÁN PHÂN LỚP VÀ DỰ BÁO d oa nl w an lu nf va LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH z at nh oi lm ul z m co l gm @ an Lu Bình Định - Năm 2021 n va ac th si BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN TRẦN CÔNG SỰ lu an n va p ie gh tn to ỨNG DỤNG TÓM TẮT DỮ LIỆU CHO BÀI TOÁN PHÂN LỚP VÀ DỰ BÁO d oa nl w nf va an lu Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 z at nh oi lm ul Người hướng dẫn: TS LÊ XUÂN VIỆT z m co l gm @ an Lu Bình Định - Năm 2021 n va ac th si LỜI CAM ĐOAN Tôi Trần Công Sự, học viên lớp cao học Khoa học máy tính K22 Tơi lu xin cam đoan nghiên với đề tài "Ứng dụng tóm tắt liệu cho tốn phân lớp dự báo"được trình bày luận văn cơng an n va tham khảo, cơng trình nghiên cứu liên quan trích dẫn cụ thể gh tn to trình nghiên cứu riêng tơi hướng dẫn thầy giáo TS Lê Xuân Việt, không chép lại người khác Tất nguồn tài liệu p ie Tơi xin chịu hồn tồn trách nhiệm có phát chép mà khơng có trích dẫn tài liệu tham khảo d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si ii LỜI CẢM ƠN Luận văn hoàn thành hướng dẫn khoa học TS Lê lu Xuân Việt, Khoa CNTT - Trường Đại học Quy Nhơn Tác giả xin bày tỏ lòng biết ơn chân thành kính trọng sâu sắc đến Thầy hướng an n va thể hoàn thành luận văn cách tốt Tác giả xin chân thành gh tn to dẫn; Thầy tận tình giúp đỡ truyền đạt cho tác giả kiến thức quý báu kinh nghiệm trình nghiên cứu khoa học, để tác giả có p ie cảm ơn q thầy khoa Cơng nghệ thơng tin, phịng Sau đại học, Trường Đại học Quy Nhơn, quý thầy cô tham gia giảng dạy cho lớp oa nl w Cao học Khoa học máy tính khố 22 tạo điều kiện cho tác giả trình học tập nghiên cứu Nhân tác giả xin cảm ơn gia d đình, bạn bè quan tâm, động viên giúp đỡ tác giả trình học tập hoàn thành luận văn an lu nf va Tác giả hy vọng luận văn đóng góp tài liệu tham khảo hữu ích cho bạn sinh viên, học viên cao học tìm tịi nghiên cứu lm ul z at nh oi tốn tóm tắt liệu dự báo Mặc dù cố gắng hết sức, song điều kiện thời gian kinh nghiệm thực tế thân cịn ít, đề tài khơng thể tránh khỏi thiếu sót z Vì vậy, mong nhận đóng góp ý kiến quý thầy cô bạn m co l gm @ Tôi xin chân thành cảm ơn! an Lu n va ac th si iii Mục lục Lời cam đoan i lu an n va Lời cảm ơn ii Danh mục thuật ngữ, từ viết tắt v tn to Danh sách hình vẽ vi ie gh vii p Danh sách bảng oa nl w Mở đầu d CÁC KIẾN THỨC CƠ SỞ lu Khám phá tri thức khai phá liệu Quá trình khám phá tri thức 1.3 Các phương pháp, kỹ thuật khai phá liệu nf va an 1.1 1.2 Phân lớp dự đoán (Classification & Prediction) Mạng Bayesian (Bayesian networks) 10 z at nh oi 1.4 lm ul 1.3.1 1.3.2 z Bài toán dự báo 11 1.4.1 Khái niệm dự báo 11 Đặc điểm dự báo 11 Chức vai trò dự báo 12 l gm Kết luận Chương 12 m co 1.5 @ 1.4.2 1.4.3 LỚP DỮ LIỆU NAIVE BAYES an Lu PHƯƠNG PHÁP DỰ BÁO SỬ DỤNG KỸ THUẬT PHÂN 13 n va ac th si iv 2.1 2.2 Tổng quan phân loại liệu 13 Phân loại liệu với mạng Bayesian 15 2.3 Các bước giải toán dự báo sử dụng kỹ thuật phân lớp Naive Bayes 20 2.4 Một số ví dụ minh họa 24 2.4.1 Trường hợp mẫu dự đoán xuất liệu 2.4.2 huấn luyện 24 Trường hợp mẫu dự đốn khơng xuất liệu huấn luyện 28 lu an 2.6 Kết luận Chương 37 n va 2.5 2.4.3 Sử dụng kỹ thuật làm mịn liệu Laplace Smoothing 32 Một số ưu điểm phương pháp Naive Bayes 36 p ie gh tn to THỬ NGHIỆM VÀ ĐÁNH GIÁ 38 3.1 Mơ tả tốn 39 3.1.1 Bài toán 39 oa nl w 3.2 3.1.2 Làm sạch, tiền xử lý liệu 39 Phân tích tốn 42 Tóm tắt liệu 42 Phân lớp cho liệu 46 d an lu 3.2.1 3.2.2 3.4 3.5 Đánh giá kết 47 Kết luận Chương 48 nf va 3.3 3.2.3 Dự đoán kết 46 Giao diện chương trình 47 z at nh oi lm ul KẾT LUẬN 51 z @ 52 m co l gm TÀI LIỆU THAM KHẢO an Lu n va ac th si v DANH MỤC THUẬT NGỮ, CÁC TỪ VIẾT TẮT lu STT Tiếng Anh/Viết tắt Tiếng Việt/Nghĩa n va p ie gh tn to TRUNG HỌC PHỔ THÔNG NB Naive Bayes CSDL Cơ sở liệu KPDL Khai phá liệu NBC Naive Bayes Classifier M Điểm miệng TX1 Điểm thường xuyên THPT w an TX2 Điểm thường xuyên d oa nl Điểm thường xuyên TX3 10 GK 11 CK 12 Training data Dữ liệu đào tạo 13 Test data Dữ liệu kiểm tra 14 Noise 15 Missing value 16 Frequency table Bảng tần số 17 Likehood Khả xảy an lu nf va Điểm kỳ Điểm cuối kỳ z at nh oi lm ul Dữ liệu lỗi Giá trị thiếu z m co l gm @ an Lu n va ac th si vi Danh sách hình vẽ lu an n va Quá trình khám phá tri thức 2.1 Bước học/huấn luyện 14 2.2 Bước phân loại liệu 14 2.3 2.4 Phân loại liệu dạng học có giám sát 15 CSDL khách hàng AllElectronics dùng cho bước học 16 2.5 2.6 Ví dụ liệu đầu vào 23 Số lần xuất từ email 33 Lớp Spam trước sau Smoothing 33 Lớp Not Spam trước sau Smoothing 34 3.1 Dữ liệu thô bảng điểm học sinh 39 3.2 Dữ liệu sau tổng hợp 41 3.3 3.4 Dữ liệu sau làm 42 Giao diện ứng dụng 47 3.5 3.6 Giao diện nhập liệu kết dự báo 48 Kết Test 100 ghi liệu 49 3.7 Kết Test 100 ghi liệu (tiếp theo) 2.7 2.8 w p ie gh tn to 1.1 d oa nl nf va an lu z at nh oi lm ul 50 z m co l gm @ an Lu n va ac th si vii Danh sách bảng lu an n va Tần suất đặc trưng buys_computer 18 2.2 2.3 Tần suất đặc trưng age 18 Tần suất đặc trưng income 19 2.4 2.5 Tần suất đặc trưng student 19 Tần suất đặc trưng student 19 2.6 Kết xét tuyển vào 10 24 gh tn to 2.1 p ie 2.7 2.8 Xác suất thuộc tính nơi ở, điểm vào 10, kinh tế, giới tính 25 Dữ liệu việc học muộn học sinh 28 oa nl w 2.9 Dữ liệu việc học muộn học sinh 28 2.10 Tần suất đặc trưng Sức khỏe 29 d 2.11 Tần suất đặc trưng Thời tiết 29 nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si MỞ ĐẦU Lý chọn đề tài Trong trình hoạt động, người tạo nhiều lu liệu nghiệp vụ Các tập liệu tích lũy có kích thước ngày lớn, chứa nhiều thông tin ẩn dạng quy luật chưa an n va khám phá Chính vậy, nhu cầu đặt cần tìm cách trích rút từ tập liệu luật phân lớp liệu hay dự đoán to tạo phục vụ đắc lực cho hoạt động thực tiễn, phục vụ đắc lực cho trình nghiên cứu khoa học Công nghệ phân lớp p ie gh tn xu hướng liệu tương lai Những quy tắc nghiệp vụ thông minh nl w dự đoán liệu đời để đáp ứng mong muốn [1] oa Cơng nghệ phân lớp liệu đã, phát triển mạnh mẽ trước d khao khát tri thức người Trong năm qua, phân lớp liệu thu hút quan tâm nhà nghiên cứu nhiều nf va an lu lm ul lĩnh vực khác học máy (machine learning), hệ chuyên gia (expert systems), thống kê (statistics), Công nghệ ứng dụng z at nh oi nhiều lĩnh vực thực tế như: thương mại, nhà băng, maketing, nghiên cứu thị trường, bảo hiểm, y tế, giáo dục [1] Có nhiều phương pháp dự báo khác Hiện nay, việc sử dụng z phương pháp học máy ứng dụng cho toán dự báo trở nên phổ biến Trong đó, dự báo sử dụng phân lớp Bayes ứng dụng gm @ m co l rộng rãi, công cụ dễ cài đặt, học nhanh, kết dễ hiểu Ví dụ, dự báo giá loại mặt hàng, dự báo tỉ lệ tăng dân số, biết thông tin khứ số điều kiện cho trước [2] an Lu Luận văn nghiên cứu tổng quan kỹ thuật phân lớp liệu n va ac th si 39 lớp học trường THPT Trần Cao Vân, Chư Sê, Gia Lai, với 829 học sinh (tương ứng 829 ghi liệu loại điểm số môn học cụ thể) 3.1 Mơ tả tốn 3.1.1 Bài tốn Dự đốn kết học tập môn học học sinh học kỳ Thông tin liệu đầu vào Điểm học tập học kỳ học sinh gồm: Điểm miệng (M), kiểm tra thường xuyên (TX), kiểm tra kỳ lu an (GK) điểm cuối kỳ (CK) Dự đoán kết cuối học sinh đạt trình học tập n va gh tn to Dữ liệu thu thập 20 file excel liệu lưu Sổ gọi tên ghi điểm 20 lớp học kỳ năm học 2020-2021 trường THPT Trần Cao Vân, Gia p ie Lai d oa nl w nf va an lu z at nh oi lm ul Hình 3.1: Dữ liệu thơ bảng điểm học sinh z Làm sạch, tiền xử lý liệu gm @ 3.1.2 m co l Dữ liệu cần lấy sổ điểm bảng điểm mơn Tốn (vì mơn Tốn mơn học có số cột điểm nhiều so với mơn học cịn lại nên an Lu lấy liệu môn học để training) Dữ liệu cần lấy bảng điểm mơn Tốn cột điểm chính: điểm Miệng, điểm Thường xuyên 1, n va ac th si 40 điểm Thường xuyên 2, điểm Thường xuyên 3, điểm kỳ điểm cuối kỳ Nhưng trước hết ta cần phải tổng hợp lại thành file chứa điểm mơn Tốn 20 lớp (lưu dạng DataFrame hỗ trợ thư viện Pandas ngôn ngữ lập trình Python) Bước 1: Tổng hợp liệu từ nhiều file # Khai b o th vi ệ n lu import pandas as pd import numpy as np import os an va n # G n đ ng d ẫ n th m ụ c ch ứ a d ữ li ệ u v t ê n Sheet l m vi ệ c tn to path = " / Master_Thesis_Data / " p ie gh sheetName = " Diem_HKII " # G ộ p d ữ li ệ u 20 sheet t 20 file c ầ n l ấ y d ữ li ệ u w oa nl c ù ng th m ụ c frames = [] d in os listdir ( path ) : file endswith ( " xls " ) : file nf va an if lu for filepath = path + file lm ul df1 = pd read_excel ( filepath , z at nh oi sheet_name = sheetName , skiprows = range (5) , skipfooter = , z frames append ( df1 ) m co df = result l result = pd concat ( frames ) gm @ header = None , index_col = 0) an Lu df to_excel ( " Concat_Result xlsx " ) n va ac th si 41 Kết thu tất trường liệu bảng điểm mơn Tốn từ Sổ gọi tên ghi điểm lớp; với số ghi số học sinh lớp lu an n va tn to p ie gh Hình 3.2: Dữ liệu sau tổng hợp nl w Bước Làm liệu file tổng hợp (Chuẩn hoá liệu) oa folder = " / Master_Thesis_Data " d df = pd read_excel ( " Concat_Result xlsx " ) nf va an lu df = df loc [: , [1 , , , , , 12 , 20 , 21]] lm ul df = df rename ( columns = {1: " H ọ v t ê n " , 2: " M " , 3: " TX1 " , 4: " TX2 " , 5: " TX3 " , 12: " GK " , 21: " TBM " }) z at nh oi df = df dropna ( axis = , subset = [ " H ọ v t ê n " ]) df [ " K ế t qu ả " ] = " " z dk = [ gm @ ( df [ " TBM " ] < 3.5) , ( df [ " TBM " ] >= 3.5) & ( df [ " TBM " ] < 5) , l m chon = [ " K é m " , " Y ế u " , " TB " , " Kh " ] co ( df [ " TBM " ] >= 6.5) & ( df [ " TBM " ] < 8) ] an Lu df [ " K ế t qu ả " ] = np select ( dk , chon , default = " Gi ỏ i " ) df to_csv ( " Training_Data csv " , encoding = " utf -8 - sig " ) n va ac th si 42 Kết thu liệu điểm cần phục vụ cho q trình training tốn lu an n va p ie gh tn to d oa nl w Hình 3.3: Dữ liệu sau làm Phân tích tốn z at nh oi Tóm tắt liệu lm ul 3.2.1 nf va an lu 3.2 Thống kê liệu trường kết quả: total () : z def for i in range ( l e n ( TBM ) ) : if XL == " Y " : an Lu sl [0]+=1 m XL == " K " : co if l XL = convert ( f l o a t ( TBM [ i ]) ) gm @ sl =[0 ,0 ,0 ,0 ,0] n va ac th si 43 sl [1]+=1 if XL == " TB " : sl [2]+=1 if XL == " Kh " : sl [3]+=1 if XL == " G " : sl [4]+=1 return sl slXL = total () lu Thống kê liệu đầu vào tính xác suất điểm Miệng: an va def XSM ( Min , XLin ) : n tn to P =0 total_in =1 p ie gh i for in range ( l e n ( TBM ) ) : if XL == XLin : nl w XL = convert ( f l o a t ( TBM [ i ]) ) d oa total_in +=1 lu convert ( f l o a t ( M [ i ]) ) == convert ( f l o a t ( Min ) ) : nf va an if P +=1 return P z at nh oi lm ul P = P / total_in Thống kê liệu đầu vào tính xác suất điểm Thường xuyên: def z XSTX1 ( TXin , XLin ) : @ P =0 for in range ( l e n ( TBM ) ) : XL == XLin : total_in +=1 an Lu if m XL = convert ( f l o a t ( TBM [ i ]) ) co i l gm total_in =1 n va ac th si 44 if convert ( f l o a t ( TX1 [ i ]) ) == convert ( f l o a t ( TXin ) ) : P +=1 P = P / total_in return def P XSTX2 ( TXin , XLin ) : P =0 lu total_in =1 an i for in range ( l e n ( TBM ) ) : va XL = convert ( f l o a t ( TBM [ i ]) ) n XL == XLin : tn to if p ie gh total_in +=1 if nl w convert ( f l o a t ( TX2 [ i ]) ) == convert ( f l o a t ( TXin ) ) : d oa P +=1 return an lu P = P / total_in P nf va lm ul def XSTX3 ( TX3in , XLin ) : total_in =1 for i in range z at nh oi P =0 ( l e n ( TBM ) ) : z XL = convert ( f l o a t ( TBM [ i ]) ) if m co l total_in +=1 gm XL == XLin : @ if an Lu convert ( f l o a t ( TX3 [ i ]) ) == convert ( f l o a t ( TX3in ) ) : n va ac th si 45 P +=1 P = P / total_in return P Thống kê liệu đầu vào tính xác suất điểm Giữa kỳ: def XSGK ( GKin , XLin ) : P =0 total_in =1 i for in range ( l e n ( TBM ) ) : XL = convert ( f l o a t ( TBM [ i ]) ) lu an if XL == XLin : n va total_in +=1 tn to if convert ( f l o a t ( GK [ i ]) ) == convert ( f l o a t ( GKin ) ) : gh p ie P +=1 P = P / total_in P oa nl w return Thống kê liệu đầu vào tính xác suất điểm Cuối kỳ: d lu XSCK ( CKin , XLin ) : nf va an def P =0 for i in range lm ul total_in =1 ( l e n ( TBM ) ) : z at nh oi XL = convert ( f l o a t ( TBM [ i ]) ) if XL == XLin : z total_in +=1 gm @ if convert ( f l o a t ( CK [ i ]) ) == convert ( f l o a t ( CKin ) ) : an Lu P m return co P = P / total_in l P +=1 n va ac th si 46 3.2.2 Phân lớp cho liệu Tiến hành phân lớp liệu dựa liệu có so với liệu đầu vào XL1 =[ " K é m " ," Y ế u " ," Trung B ì nh " ," Kh " ," Gi ỏ i " ] XL =[ " K " ," Y " ," TB " ," Kh " ," G " ] P =[1 ,1 ,1 ,1 ,1] maxs =0 index =0 for j in lu an if range ( l e n ( XL ) ) : a > -1: n va P [ j ]= P [ j ]* XSM (a , XL [ j ]) b > -1: tn to if P [ j ]= P [ j ]* XSTX1 (b , XL [ j ]) gh if p ie c > -1: P [ j ]= P [ j ]* XSTX2 (c , XL [ j ]) d > -1: nl w if e > -1: d if oa P [ j ]= P [ j ]* XSTX3 (d , XL [ j ]) lu if f > -1: nf va an P [ j ]= P [ j ]* XSGK (e , XL [ j ]) 3.2.3 Dự đoán kết z at nh oi lm ul P [ j ]= P [ j ]* XSCK (f , XL [ j ]) Áp dụng kỹ thuật phân lớp Bayesian để dự đoán kết quả: z in range ( l e n (P)): P [ i ] > maxs : m co index = i l maxs = P [ i ] gm if i @ for an Lu n va ac th si 47 3.3 Giao diện chương trình Giao diện chạy ứng dụng: lu an n va ie gh tn to p Hình 3.4: Giao diện ứng dụng w oa nl Sau nhập liệu điểm (mỗi giá trị điểm tương ứng với liệu d theo thời gian) em học sinh cần dự đốn Sau ấn nút nf va an lu lệnh “DỰ BÁO” để xem kết Để thực dự báo khác ta chọn nút lệnh “Dự đốn khác” Giao diện chạy chương trình với liệu nhập vào để khảo sát: Đánh giá kết z at nh oi lm ul 3.4 Ở xét liệu kết dự báo 100 ghi ngẫu nhiên z trường hợp có nửa liệu dự đốn (tức có cột điểm Miệng, điểm Thường xuyên điểm Thường xuyên 2) trường hợp có đầy đủ gm @ co l cột điểm kết thu so với thực tế Hình 3.6 Hình 3.7 m - Trường hợp nhập cột điểm: có 65 kết dự đốn an Lu - Trường hợp nhập cột điểm: có 87 kết dự đoán n va ac th si 48 lu an va n Hình 3.5: Giao diện nhập liệu kết dự báo ie gh tn to Từ kết cho thấy: kết dự đoán phương pháp tốt p đặc biệt số lượng liệu nhiều kết dự đốn cao oa nl w điều sát với thực tế Khi có kết dự đốn, dự báo giúp học sinh giáo viên có định hướng, điều chỉnh việc học tập, d thi cử để có kết tốt Mở rộng nhà quản lý, hoạch định có định, định hướng phù hợp theo thời gian tương nf va lm ul 3.5 an lu lai Kết luận Chương z at nh oi Nội dung Chương trình bày ứng dụng kỹ thuật phân lớp z toán dự báo Đã tiến hành cài đặt ứng dụng liệu điểm thực tế Ứng dụng chứng minh khả áp dụng kỹ thuật phân @ m co chỉnh theo chiều hướng tích cực l gm lớp liệu NB nói chung lĩnh vực khoa học máy tính mà cụ thể phục vụ cho nhu cầu định người, từ định hướng điều an Lu n va ac th si 49 lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ Hình 3.6: Kết Test 100 ghi liệu an Lu n va ac th si 50 lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ Hình 3.7: Kết Test 100 ghi liệu (tiếp theo) an Lu n va ac th si 51 KẾT LUẬN Trong luận văn "Ứng dụng tóm tắt liệu cho toán phân lớp dự báo" đạt số kết sau: lu an ˆ Trình bày khái niệm khám phá tri thức khai phá va n liệu;quá trình khám phá tri thức; phương pháp, kỹ thuật dự báo p ie gh tn to khai phá liệu, tập trung đề cập phương pháp phân lớp dự đốn; tìm hiểu mạng Bayesian nhìn tổng quan tốn w ˆ Đầu chương chúng tơi trình bày kiến thức phân loại liệu oa nl phân loại liệu với mạng Bayesian Phần trọng tâm d đề xuất bước để giải toán dự báo sử dụng kỹ thuật phân lớp liệu NB; cuối chương số ví dụ minh họa cho trường an lu nf va hợp dự báo xảy lm ul ˆ Trong chương sử dụng bước giải đề xuất chương z at nh oi trước để tiến hành cài đặt đánh giá kết liệu thực tế Hạn chế hướng phát triển luận văn: Hướng khắc phục cho vấn z đề xác suất “bằng khơng” ta xử lý theo cách giải ví dụ minh họa mục 2.4.3 sử dụng phương án [9] - [?] Bên gm @ m tốt cho nhiều trường hợp xảy thực tế co l cạnh phát triển phần giao diện thân thiện hơn, đồng thời tiếp cận phương pháp phân lớp khác cho toán để mang lại kết dự báo an Lu n va ac th si 52 Tài liệu tham khảo [1] Katarzyna Kaczmarek-Majer, Olgierd Hryniewicz, "Application of Linguistic Summarization Methods in Time Series", Information Sci- lu ences, no INS 14080, 2018 an va [2] T V T N Châu, "Khai phá liệu", in Chương 4: Phân loại n liệu, Tp Hồ Chí Minh, Khoa Khoa học & kỹ thuật máy tính, Trường to gh tn ĐHBK Tp Hồ Chí Minh, 2011-2012 p ie [3] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Tech- w niques”, Second Edition, Morgan Kaufmann Publishers, 2006 oa nl [4] Graham J Williams, Simeon J Simoff, “Data Mining: Theory, d Methodology, Techniques, and Applications”, Springer-Verlag, 2006 lu nf va an [5] N T T Linh, Nghiên cứu thuật toán phân lớp liệu Dựa định, Hà Nội: Trường ĐH Công Nghệ, 2005 lm ul z at nh oi [6] P H Q Thụy, Bài giảng Khai phá liệu„ Hà Nội: Đại học Công Nghệ-Đại Học Quốc Gia Hà Nội [7] Jiawei Han Micheline Kamber, Khái niệm kỹ thuật khai phá liệu, 2012 z @ gm [8] Duan Li-guo, Di peng*, Li Ai-ping, A New Naive Bayes Text Classifi- co l cation Algorithm, Indonesian Journal of Electrical Engineering, 2014 [9] Đào Đức Anh, Nguyễn Tu Trung, Vũ Văn Thỏa, "Ứng dụng thuật m an Lu toán bayes vấn đề dự báo học lực học sinh phổ thơng,"Tạp chí khoa học CNTT&TT, no Số 01 (CS.01) 2020 , 2020 n va ac th si 53 [10] H A Công, "Nghiên cứu lý thuyết naive bayes ứng dụng Phân loại tài liệu tiếng việt thư viện số" [11] N V Huy, "Thuật toán Bayes ứng dụng,"vol Khóa luận tốt nghiệp, 2009 [12] N B Nam, "Nghiên cứu ứng dụng khai phá liệu chuỗi thời,"2012 [13] Hoàng Thị Lan Giao, Giang Hào Cơn, Nghiên cứu ứng dụng thuật tốn phân lớp vào tốn dự đốn rủi ro tín dụng ngân hàng lu tổ chức tín dụng - Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 2011, pp 7-8 tháng 10 năm 2011 an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si

Ngày đăng: 20/07/2023, 09:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN