Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 44 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
44
Dung lượng
2,69 MB
Nội dung
lOMoARcPSD|18034504 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH TRƯỜNG CƠNG NGHỆ VÀ THIẾT KẾ ĐỒ ÁN MƠN HỌC ĐỀ TÀI: PHÂN TÍCH DỮ LIỆU THU NHẬP CÁ NHÂN DỰA TRÊN BỘ DỮ LIỆU ADULT CENSUS INCOME BẰNG PHẦN MỀM ORANGE Học phần: Khoa Học Dữ Liệu Nhóm Sinh Viên: NGUYỄN THÀNH QUANG - 31201024059 LÊ NGỌC TOÀN - 31201020516 TRẦN NGUYỄN NHẬT TIẾN - 31201020511 Chuyên Ngành: KINH TẾ ĐẦU TƯ Khóa: K46 Giảng Viên: TS Đặng Ngọc Hồng Thành TP Hồ Chí Minh, Ngày 28 tháng 05 năm 2022 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 MỤC LỤC MỤC LỤC CHƯƠNG TỔNG QUAN 1.1 Tổng Quan Về Bài Toán Phân Lớp Dữ Liệu 1.2 Giới Thiệu Về Python Phần Mềm Orange 1.3 Lý Do Chọn Lựa Đề Tài CHƯƠNG CÁC MÔ HÌNH PHÂN LỚP DỮ LIỆU 2.1 Các Mơ Hình Phân Lớp Dữ Liệu 2.1.1 Mơ Hình Logistic Regression 2.1.2 Mơ Hình Decision Tree 2.1.3 Mơ Hình Support Vector Machine 2.1.4 Mơ Hình Neural Network 11 2.2 Quy Trình Phân Lớp Dữ Liệu 11 2.2.1 Phân Chia Dữ Liệu 11 2.2.2 Phân Lớp Dữ Liệu 12 2.2.3 Đánh Giá Tính Hiệu Quả .24 CHƯƠNG CÁC KẾT QUẢ THỰC NGHIỆM 31 3.1 Bộ Dữ Liệu 31 3.2 Các Kết Quả Thực Nghiệm 34 3.3 Phân Tích Đánh Giá 37 CHƯƠNG KẾT LUẬN 41 4.1 Các Kết Quả Đạt Được 41 4.2 Những Hạn Chế Hướng Phát Triển 41 TÀI LIỆU THAM KHẢO 42 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 LỜI CẢM ƠN Đề tài đồ ăn cuối kỳ nhóm hoàn thành, chúng em trải qua nhiều q trình, q trình chúng em ln nhận giúp đỡ tận tình thầy, bạn xung quanh Với tình cảm chân thành sâu sắc, chúng em xin bày tỏ lòng biết ơn đến thành viên nhóm, bạn lớp, bạn sinh viên tham gia làm khảo sát,….đã tạo điều kiện giúp đỡ hết lịng q trình học tập nghiên cứu Đặc biệt, chúng em xin gửi lời cảm ơn chân thành đến thầy Đặng Ngọc Hoàng Thành Trong trình học tập tìm hiểu môn, chúng em nhận quan tâm giúp đỡ, hướng dẫn tận tình, tâm huyết thầy Thầy giúp chúng em tích lũy thêm nhiều kiến thức, tạo điều kiện giúp đỡ hết lòng trình học tập nghiên cứu Thơng qua đồ án cuối kỳ này, chúng em xin trình bày lại mà tích lũy, tiếp thu suốt q trình học tập, nhờ có thầy mà chúng em tiếp cận phần mềm chạy liệu thú vị Orange, phần mềm hữu ích sinh viên khối ngành kinh tế, hành trang bổ ích phục vụ cho công việc chúng em tương lai Nếu khơng nhờ thầy tất bạn đồ án cuối kỳ chúng em khó mà hồn thành Và có lẽ kiến thức vơ hạn mà tiếp nhận kiến thức thân người tồn hạn chế định Đồng thời chúng em gặp khó khăn phải làm việc nhóm online chưa có kinh nghiệm viết luận dạng đồ án cuối kỳ môn Khoa học liệu Do đó, q trình hồn thành đề tài, chắn tránh khỏi thiếu sót Chúng em mong nhận bảo, sửa chữa nhận xét từ thầy để chúng em có điều kiện để bổ sung, nâng cao kiến thức nhằm phục vụ tốt cho lần viết báo cáo tiểu luận Chúng em kính chúc thầy sức khỏe, hạnh phúc thành cơng đường nghiệp giảng dạy Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG TỔNG QUAN 1.1 Tổng Quan Về Bài Toán Phân Lớp Dữ Liệu 1.1.1 Định nghĩa Phân lớp liệu trình phân đối tượng liệu vào hay nhiều lớp (loại) cho trước nhờ mơ hình phân lớp Mơ hình xây dựng dựa tập liệu gán nhãn trước (thuộc lớp nào) Quá trình gán nhãn (thuộc lớp nào) cho đối tượng liệu q trình phân lớp liệu 1.1.2 Quá trình phân lớp liệu Quá trình phân lớp liệu gồm bước chính: Bước 1: Xây dựng mơ hình (hay cịn gọi giai đoạn “học” “huấn luyện”) Dữ liệu đầu vào: liệu mẫu gán nhán tiền xử lý Các thuật toán phân lớp: định, hàm số toán học, tập luật… Kết bước mơ hình phân lớp huấn luyện (trình phân lớp) Bước 2: Sử dụng mơ hình chia thành bước nhỏ: Bước 2.1: Đánh giá mơ hình (kiểm tra tính đắn mơ hình) Dữ liệu đầu vào: tập liệu mẫu khác gán nhãn tiền xử lý Tuy nhiên lúc đưa vào mơ hình phân lớp, ta “lờ” thuộc tính gán nhãn Tính đắn mơ hình xác định cách so sánh thuộc tính gán nhãn liệu đầu vào kết phân lớp mô hình Bước 2.2: Phân lớp liệu Dữ liệu đầu vào: liệu “khuyết” thuộc tính cần dự đốn lớp (nhãn) Mơ hình tự động phân lớp (gán nhãn) cho đối tượng liệu dựa vào huấn luyện bước 1.1.3 Phân loại toán phân lớp Nhiệm vụ toán phân lớp phân đối tượng liệu vào n lớp cho trước Nếu: n = : Phân lớp nhị phân n > 2: Phân lớp đa lớp Mỗi đối tượng liệu thuộc vào lớp nhất: Phân lớp đơn nhãn Mỗi đối tượng liệu lúc thuộc nhiều lớp khác nhau: Phân lớp đa nhãn Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 1.1.4 Các ứng dụng phân lớp liệu kinh tế Tài ngân hàng Dự báo giá chứng khốn Xếp hạng tín dụng cá nhân tổ chức Đánh giá rủi ro tài Sales & Marketing Dự báo doanh thu Dự báo khách hàng trung thành Kinh tế học Dự báo khủng hoảng kinh tế Dự báo cung cầu 1.2 Giới Thiệu Về Python Phần Mềm Orange 1.2.1 Giới thiệu Python Python ngôn ngữ lập trình thơng dịch (interpreted), hướng đối tượng (object-oriented) ngôn ngữ bậc cao (high-level), ngữ nghĩa động (dynamic semantics) Python hỗ trợ module gói (packages), khuyến khích chương trình module hóa tái sử dụng mã Trình thơng dịch Python thư viện chuẩn mở rộng có sẵn dạng mã nguồn dạng nhị phân miễn phí cho tất tảng phân phối tự Đặc điểm Python: Ngữ pháp đơn giản, dễ đọc Vừa hướng thủ tục (procedual-oriented), vừa hướng đối tượng (objectoriented) Hỗ trợ module hỗ trợ gói (package) Xử lý lỗi ngoại lệ (Exception) Kiểu liệu động mức cao Có thư viện chuẩn module ngoài, đáp ứng tất nhu cầu lập trình Có khả tương tác với module khác viết C/C++ (hoặc Java cho Jython, Net cho IronPython) Có thể nhúng vào ứng dụng giao tiếp kịch (scripting interface) 1.2.2 Phần mềm Orange Orange giải pháp phần mềm Self-Service Business Intelligence Software với chức chi phí phù hợp cho doanh nghiệp từ nhỏ vừa (SMEs) tới doanh nghiệp lớn Phần mềm Orange đánh giá cao người dùng lẫn chuyên gia lĩnh vực Business Intelligence Software Orange cung cấp cho người dùng tập toolbox tinh gọn giúp ta bắt tay vào phân tích liệu gồm: Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Data: dùng để rút trích, biến đổi, nạp liệu (ETL process) Visualize: dùng để biểu diễn biểu đồ (chart) giúp quan sát liệu tốt Model: gồm hàm machine learning phân lớp liệu, có Neural Network gồm hyper-parameter để bạn xây dựng nhanh Deep learning Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Evaluate: phương pháp đánh giá mơ hình máy học Unsupervised: gồm hàm machine learning gom nhóm liệu Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 1.3 Lý Do Chọn Lựa Đề Tài Thu nhập cá nhân người trưởng thành thu hút quan tâm nhà nghiên cứu kinh tế mặc quốc gia giàu mạnh, nghèo đói hay khu vực lân cận Có thể nói thu nhập cá nhân người trưởng thành báo quan trọng có ý nghĩa kinh tế để đánh giá mức độ phát triển, mức sống quốc gia, khu vực Thu nhập khác khu vực, thành thị nông thôn Riêng khu vực thành thị, thu nhập khác cá nhân có chênh lệch lớn tạo nên bất bình đẳng xã hộ khu vực thành thị Việc gia tăng thu nhập cá nhân, cải thiện mức sống người dân giảm bất bình đẳng xã hội vấn đề phủ nước quan tâm Nhằm đưa thông tin cần thiết để cải thiện mức thu nhập người dân, nhóm thực nghiên cứu “PHÂN TÍCH DỮ LIỆU THU NHẬP CÁ NHÂN DỰA TRÊN BỘ DỮ LIỆU ADULT CENSUS INCOME BẰNG PHẦN MỀM ORANGE” Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG CÁC MƠ HÌNH PHÂN LỚP DỮ LIỆU 2.1 Các Mơ Hình Phân Lớp Dữ Liệu 2.1.1 Mơ Hình Logistic Regression Hồi quy logistic mơ hình xác suất dự đoán giá trị đầu rời rạc từ tập giá trị đầu vào Thường sử dụng cho phân lớp nhị phân Ứng dụng: o Dự đoán email có phải spam hay khơng o Dự đốn giao dịch ngân hàng gian lận hay không o Dự đốn khối u lành hay ác tính o Dự đốn khoản vay có trả khơng o Dự đốn khoản đầu tư vào start-up có sinh lãi hay khơng 2.1.2 Mơ Hình Decision Tree Theo lý thuyết quản trị, mơ hình Cây định đồ thị định kết kèm nhằm hỗ trợ trình định Trong lĩnh vực khai thác liệu, định phương pháp nhằm mô tả, phân loại tổng quát hóa tập liệu cho trước Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Một tập liệu biểu diễn nhiều định tương ứng Trong đó, (theo nguyên lý Ockham’s Razor) gọn tốt Ưu điểm: o Dễ hiểu o Khơng địi hỏi việc chuẩn hóa liệu o Có thể xử lý nhiều kiểu liệu khác o Xử lý tốt lượng liệu lớn thời gian ngắn Khuyết điểm: o Khó giải tình dữu liệu phụ thuộc thời gian o Chi phí xây dựng mơ hình cao 2.1.3 Mơ Hình Support Vector Machine SVM thuật tốn có giám sát, SVM nhận liệu vào, xem chúng vector không gian phân loại chúng vào lớp khác cách xây dựng siêu phẳng không gian nhiều chiều làm mặt phân cách lớp liệu Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 * Mơ hình SVM: Mức độ nhầm lẫn dự đốn người có thu nhập lớn 50 nghìn la thành người có thu nhập 50 nghìn la 31.6% Mức độ nhầm lẫn dự đoán người có thu nhập 50 nghìn la thành người có thu nhập lớn 50 nghìn la 16.9% * Mơ hình Neural Network: Mức độ nhầm lẫn dự đoán người có thu nhập lớn 50 nghìn la thành người có thu nhập 50 nghìn la 30.5% 29 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Mức độ nhầm lẫn dự đoán người có thu nhập 50 nghìn la thành người có thu nhập lớn 50 nghìn la 19.0% → Dự kết Ma trận nhầm lẫn Confusion Matrix, ta thấy mức độ dự đốn nhầm lẫn mơ hình Decision Tree KẾT LUẬN: Thơng qua việc đánh giá số kiểm định ta thấy mơ hình Decision Tree có số kiểm định tốt nên lựa chọn phù hợp 30 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG CÁC KẾT QUẢ THỰC NGHIỆM 3.1 Bộ Dữ Liệu 3.1.2 Mô tả tổng quát liệu Tên liệu: # Nguồn gốc: Dữ liệu trích xuất từ sở liệu Cục điều tra dân số năm 1994 Ronny Kohavi Barry Becker (Data Mining and Visualization, Silicon Graphics) Đã qua sử dụng: Ron Kohavi, "Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid", Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, 1996 Số mẫu: 35261 Số mẫu sử dụng nghiên cứu này: 500 Bảng thuộc tính: STT Thuộc tính Ý nghĩa Đo lường age Độ tuổi numeric workclass Phân lớp nghề categorical Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked fnlwgt Trọng lượng cuối numeric education Giáo dục categorical Bachelors, Some-college, 11th, HSgrad, Prof-school, Assoc-acdm, Assocvoc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool education.num Sô lớp numeric học marital.status Tình trạng nhân Mô tả categotical Married-civ-spouse, Divorced, Nevermarried, Separated, Widowed, Marriedspouse-absent, Married-AF-spouse 31 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 occupation Nghề nghiệp categorical Tech-support, Craft-repair, Otherservice, Sales, Exec-managerial, Profspecialty, Handlers-cleaners, Machineop-inspct, Adm-clerical, Farmingfishing, Transport-moving, Priv-houseserv, Protective-serv, Armed-Forces relationship Các mối categorical Wife, Own-child, Husband, Not-inquan hệ family, Other-relative, Unmarried race Sắc tộc categorical White, Asian-Pac-Islander, Indian-Eskimo, Other, Black 10 sex Giới tính categorical Female, Male 11 capital.gain categorical 12 capital.loss numeric 13 hours.per.week Số numeric làm việc tuần 14 native.country Quốc tịch categorical United-States, Cambodia, England, Puerto-Rico, Canada, Germany, Outlying-US(Guam-USVI-etc), India, Japan, Greece, South, China, Cuba, Iran, Honduras, Philippines, Italy, Poland, Jamaica, Vietnam, Mexico, Portugal, Ireland, France, Dominican-Republic, Laos, Ecuador, Taiwan, Haiti, Columbia, Hungary, Guatemala, Nicaragua, Scotland, Thailand, Yugoslavia, El-Salvador, Trinadad&Tobago, Peru, Hong, HolandNetherlands 15 income Thu nhập categorical 50K Amer- 32 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 3.1.2 Tiền xử lý liệu Trong nghiên cứu này, nhóm tác giả sử dụng phương pháp xử lý liệu xử lý liệu bị thiếu Xử lý liệu bị thiếu (missing data): Là liệu khơng có sẵn, khơng đủ cần sử dụng Nguyên nhân: Khách quan (không tồn lúc nhập liệu, cố, …) Chủ quan (tác nhân người) Giải pháp cho liệu bị thiếu Bỏ qua liệu bị thiếu Xử lý tay (không tự động, bán tự động) Dùng giá trị thay (tự động): số tồn cục, trị phổ biến nhất, trung bình tồn cục, trung bình cục bộ, trị dự đốn, … Ngăn chặn liệu bị thiếu: thiết kế tốt CSDL thủ tục nhập liệu (các ràng buộc liệu) → Quan sát liệu từ liệu, nhóm tác giả định bỏ qua liệu bị thiếu để xây dựng mơ hình phần mềm Orange Mining → Lý bỏ qua liệu khuyết số liệu bị thiếu số ít, dùng liệu gốc kết chân thật so với thực tế Xây dựng mơ hình xử lý liệu Preprocess: Kết thu được: 33 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Sau xử lý liệu bị khuyết từ liệu ban đầu gồm 500 mẫu, lưu lại liệu bao gồm 466 mẫu tiến hành chạy phân tích mơ hình nghiên cứu 3.2 Các Kết Quả Thực Nghiệm Sử dụng mô hình Decision Tree để phân lớp liệu tiến hành dự đoán mức lương: 34 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 35 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Kết dự đốn mơ hình Decision Tree: 36 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 3.3 Phân Tích Đánh Giá Mức độ phù hợp: o So với mơ hình khác: So với mơ hình cịn lại Decision Tree có số AUC, Recall, Precision cao mơ hình cịn lại o Mức phù hợp cùa mơ hình Decision Tree: Có đường cong ROC tiệm cận với khoảng (0;1), TPR cao so với FPR, diện tích AUC lớn o Độ nhầm lẫn: Mức độ dự đoán nhầm lẫn thấp so với độ nhầm lẫn mô hình khác cịn cao cần cải thiện độ xác 37 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 o Tuy nhiên mơ hình Cây định chưa tinh gọn hiệu theo ngun lý Ockham’s Razor, mơ hình chưa thực tốt liệu mà cịn mơ hình khác hiệu So sánh kết dự đoán thu nhập với liệu thực liệu: 38 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 39 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Qua so sánh ta thấy mức độ xác dự đốn cao, chi có dự đốn nhầm lẫn Có nhiều gun nhân dẫn đến đánh giá nhầm lẫn: mơ hình chưa đánh giá xác, khách quan nỗ lực cơng việc người điều tra, nhập liệu cịn sai sót… Đánh giá mơ hình: Thơng qua số kiểm định ý nghĩa rủi ro thực tiễn qua ma trận nhầm lẫn kết luận sử dụng Mô hình Decision Tree hiệu với mức độ kiểm định cao độ nhầm lẫn dự đốn so với thực tế liệu 40 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG KẾT LUẬN 4.1 Các Kết Quả Đạt Được Sau triển khai mơ hình phân tích đánh giá liệu ta thể hiệu mơ hình dự đốn thu nhập dựa thuộc tính sẵn có người dân, hỗ trợ cho việc dự báo mức sống người dân Từ thực nghiên cứu sâu dân số, đề kế hoạch, sách nâng cao mức sống người dân thúc đẩy tăng trưởng kinh tế quốc gia Do mang tính chất dự đốn, dự báo nên sử dụng mơ hình muốn khái quát mức sống dân số, thuộc tính khác cần trước có số liệu khảo sát mức sống cụ thể Ngồi phát triển mơ hình để ứng dụng vào nhiều lĩnh vực khác bao gồm kinh tế, xã hội… Tuy mức độ xác cao mơ hình cịn có hạn chế định cần phải có nhiều liệu thuộc tính khác để dự báo xác, tính xác cao so sánh với thực tế lại bị sai lệch trở thành “dữ liệu ảo” khơng sử dụng được… Vì mà cần phải phát triển cải thiện nhiều mặt lẫn liệu thu lẫn tính hữu dụng thực tế mơ hình phần lớp, dự báo 4.2 Những Hạn Chế Hướng Phát Triển 4.2.1 Hạn chế Trong trình thực nghiên cứu đề tài, nhóm cố gắng hồn thành mục tiêu ban đầu đặt ra, nhiên với kinh nghiệm nghiên cứu chưa có nhiều vốn kiến thức cịn hạn chế bên canh thời gian nghiên cứu ỏi nên đề tài chắn không tránh khỏi thiếu sót: Thứ nhất, thời gian nhóm bắt đầu thực dự án gấp rút nên việc chọn liệu ban đầu không suy xét kỹ lưỡng Dữ liệu nhóm thu thập phần lớn phục vụ mục đích trau dồi kỹ chạy phân tích liệu phần mềm Orange chưa có ý nghĩa nhiều mặt thực tiễn Thứ hai, dự án nhóm thực ba sinh viên năm hai khơng phải chuyên gia lĩnh vực nên thiên hướng phân tích chủ quan cịn nhiều chắn khơng tránh khỏi sai sót cách trình bày, cách chạy phân tích liệu cách sử dụng ngơn từ cịn thiếu chun nghiệp 4.2.2 Hướng phát triển nghiên cứu Nhóm trau dồi thêm kĩ phân tích liệu phần mềm Orange để dự án sau đa dạng kiến thức Định hướng cách tìm liệu sau phân tích có ý nghĩa thực tiễn hơn, hạn chế tìm liệu có liệu trống nhiều để tối ưu thời 41 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 gian phần tiền xử lý liệu Học cách diễn giải câu từ cách trình bày dự án cách chỉnh chu khoa học 42 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 TÀI LIỆU THAM KHẢO Bộ liệu: Adult Census Income [1] Oded Maimon, Lior Rokach, “Data Mining and Knowledge Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010 [2] Hillol Kargupta, Jiawei Han, Philip S Yu, Rajeev Motwani, and Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis Group, LLC, 2009 [3] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006 [4] Daniel T Larose, “Data mining methods and models”, John Wiley & Sons, Inc, 2006 [5] R Xu, D Wunsch II Survey of Clustering Algorithms IEEE Transactions on Neural Networks, 16(3), May 2005, pp 645-678 43 Downloaded by vu ga (vuchinhhp2@gmail.com) ... tin cần thiết để cải thiện mức thu nhập người dân, nhóm thực nghiên cứu “PHÂN TÍCH DỮ LIỆU THU NHẬP CÁ NHÂN DỰA TRÊN BỘ DỮ LIỆU ADULT CENSUS INCOME BẰNG PHẦN MỀM ORANGE? ?? Downloaded by vu ga (vuchinhhp2@gmail.com)... Bài Toán Phân Lớp Dữ Liệu 1.2 Giới Thiệu Về Python Phần Mềm Orange 1.3 Lý Do Chọn Lựa Đề Tài CHƯƠNG CÁC MƠ HÌNH PHÂN LỚP DỮ LIỆU 2.1 Các Mơ Hình Phân Lớp Dữ Liệu ... Nhóm trau dồi thêm kĩ phân tích liệu phần mềm Orange để dự án sau đa dạng kiến thức Định hướng cách tìm liệu sau phân tích có ý nghĩa thực tiễn hơn, hạn chế tìm liệu có liệu trống nhiều để tối