1. Trang chủ
  2. » Giáo Dục - Đào Tạo

hệ thống thông minh cây quyết định

22 55 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • I. MỞ ĐẦU VỀ PHÂN LỚP DỮ LIỆU:

  • II. TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH:

    • 1. Giới thiệu chung

    • 2. Các loại Cây Quyết Định

    • 3. Ví Dụ:

  • III. ƯU VÀ KHUYẾT ĐIỂM CỦA CÂY QUYẾT ĐỊNH:

    • 1. Ưu điểm:

    • 2. Khuyết điểm:

  • IV. XÂY DỰNG CÂY QUYẾT ĐỊNH:

    • 1. Chọn thuộc tính phân tách

    • 2. Phép kiểm tra để chọn phép phân tách tốt nhất:

  • V. THUẬT TOÁN XÂY DỰNG CÂY QUYẾT ĐỊNH:

Nội dung

Nhóm 10: Tìm hiểu định BÁO CÁO TÌM HIỂU SERMINA LÝ THUYẾT HỆ THỐNG THÔNG MINH Giáo viên: Hồ Thị Hoàng Vy CÂY QUYẾT ĐỊNH NHÓM 10: Thành viên: 1012145 Nguyễn Hoàng Hiệp 1012210 Tô Trần Hiếu Lâm 1012211 Trần Tiến Lâm 1012196 Phạm Đăng Khoa Nhóm 10: Tìm hiểu định I II MỞ ĐẦU VỀ PHÂN LỚP DỮ LIỆU: TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH: Giới thiệu chung Các loại Cây Quyết Định Ví Dụ: III ƯU VÀ KHUYẾT ĐIỂM CỦA CÂY QUYẾT ĐỊNH: Ưu điểm: Khuyết điểm: IV XÂY DỰNG CÂY QUYẾT ĐỊNH: 10 Chọn thuộc tính phân tách 10 Phép kiểm tra để chọn phép phân tách tốt nhất: 12 V THUẬT TOÁN XÂY DỰNG CÂY QUYẾT ĐỊNH: 14 Thuật Toán CLS 15 Thuật toán ID3 17 Nhóm 10: Tìm hiểu định I MỞ ĐẦU VỀ PHÂN LỚP DỮ LIỆU: Phân lớp liệu (classification) hướng nghiên cứu khai phá liệu Thực tế đặt nhu cầu từ sở liệu với nhiều thông tin ẩn người trích rút định nghiệp vụ thông minh Phân lớp dự đoán hai dạng phân tích liệu nhằm trích rút mô hình mô tả lớp liệu quan trọng hay dự đoán xu hướng liệu tương lai Phân lớp dự đoán giá trị nhãn xác định (categorical label) hay giá trị rời rạc (discrete value), có nghĩa phân lớp thao tác với đối tượng liệu mà có giá trị biết trước Trong đó, dự đoán lại xây dựng mô hình với hàm nhận giá trị liên tục Cây định đánh giá giải phát tốt cho việc phân lớp liệu II TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH: Giới thiệu chung Cây định biểu đồ phát triển có cấu trúc dạng cây, mô tả hình vẽ sau: Nhóm 10: Tìm hiểu định Hình 1: Ví dụ định Trong định: • Gốc: node • Node trong: biểu diễn kiểm tra thuộc tính đơn (hình chữ nhật) • Nhánh: biểu diễn giá trị có thuộc tính • Node lá: biểu diễn lớp hay phân phối lớp (còn gọi lớp định) Cây Quyết Định sử dụng để xây dựng kế hoạch nhằm đạt mục tiêu mong muốn Các định dung để hỗ trợ trình định Cây định dạng đặc biệt cấu trúc Tạo định trình phân tích sở liệu, phân lớp đưa dự đoán Cây định tạo thành cách chia đệ quy tập liệu thành tập liệu con, phần tử tạo thành chủ yếu từ phần tử thuộc lớp Lựa chọn thuộc tính thông qua Entropy Gain Nhóm 10: Tìm hiểu định Học định phương pháp thông dụng khai phá liệu Khi đó, định mô tả cấu trúc cây, đại diện cho phân loại canh đại diện cho kết hợp thuộc tính dẫn tơi phân loại Một định học cách chia tập ngồn thành tập dự theo kiểm tra thuộc tính Quá trình lặp lại cách đệ quy cho tập dẫn xuất Quá trình đệ quy hoàn thành thực việc tiếp tục chia tách nữa, hay phân loại đơn áp dụng cho phần tử tập dẫn xuất Cây định mô tả kết hợp kĩ thuật toán học tính toán nhằm hỗ trợ việc mô tả, phân loại tổng quát tập liệu cho trước Dữ liệu cho dạng ghi có dạng (x,y) =(x1, x2, x3, ….,xk, y) Biến phụ thuộc (dependant variable) y biến mà cúng ta cần tìm hiểu, phân loại hay tổng quát hóa x1, x2, x3, … biến giúp ta thực công việc Các loại Cây Quyết Định Cây định có hai tên khác:  Cây Hồi Quy: (Regreesion Tree) ước lượng hàm có giá trị số thực thay sử dụng cho nhiệm vụ phân loại(ví dụ ước tính giá trị nhà hay thời gian bệnh nhân nằm viện)  Cây Phân Loại: (Classification Tree) Nếu y biến phân loại như: giới tính(nam hay nữ), kết trận đấu (thắng hay thua) Ví Dụ: Ta dùng ví dụ để giải thích định: David quản lý câu lạc đánh golf tiếng Anh ta có rắc rối chuyện thành viên đến hay không đến Có ngày muốn chơi golf số nhân viên câu lạc lại không đủ phục vụ Có hôm, không hiểu lý mà chẳng đến chơi, câu lạc lại thừa nhân viên Mục tiêu David tối ưu hóa số nhân viên phục vụ ngày cách dựa theo thông tin dự báo thời tiết để đoán xem người ta đến chơi golf Để thực điều đó, anh cần hiểu khách hàng định chơi tìm hiểu xem có cách giải thích cho việc hay không Nhóm 10: Tìm hiểu định Vậy hai tuần, thu thập thông tin về: Quang cảnh (outlook), nắng (sunny), nhiều mây (clouded) mưa (raining)) Nhiệt độ (temperature), độ ẩm (humidity) Có gió mạnh (windy) hay không Và tất nhiên số người đến chơi golf vào hôm David thu liệu gồm 14 dòng cột Nhóm 10: Tìm hiểu định Ngày Quang Cảnh Nhiệt độ Độ ẩm Gió Chơi Tennis D1 Nắng Nóng Cao Nhẹ Không D2 Nắng Nóng Cao Mạnh Không D3 Âm u Nóng Cao Nhẹ Có D4 Mưa Ấm áp Cao Nhẹ Có D5 Mưa Mát TB Nhẹ Có D6 Mưa Mát TB Mạnh Không D7 Âm u Mát TB Mạnh Có D8 Nắng Ấm áp Cao Nhẹ Không D9 Nắng Mát TB Nhẹ Có D10 Mưa Ấm áp TB Nhẹ Có D11 Nắng Ấm áp TB Mạnh Có D12 Âm u Ấm áp Cao Mạnh Có D13 Âm u Nóng TB Nhẹ Có D14 Mưa Ấm áp Cao Mạnh Không Sau đó, để giải toán David, người ta đưa mô hình định kiểm tra chơi golf, không chơi Nhóm 10: Tìm hiểu định Cây định mô hình liệu mã hóa phân bố nhãn lớp (cũng y) theo thuộc tính dùng để dự đoán Nút gốc (nút nằm đỉnh) đại diện cho toàn liệu Thuật toán phân loại phát cách tốt để giải thích biến phụ thuộc Chơi (play), sử dụng biến Quang cảnh Phân loại theo giá trị biến Quang cảnh, ta có ba nhóm khác nhau: Nhóm người chơi golf trời nắng, nhóm chơi trời nhiều mây, nhóm chơi trời mưa Kết luận thứ nhất: trời nhiều mây tức âm u, người ta luôn chơi golf Và có số người chơi golf trời mưa Tiếp theo, ta lại chia nhóm trời nắng thành hai nhóm Ta thấy khách hàng không muốn chơi golf độ ẩm cao Cuối cùng, ta chia nhóm trời mưa thành hai thấy khách hàng không chơi golf trời nhiều gió Nhóm 10: Tìm hiểu định Và lời giải ngắn gọn cho toán mô tả phân loại David cho phần lớn nhân viên nghỉ vào ngày trời nắng ẩm, ngày mưa gió Vì chẳng có chơi golf ngày Vào hôm khác, nhiều người đến chơi golf, thuê thêm nhân viên thời vụ để phụ giúp công việc Lưu ý :  Cây định tham gia thuộc tính “Nhiệt độ” thành phần cây, thuộc tính gọi chung thuộc tính dư thừa thuộc tính không ảnh hưởng đến trình xây dựng mô hình  Các thuộc tính tham gia vào trình phân lớp thông thường có giá trị liên tục hay gọi kiểu số (ordered or numeric values) kiểu rời rạc hay gọi kiểu liệu phân loại (unordered or category values) Ví dụ kiểu liệu độ ẩm hay lương biểu diễn số thực kiểu liệu liên tục, kiểu liệu giới tính kiểu liệu rời rạc (có thể rời rạc hóa thuộc tính giới tính cách dễ dàng) Kết luận định giúp ta biến biểu diễn liệu phức tạp thành cấu trúc đơn giản nhiều III ƯU VÀ KHUYẾT ĐIỂM CỦA CÂY QUYẾT ĐỊNH: Ưu điểm: - Khả sinh quy tắc hiểu - Khả thực thi lĩnh vực hướng quy tắc - Dễ dàng tính toán phân lớp - Khả xử lý với thuộc tính liên tục thuộc tính rời rạc - Thể rõ ràng thuộc tính tốt Khuyết điểm: - Dễ xẩy lỗi có nhiều lớp - Chi phí tính toán đắt để đào tạo Nhóm 10: Tìm hiểu định IV XÂY DỰNG CÂY QUYẾT ĐỊNH: Chọn thuộc tính phân tách Lúc khởi đầu, ta có tay tập luyện chứa tập ghi phân loại trước – tức giá trị biến đích xác định tất trường hợp Cây định xây dựng cách phân tách ghi nút dựa thuộc tính đầu vào Rõ ràng nhiệm vụ phải chọn xem thuộc tính đưa phân tách tốt nút Độ đo sử dụng để đánh giá khả phân tách độ tinh khiết Chúng ta có phương pháp xác định để tính toán độ tinh khiết cách chi tiết, nhiên chúng cố gắng đạt hiệu Một phân tách tốt phân tách làm tăng độ tinh khiết tập ghi với số lượng lớn Một phân tách tốt phải tạo nút có kích cỡ tương tự nhau, hay chí không tạo nút có ghi Dữ liệu gốc Phép phân tách Phép phân tách Nhóm 10: Tìm hiểu định Phép phân tách tốt Thuật toán xây dựng định thấu đáo Chúng bắt đầu việc chọn biến đầu vào chưa chọn đo mức độ tăng độ tinh khiết kết ứng với biến Sau phép tách tốt sử dụng phép tách khởi đầu, để tạo hai hay nhiều nút Nếu không phép phân tách có khả (có thể có ghi) phép phân tách làm tăng độ tinh khiết thuật toán kết thúc nút trở thành nút Phép phân tách biến đầu vào kiểu số: phân tách nhị phân biến đầu vào, giá trị mà biến chứa trở thành giá trị dự tuyển Phép phân tách nhị phân dựa biến đầu vào kiểu số có dạng X < N Để cải thiện hiệu năng, số thuật toán không kiểm tra hết toàn giá trị biến mà kiểm tra tập mẫu giá trị biến Phép phân tách biến đầu vào định tính : thuật toán đơn giản việc phân tách biến định tính ứng với giá trị biến đó, ta tạo nhánh tương ứng với lớp phân loại Phương pháp sử dụng thực số phần mềm mang lại hiệu thấp Một phương pháp phổ biến nhóm lớp mà dự đoán kết với Cụ thể, hai lớp biến đầu vào có phân phối biến đích khác giới hạn cho phép hai lớp hợp với Phép phân tách với có mặt giá trị bị thiếu: điểm hay định có khả xử lý giá trị bị thiếu cách coi giá trị rỗng (NULL) nhánh Phương pháp ưa thích so với việc vứt ghi có giá trị thiếu cố gắng gắn giá trị cho nhiều giá trị rỗng có ý nghĩa riêng Mặc dù phép phân tách giá trị rỗng lớp riêng rẽ có ý nghĩa người ta thường đề xuất giải pháp khác Trong khai phá liêu, nút chứa vài luật phân tách thực nút đó, phép phân tách dựa vào biến đầu vào khác Khi giá trị rỗng xuất hiên biến đầu vào phép phân tách tốt nhất, ta sử dụng phép phân tách thay biến đầu vào có phép phân tách tốt thứ hai Nhóm 10: Tìm hiểu định Phép kiểm tra để chọn phép phân tách tốt nhất: - Độ lợi thông tin (Information gain) • Information gain đại lượng sử dụng để chọn lựa thuộc tính với information gain lớn • Cho P N hai lớp S tập liệu có p phần tử lớp P n phần tử lớp N • Khối lượng thông tin cần thiết để định mẫu tùy ý có thuộc lớp P hay N hay không là: Info ( p , n )  Entropy ( p n p p n n , ) log  log pn pn pn pn pn pn • Cho tập {S1, S2 , …, Sv} phân hoạch tập S, sử dụng thuộc tính A • Cho Si chứa pi mẫu lớp P ni mẫu lớp N • Entropy, hay thông tin mong muốn cần thiết để phân lớp đối tượng tất Si là:  Entropy ( A )   i 1 • p i  ni Info ( pi , ni ) pn Thông tin có việc phân nhánh thuộc tính A là: Gain ( A)  Info ( p , n )  Entropy ( A) Ví dụ: Với bảng liệu dự báo thời tiết trên: • Lớp P: Chơi_tennis = “Có” • Lớp N: Chơi_tennis = “Không” • Thông tin cần thiết để phân lớp mẫu cho là: Nhóm 10: Tìm hiểu định In fo ( p , n )  In fo (9 , )  - 9 5 lo g lo g  14 14 14 14  Xét thuộc tính ‘Quang cảnh’ ta có : ○ ‘Quang cảnh’ = ‘Nắng’: Info ([2,3]) = entropy (2/5, 3/5) = – 2/5log2(2/5) – 3/5log2(3/5) = 0.971 ○ ‘Quang cảnh’ = ‘Âm u’: Info ([4,0]) = entropy (1, 0) = – 1log2(1) – 0log2(0) = Do log2(0) nên ta quy ước ○ ‘Quang cảnh’ = ‘Mưa’: Info ([3,2]) = entropy (3/5, 2/5) = – 3/5log2(3/5) – 2/5log2(2/5) = 0.971 ○ Entropy cho phép phân tách thuộc tính « Quang cảnh» : Entropy ( Quang canh )  5 Info (2, 3)  Info (4, 0)  Info (3, 2) 14 14 14 = (5/14) * 0.971 + (4/14) * + (5/14) * 0.971 = 0.694 Do ta có: Gain(Quang canh)  Info(9,5)  Entropy(Quang canh) = 0.940 – 0.694= 0.246  Xét thuộc tính ‘Độ ẩm’ ta có : ○ ‘Độ ẩm’ = ‘Cao’: Info ([3,4]) = entropy (3/7, 4/7) = – 3/7log2(3/7) – 4/7log2(4/7) = 0.985 ○ ‘Độ ẩm’ = ‘Trung bình’: Info ([6,1]) = entropy (6/7, 1/7) = – 6/7log2(6/7) – 1/7log2(1/7) = 0.592 Entropy(Độ ẩm)= 7/14 Info(3,4) + 7/14 Info(6,1) = 7/14* 0.985 + 7/14* 0.592 = 0.789 Nhóm 10: Tìm hiểu định Gian(Độ ẩm) = Info(9,5) – Entropy(Độ ẩm) = 0.940 – 0.798 = 0.151 Tương tự cho thuộc tính lại ta có: Gain (Quang canh )  0.246 Gain ( Do am )  0.151 Gain (Gio)  0.048 Gain ( Nhiet )  0.029 Rõ ràng ban đầu ta chọn thuộc tính ‘Quang cảnh’ để phân tách Sau làm tương tự ta định cuối có dạng : Quang cảnh Nắng Độ ẩm Cao Không V Mưa Âm u Gió Có Mạnh TB Có Không Nhẹ Có THUẬT TOÁN XÂY DỰNG CÂY QUYẾT ĐỊNH: Với tiêu chí xây dựng định ngày đơn giản, cho độ xác phân lớp cao, chi phí thấp, có khả mở rộng,… có nhiều tác giả cho Nhóm 10: Tìm hiểu định đời thuật toán ngày tối ưu Một số thuật toán tiêu biểu sau: Algorithms References CLS(Concept learning System) C I Hovland E B Hunt CART(Classification And Regression Tree) Breiman et al.(1984) ID3(Interactive Dichotomizer 3) Quinlan(1986) C4.5 Quinlan(1993) CHAID (CHi-squared Automatic Interaction Kass(1980) QUEST LohandShih(1997) CAL5 Muller and Wysotzki(1994) FACT Loh LMDT Brodley and Utgoff(1995) T1 Holte(1993) PUBLIC Rastogi and Shim(2000) MARS Friedman(1991) SLIQ (Supervised Learning in Quest) Mehta(1996) SPRINT(A Scalable Parallel Classifier for DataMining) Shafer, Agrawal, Mehta … … and Thuật Toán CLS Tạo nút T, nút gồm tất mẫu tập huấn luyện Nếu tất mẫu T thuộc lớp có thuộc tính định mang giá trị :  “yes” gán nhãn cho nút T "yes" dừng lại T lúc nút  "no” gán nhãn cho nút T "no" dừng lại T lúc nút Trường hợp ngược lại mẫu tập huấn luyện thuộc hai lớp "yes" "no" thì:  Chọn thuộc tính X tập thuộc tính tập mẫu liệu, X Nhóm 10: Tìm hiểu định có giá trị v1, v2, …vn  Chia tập mẫu T thành tập T1, T2,….,Tn chia theo giá trị X  Tạo n nút Ti (i=1,2…n) với nút cha nút T  Tạo nhánh nối từ nút T đến nút Ti (i=1,2…n) thuộc tính X Thực lặp cho nút Ti(i =1,2 n) quay lại bước Ví dụ: Cho tập huấn luyện gồm 14 mẫu, dựa vào thời tiết để xác định người có chơi Tennis hay không?(dữ liệu ví dụ trên) Theo bước thuật toán ta có định sau: Quang Cảnh Nắng T1[D1, D2, D8, D9, D11] T2[D3, D7, D12, D13] Ấm Nóng [D8, D11] Độ ẩm [D9] Có TB Có Mưa T3[D4, D5, D6, D10, D14] Có Nhiệt độ Mát Âm u Gió Nhẹ Mạnh [D1, D2] không Cao không Có không Nhóm 10: Tìm hiểu định Ta nhận thấy bước thuật toán, thuộc tính chọn để triển khai tuỳ ý Nếu ta chọn thuộc tính “Độ ẩm” làm thuộc tính để triển khai T1 ta có khác: Quang Nắng T1[D1, D2, D8, D9, D11] Có T2[D3, D7, D12, D13] Mưa T3[D4, D5, D6, D10, D14] Có Độ ẩm TB Âm u Gió Cao Nhẹ khôn Có Mạnh khôn Do với tập mẫu liệu huấn luyện áp dụng thuật toán CLS với thứ tự chọn thuộc tính triển khai khác nhau, cho có hình dạng khác Việc lựa chọn thuộc tính ảnh hưởng tới độ rộng, độ sâu, độ phức tạp Vì câu hỏi đặt thứ tự thuộc tính chọn để triển khai tốt Vấn đề giải thuật toán ID3 Thuật toán ID3 - Thuật toán ID3 phát biểu tác giả Quinlan (trường đại học Syney, Australia) công bố vào cuối thập niên 70 kỷ 20 Sau đó, thuật toán giới thiệu trình bày mục Induction on decision trees, machine learning năm Nhóm 10: Tìm hiểu định 1986 ID3 xem cải tiến CLS với khả lựa chọn thuộc tính tốt để tiếp tục triển khai bước ID3 xây dựng định từ trênxuống (top -down) ID3 sử dụng độ đo Information Gain để đo tính hiệu thuộc tính phân lớp Trong trình xây dựng định theo thuật toán ID3 bước phát triển cây, thuộc tính chọn để triển khai thuộc tính có giá trị Gain lớn Hàm xây dựng định thuật toán ID3 - Function induce_tree(tập_ví_dụ, tập_thuộc_tính) - begin if ví dụ tập_ví_dụ nằm lớp then return nút gán nhãn lớp else if tập_thuộc_tính rỗng then return nút gán nhãn tuyển tất lớp tập_ví_dụ else begin chọn thuộc tính P, lấy làm gốc cho tại; xóa P khỏi tập_thuộc_tính; với giá trị V P begin tạo nhánh gán nhãn V; Đặt vào phân_vùngV ví dụ tập_ví_dụ có giá trị V thuộc tính P; Gọi induce_tree(phân_vùngV, tập_thuộc_tính), gắn kết vào nhánh V end end - End Áp dụng vào ví dụ ban đầu ta có: - Gọi tập huấn luyện S, số mẫu thuộc lớp Có ký hiệu (+) số mẫu thuộc lớp Không ký hiệu (-), ta có S[9+,5-] tức tập huấn luyện S có 14 mẫu có mẫu thuộc lớp Có mẫu thuộc lớp Không - Để xác định thuộc tính phân lớp ta cần tính Information Gain cho thuộc tính mẫu huấn luyện: o Thuộc tính Quang Cảnh Nhóm 10: Tìm hiểu định Value(QC)={Nắng, Mưa, Âm u} Gọi SNắng tập mẫu có QC=Nắng ta có SNắng=[2+,3-] Tương tự ta có SMưa=[3+,2-], SÂm u=[4+,0-] ( , )= ( )−∑ ắ 0.971 − ×0− − ( ( Â | | ) | | )− ( ) = ( ) = 0.94 − ( )− × × 0.971 ≈ 0.246 Tư tượng thuộc tính Nhiệt độ, Độ ẩm, Gió ta có Gain tương ứng sau: - Gain(S,ND)= 0.029 - Gain(S,DA)= 0.151 - Gain(S,G)= 0.048 Chọn Quang cảnh làm thuộc tính phân lớp có Gain lớn - Vẽ định: Nhóm 10: Tìm hiểu định Quang Cảnh Nắng [D1, D2, D8, D9, D11] S Nắng[2+,3-] ??? Âm u [D3, D7, D12, D13] S Âm u[4+,0-] Có Mưa [D4, D5, D6, D10, D14] S [3+,2-] ??? Do Quang cảnh=Nắng Quang cảnh=Mưa chưa xác định thuộc tính phân lớp nên ta chia tập huấn liệu thành bảng hình tiếp tục tìm thuộc tính phân lớp cho bảng mẫu huấn luyện Kết cuối ta có định sau: Nhóm 10: Tìm hiểu định Quang Cảnh Nắng Âm u [D1, D2, D8, D9, D11] S Nắng[2+,3-] [D3, D7, D12, D13] S Âm u[4+,0-] Độ ẩm Có TB Mưa [D4, D5, D6, D10, D14] S [3+,2-] Gió Cao Nhẹ S TB[2+,0-] S cao[0+,3-] Có khôn S Nhẹ[3+,0-] Có Từ định tạo luật: – R1: IF QC=Âm u THEN Chơi Tennis=Có – R2: IF QC=Nắng AND Độ ẩm=TB THEN Chơi Tennis=Có – R3: IF QC=Nắng AND Độ ẩm=Cao THEN Chơi Tennis=Không – R4: IF QC=Mưa AND Gió=Nhẹ THEN Chơi Tennis=Có – R5: IF QC=Mưa AND Gió=Mạnh THEN Chơi Tennis=Không Mạnh S Mạnh[0+,2-] khôn Nhóm 10: Tìm hiểu định Các Nguồn tham khảo mà nhóm sử dụng trình tìm hiểu đề tài: - Wikipedia - Tài Liệu chuyên đề khai phá liệu_Cây Quyết Định Đại Học Sư Phạm Huế - Đồ án môn học máy học – Lớp Cao học chuyên ngành KHTM – HTTT trường Đại Học Khoa Học Tự Nhiên TP HCM năm 2012 nhóm Hồ Sơn Lâm, Bùi Tuấn Phụng, Đỗ Minh Tuấn, Trần Thị Tuyết Vân, Phan Hoàn Vũ - Cây định với toán phân lớp (Decision Tree with Classification Problem) thây Nguyễn Văn Chức http://bis.net.vn/forums/t/378.aspx ... phối lớp (còn gọi lớp định) Cây Quyết Định sử dụng để xây dựng kế hoạch nhằm đạt mục tiêu mong muốn Các định dung để hỗ trợ trình định Cây định dạng đặc biệt cấu trúc Tạo định trình phân tích... nhận giá trị liên tục Cây định đánh giá giải phát tốt cho việc phân lớp liệu II TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH: Giới thiệu chung Cây định biểu đồ phát triển có cấu trúc dạng cây, mô tả hình vẽ sau:...Nhóm 10: Tìm hiểu định I II MỞ ĐẦU VỀ PHÂN LỚP DỮ LIỆU: TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH: Giới thiệu chung Các loại Cây Quyết Định

Ngày đăng: 29/08/2017, 10:29

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w