Trong lý thuyết quyết định một cây quyết đinh là một đồ thị các quyết định và các hậu quả của nó. Cây quyết định là cấu trúc biểu diễn dưới dạng cây trong đó mỗi nút biểu diễn một thuộc tính, nhánh biểu diễn giá trị có thể của thuộc tính, mỗi lá biểu diễn các lớp quyết định và đỉnh trên cùng của cây gọi là gốc....
Mục Lục Trang I TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH 1.Giới thiệu chung 2.Các kiểu định 3.Ví dụ định 4.Ưu điểm định II CẤU TRÚC CỦA CÂY QUYẾT ĐỊNH Gới thiệu chung Suy diễn định III.Kết Luận 13 Nội Dung I.TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH 1.Giới thiệu chung Trong lý thuyết định, định đồ thị định hậu (bao gồm rủi ro hao phí tài nguyên) Cây định cấu trúc biểu diển dạng Trong đó, nút biểu diễn thuộc tính, nhánh biểu diễn giá trị có thuộc tính, biểu diễn lớp định đỉnh gọi gốc Cây định dùng để phân lớp cách xuất phát từ gốc di chuyển theo nhánh gặp nút Trên sở phân lớp chuyển đổi luật định Cây định sử dụng để xây dựng kế hoạch nhằm đạt mục tiêu mong muốn Các định dùng để hỗ trợ đưa định Cây định dạng đặc biệt cấu trúc Tạo định q trình phân tích sở liệu, phân lớp đưa dự đoán Cây định tạo thành cách chia tập liệu thành tập liệu con, tập liệu tạo thành chủ yếu từ phần tử lớp Lựa chọn thuộc tính để tạo nhánh thông qua Entropy Gain Học định phương pháp thông dụng khai phá liệu, định mơ tả cấu trúc cây, đó, đại diện cho phân loại cành đại diện cho kết hợp thuộc tính dẫn tới phân loại Một định học cách chia tập hợp nguồn thành tập dựa thó kiểm tra giá trị thuộc tính Qúa trình lặp lặp lại cách đệ quy cho tập dẫn xuất, q trình đệ quy hồn thành tiếp tục việc chia tách nữa, hay phân loại đơn áp dụng cho phần tử tập dẫn xuất Cây định mơ tả kết hợp kĩ thuật tính tốn tốn học nhằm hỗ trợ việc mơ tả, phân loại tổng quát hóa tập liệu cho trước Dữ liệu cho dạng ghi có dạng:(x, y)=(x1,x2,x3 xn,y), biến phụ thuộc vào y mà cần tìm hiểu, phân loại hay tổng qt hóa x1,x2,x3 biến giúp ta thực công việc 2.Các kiểu định - Cây hồi quy: ước lượng hàm có giá trị thay sử dụng cho nhiệm vụ phân loại(ví dụ: ước tính giá trị ngơi nhà) _Cây phân loại: y biến phân loại : giới tính(nam hay nữ), kết trận thi đấu 3.Ví dụ định Chúng ta xét ví dụ sau: Mr Hùng quản lý câu lạc golf Anh muốn biết có đến chơi khơng đến chơi, có ngày người đến chơi đơng, có ngày lại Mr Hưng cần tối ưu hóa mục tiêu ngày nhân viên cách dựa theo thơng tin dự báo thời tiết để đốn xem người ta đến chơi golf không đến chơi Trong tuần Mr Hùng thu thập thông tin về: Quang cảnh, nẳng, mưa, nhiểu mây Nhiệt độ , độ ẩm Gio mạnh hay không Mr Hung thu liệu sau: DỮ LIỆU CHƠI GOLF CÁC BIẾN ĐỘC LẬP BIẾN PHỤ THUỘC Qang cảnh Nhiệt độ Độ ẩm Gío Chơi Nắng Nóng Cao Nhẹ Khơng Nắng Nóng Cao Mạnh Khơng Âm u Nóng Cao Nhẹ Có Mưa Âm áp Cao Nhẹ Có Mưa Mát Trung bình Nhẹ Có Mưa Mát Trung bình Mạnh Khơng Âm u Mát Trung bình Mạnh Có Nắng Ấm áp Cao Nhẹ Khơng Nắng Mát Trung bình Nhẹ Có Mưa Ấm áp Trung bình Nhẹ Có Nắng Âm áp Trung bình Mạnh Có Âm u Âm áp Cao Nhẹ Có Âm u Âm áp Cao Mạnh Có Mưa Ấm áp Cao Mạnh Khơng Sau người ta đưa mơ hình để giải tốn Mr Hưng sau: Cây định mơ hình liêu phân bố nhãn lớp theo thuộc tính dùng để dự đốn Nút gốc đại diện cho tồn liệu, thuật tốn phân loại nhằm phát cách tốt để giải thích biến phụ thuộc chơi, sử dụng quang cảnh Phân loại theo giá trị biến quang cảnh ta có nhóm sau:Người chơi golf trời nắng, nhóm chơi trời nhiều mây, nhóm chơi trời mưa Kết luận: trời nhiều mây tức âm u, người ta luôn chơi golf, có số người chơi golf trời mưa Tiếp theo, ta lại chia nhóm trời nắng thành nhóm con, ta thấy khách hàng khơng muốn chơi nhiệt độ cao Cuối ta chia nhóm trời mưa thành hai thấy khách hàng khơng chơi vào hơm trời mưa có gió 4.Ưu điểm định -Cây định dể hiểu: người ta hiểu mơ hình định sau giải thích ngắn -Việc chuẩn bị liệu cho định không cần thiết, kỹ thuật khác đòi hỏi chuẩn hóa liệu, cần tạo biến phụ loại bỏ giá trị rỗng -Cây định xử lý liêu có số va liệu có giá trị tên thể loại, kỹ thuật khác thường xuyên để phân tích liệu gồm loại biến.Chẳng hạn quy luật quan hệ dùng cho biến tên, mạng nơ-ron dùng cho biến có gí trị số -Cây định mơ hình hộp trắng, mạng nơ-ron ví dụ mơ hình hộp đen lời giải thích cho kết phức tạp hiểu -Có thể thẩm định mơ hình cách kiểm tra thống kê Điều làm cho người ta tin tưởng vào mơ hình -Cây định xử lý lượng liệu lớn thời gian ngắn, dùng máy tính cá nhân để phân tích lượng liệu lớn thời gian ngắn để đưa chiến lược định dựa phân tích định II CẤU TRÚC CỦA CÂY QUYẾT ĐỊNH Gới thiệu chung Cây định cấu trúc sử dụng để chia liên tiếp tập ghi lớn thành tập ghi nhỏ cách áp dụng chuỗi luật đơn giản Với phép chia liên tiếp tập thi tập kết giống Nó có cấu trúc gồm thành phần sau: -Nhánh: Là biến cố hay chiến lược nối Nút hay Nút Kết -Nút định: điểm biểu diễn hình vng từ phát xuất nhiều nhánh Mỗi nhánh từ nút định chiến lược người định xem xét -Biến cố: điểm định biểu diễn hình tròn từ phát xuất nhiều nhánh, nhánh biến cố xảy -Kết quả: chuỗi chiến lược biến cố tạo thành đường định từ điểm đầu đến điểm cuối Nút bắt đầu Quyết định thứ 1: Chọn Chiến lược hay Chiến lược Theo sau chọn chiến lược Biến cố ngẫu nhiên: Biến cố Biến cố Lúc người định đứng nút định phải thực Quyết định thứ 2: Chọn Chiến lược Chiến lược Sau định thứ biến cố ngẫu nhiên thứ 2: Biến cố Biến cố Tuỳ theo đường chọn, 16 kết Kết cuối (từ CP1 đến CP16) Ví dụ: Như hình vẽ, đường gồm: Chiến lược 1, Biến cố 2, Chiến lược 3, Biến cố dẫn đến Kết CP6 Quyết định tối ưu: cho loại toán chọn chiến lược cho giá trị kỳ vọng tốt ứng với nút Lời giải giả định ấn định giá trị kỳ vọng nút biến cố người định thực định phức tạp dựa nhiều biến cố ngẫu nhiên Suy diễn định Để trình bày cách giải tốn định dựa sơ đồ định, ta khảo sát tốn sau: ‒ Giả sử Cơng ty có trụ sở đặt Tp Hồ Chí Minh muốn kinh doanh máy vi tính miền Bắc miền Trung Nếu kinh doanh miền Trung, Cơng ty khơng có đối thủ cạnh tranh nhu cầu cho thị trường khoảng 100, 200, 300 bộ/tháng Nếu kinh doanh miền Bắc bị cạnh tranh nhu cầu cho thị trường 0, 100, 200 bộ/tháng Số lượng máy vi tính dự định kinh doanh 200 bộ/tháng Giả định giá mua (đầu vào) máy vi tính 3.000.000 đ, giá bán 5.000.000 đ Hình 3.6 sau sơ đồ định toán: Qua kinh nghiệm nhiều năm kinh doanh thị trường này, người định số xác suất cho biến cố 10 Người định dùng giá trị kỳ vọng (EMV) làm tiêu chuẩn định Do vậy, ta cần tính giá trị kỳ vọng chiến lược kinh doanh máy tính miền Bắc hay miền Trung Lưu ý: Trong lý thuyết xác suất, giá trị kỳ vọng hay giá trị mong đợi, trung bình (mean) biến ngẫu nhiên trung bình có trọng số tất 11 giá trị biến đó, tính tổng tích xác suất xảy giá trị biến với giá trị Nếu X biến ngẫu nhiên rời rạc với giá trị x1 , x2 , xác suất tương ứng p1 , p2 với tổng 1, giá trị kỳ vọng E[X] tính tổng chuỗi: E[X] = ∑pixi Ta có: EMV(S1: Kinh doanh miền Trung)= 0,5(100.000.000)+0,4(400.000.000) + 0,1(600.000.000) = 170.000.000 đ Đối với kinh doanh miền Bắc, ta tính EMV biến cố “có đối thủ” “khơng có đối thủ” sau: EMV(E1: Có đối thủ) = 0,1(-600.000.000) + 0,5(-100.000.000) + 0,4(400.000.000) = 50.000.000 đ EMV(E2: khơng có đối thủ) = 0,4(100.000.000) + 0,5(400.000.000) + 0,1(600.000.000) = 300.000.000 đ Do vậy: EMV(S2: Kinh doanh miền Bắc) = = 0,3(50.000.000) + 0,7(300.000.000) = 225.000.000 đ Quyết định tối ưu theo hướng S2 mang lại kết cao S1 – Phương pháp phân tích sử dụng tốn định phương pháp “suy diễn lùi” Theo đó, để thẩm định chiến lược thiết phải khảo sát tất chiến lược biến cố sau xuất phát từ chiến lược Do vậy, biến cố nút định sau phân tích trước Sau lần ngược lên nút trước để hướng nút Dùng kỹ thuật này, ta thiết lập lựa chọn tối ưu cho kết cách duyệt sơ đồ 12 III.Kết Luận Cây định sử dụng để xây dựng kế hoạch nhằm đạt mục tiêu mong muốn Các định dùng để hỗ trợ đưa định Cây định dạng đặc biệt cấu trúc Qua phần tìm hiểu định thành viên nhóm nắm bắt hiểu tổng quan định, định nghĩa, kiểu định ưu nhược điểm định, thành phần cấu trúc định gồm thành phần: - Nhánh -Nút định -Biến cố -Kết Trong trình làm Phần làm nhóm chúng em nhiều thiếu sót kính mong thầy đưa nhận xét tập hoàn thiện hơn, e xin chân thành cảm ơn 13 ... III.Kết Luận Cây định sử dụng để xây dựng kế hoạch nhằm đạt mục tiêu mong muốn Các định dùng để hỗ trợ đưa định Cây định dạng đặc biệt cấu trúc Qua phần tìm hiểu định thành viên nhóm nắm bắt hiểu tổng... chia nhóm trời nắng thành nhóm con, ta thấy khách hàng không muốn chơi nhiệt độ cao Cuối ta chia nhóm trời mưa thành hai thấy khách hàng không chơi vào hôm trời mưa có gió 4.Ưu điểm định -Cây. .. cố Biến cố Tuỳ theo đường chọn, 16 kết Kết cuối (từ CP1 đến CP 16) Ví dụ: Như hình vẽ, đường gồm: Chiến lược 1, Biến cố 2, Chiến lược 3, Biến cố dẫn đến Kết CP6 Quyết định tối ưu: cho loại toán