Giới thiệu về mơ hình Cây quyết định

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng chatbot cho cổng thông tin điện tử thành phố bà rịa (Trang 36 - 39)

Chƣơng 3 TỔNG QUAN VỀ MÁY HỌC VÀ CÂY QUYẾT ĐỊNH

3.2. Mơ hình cây quyết định

3.2.1. Giới thiệu về mơ hình Cây quyết định

Trong cuộc sống hàng ngày, chúng vẫn đang sử dụng mơ hình “Cây quyết định” để giải quyết các cơng việc hàng ngày. Ví dụ, khi vào siêu thị mua thịt cho bữa ăn trong gia đình. Câu hỏi đầu đầu tiên trong ta là: Cần mua bao nhiêu thịt? Lúc đó bản thân sẽ xác định: Nếu là ngày thường thì gia đình sẽ sử dụng khoảng 1 kg thịt, cịn cuối tuần thì sẽ là 1,5 kg. Như vậy, dựa theo ngày, ta sẽ quyết định lượng thực phẩm cần mua cho gia đình [12].

Đó chính là một dạng của mơ hình cây quyết định nhị phân.

Cây quyết định là một cấu trúc giống như lưu đồ, trong đó mỗi nút bên trong đại diện cho một “phép thử” trên một thuộc tính (ví dụ: liệu một lần lật đồng xu

xuất hiện ngửa hay sấp), mỗi nhánh đại diện cho kết quả của thử nghiệm và mỗi nút lá đại diện cho một nhãn lớp (quyết định được thực hiện sau khi tính tốn tất cả các thuộc tính). Các đường dẫn từ gốc đến lá đại diện cho các quy tắc phân loại.

Trong phân tích quyết định, cây quyết định và sơ đồ ảnh hưởng có liên quan chặt chẽ được sử dụng như một công cụ hỗ trợ ra quyết định trực quan và phân tích, nơi các giá trị mong muốn của các lựa chọn thay thế cạnh tranh được tính tốn [35], [22].

Đặc điểm của cây quyết định: là một cây có cấu trúc, trong đó (hình 3.7): + Root (Gốc): Nút trên cùng của cây.

+ Node trong: nút trung gian trên một thuộc tính đơn. + Nhánh: Biểu diễn các kết quả của kiểm tra trên nút.

+ Node lá: Biểu diễn lớp hay sự phân phối lớp (hình vng hoặc chữ nhật).

Hình 3.7. Cấu trúc Cây quyết định

Hình 3.8. Mơ hình cây quyết định chơi hay không chơi Tennis (Nguồn https://nulpointerexception.com/2017/12/16/a-tutorial-to- (Nguồn https://nulpointerexception.com/2017/12/16/a-tutorial-to-

understand-decision-tree-id3-learning-algorithm)

Cây quyết định được sử dụng có hai loại chính [22]:

+ Phân loại (Classification) (hình 3.9):

Các ví dụ mơ hình nêu ở trên là một ví dụ về cây phân loại, trong đó kết quả là một biến như “phù hợp” hoặc “không phù hợp”. Ở đây biến quyết định là phân loại.

Một cây như vậy được xây dựng thông qua một quá trình được gọi là phân vùng đệ quy nhị phân . Đây là một quá trình lặp đi lặp lại của việc chia nhỏ dữ liệu thành các phân vùng , sau đó chia nhỏ dữ liệu ra từng nhánh.

Hình 3.9. Ví dụ về cây phân loại

+ Hồi quy (Regression) (hình 3.10): Cây quyết định trong đó biến mục tiêu

có thể nhận các giá trị liên tục (thường là số thực) được gọi là cây hồi quy (ví dụ giá của một ngơi nhà, hoặc thời gian bệnh nhân nằm viện).

Hình 3.10. Ví dụ về cây hồi quy

(Nguồn https://machinelearningmastery.com/classification-and-regression-trees- for-machine-learning/)

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng chatbot cho cổng thông tin điện tử thành phố bà rịa (Trang 36 - 39)

Tải bản đầy đủ (PDF)

(103 trang)