Hình 12 minh họa thao tác nhập dữ liệu cho nút lá (Thị trƣờng toàn quốc). Rõ ràng khi dữ liệu hoặc hệ số chắc chắn của nút thay đổi, ta dễ dàng nhập lại đê tạo ra cây quyết định có số liệu thu đƣợc sau xử lý là mới.
Hình 13 : Kết quả bài toán 2 Phân tích kết quả thu đƣợc:
Tất cả các ứng dụng ra quyết định trong điều kiện không chắc chắn đƣợc thực hiện theo những quy trình sau:
Đầu tiên sẽ xác định những khả năng có thể, đánh giá những khả năng có liên quan, và tính toán giá trị kỳ vọng.
bản tóm tắt rủi ro cho những lựa chọn khác nhau. Điều đó sẽ hữu dụng nếu những tiêu chí khác đƣợc xem xét.
Giải thích của cây này là khá đơn giản nếu ta nhận xét rằng mỗi giá trị chỉ dƣới mỗi tên nút là một giá trị kỳ vọng. 807 ở ô B49 là giá trị kỳ vọng cho toàn bộ vấn đề quyết định, có nghĩa là Công ty may Thăng Long sẽ nhận kết quả tốt nhất là 8070 triệu đồng. Sản lƣợng tốt nhất có thể tiêu thụ là 449.000 sản phẩm.
Các giá trị kỳ vọng đã đƣợc tính toán bắt đầu từ bên phải và hoạt động trở lại phía bên trái. Công ty có thể tối ƣu chiến lƣợc bằng cách theo nhánh TRUE từ trái tới phải. Đầu tiên cho bán thử nghiệm sản phẩm mới tại thị trƣờng địa phƣơng, nếu kết quả là tốt, thì sản phẩm sẽ đƣợc bán trên toàn quốc. Tuy nhiên nếu kết quả là khá hoặc tồi thì sản phẩm có thể bị dừng sản xuất. Trong trƣờng hợp thị trƣờng toàn quốc ảm đạm, công ty có thể giảm đƣợc thua lỗ, công ty chịu phí 30 triệu đồng để bán thử tại thị trƣờng địa phƣơng nhƣng thu lại đƣợc 18 triệu hoặc 5.4 triệu đồng.
Nhƣ vậy, cây quyết định ở đây dựa vào suy diễn lùi, nhận giá trị tại các nút lá, và phân tích ngƣợc lên đến kết quả tại gốc của cây.
Với kết quả bài toán 2, có thể quyết định sản lƣợng sản phẩm mới đƣợc sản xuất tại xí nghiệp 1 của công ty. Tuy nhiên, ngoài sản phẩm mới đƣợc công ty ƣu tiên sản xuất trong chiến lƣợc phát triển kinh doanh, xí nghiệp còn sản xuất sản phẩm truyền thống. Căn cứ vào năng lực sản xuất và chỉ tiêu còn lại sau khi thực hiện sản phẩm mới, sản lƣợng sản phẩm truyền thống đƣợc sản xuất đƣợc quyết định trong bài toán 3.
Bài toán 3
Các giá trị bài toán đầu vào, đầu ra nhƣ sau:
Đầu vào:
Để tính toán sản lƣợng sản xuất của nhà máy 1, ngoài sản lƣợng sản xuất của sản phẩm mới, cần xem xét thêm sản phẩm truyền thống đƣợc lên kế hoạch sản xuất cho năm tới.
Xác định sản lƣợng của sản phẩm truyền thống tại Xí nghiệp 1 đƣợc sản xuất trong năm tới là bao nhiêu sản phẩm. Dựa vào các căn cứ để lập kế hoạch sản xuất, nhà quản lý đã đánh giá xác suất xảy ra của các thông tin không chắc chắn về kinh tế thị trƣờng nhƣ bảng 5
Đầu ra: Quyết định sản lƣợng của sản phẩm truyền thống tại xí nghiệp1 đƣợc
sản xuất trong năm tới.
(sản phẩm)
Nhu cầu thị trƣờng xấu
Sản phẩm cạnh tranh bán tốt 300,000
Căn cứ đánh giá tình hình thực hiện kế hoạch năm trƣớc 450000 12% Căn cứ vào kết quả nghiên cứu và dự báo thị trƣờng 700000 30% Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 8%
Sản phẩm cạnh tranh bán xấu 250,000
Năng lực sản xuất còn lại 655600 60%
Căn cứ đánh giá tình hình thực hiện kế hoạch năm trƣớc 450000 15% Căn cứ vào kết quả nghiên cứu và dự báo thị trƣờng 500000 20% Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%
Nhu cầu thị trƣờng tốt
Sản phẩm cạnh tranh bán tốt 200,000
Năng lực sản xuất còn lại 655600 25%
Căn cứ đánh giá tình hình thực hiện kế hoạch năm trƣớc 450000 12% Căn cứ vào kết quả nghiên cứu và dự báo thị trƣờng 500000 60% Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 3%
Sản phẩm cạnh tranh bán xấu 150000
Năng lực sản xuất còn lại 655600 20%
Căn cứ đánh giá tình hình thực hiện kế hoạch năm trƣớc 450000 15% Căn cứ vào kết quả nghiên cứu và dự báo thị trƣờng 700000 60% Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 5%
Bảng 5: Dữ liệu bài toán 3
Bằng việc tự xác định nút gốc, nhánh và các nút là dựa trên bảng trên, sử dụng phần mềm PrecisionTree 5.7 trực tiếp trên bảng tính dữ liệu trên thu đƣợc kết quả:
Hình 14: Kết quả bài toán 3 Đánh giá kết quả thu đƣợc:
Cây quyết định ở đây dựa vào cơ chế suy diễn lùi hay hƣớng từ mục tiêu, hệ thống sẽ lần lƣợt tính toán giá trị kỳ vọng của từng mục tiêu, nhận giá trị tại các nút lá, và phân tích ngƣợc lên đến kết quả tại gốc của cây
Sản lƣợng sản phẩm truyền thống nên sản xuất trong năm tới là 506.120 sản
phẩm. Để đạt đƣợc kết quả trên, cây quyết định có đƣờng đi từ gốc tới nút TRUE ->TRUE nhƣ mũi tên trong hình 13. Ngoài ra, khi lựa chọn nhánh đi từ gốc tới
nút FALSE –>TRUE, hay nút FALSE –> FALSE thì các sản lƣợng kỳ vọng sẽ nhận đƣợc các giá trị khác nhau.
Nhƣ vậy, từ cây quyết định trên, có thể rút ra đƣợc một số luật suy diễn sau:
- IF „NCTTtốt = TRUE‟ AND „SPCTBT=TRUE‟ THEN “ SLSX = 506120 sp”
- IF „NCTTxấu = FALSE‟ AND „SPCTBT=TRUE‟ THEN “SLSX = 351800 sp”
- IF „NCTTxấu = FALSE‟ AND „SPCTBX=FALSE‟THEN “ SLSX = 348360sp” (Với các từ viết tắt: SLSX là số lƣợng sản xuất, NCTT là nhu cầu thị trƣờng, SPCTBX là sản phẩm cạnh tranh bán xấu, SPCTBT là sản phẩm cạnh tranh bán tốt, sp là sản phẩm)
Để quyết định sản lƣợng sản xuất cho xí nghiệp 1 của công ty may Thăng Long, cần tổng hợp kết quả của bài toán 2 và bài toán 3, với yêu cầu sản lƣợng dự kiến sản xuất trong năm tƣơng đƣơng tổng sản lƣợng của sản phẩm mới (SPM) và sản phẩm truyền thống (SPTT).
Tổng hợp:
Nhƣ vậy tổng hợp các bài toán trên có thể xây dựng đƣợc bảng kế hoạch sản xuất kinh doanh cho sản phẩm của Xí nghiệp 1 năm 2007 nhƣ sau:
Đơn vị SX Khách hàng Chủng loại Số tổ SX Năng suất 1 tổ sp /ngày Sản lƣợng SPM/năm Sản lƣợng SPTT/năm Giá bình quân (đ) Doanh thu (1000đ) /năm Tên SL dự kiến/n
Xí nghiệp 1 SAMW 1,000,000 Sơ mi 6 500 449,000 506,120 20.000 2,000,000
Bảng 6: Kế hoạch sản xuất cho một sản phẩm của xí nghiệp 1 3.5. So sánh với cây quyết định khác
Trong môn học Trí tuệ nhân tạo nâng cao đã trình bầy kỹ thuật phân lớp dựa vào cây quyết định. Trong luận văn này sẽ so sánh cây quyết định đƣợc xây dựng bằng công cụ PrecisionTree khi giải các bài toán đƣợc giới thiệu ở trên với cây phân lớp đƣợc học nhƣ sau:
Cây quyết định PrecisionTree Cây quyết định sử dụng phân lớp Phƣơng án 1 Phƣơng Án 2 Tr.Đ Xác suất Tr.Đ Xác suất Chi phí mở đại lý 25 55% 35 65% Chi phí quản lý 15 35% 25 20% Chi phí phát sinh 8 10% 15 15% Sử dụng công cụ hỗ trợ xây dựng cây quyết định PrecisionTree để giải bài toán.
Đầu vào: Các dữ liệu chứa thông tin
không chắc chắn.
Đầu ra: Cây quyết định đƣa ra đƣợc
giá trị kỳ vọng lớn nhất cho bài toán Lấy ví dụ là bài toán 1để so sánh nhƣ sau:
Bảng trên cho thấy chi phí phát triển một sản phẩm tại một thị trƣờng địa phƣơng thử nghiệm đƣợc đánh giá qua 2 phƣơng án. Dữ liệu trên không chắc chắn xảy ra trên thực tế, mà xác suất khả năng xảy ra nhƣ sau: Chi phí mở đại lý ở phƣơng án 1 và 2 là 25 triệu và 35 triệu đồng, chi phí quản lý là 15 triệu đồng và 25 triệu đồng, chi phí phát sinh là 8 triệu và 15 triệu đồng với xác suất tƣơng ứng hay còn gọi hệ số chắc chắn tƣơng ứng là 0.55, 0.35, 0.1 và 0.65, 0.2, 0.15
Dựa trên bảng trên, ta xác định nút gốc, và các nhánh là phƣơng án 1, 2, sử dụng phần mềm PrecisionTree là Add-in trên Excel để xây dựng cây quyết định nhƣ sau:
Sử dụng giải thuật ID3 để tạo cây quyết định từ một tập các mẫu huấn luyện.
Đầu vào: Một tập hợp các ví dụ.
Đầu ra: Cây quyết định có khả năng phân
loại đúng đắn các ví dụ trong tập dữ liệu huấn luyện và có khả năng học.
Lấy ví dụ là bài toán kinh điển nhƣ sau:
Tập dữ liệu này bao gồm 14 ví dụ. Mỗi ví dụ biểu diễn cho tình trạng thời tiết gồm các thuộc tính quang cảnh, nhiệt độ, độ ẩm và gió; và đều có một thuộc tính phân loại, giá trị phân loại ở đây chỉ có hai loại (có, không)
Mỗi thuộc tính đều có một tập các giá trị hữu hạn. Thuộc tính quang cảnh có ba giá trị (âm u, mƣa, nắng), nhiệt độ có ba giá trị (nóng, mát, ấm áp), độ ẩm có hai giá trị (cao, TB) và gió có hai giá trị (mạnh, nhẹ). Các giá trị này chính là ký hiệu (symbol) dùng để biểu diễn bài toán.
Ta áp dụng phƣơng thức tính Entropy để xác định chắc chắn thuộc tính nào đƣợc chọn trong quá trình tạo cây quyết định
Đầu tiên tính độ thuần nhất của tập dữ liệu:
Tại ô bất kỳ trên bảng tính Excel tạo và đặt tên cho nút gốc, từ nút gốc chọn thuộc tính lựa chọn để tạo nhánh, gán giá trị cho mỗi nhánh các thuộc tính chi phí nhƣ bảng trên và tạo các nút lá. Phần mềm xử lý các số liệu và đƣa ra giá trị kỳ vọng lớn nhất cho cây.
Kết quả cây quyết định thu đƣợc
Log2 (5/14) = 0.940
Từ đó tính tiếp Gain cho từng thuộc tính để suy ra thuộc tính nào đƣợc chọn làm nút gốc
Gain(S, Quang cảnh) = Entropy(S) – (5/14)Entropy(SNắng) – (4/14)Entropy(SÂm u) – (5/14) Entropy(SMưa) = 0.246
Tƣơng tự cho các Gain khác:
Gain(S, Nhiệt độ) = 0.029 Gain(S, Độ ẩm) = 0.151 Gain(S, Gió) = 0.048
Ta thấy Gain(S, Quang cảnh) là lớn nhất lấy thuộc tính quang cảnh làm nút gốc
Sau khi lập đƣợc cấp đầu tiên của cây quyết định ta lại xét nhánh Nắng
Tiếp tục lấy Entropy và Gain cho nhánh Nắng ta đƣợc hiệu suất nhƣ sau:
Gain(SNắng, Độ ẩm) = 0.970 Gain(SNắng, Nhiệt độ) = 0.570 Gain(SNắng, Gió) = 0.019
Nhƣ vậy thuộc tính độ ẩm có hiệu suất phân loại cao nhất trong nhánh Nắng ta chọn thuộc tính Độ ẩm làm nút kế tiếp ….
Tƣơng tự nhƣ vậy đối với nhánh còn lại của cây quyết định ta đƣợc cây quyết định hoàn chỉnh nhƣ sau
3.6 Kết luận chƣơng 3
Chƣơng này đã tìm hiểu quy trình lập kế hoạch sản xuất kinh doanh và thực nghiệm việc ứng dụng mô hình cây quyết định với thông tin đầu vào là không chắc chắn, để giải quyết bài toán ra quyết định về sản lƣợng sản xuất của Xí nghiệp 1 thuộc Công ty May Thăng Long.
Do điều kiện thời gian, Chƣơng này chỉ trình bầy phƣơng pháp giải quyết một trong những nội dung của bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp. Kết quả thực nghiệm cho thấy khả năng có thể ra quyết định với thông tin không chắc chắn bằng việc công cụ PrecisionTree trên tập dữ liệu thực tế trong quá trình lập kế hoạch.
Chƣơng này cũng đã so sánh cây quyết định hỗ trợ quá trình ra quyết định bằng việc ứng dụng phần mềm PrecisionTree và cây quyết định đƣợc xây dựng dựa theo các thuật toán ID3, C45 và những phiên bản khác của các thuật toán này.
Kết quả đƣa ra của cây quyết định là giá trị kỳ vọng lớn nhất của bài toán. Và đƣờng đi để đạt đƣợc giá trị lớn nhất đó.
Vậy, có thể đƣa ra một số nhận xét tổng quát nhƣ sau:
- Ngƣời dùng tự phân loại các nút, nhánh dựa trên tri thức, kinh nghiệm của bản thân trên cơ sở dữ liệu của bài toán.
- Thuộc tính của cây chấp nhận giá trị không chắc chắn.
- Dữ liệu của bài toán đƣợc nhập tại nút lá, và xử lý ngƣợc lên và cho kết quả tại nút gốc. Đƣờng đi từ nút gốc đến nút lá là một phƣơng án có thể đƣợc lựa chọn để ra quyết định.
Kết quả đƣa ra là lớp phân loại (có, không) của các thuộc tính tập dữ liệu, và có khả năng huấn luyện để phân lớp các tập dữ liệu tƣơng tự.
Vậy, có thể đƣa ra một số nhận xét tổng quát nhƣ sau:
- Thuật toán tự động tạo các nút và nhánh nhờ kết hợp với việc tính giá trị Entropy(S) và Gain(S,thuộc tính).
- Thuộc tính của cây là các giá trị rời rạc trong tập mẫu.
- Dữ liệu của tập ví dụ đƣợc phân tích để chọn các nút, cho kết quả tại nút lá. Đƣờng đi từ nút gốc đến một nút lá là tập dữ liệu nằm ở lớp đƣợc xác định bởi nút lá.
KẾT LUẬN
Luận văn tập trung khảo cứu lý thuyết về cây quyết định, về thông tin không chắc chắn, về qui trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp và thực hành việc ra quyết định trong lập kế hoạch sản xuất kinh doanh doanh nghiệp với thông tin không chắc chắn bằng việc ứng dụng mô hình cây quyết định.
Do điều kiện thời gian và khuôn khổ cho phép, luận văn mới thực hành xây dựng mô hình cây quyết định phục vụ ra quyết định trong lập kế hoạch sản xuất kinh doanh của một sản phẩm thuộc một Công ty, chƣa bao quát các sản phẩm cũng nhƣ toàn bộ quá trình lập kế hoạch.
Tuy nhiên, những kết quả thu đƣợc chứng tỏ khả năng ứng dụng to lớn của mô hình cây quyết định trong việc xử lý thông tin không chắc chắn, trong việc giúp chuyển đổi quá trình ra quyết định mang tính chủ quan của ngƣời quản lý sang quyết định mang tính khách quan, chính xác hơn.
Những kết quả chính mà luận văn thực hiện đƣợc là:
- Về lý thuyết: Luận văn tập trung tìm hiểu lý thuyết về cây quyết định, thông tin không chắc chắn, quá trình ra quyết định và lập kế hoạch sản xuất kinh doanh của doanh nghiệp.
- Về thực tiễn: Luận văn đã thực nghiệm việc lập một kế hoạch sản xuất cho doanh nghiệp bằng việc ứng dụng mô hình cây quyết định. Kết quả thu đƣợc có thể ứng dụng vào thực tiễn nhằm cải tiến và nâng cao chất lƣợng công tác lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, tƣ vấn cho hoạt động sản xuất kinh doanh của doanh nghiệp
Hƣớng phát triển tiếp theo của luận văn có thể là:
- Tiếp tục nghiên cứu quá trình ra quyết định với thông tin không chắc chắn trong lập kế hoạch phát triển kinh tế xã hội cấp tỉnh và cấp quốc gia bằng việc ứng dụng mô hình cây quyết định.
- Hoàn thiện quy trình ứng dụng mô hình cây quyết định với thông tin không chắc chắn trong việc lập kế hoạch sản xuất kinh doanh doanh nghiệp, giải quyết trọn vẹn bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp nhằm nâng cao chất lƣợng công tác lập kế hoạch và tƣ vấn, hỗ trợ doanh nghiệp.
TÀI LIỆU THAM KHẢO Tiếng Việt:
1. Cao Hào Thi. Giáo trình xác suất thống kê. . Trung Tâm Viện Công Nghệ Châu Á
tại Việt Nam (AITCV) -2008.
2. Đoàn Thị Thu Hà - Nguyễn Thị Ngọc Huyền, Khoa học quản lý tập 1. NXB
Khoa học Kỹ thuật, 2004.
3. Đỗ Thanh Nghị, Giáo trình khai thác dữ liệu, Đại học Cần Thơ – 2008.
4. Đinh Mạnh Tƣờng, Giáo trình trí tuệ nhân tạo, ĐH Công Nghệ -2007.
5. Nguyễn Thị Hồng Thuỷ -Nguyễn Thị Ngọc Huyền, Lý thuyết quản trị kinh doanh – NXB Khoa học Kỹ thuật, 1997.
6. Trần Bình Minh Thực trạng lập kế hoạch sản xuất kinh doanh tại công ty cổ phần
may Thăng Long. Báo cáo chuyên đề, Đại học Kinh tế Quốc dân, 2007.