Bằng việc tự xác định nút gốc, nhánh và các nút là dựa trên bảng trên, sử dụng phần mềm PrecisionTree 5.7 trực tiếp trên bảng tính dữ liệu trên thu đƣợc kết quả:
Hình 14: Kết quả bài toán 3 Đánh giá kết quả thu đƣợc:
Cây quyết định ở đây dựa vào cơ chế suy diễn lùi hay hƣớng từ mục tiêu, hệ thống sẽ lần lƣợt tính toán giá trị kỳ vọng của từng mục tiêu, nhận giá trị tại các nút lá, và phân tích ngƣợc lên đến kết quả tại gốc của cây
Sản lƣợng sản phẩm truyền thống nên sản xuất trong năm tới là 506.120 sản
phẩm. Để đạt đƣợc kết quả trên, cây quyết định có đƣờng đi từ gốc tới nút TRUE ->TRUE nhƣ mũi tên trong hình 13. Ngoài ra, khi lựa chọn nhánh đi từ gốc tới
nút FALSE –>TRUE, hay nút FALSE –> FALSE thì các sản lƣợng kỳ vọng sẽ nhận đƣợc các giá trị khác nhau.
Nhƣ vậy, từ cây quyết định trên, có thể rút ra đƣợc một số luật suy diễn sau:
- IF „NCTTtốt = TRUE‟ AND „SPCTBT=TRUE‟ THEN “ SLSX = 506120 sp”
- IF „NCTTxấu = FALSE‟ AND „SPCTBT=TRUE‟ THEN “SLSX = 351800 sp”
- IF „NCTTxấu = FALSE‟ AND „SPCTBX=FALSE‟THEN “ SLSX = 348360sp” (Với các từ viết tắt: SLSX là số lƣợng sản xuất, NCTT là nhu cầu thị trƣờng, SPCTBX là sản phẩm cạnh tranh bán xấu, SPCTBT là sản phẩm cạnh tranh bán tốt, sp là sản phẩm)
Để quyết định sản lƣợng sản xuất cho xí nghiệp 1 của công ty may Thăng Long, cần tổng hợp kết quả của bài toán 2 và bài toán 3, với yêu cầu sản lƣợng dự kiến sản xuất trong năm tƣơng đƣơng tổng sản lƣợng của sản phẩm mới (SPM) và sản phẩm truyền thống (SPTT).
Tổng hợp:
Nhƣ vậy tổng hợp các bài toán trên có thể xây dựng đƣợc bảng kế hoạch sản xuất kinh doanh cho sản phẩm của Xí nghiệp 1 năm 2007 nhƣ sau:
Đơn vị SX Khách hàng Chủng loại Số tổ SX Năng suất 1 tổ sp /ngày Sản lƣợng SPM/năm Sản lƣợng SPTT/năm Giá bình quân (đ) Doanh thu (1000đ) /năm Tên SL dự kiến/n
Xí nghiệp 1 SAMW 1,000,000 Sơ mi 6 500 449,000 506,120 20.000 2,000,000
Bảng 6: Kế hoạch sản xuất cho một sản phẩm của xí nghiệp 1 3.5. So sánh với cây quyết định khác
Trong môn học Trí tuệ nhân tạo nâng cao đã trình bầy kỹ thuật phân lớp dựa vào cây quyết định. Trong luận văn này sẽ so sánh cây quyết định đƣợc xây dựng bằng công cụ PrecisionTree khi giải các bài toán đƣợc giới thiệu ở trên với cây phân lớp đƣợc học nhƣ sau:
Cây quyết định PrecisionTree Cây quyết định sử dụng phân lớp Phƣơng án 1 Phƣơng Án 2 Tr.Đ Xác suất Tr.Đ Xác suất Chi phí mở đại lý 25 55% 35 65% Chi phí quản lý 15 35% 25 20% Chi phí phát sinh 8 10% 15 15% Sử dụng công cụ hỗ trợ xây dựng cây quyết định PrecisionTree để giải bài toán.
Đầu vào: Các dữ liệu chứa thông tin
không chắc chắn.
Đầu ra: Cây quyết định đƣa ra đƣợc
giá trị kỳ vọng lớn nhất cho bài toán Lấy ví dụ là bài toán 1để so sánh nhƣ sau:
Bảng trên cho thấy chi phí phát triển một sản phẩm tại một thị trƣờng địa phƣơng thử nghiệm đƣợc đánh giá qua 2 phƣơng án. Dữ liệu trên không chắc chắn xảy ra trên thực tế, mà xác suất khả năng xảy ra nhƣ sau: Chi phí mở đại lý ở phƣơng án 1 và 2 là 25 triệu và 35 triệu đồng, chi phí quản lý là 15 triệu đồng và 25 triệu đồng, chi phí phát sinh là 8 triệu và 15 triệu đồng với xác suất tƣơng ứng hay còn gọi hệ số chắc chắn tƣơng ứng là 0.55, 0.35, 0.1 và 0.65, 0.2, 0.15
Dựa trên bảng trên, ta xác định nút gốc, và các nhánh là phƣơng án 1, 2, sử dụng phần mềm PrecisionTree là Add-in trên Excel để xây dựng cây quyết định nhƣ sau:
Sử dụng giải thuật ID3 để tạo cây quyết định từ một tập các mẫu huấn luyện.
Đầu vào: Một tập hợp các ví dụ.
Đầu ra: Cây quyết định có khả năng phân
loại đúng đắn các ví dụ trong tập dữ liệu huấn luyện và có khả năng học.
Lấy ví dụ là bài toán kinh điển nhƣ sau:
Tập dữ liệu này bao gồm 14 ví dụ. Mỗi ví dụ biểu diễn cho tình trạng thời tiết gồm các thuộc tính quang cảnh, nhiệt độ, độ ẩm và gió; và đều có một thuộc tính phân loại, giá trị phân loại ở đây chỉ có hai loại (có, không)
Mỗi thuộc tính đều có một tập các giá trị hữu hạn. Thuộc tính quang cảnh có ba giá trị (âm u, mƣa, nắng), nhiệt độ có ba giá trị (nóng, mát, ấm áp), độ ẩm có hai giá trị (cao, TB) và gió có hai giá trị (mạnh, nhẹ). Các giá trị này chính là ký hiệu (symbol) dùng để biểu diễn bài toán.
Ta áp dụng phƣơng thức tính Entropy để xác định chắc chắn thuộc tính nào đƣợc chọn trong quá trình tạo cây quyết định
Đầu tiên tính độ thuần nhất của tập dữ liệu:
Tại ô bất kỳ trên bảng tính Excel tạo và đặt tên cho nút gốc, từ nút gốc chọn thuộc tính lựa chọn để tạo nhánh, gán giá trị cho mỗi nhánh các thuộc tính chi phí nhƣ bảng trên và tạo các nút lá. Phần mềm xử lý các số liệu và đƣa ra giá trị kỳ vọng lớn nhất cho cây.
Kết quả cây quyết định thu đƣợc
Log2 (5/14) = 0.940
Từ đó tính tiếp Gain cho từng thuộc tính để suy ra thuộc tính nào đƣợc chọn làm nút gốc
Gain(S, Quang cảnh) = Entropy(S) – (5/14)Entropy(SNắng) – (4/14)Entropy(SÂm u) – (5/14) Entropy(SMưa) = 0.246
Tƣơng tự cho các Gain khác:
Gain(S, Nhiệt độ) = 0.029 Gain(S, Độ ẩm) = 0.151 Gain(S, Gió) = 0.048
Ta thấy Gain(S, Quang cảnh) là lớn nhất lấy thuộc tính quang cảnh làm nút gốc
Sau khi lập đƣợc cấp đầu tiên của cây quyết định ta lại xét nhánh Nắng
Tiếp tục lấy Entropy và Gain cho nhánh Nắng ta đƣợc hiệu suất nhƣ sau:
Gain(SNắng, Độ ẩm) = 0.970 Gain(SNắng, Nhiệt độ) = 0.570 Gain(SNắng, Gió) = 0.019
Nhƣ vậy thuộc tính độ ẩm có hiệu suất phân loại cao nhất trong nhánh Nắng ta chọn thuộc tính Độ ẩm làm nút kế tiếp ….
Tƣơng tự nhƣ vậy đối với nhánh còn lại của cây quyết định ta đƣợc cây quyết định hoàn chỉnh nhƣ sau
3.6 Kết luận chƣơng 3
Chƣơng này đã tìm hiểu quy trình lập kế hoạch sản xuất kinh doanh và thực nghiệm việc ứng dụng mô hình cây quyết định với thông tin đầu vào là không chắc chắn, để giải quyết bài toán ra quyết định về sản lƣợng sản xuất của Xí nghiệp 1 thuộc Công ty May Thăng Long.
Do điều kiện thời gian, Chƣơng này chỉ trình bầy phƣơng pháp giải quyết một trong những nội dung của bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp. Kết quả thực nghiệm cho thấy khả năng có thể ra quyết định với thông tin không chắc chắn bằng việc công cụ PrecisionTree trên tập dữ liệu thực tế trong quá trình lập kế hoạch.
Chƣơng này cũng đã so sánh cây quyết định hỗ trợ quá trình ra quyết định bằng việc ứng dụng phần mềm PrecisionTree và cây quyết định đƣợc xây dựng dựa theo các thuật toán ID3, C45 và những phiên bản khác của các thuật toán này.
Kết quả đƣa ra của cây quyết định là giá trị kỳ vọng lớn nhất của bài toán. Và đƣờng đi để đạt đƣợc giá trị lớn nhất đó.
Vậy, có thể đƣa ra một số nhận xét tổng quát nhƣ sau:
- Ngƣời dùng tự phân loại các nút, nhánh dựa trên tri thức, kinh nghiệm của bản thân trên cơ sở dữ liệu của bài toán.
- Thuộc tính của cây chấp nhận giá trị không chắc chắn.
- Dữ liệu của bài toán đƣợc nhập tại nút lá, và xử lý ngƣợc lên và cho kết quả tại nút gốc. Đƣờng đi từ nút gốc đến nút lá là một phƣơng án có thể đƣợc lựa chọn để ra quyết định.
Kết quả đƣa ra là lớp phân loại (có, không) của các thuộc tính tập dữ liệu, và có khả năng huấn luyện để phân lớp các tập dữ liệu tƣơng tự.
Vậy, có thể đƣa ra một số nhận xét tổng quát nhƣ sau:
- Thuật toán tự động tạo các nút và nhánh nhờ kết hợp với việc tính giá trị Entropy(S) và Gain(S,thuộc tính).
- Thuộc tính của cây là các giá trị rời rạc trong tập mẫu.
- Dữ liệu của tập ví dụ đƣợc phân tích để chọn các nút, cho kết quả tại nút lá. Đƣờng đi từ nút gốc đến một nút lá là tập dữ liệu nằm ở lớp đƣợc xác định bởi nút lá.
KẾT LUẬN
Luận văn tập trung khảo cứu lý thuyết về cây quyết định, về thông tin không chắc chắn, về qui trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp và thực hành việc ra quyết định trong lập kế hoạch sản xuất kinh doanh doanh nghiệp với thông tin không chắc chắn bằng việc ứng dụng mô hình cây quyết định.
Do điều kiện thời gian và khuôn khổ cho phép, luận văn mới thực hành xây dựng mô hình cây quyết định phục vụ ra quyết định trong lập kế hoạch sản xuất kinh doanh của một sản phẩm thuộc một Công ty, chƣa bao quát các sản phẩm cũng nhƣ toàn bộ quá trình lập kế hoạch.
Tuy nhiên, những kết quả thu đƣợc chứng tỏ khả năng ứng dụng to lớn của mô hình cây quyết định trong việc xử lý thông tin không chắc chắn, trong việc giúp chuyển đổi quá trình ra quyết định mang tính chủ quan của ngƣời quản lý sang quyết định mang tính khách quan, chính xác hơn.
Những kết quả chính mà luận văn thực hiện đƣợc là:
- Về lý thuyết: Luận văn tập trung tìm hiểu lý thuyết về cây quyết định, thông tin không chắc chắn, quá trình ra quyết định và lập kế hoạch sản xuất kinh doanh của doanh nghiệp.
- Về thực tiễn: Luận văn đã thực nghiệm việc lập một kế hoạch sản xuất cho doanh nghiệp bằng việc ứng dụng mô hình cây quyết định. Kết quả thu đƣợc có thể ứng dụng vào thực tiễn nhằm cải tiến và nâng cao chất lƣợng công tác lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, tƣ vấn cho hoạt động sản xuất kinh doanh của doanh nghiệp
Hƣớng phát triển tiếp theo của luận văn có thể là:
- Tiếp tục nghiên cứu quá trình ra quyết định với thông tin không chắc chắn trong lập kế hoạch phát triển kinh tế xã hội cấp tỉnh và cấp quốc gia bằng việc ứng dụng mô hình cây quyết định.
- Hoàn thiện quy trình ứng dụng mô hình cây quyết định với thông tin không chắc chắn trong việc lập kế hoạch sản xuất kinh doanh doanh nghiệp, giải quyết trọn vẹn bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp nhằm nâng cao chất lƣợng công tác lập kế hoạch và tƣ vấn, hỗ trợ doanh nghiệp.
TÀI LIỆU THAM KHẢO Tiếng Việt:
1. Cao Hào Thi. Giáo trình xác suất thống kê. . Trung Tâm Viện Công Nghệ Châu Á
tại Việt Nam (AITCV) -2008.
2. Đoàn Thị Thu Hà - Nguyễn Thị Ngọc Huyền, Khoa học quản lý tập 1. NXB
Khoa học Kỹ thuật, 2004.
3. Đỗ Thanh Nghị, Giáo trình khai thác dữ liệu, Đại học Cần Thơ – 2008.
4. Đinh Mạnh Tƣờng, Giáo trình trí tuệ nhân tạo, ĐH Công Nghệ -2007.
5. Nguyễn Thị Hồng Thuỷ -Nguyễn Thị Ngọc Huyền, Lý thuyết quản trị kinh doanh – NXB Khoa học Kỹ thuật, 1997.
6. Trần Bình Minh Thực trạng lập kế hoạch sản xuất kinh doanh tại công ty cổ phần
may Thăng Long. Báo cáo chuyên đề, Đại học Kinh tế Quốc dân, 2007.
7. Võ Huỳnh Trâm –Trần Ngân Bình, Giáo trình trí tuệ nhân tạo, ĐH Cần Thơ -
2008.
Tiếng Anh
8. Breiman, L., Friedman, J., Olshen, R., Stone, C.: Classification and Regression Trees. Chapman & Hall, New York, 1984.
9. Douglas H., "How to Measure Anything: Finding the Value of Intangibles in
Business", John Wiley & Sons, 2007.
10. Do, T-N., Lenca, P. and Lallich, S., Enhancing network intrusion classification
with the Kolmogorov-Smirnov splitting criterion. in proc. of ICTACS‟10, The 3rd International Conference on Theories and Applications of Computer Sciences, Vietnam, 2010.
11. Miheev, V., Vopilov, A., Shabalin, I.: The mp13 approach to the kdd‟99 classifer
learning. SIGKDD Explorations 1(2) (2000) 76–77.
12. Quinlan, J., C4.5: Programs for Machine Learning. Morgan Kaufmann
Publishers, 1993.
13. Robert F. Stewart, SWOT analysis modelStandford, Menlo Park, California, 1980.
14. Shannon, C-E., A mathematical theory of communication. Bell System Technological Journal (27):379–423, 623–656, 1948.
15. Zhang, J., Zulkernine, M., Network intrusion detection using random forests. In:
PHỤ LỤC
NĂNG LỰC SẢN XUẤT CỦA CÔNG TY
ĐƠN VỊ SX MẶT HÀNG SX CHÍNH DTKH NĂM 2005 % TÍNH THEO KỲ % TÍNH THEO NĂM 0 1 2 3 4 5 6 7 8 9 10 11 12 XN1 Sơ mi nam 802454 KH 65560 49826 70805 65560 68182 68182 68182 70805 68182 68182 68182 70805 69% 60% (Qui chuẩn) TT 29908 31380 35361 27927 47330 40502 46648 47544 45651 41044 41897 48716 XN2 Jacket. Quần 1676880 KH 13700 104120 147960 137000 142480 142480 142480 147960 142480 142480 142480 147960 40% 41% TT 66084 27082 58095 56016 50152 60874 70285 70612 61734 53325 52313 59608 XN3 Dệt kim 1676880 KH 137000 104120 147960 137000 142480 142480 142480 147960 142480 142480 142480 147960 38% 37% TT 40693 30527 46761 54974 56618 58636 57507 64572 61795 46839 41944 56435 XN may Quần 2320128 KH 148600 105944 136728 133600 134368 127596 122720 125064 161824 161824 161824 168048 48% 37% Nam Hải Vải mỏng TT 68305 50561 63555 51700 71058 70002 85495 85473 70885 80029 80312 80006 TT may Quần 313128 KH 17800 10336 11124 10200 8840 9568 8632 15% Hoà lạc Vải mỏng TT 3507 4441 4949 3356 6780 9217 7111 7625
TÌNH HÌNH THỰC HIỆN KHSX CỦA CÁCXN - T3/2006
TT Đơn vị sản xuất ĐV tính năm 2006 KH-DT KH-DT 3 tháng TH-DT tháng 3 TH-DT 3 tháng
% TH/KH năm 2006 % TH/KH tháng % TH/KH quý % cùng kỳ 2005 Năm 2005 A B C 1 2 3 4 5 6 7 8 9 1 XN 1 USD 636,300 147,000 54,520 136,339 21% 93% 93% 141% 96649 2 XN 2 USD 909,000 210,000 65,016 176,063 19% 84% 84% 116% 151261 3 XN 3 USD 787,800 182,000 82,049 205,010 26% 113% 113% 174% 117981
4 Nam Hải USD 1,308,960 302,400 85,039 211,628 16% 70% 70% 117% 181421
Cộng phần sản xuất may 3,462,060 841,400 286,624 729,040 20% 87% 87% 133% 547321 5 Gia công may vệ tinh
Cộng SX may + gia công USD 3,642,060 841,400 286,624 729,040 20% 87% 87%
6 Giặt mài công ty USD 120,000 26,924 9,198 18,690 16% 69% 69% 106% 17691
6 Xƣởng thêu USD 58,462 10,770 720 2,777 5% 26% 26% 205% 1357
Trđó: Thêu (khai thác ngoài)
8 WOOJIN (Không VAT) USD 120,000 30,000 10,000 30,000 25% 100% 100% 100% 30000 9 Hà Nam (không VAT) USD 240,000 60,000 20.000 60,000 25% 100% 100% 100% 60000
Cộng phần sản xuất 4,180,522 969,094 326,542 840,507 20% 87% 87% 10 CH – TT (Minh Khai) Tr. đ 48 425 11 TTTM Tr. đ (DT bán hàng Cty) Tr. đ 115 460 (DT bán hàng khai thác) Tr. đ 650 2,153 12 TTTM (Tràng Tiền) " 900 225 35 110
DT bán đứt (nội địa) " 513 699 DTNĐ khác (Giặt chăn DV) " DT phế liệu + ống nhựa " 7 22 Các đại lý khác " 136 484 13 Tổng DT - CT (Có VAT) " 119,500 29,875 8,204 21,833 18% 73% 73% Tổng DT-CT (không VAT) " 117,000 29,250 8,007 21,282 18% 73% 73% Tr. đó: DTXK " 94,500 23,625 6,176 15,900 17% 67% 67% -Bán FOB (XK) " 33,600 8,400 563 2% 7% 7% - Bán hàng NĐ+Khác 25,000 6,250 1,504 4,353 17% 70% 70% - Bán hàng NĐ+khác " 22,500 5,625 1,354 3,945 18% 70% 70% Thuê xƣởng (HP+HN) (Có) " 6,336 1,584 524 1,580 25% 100% 100% Thuê xƣởng (HP+HN) (Không) 5,760 1,440 477 1,437 25% 100% 100% * Doanh thu NĐ+DT khác " 31,336 7,834 2,028 5,933 19% 76% 76% 14 Nộp ngân sách " 3,390 848 150 434 13% 51% 51% 15 Thu nhập BQ 1000đ 1300
Đánh giá công tác lập kế hoạch trên cơ sở đánh giá hiệu quả sản xuát kinh doanh
TT Chỉ tiêu Đơn vị tính TH 2004 Năm 2005 KH-TCT 2006 % KH TCTY TH 2005/ 2004 KH2005 TH2005/ 2006/ 2005 1 GTTSL (Giá CĐ 1994) Tr. đ 76095 75000 56552 62500 74% 75% 111% 2 Doanh thu (Có VAT) " 235000 245000 250000 265000 106% 102% 106%
KẾ HOẠCH CÁC XÍ NGHIỆP NĂM 2006 Đơn vị SX Khách hàng Chủng loại Số tổ SX Năng suất 1 tổ/ngày Sản lƣợng 1 tháng Sản lƣợng 1 năm Giá BQ (USD) Doanh thu (USD)/năm Doanh thu (USD/th) Tên SL dự kiến/t