Huấn luyện cây quyết định

Một phần của tài liệu xây dựng hệ trợ giúp ra quyết định trong công tác tuyển sinh đại học hệ từ xa tại viện đại học mở hà nội (Trang 83 - 114)

7. Bố cục luận văn

3.2.1. Huấn luyện cây quyết định

Chọn dữ liệu huấn luyện cho cây quyết định: Đây là chức năng cho máy học với tập dữ liệu huấn luyện. Người sử dụng chọn nút “Open file…” để chọn file dữ liệu huấn luyện (file excel có phần mở rộng là *.xls, *.xlsx hoặc *.csv)

Dữ liệu huấn luyện

file.xls Dữ liệu kiểm thử file.xls Giải thuật C45 Cây quyết định Tập các luật Thống kê tỷ lệ lỗi

Hình 3.6. Chọn dữ liệu huấn luyện

Hiển thị dữ liệu huấn luyện: Sau khi chọn tập dữ liệu huấn luyện, nội dung của tập này được hiển thị ngay ở khung bên dưới của giao diện hệ thống nhằm giúp người sử dụng xác định lại một lần nữa độ chính xác trước khi đưa vào sử dụng.

Hình 3.7. Hiển thị dữ liệu được huấn luyện

Hiển thị cây quyết định đã huấn luyện: Sau khi chọn file dữ liệu huấn luyện, người sử dụng bấm vào nút “Decision Tree” bên cạnh để xem được hình dáng của cây tương ứng nhằm giúp người dùng dễ hình dung, so sánh, kiểm tra.

Hiển thị tập luật: Là phần hiển thị tập luật thu được từ thuật toán C4.5 thông qua file dữ liệu huấn luyện. Để hiển thị phần này, người sử dụng chọn file dữ liệu huấn luyện sau đó bấm vào nút “Rules”.

Hình 3.9. Tập luật ứng với dữ liệu được huấn luyện 3.2.2. Áp dụng cây quyết định

Màn hình chọn file dữ liệu kiểm thử: Là phần giúp người dùng tương tác với hệ thống bằng cách nhập đầy đủ các thông tin có liên quan vào 1 file *.xls, sau đó người dùng chọn mở file đã nhập để tiến hành kiểm thử bằng cách bấm vào nút

“Report”.

Hình 3.10. Màn hình chọn file dữ liệu kiểm thử

Hiển thị dữ liệu file kiểm thử: Phần này sẽ hiển thị kết quả tương ứng với dữ liệu đã được người sử dụng nhập vào file *.xls.

Xem kết quả áp dụng cây quyết định: Sau khi chọn file dữ liệu kiểm thử, người sử dụng bấm vào nút “Report” để xem kết quả áp dụng cây quyết định.

Hình 3.12. Hiển thị kết quả áp dụng cây quyết định

Xuất kết quả ra file excel: Người dùng có thể chọn 1 trong 3 cách thống kê của chương trình ứng dụng, sau đó bấm vào nút “Export to Excel” để xuất kết quả ra file excel.

3.3. ĐÁNH GIÁ KẾT QUẢ THỰC HIỆN

3.3.1. Về ứng dụng hệ thống

Sau khi đưa hệ thống trợ giúp quyết định trong công tác tuyển sinh vào thử nghiệm với số dữ liệu của 56 lớp đã tuyển sinh và đào tạo (tại 3 địa phương Đà Nẵng, Quảng Nam và TP. Huế), chúng tôi rút ra được những nhận xét, đánh giá một cách tương đối về hệ thống như sau:

Hệ thống được triển khai cài đặt, thử nghiệm dễ dàng, dễ sử dụng.

Hệ thống hoạt động ổn định, hiển thị kết quả nhanh chóng và rất thuận tiện. Với số lượng dữ liệu thử nghiệm, hệ thống đã xử lý và cho ra được những quyết định có độ chính xác cao, phù hợp với tính toán thực tế.

3.3.2. Về hiệu quả trong công tác tuyển sinh.

Với số liệu thống kê của 55 lớp khi đưa vào hệ thống để phân tích và đưa ra kết quả, hệ thống đã phát hiện ra 38 lớp tuyển sinh và đào tạo đạt hiệu quả (chiếm 69.09%) và 17 lớp (lỗi) tuyển sinh, đưa vào đào tạo không đạt hiệu quả về mặt kinh tế (chiếm 30.91%).

Hình 3.15. Hiển thị kết quả các lớp tuyển sinh không đạt hiệu quả về mặt kinh tế

Qua kết quả hiển thị trên, ta dễ dàng nhận ra những nguyên nhân và những ngành tuyển sinh không đạt hiệu quả về mặt kinh tế:

Bảng 3.1. Bảng thống kê nguyên nhân tuyển sinh không hiệu quả

TT Nguyên nhân Số lượng Tỷ lệ

1 Có sự cạnh tranh 1 5.88%

2 Nhu cầu xã hội thấp hơn mức học viên tối thiểu 3 17.65%

3 Tỷ lệ học viên bỏ học cao 13 76.47%

TỔNG CỘNG 17 -

Bảng 3.2. Bảng thống kê hiệu quả tuyển sinh của các ngành đào tạo

TT Ngành Tổng

Tuyển sinh đạt hiệu quả

Tuyển sinh không đạt hiệu quả Số lượng Tỷ lệ Số lượng Tỷ lệ

1 Quản trị kinh doanh 22 15 68.18% 7 31.82%

2 Kế toán 25 16 64.00% 9 36.00%

3 Luật kinh tế 8 7 87.50% 1 12.50%

Có thể thấy rằng, nguyên nhân tuyển sinh không đạt hiệu quả chủ yếu do tỷ lệ học viên bỏ học quá cao (chiếm 76.47%). Ngày nay, công tác tuyển sinh ngày càng gặp nhiều khó khăn vì lý do người học có nhiều sự lựa chọn: trường đào tạo, cấp độ đào tạo, ngành nghề đào tạo,… Tuyển sinh được học viên đã khó, giữ được sỉ số học viên ổn định trong suốt quá trình đào tạo lại càng khó hơn.

Vì vậy, ngoài việc triển khai thật tốt và có hiệu quả trong công tác tuyển sinh, cần phải có biện pháp nhằm giải quyết bài toán giảm tỷ lệ bỏ học của học viên xuống mức tối thiểu có thể chấp nhận được, nhằm nâng cao hiệu quả của công tác tuyển sinh của nhà trường.

Trong quá trình thực hiện luận văn, chúng tôi đã phân tích số liệu, các yếu tố liên quan đến công tác tuyển sinh như đã nêu ở phần “thực trạng tuyển sinh”. Qua kinh nghiệm công tác, chúng tôi có thể đánh giá và chỉ ra nguyên nhân những lần tuyển sinh không đạt hiệu quả của nhà trường trong thời gian qua như sau:

Đầu tiên, nhà trường chưa chú trọng đến công tác điều tra, thống kê về nhu cầu xã hội và sự cạnh tranh của các trường đối với các ngành, địa bàn tuyển sinh.

Tiếp đến, công tác tuyển sinh tại địa phương hoàn toàn giao cho các đơn vị liên kết tự làm mà không có sự phối hợp, giám sát từ các phòng ban chức năng của nhà trường.

Hơn nữa, công tác tư vấn tuyển sinh chưa được chú trọng. Công tác này do các cán bộ tại địa phương liên kết đảm trách mà không có sự tập huấn bài bản.

Ngoài ra, nhà trường chưa có sự tính toán cụ thể về các khoản chi phí phải trả đối với các lớp mở tại các địa phương để đưa ra số lượng học viên tối thiểu có thể mở lớp. Do đó, đã có những quyết định mở lớp chưa phù hợp, số lượng học viên đăng ký thấp hơn số học viên tối thiểu nhưng vẫn đưa vào đào tạo (phụ lục 11).

Cuối cùng, nhà trường chưa có biện pháp hữu hiệu nhằm hạn chế tỷ lệ bỏ học của học viên. Ngay cả đối với những lớp đào tạo đạt hiệu quả về mặt kinh tế nhưng tỷ lệ bỏ học vẫn cao, dẫn đến ảnh hưởng đến kết quả chung của công tác tuyển sinh.

Tỷ lệ bỏ học của học viên cao, có thể do những lý do sau:

Thời gian đào tạo một khóa học của nhà trường kéo dài 5 năm, trong khi các trường khác chỉ có 4 năm. (phụ lục 13)

Học từ xa, học viên lấy việc tự học thông qua giáo trình là chủ yếu, tuy nhiên việc tổ chức, ra đề thi để đánh giá chất lượng vẫn chưa sát với giáo trình, bài giảng… Do đó, kết quả thi của học viên không đạt yêu cầu chiếm tỷ lệ cao. Có những học viên thi đi, thi lại đến bảy, tám lần vẫn chưa đạt. (phụ lục 21)

Việc xét miễn môn học để tạo điều kiện cho học viên rút ngắn thời gian đào tạo còn nhiều bất cập, chưa hợp tình, hợp lý.

Công tác quản lý, theo dõi lớp học chưa được quan tâm đúng mức, dẫn đến việc nhắc nhở, động viên và giải quyết các tồn đọng, thắc mắc của học viên chưa kịp thời, thỏa đáng.

Trên đây là những kết quả đạt được khi thực hiện luận văn, kết quả này giúp chúng tôi có thể đánh giá một cách bao quát về quá trình tuyển sinh cũng như đào tạo của Viện Đại học Mở Hà Nội trong thời gian qua. Chúng tôi sẽ nêu những vấn đề còn bất cập ở trên với ban giám hiệu nhà trường để có những biện pháp khắc phục. Đồng thời đưa hệ thống trợ giúp quyết định trong công tác tuyển sinh vào sử dụng nhằm giúp cho phòng đào tạo, ban giám hiệu, lãnh đạo các đơn vị liên kết có một công cụ hỗ trợ hữu ích, nhanh chóng, hiệu quả trong việc quyết định công tác tuyển sinh sau này.

KẾT LUẬN 1. Kết quả đạt được

Về mặt khoa học

Luận văn đã tiến hành phân tích, tìm hiểu được quy trình tuyển sinh của Viện Đại học Mở Hà Nội. Phát hiện ra những vấn đề còn hạn chế để đề xuất với ban giám hiệu nhằm có những phương án khắc phục để nâng cao hiệu quả trong công tác tuyển sinh.

Nắm được các phương pháp và các mô hình toán học, áp dụng để giải quyết yêu cầu luận văn đã đặt ra.

Nghiên cứu và vận dụng giải thuật C4.5 để xây dựng mô hình dự đoán bằng cây quyết định.

Về mặt thực tiễn

Luận văn đã nêu được giải pháp kỹ thuật để xây dựng hệ thống trợ giúp quyết định trong công tác tuyển sinh.

Xây dựng được ứng dụng có khả năng phân tích tốt các dữ liệu về công tác tuyển sinh của nhà trường trong những năm qua.

Việc kết hợp lý thuyết về hệ trợ giúp quyết định và phân tích dữ liệu bằng cây quyết định là rất cần thiết, nó giúp giảm thiểu đáng kể thời gian tính toán trong công tác tuyển sinh.

Hệ thống có thể giúp cho phòng đào tạo, ban giám hiệu nhà trường và lãnh đạo các đơn vị liên kết ra quyết định một cách kịp thời, khoa học, tránh được các tình huống quyết định theo cảm tính nhằm hạn chế các trường hợp tuyển sinh không hiệu quả dẫn đến thiệt hại về kinh tế, lãng phí thời gian và tiền bạc của người học.

Có thể nói, đây là một công cụ hữu ích nhằm cung cấp cho nhà trường có thêm một giải pháp hỗ trợ về công tác tuyển sinh sau này.

2. Hạn chế

Hệ thống hiện tại chỉ xử lý dữ liệu được lưu trữ bằng các tập tin Excel, chưa kết nối và truy xuất dữ liệu trực tiếp đến hệ quản trị cơ sở dữ liệu SQL Server của nhà trường, của các đơn vị liên kết. Do đó cần một khoảng thời gian để chuyển đổi dữ liệu từ SQL Server sang Excel.

3. Hướng phát triển

Cần thử nghiệm hệ thống với khối lượng dữ liệu lớn để đánh giá lại độ tin cậy của cây quyết định công tác tuyển sinh.

Phối hợp với các phòng ban chức năng, các đơn vị liên kết để tính toán, xây dựng hoàn thiện hơn tập dữ liệu huấn luyện nhằm đưa hệ thống vào sử dụng có hiệu quả cho tất cả các địa phương liên kết.

Nghiên cứu vận dụng thuật toán C5.0, là một cải tiến của C4.5, để giảm thiểu tỉ lệ lỗi, nâng cao hiệu suất và tăng cường độ tối ưu cho ứng dụng.

Tiếp tục phát triển, nâng cấp hệ thống, hỗ trợ kết nối, truy xuất và xử lý dữ liệu trực tiếp với hệ quản trị CSDL SQL Server đồng thời mở rộng sang các hệ quản trị CSDL khác.

DANH MỤC TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Lê Văn Dực (2006), Hệ hỗ trợ ra quyết định, NXB Đại học Quốc gia TP Hồ Chí Minh.

[2] Nguyễn Thống, Cao Hào Thi (1998), Phương pháp định lượng trong quản lý,

NXB Thống Kê.

[3] Hoàng Kiếm, Đỗ Phúc (2005), Giáo trình khai phá dữ liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh.

[4] Đoàn Văn Ban, Lê Mạnh Thạnh, Lê Văn Tường Lân (2006), “Một phương pháp để xây dựng cây quyết định có hiệu quả trong khai phá dữ liệu”, Kỷ

yếu hội thảo quốc gia về Công nghệ phần mềm và Công nghệ tri thức.

[5] Đoàn Văn Ban, Lê Mạnh Thạnh, Lê Văn Tường Lân (2007), “Một cách chọn mẫu huấn luyện và thuật toán học để xây dựng cây quyết định trong khai phá dữ liệu”, Tạp chí Tin học và Điều khiển học, (Số 4), Tr. 29-32.

[6] Lê Văn Tường Lân (2009), “Phụ thuộc dữ liệu và tác động của nó đối với bài toán phân lớp của khai phá dữ liệu”, Tạp chí Khoa học, Đại học Huế, (Số 53), Tr. 14-20.

[7] Lê Quyết Thắng, Phan Tấn Tài, Dương Minh Hiếu (2008), Giáo trình Lý thuyết thông tin, Khoa CNTT - Đại học Cần Thơ.

[8] TS. Nguyễn Hồng Sơn (2010), “Giáo dục từ xa trong sự nghiệp xây dựng xã hội học tập và giáo dục suốt đời”, Kỷ yếu Hội thảo khoa học quốc gia về giáo dục Mở và Từ xa, Nhà Xuất bản thế giới Hà Nội, Tr. 4-17.

Tiếng nước ngoài

[9] Efraim Turban (2001), Decision Support Systems and Intelligent Systems, Prentice Hall.

[10] David L. Olson, James F. Courtney (1998), Decision Support Models and Expert Systems, DAME.

[11] P. Gray, H. J. Watson (1998), Decision Support in Data Warehouse, Prentice Hall.

[12] David J.C Mackey (2003), Information Theory, Infernce and Learning Algorithms, Cambridge University Express.

[13] Tom M. Mitchell (1997), Machine Learning, McGraw-Hill.

[14] Vanden Berghen Frank (2003), C4.5 – Classification Tree, Universit Libre de bruxelles.

[15] Andrew Troelsen (2007), Pro C# 2008 and the.NET 3.5 Platform, Fourth Edition

Trang Web

[16] http://vi.wikipedia.org/wiki/Cây_quyết_định

[17] Huynh Tram Vo, Tiếp cận ký hiệu: Giải thuật quy nạp cây quyết định ID3,

http://voer.edu.vn/content/m14329/1.1/ [18] C4.5 Tutorial, http://www2.cs.uregina.ca/~dbd/cs831/notes/ml/dtrees/c4.5/tutorial.html [19] http://en.wikipedia.org/wiki/C4.5_algorithm [20] http://www.decisiontrees.net/ [21] Website: http://www.google.com [22] http://tsc.edu.vn/Pages/ArticleDetail.aspx?siteid=1&sitepageid=115&articlei d=294 [23] http://www.tchdkh.org.vn/tchitiet.asp?code=1044 [24] http://www.hou.edu.vn

PHỤ LỤC

Phụ lục 1: Nhu cầu nhân lực trong cả nước (tầm nhìn đến năm 2015 và 2020)

ĐVT: triệu người

Nhu cầu nhân lực

Đến năm 2015 Đến năm 2020 Số lượng Tỷ lệ Số lượng Tỷ lệ Sơ cấp nghề 18 59% 24 54% Trung cấp 7 23% 12 27% Cao đẳng 2 6% 3 7% Đại học 3.3 11% 5 11% Trên Đại học 0.2 1% 0.3 1%

(Nguồn: TT Hỗ trợ đào tạo và cung ứng nhân lực - Bộ Giáo dục và Đào tạo)[23] Dự báo nhu cầu nhân lực của nước ta đến năm 2015 và 2020: Phát triển nguồn nhân lực được xem là một trong 3 mũi đột phá chiến lược để thực hiện thắng lợi các chỉ tiêu kinh tế - xã hội của đất nước giai đoạn 2011-2020 được ghi trong Văn kiện Đại hội Đảng CSVN lần thứ XI.

Phụ lục 2: Thống kê số liệu các trường Đại học có tổ chức đào tạo từ xa (tính đến

tháng 10/2010)

TT Tên trường Số SV đang

theo học

Số SV đã tốt nghiệp

1 Đại học quốc gia TP. HCM (ĐH CNTT) 12.658 3.750

2 Viện Đại học Mở Hà Nội 41.928 23.741

3 Đại học Mở TP. Hồ Chí Minh 39.519 7.024

4 Đại học Sư Phạm Hà Nội 45.327 38.795

5 Đại học Hà Nội 2.437 6.735

6 Học Viện công nghệ bưu chính viễn thông 4.540 297

7 Đại học Kinh tế quốc dân Hà Nội 2.500 0

8 Đại học Huế 48.038 77.731

9 Đại học Đà Nẵng 14.541 3.100

10 Đại học Đà Lạt 931 995

11 Đại học Bình Dương 13.900 20

12 Đại học Trà Vinh 2.300 0

13 Đại học Duy Tân Đà Nẵng 3.400 0

14 Đại học Sư phạm Hà Nội 2 0 0

15 Đại học Hồng Bàng 0 0

16 Đại học Sư phạm Đồng Táp 0 0

17 Đại học Kinh doanh - Công nghệ Hà Nội 290 0

TỔNG CỘNG 232.309 162.400

Phụ lục 3a: Số lượng học viên đã tuyển được của hệ Từ xa (từ năm 2000 - 2010) TT Năm Ngành 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Tổng 1 Quản trị KD 969 540 857 1.296 2.108 1.890 2.311 2.587 1.708 1.683 1.383 17.332 2 Kế toán 602 779 1.653 2.924 3.693 4.070 3.479 4.538 3.713 3.221 2.676 31.348 3 Luật Kinh tế 379 402 665 1.082 1.912 2.833 3.760 3.585 4.316 3.192 2.402 24.528 4 Tiếng Anh - 349 1.520 1.834 706 585 698 614 172 434 123 7.035 5 Tin học - 46 894 608 529 534 382 232 209 322 82 3.838 6 Điện tử VT - - 195 365 196 172 182 234 60 106 28 1.538 7 Tài chính NH - - - - - - - - - - 140 140 Tổng cộng 1.950 2.116 5.784 8.109 9.144 10.084 10.812 11.790 10.178 8.958 6.834 85.759

(Nguồn: Trung tâm phát triển đào tạo - Viện Đại học Mở Hà Nội)

Phụ lục 3b: Số lượng học viên đã tốt nghiệp của hệ Từ xa (từ năm 2001 - 2010)

STT Ngành 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Tổng 1 Quản trị KD 1304 548 568 249 180 267 199 681 1007 827 5.830 2 Kế toán 800 599 596 448 414 626 397 1539 1882 2289 9.590 3 Luật Kinh tế - - - 165 312 510 657 975 1213 1601 5.433 4 Tiếng Anh - - - - 345 327 288 348 462 239 2.009 5 Tin học - - - - 42 28 192 101 107 158 628 6 Điện tử VT - - - - - 39 74 45 52 41 251 Tổng cộng 2.104 1.147 1.164 862 1.293 1.797 1.807 3.689 4.723 5.155 23.741

Một phần của tài liệu xây dựng hệ trợ giúp ra quyết định trong công tác tuyển sinh đại học hệ từ xa tại viện đại học mở hà nội (Trang 83 - 114)

Tải bản đầy đủ (PDF)

(114 trang)