Phát biểu bài toán ứng dụng

Một phần của tài liệu mạng nơron kohonen - som ứng dụng trọng phân nhóm sinh viên dựa trên kết quả học tập (Trang 54 - 73)

- – SOM

3.1. Phát biểu bài toán ứng dụng

3.1.1. Nội dung

Bài toán quản lý đã trở thành một bài toán xuất hiện nhiều trong thời gian trở lại đây, nguyên nhân xuất phát từ quá trình bùng nổ dữ liệu và con ngƣời không thể quản lý dữ liệu bằng sổ sách đƣợc nữa. Lẽ tất nhiêu là chúng ta ứng dụng công nghệ thông tin số hóa toàn bộ dữ liệu và thay cho những tập giấy tờ khổng lồ là hệ thồng máy tính với khả năng truy suất tìm kiếm thống kê nhanh hơn rất nhiều. Tuy nhiên khối lƣợng dữ liệu là không đổi cho dù quản lý bằng cách nào đi nữa. Việc quản lý nắm bắt và hiểu đƣợc khối lƣợng dữ liệu khổng lồ đó vẫn là một thách thức không nhỏ.

Từ đó đã đƣa ra một bài toán đó là làm sao để quản lý khối lƣợng dữ liệu đó cho tốt nhất và nắm bắt đƣợc xu thế cũng nhƣ phân loại đƣợc giữa các nhóm dữ liệu. Và với mỗi nhóm sẽ thấy đƣợc chi tiết đặc trƣng của nhóm đó, từ đó đƣa ra quyết định đúng với nhóm dữ liệu đang đƣợc thao tác. Đây là nguyên nhân của quá trình phát triển mạng SOM cho khai phá dữ liệu.

Trong nội dung đề tài chọn bài toán phân cụm điểm học sinh – sinh viên làm bài toán cần giải quyết. Đây là một hƣớng có ứng dụng thực tiễn tốt góp phần giúp các nhà quản lý và bản thân sinh viên thấy đƣợc kết quả học tập của một đơn vị dữ liệu hay một nhóm dữ liệu học sinh – sinh viên trên toàn bộ tập dữ liệu. Giải quyết bài toán này sẽ giúp ích lớn cho quá trình cải thiện chất lƣợng dạy và học. Phân tích dữ liệu đầu vào cho bài toán có thể thấy chính là tập điểm của các môn đƣợc học. Vậy vì sao phải sử dụng mạng nơron mà không sử dụng các phƣơng pháp thống kê bình thƣờng? Có một số nguyên nhân nhƣ sau:

Thống kê là một phƣơng pháp cài đặt cứng trong chƣơng trình thống kê chỉ đƣa ra những kết quả đƣợc lập trình sẵn dựa trên tập dữ liệu đầu vào. Nhƣng số lƣợng môn học là rất nhiều có thể lên đến hàng trăm vậy thống kê có giải quyết đƣợc tất cả các trƣờng hợp đó không ! Hơn nữa các phƣơng pháp thống kê chỉ đƣa ra đƣợc cái nhìn chung nhất chứ không hỗ chợ đƣợc chi tiết và nhà quản lý chỉ

55

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

nhìn đƣợc một kết quả vĩ mô duy nhất. Trong khi đó mạng nơron đƣa ra những mối quan hệ mềm phân chia học sinh-sinh viên theo những mối liên hệ có khi nhà quản lý không ngờ tới và nhờ đó gợi ý cho nhà quản lý cách thức tốt nhất để tăng khả năng học tập cho một nhóm. Việc phân chia và quản lý dữ liệu không cần lập trình chi tiết tới từng môn học nhƣng mạng nơron vẫn có thể thống kê đƣợc. Và một lý do rất qua trong là mà mạng nơron đƣợc ứng dụng nhiều trong vấn đề khai phá dữ liệu là với một tập dữ liệu vô cùng lớn thì thống kê là một phƣơng pháp không thể thực thi đƣợc trong khi đó mạng nơron có thể dễ dàng làm đƣợc điều đó nhờ vào khả năng học trên tập dữ liệu. Nhờ đó mà không cần phải đƣợc huấn luyện hết trên tập dữ liệu nhƣng mạng nơron vẫn có thể thành công trong quá trình phân cụm.

Vì những lý do đó mà bài toán phân cụm điểm là một bài toán có tính thực tiễn cao và việc phát triển sẽ giúp quá trình quản lý mang một màu sắc khác tích cực hơn.

3.1.2. Mục đính- Yêu cầu

Với nội dung bài toán đƣợc phát biểu nhƣ trên có thể thấy ứng dụng sẽ đƣợc xây dựng sử dụng mạng nơron cho quá trình phân cụm điểm học sinh-sinh viên với một tập dữ liệu đƣợc chọn. Ứng dụng các thành tựu có đƣợc trong quá trình nghiên cứu mạng SOM có thể giả quyết cho bài toán phân cụm điểm khi cấu hình trọng số mạng thay đổi phù hợp với bài toán. Mục đích chính đƣợc xác định khi xây dựng ứng dụng là phải phân nhóm tập dữ liệu vào và phân chia học sinh- sinh viên thành các nhóm khác nhau để có thể đánh giá đƣợc sự khác nhau trong kết quả học tập. Bên cạnh đó để phù hợp hơn với mục đính cải thiện chất lƣợng quản lý khi phân cụm xong đòi hỏi phải có những phƣơng pháp trực quan nhóm giúp ngƣời quản lý có thể quan sát đƣợc dễ dàng những kết quả có đƣợc từ mạng. Vì con ngƣời thƣờng có nhận thức kém với tập các số học, mà kết quả của mạng sau quá trình phân cụm lại là một tập các nhóm cùng tập các trọng số của nó. Từ đó tạo ra yêu cẩu trực quan hóa kết quả đầu ra bằng tập các đồ thị mô phỏng cấu hình nhóm, đây cũng là một trong những mục đích cần phải đạt đƣợc khi giải quyết bài toán trên.

56

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Bên cạnh đó qua quá trình thu thập cơ sở dữ liệu lƣu trữ điểm học sinh sinh

viên cho thấy cơ sở dữ liệu của con ngƣời trong bài toán quản lý điểm thƣờng là những file excel. Đây là phƣơng pháp quản lý sử dụng phần mềm của Microsoft rất trực quan và phổ biến. Nhƣng đòi hỏi ứng dụng khi vận hành cũng phải có khả năng đọc hiểu những file dữ liệu dạng này. Khi thực hiện xong quá trình đọc dữ liệu ứng dụng phải có khả năng cho phép ngƣời dùng chọn tập các môn để phân cụm tùy theo mục đích đề ra của ngƣời quản lý đây cũng là một yêu cầu nhất thiết phải có cho quá trình vận hành ứng dụng đạt đƣợc kết quả nhƣ mong muốn.

Là một ứng dụng hƣớng tới ngƣời dùng lẽ tất nhiên chƣơng trình phải thỏa mãn những yêu cầu chung nhất về mặt kĩ nghệ phần mềm, thỏa mãn những yêu cầu, tiện ích cho ngƣời sử dụng .

Đây là những yêu cầu cơ bản làm nền tảng cho quá trình phát triển ứng dụng. Mọi tính năng và chi tiết của ứng dụng sẽ đƣợc trình bày rõ hơn trong quá trình phân tích thiết kêt phần mềm phân cụm điểm sẽ đƣợc trình bày trong phần sau của luận văn.

3.2. Phân tích thiết kế hệ thống cho ứng dụng 3.2.1. Xác định các tác nhân và các Use case 3.2.1. Xác định các tác nhân và các Use case Tác nhân : Ngƣời dùng

Danh sách các Use Case : Để thực hiện đƣợc mục tiêu của bài toán qua quá trình khảo sát phân tích, thiết kế chƣơng trình xây dựng đƣợc các chức năng chính thể hiện nhƣ sau :

Chọn cơ sở dữ liệu

Tạo và huấn luyện mạng nơron Tạo biểu đồ theo nhóm

Phân cụm sinh viên theo nhóm Cấu hình mạng nơron

Chọn loại biểu đồ

Chọn và hiển thị biểu đồ Trợ giúp

57

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

3.2.2. Biểu đồ Use Case

Hình 3.2.2 : Mô hình Use Case tổng thể của bài toán

3.2.3. Biểu đồ trình tự cho từng Use Case 3.2.3.1. Chọn cơ sở dữ liệu 3.2.3.1. Chọn cơ sở dữ liệu

58

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

3.2.3.2. Tạo và huấn luyện mạng nơron

Hình 3.2.3.2: Biểu đồ trình tự tạo và huấn luyện mạng nơron.

59

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.2.3.3: Biểu đồ trình tự tạo biểu đồ theo nhóm.

3.2.3.4. Phân cụm sinh viên theo nhóm

Hình 3.2.3.4: Biểu đồ trình tự phân cụm sinh viên theo nhóm.

60

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.2.3.5: Biểu đồ trình tự cấu hình mạng nơron.

61

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.2.3.6: Biểu đồ trình tự chọn loại biểu đồ.

3.2.3.7. Chọn và hiển thị biểu đồ

Hình 3.2.3.7: Biểu đồ trình tự chọn và hiển thị biểu đồ.

3.3. Chƣơng trình ứng dụng

3.3.1. Giao diện tổng quan cho ứng dụng

Qua quá trình phân tích, thiết kế kết hợp với những thành tựu đã đạt đƣợc trong mạng nơron ứng dụng ngôn ngữ lập trình Visual C# của Microsotf trong luận văn đã xây dựng một chƣơng trình tƣơng đối hoàn thiện giải quyết bài toán phân cụm dữ liệu điểm cho học sinh-sinh viên thỏa mãn những yêu cầu đã đề ra ban đầu. Sau đây là hình ảnh cho ứng dụng sau quá trình cài đặt và chạy thử nghiệm.

62

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.1: Giao diện chương trình

3.3.2 Một số tính năng cho ứng dụng

Khả năng đọc và chọn dữ liệu: đây là tính năng bắt buộc, để có thể vận dụng đƣợc thuật toán từ mạng nơron thì trƣớc hết chƣơng trình phải có khả năng chọn,đọc dữ liệu excel và hiện thị dữ liệu trên giao diện. Tiếp đó là khả năng chọn các môn học cho quá trình phân cụm, khi đã phân cụm kết quả cuối cùng sẽ đƣợc hiển thị chi tiết. Để hỗ trợ cho quá trình chọn và phân cụm dữ liệu trong ứng dụng đã xây dựng một số thành phần hỗ trợ những nhiệm vụ này.

63

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.2(a): Tab hỗ trợ nhập và chọn dữ liệu

Trên đây là 2 tab hỗ trợ khả năng chọn lựa tập dữ liệu đầu vào đồng thời hỗ trợ khả năng chọn các môn mốn phân cụm. Trong file excel có những trƣờng không phải là dữ liệu điềm mà đó là các lable thể hiện tên, ID hoặc là số báo danh do vậy tab cũng hỗ trợ việc phân biệt các trƣờng hợp này tránh cho việc phân cụm không cần thiết.

Khả năng kết xuất biểu đồ cho từng nhóm: đây là một tính năng đặc biệt hỗ trợ khả năng hiện thị kết quả một cách trực quan giúp ngƣời quản lý dễ dàng quan sát và đánh giá nhóm tốt hơn. Tính năng này thƣờng thấy trong các bài toán thống kê và việc phân cụm điểm là một bài toán đặc biệt cần có những biểu đồ hỗ trợ so sánh và đánh giá. Ứng dụng hỗ trợ ngƣời dùng nhiều loại biểu đồ khác nhau tùy theo những phƣơng pháp quan sát khác nhau trong đó gồm cả biểu đồ 3D và 2D và hỗ trợ hơn 20 loại biểu đồ khác nhau.

64

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.2(b): Một số biểu đồ trợ giúp dạng 3D

65

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.2(c): Một số biểu đồ trợ giúp dạng 2D

66

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Khả năng phân cụm và kết xuất chi tiết: đây là tính năng cơ bản cho việc giải quyết bài toán phân cụm điểm. Chƣơng trình có khả năng phân cụm và chỉ ra cấu hình cũng nhƣ những học sinh –sinh viên có kết quả tƣơng đồng cùng một nhóm. Dựa vào SOM từ một tập dữ liệu ban đầu mạng sẽ tự học trong quá trình huấn luyện và tiến hành phân chia tập dữ liệu đầu vào thành các nhóm theo một quan hệ nào đó (quan hệ không định trƣớc và do mạng tự động đƣa ra sau quá trình học).

Từ dữ liệu đầu vào là một file excel tập hợp điểm của tất cả các học sinh, sinh viên trong lớp, chƣơng trình phân ra làm các nhóm sinh viên khác nhau và ngƣời quản lý có thể dễ dàng đƣa ra phƣơng pháp tác động tới nhóm này nhằm đạt một hiệu quả nhất định nào đó.

67

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.2(e): Nhóm và cấu hình nhóm

68

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.2(f): Các đơn vị nhóm và chi tiết nhóm

Hình 3.3.2(g) Một phần dữ liệu và khả năng phân nhóm.

3.3.3 Hƣớng dẫn sử dụng, chạy thử nghiệm

Chƣơng trình đƣợc cài đặt trên ngôn ngữ lập trình Visual C# của Microsoft, chạy trên nền net framework 3.5, vì thế để có thể chạy đƣợc chƣơng trình cần tiến hành cài đặt net framework 3.5 trở lên. Bên cạnh đó ứng dụng dành cho phân cụm dữ liệu trên các file excel do đó cần tiến hành cài đặt phần mềm Microsoft Office Excel để hỗ trợ khả năng truy suất trên dữ liệu. Các công cụ cơ bản đƣợc mô tả nhƣ sau:

69

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 3.3.3: Các phần của ứng dụng

Nhƣ kết quả thực nghiệm đã thấy ứng dụng có khả năng phân cụm dữ liệu trên tập sinh viên đầu vào và hiển thị chi tiết đặc tính cũng nhƣ danh sách các sinh viên thuộc nhóm đó. Vậy thao tác nhƣ thế nào để có đƣợc kết quả nhƣ vậy trên phần mềm ứng dụng, sau đây là các bƣớc cơ bản của quá trình sử dụng.

Bƣớc 1: Chọn cơ sở dữ liệu. Tab chọn file chứa dữ liệu. Tab chọn biểu đồ hiển thị. Tab chọn môn để phân cụm và nhãn tƣng ứng. Tab chọn nhóm sau phân cụm. Tab chọn loại biểu đồ. Khởi tạo mạng nơron Khởi tạo biểu đồ Phân cụm dữ liệu Hiển thị dữ liệu đầu vào Hiển thị biểu đồ Hiển thị cấu hình nhóm Danh sách phân nhóm

70

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Để chọn cơ sở dữ liệu có thể dùng tab Group hỗ trợ trên giao diện hoặc chọn tab home\Open. Với tab Group hỗ trợ chỉ chọn đƣợc những file đúng định dạng excel.

Bƣớc 2: Chọn môn cần phân cụm và nhãn cho đối tƣợng phân cụm.

Trong tab Properties giúp việc chọn môn để phân cụm phía bên trái và nhãn để phân cụm phía bên phải.

Bƣớc 3: Khởi tạo mạng nơron và tiến hành phân cụm.

Click vào button Create có trên giao diện thực hiện quá trình khởi tạo huấn luyện, phân nhóm trong mạng nơron.

Bƣớc 4: Khởi tạo biểu đồ cho các nhóm.

Click vào button Chart trên giao diện khởi tạo một luồng mới vẽ biểu đồ cho các nhóm đã đƣợc phân cụm sau bƣớc 3, trong đó có một biểu đồ tổng quát. Có thể cấu hình loại biểu đồ trong tab Control phía bên phải đƣợc ẩn đi.

Bƣớc 5: Phân chia dữ liệu thành các nhóm và quan sát kết quả.

Click vào button Split trên giao diện thực hiện quá trình phân nhóm cho dữ liệu đƣợc chọn ban đầu. Có thể quan sát cấu hình, danh sách và các đặc trƣng khác của các nhóm trên giao diện.

Chƣơng trình ứng dụng những thành công đối với mạng SOM vào trong quá trình phân nhóm học sinh- sinh viên, dựa vào những kết quả phân nhóm do ứng dụng mang lại ngƣời quản lý sẽ có những định hƣớng để cải thiện chất lƣợng học cho các nhóm học sinh-sinh viên cũng nhƣ đánh giá đƣợc năng lực học tập hiện tại dựa trên tập cơ sở dữ liệu đƣa vào.

71

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

KẾT LUẬN

Mạng nơron là một lĩnh vực nghiên cứu tƣơng đối rộng và đòi hỏi nhiều công sức và lỗ lực trong quá tình nghiên cứu. Bên cạnh đó việc cài đặt và ứng dụng mạng nơron gặp nhiều khó khăn do độ phức tạp tƣơng đối cao của giải thuật. Vì lí do đó trong khuôn khổ luận văn chỉ hƣớng tới một mạng nơron dùng để phân cụm dữ liệu là mạng SOM để nghiên cứu và phát triển.Thực tế đã chứng minh mạng SOM có rất nhiều ứng dụng và việc nghiên cứu khai thác mạng này sẽ đem lại nhiều kết quả thực tiễn.

Việc nghiên cứu mạng SOM bắt đầu từ quá trình phát triển lý thuyết mạng nơron và đem lại những hiểu biết về mạng nơron nhân tạo. Trong nội dung luận văn đã trình bày những hiểu biết chung nhất về mạng, đồng thời cho ngƣời đọc có đƣợc những quan niệm chung nhất về lĩnh vực khoa học còn nhiều mới mẻ này. Bên cạnh đó quá trình phát triển về mặt nền tảng lý thuyết cũng đã đem lại những thành công nhất định. Cụ thể trong nội dung báo cáo đã đề xuất một số phƣơng

Một phần của tài liệu mạng nơron kohonen - som ứng dụng trọng phân nhóm sinh viên dựa trên kết quả học tập (Trang 54 - 73)

Tải bản đầy đủ (PDF)

(73 trang)