3. 2. 2. Yêu cầu xây dựng cơ sở dữ liệu học sinh
Hàng năm nhà trường được Bộ Lao động Thương binh và Xã hội phê duyệt chi tiêu tuyển sinh. Phòng tuyển sinh có nhiệm vụ thông báo tuyển sinh trên các địa bàn trong cả nước. Phòng tuyển sinh làm nhiệm vụ phân công mọi người đi tuyển sinh các tỉnh phía Bắc, từ Hà Tĩnh trở ra. Mỗi người phụ trách một số tỉnh thành và đến các trường thông báo tuyển sinh trực tiếp tại trường đó. Sau khi học sinh tham gia học tập tại trường phòng đào tạo kết hợp với phòng tuyển sinh nhập danh sách học sinh gồm các thông tin : Họ tên học sinh, ngày sinh, giới
HỘI ĐỒNG TRƯỜNG, CÁC HỘI ĐỒNG TƯ VẤN
HIỆU TRƯỞNG, PHÓ HIỆU TRƯỞNG TRƯỜNG
ĐẢNG BỘ CƠ SỞ, ĐOÀN THANH NIÊN, CÔNG ĐOÀN
BỘ PHẬN CHỨC NĂNG PHÒNG CHUYÊN MÔN PHÒNG ĐÀO TẠO PHÒNG TUYỂN SINH PHÒNG CÔNG TÁC HSSV KHOA CƠ KHÍ CHẾ TẠO KHOA ĐIỆN-ĐIỆN
TỬ KHOA KẾ TOÁN
NGÂN HÀNG KHOA DU LỊCH
KHOA CNTT
KHOA THƯ VIỆN- THIẾT BỊ CÁC LỚP HSSV
PHÒNG HC-TC
tính, nơi sinh, địa chỉ liên hệ, số điện thoại, mã nghề đăng ký. Vì vậy nhà trường cần lưu trữ dữ liệu học sinh trong vòng 5-10 năm để thực hiện việc tra cứu đối chiếu số liệu như:
Bài toán đặt ra đối với hệ thống cơ sở dữ liệu là phân tích số liệu theo một số chủ đề quan tâm, phục vụ công tác quản lý đào tạo, như liệt kê sau :
1. Kết quả học tập của học sinh: Giỏi, khá, trung bình, yếu, kém 2. Kết quả vùng miền đến kết quả học tập đó như thế nào. 3. Các dân tộc khác nhau có kết quả học tập ra sao.
4. Hoàn cảnh gia đình, đạo đức lối sống của học sinh
5. Phân tích số liệu ảnh hưởng của các môn học tự nhiên đến các môn học xã hội và ngược lại, ở đây cụ thể là môn học toán, văn ảnh hưởng đến các môn học khác như thế nào.
Nhu cầu xử lý dữ liệu theo nhu cầu của nhà trường cần được phân tích theo các chủ đề, chiều khác nhau. Chúng được chi tiết hoá theo bảng sau:
Phân tích theo chủ đề Giỏi Khá TB Yếu Kém Điểm trung bình môn học X X X X X
Hoàn cảnh gia đình X X X X X
Vùng miền X X X X X
Liên quan giữa Môn toán và các môn xã hội
X X X X X
Dân tộc X X X X X
Đơn vị hành chính, Tỉnh huyện X X X X X
Đạo đức X X X X X
Bảng 3. 1 Các chiều phân tích theo chủ đề 3. 2. 3. Phạm vi thực hiện 3. 2. 3. Phạm vi thực hiện
Với bài toán đặt ra, việc phân tích, thiết kế và xây dựng CSDL phải đáp ứng các chủ đề như trên nhưng điểm trung bình môn học của học sinh là quan trọng nhất vì học sinh có kết quả học tập tốt sẽ thúc đẩy sự phát triển của nhà trường, động cơ học tập của học sinh và giảng dạy của giáo viên.
Một số câu hỏi được đặt ra trong công tác quản lý giáo dục:
1. Học sinh ở vùng nào thì có kết quả học tập tốt hơn, dân tộc nào có kết quả học tập cao hơn;
2. Ảnh hưởng của các vùng miền đến kết quả học tập của học sinh như thế nào ?
3. Môn toán học tốt có tác động đến kết quả của các môn khác không ? đặc biết các môn khoa học xã hội;
4. Đánh giá hạnh kiểm có ý nghĩa ra sao : Các em có đạo đức tốt thì kết quả học tập có tốt không…
5. Phân lớp học sinh thế nào là hiệu quả nhất.
Việc phân cụm dữ liệu dựa trên kết quả học tập, tu dưỡng của học sinh sẽ giải quyết các yêu cầu trên. Hay nói khác đi, trả lời các câu hỏi trên, người ta đã phân hoạch các học sinh theo các cụm khác nhau. Các tìm hiểu lý thuyết trong các chương trên sẽ làm nền cho thực nghiệm này.
Khoa Bỏ học Kém Yếu TB Khá Giỏi Tổng SL TL SL TL SL TL SL TL SL TL SL TL Tài chính-KT 25 13.6% 5 2.7% 3 1.6% 34 18.5% 114 62.0% 3 1.6% 184 CNTT 31 30.7% 1 1.0% 7 6.9% 48 47.5% 12 11.9% 2 2.0% 101 Du lịch 9 22.0% 5 12.2% 3 7.3% 8 19.5% 15 36.6% 1 2.4% 41 Cơ khí 5 16.7% 1 3.3% 2 6.7% 11 36.7% 11 36.7% 0 0% 30 Điện- Điện tử 15 32,6% 3 6,5% 4 8,7% 12 26,1% 11 23,9% 1 2,2% 46 Thiết bị 3 8,8% 3 8,8% 1 2,9% 7 20,6% 18 52,9% 2 5,9% 34 Tổng 88 20,2% 18 4,1% 20 4,6% 120 27,5% 181 41,5% 9 2,1% 436
Bảng 3. 2. Bảng kết quả học tập của học sinh sau một năm học tại trường
Theo bảng số liệu trên học sinh bỏ học của khóa 5 năm học 2010-2011 là 88 học sinh chiếm 20.2%; Số lượng học sinh học yếu và kém là 38 học sinh chiếm 8.7%; Học sinh diện trung bình là 120 học sinh chiếm 27.5%; Học sinh khá là 181 học sinh chiếm 41.5%; Học sinh loại giỏi là 9 học sinh chiếm 2.1%; Nhìn chung với bảng kết quả học tập ở trên thì các em đạt kết quả học tập loại khá, giỏi là 43.6% đây là một kết quả học tập tốt thể hiện sự hăng say giảng dạy của các thầy cô và sự lỗ lực học tập của các em. Bên cạnh đó việc vẫn còn nhiều
học sinh bỏ học đây là một lỗi lo chung của nhà trường và gia đình học sinh. Vậy chúng ta sẽ phân tích số liệu học sinh đầu vào như thế nào để phân loại học sinh một cách tốt nhất giảm khả năng bỏ học của các em và các thầy cô có phương pháp giảng dạy tốt nhất để các em lĩnh hội kiến thức.
3. 2. Công cụ xử lý dữ liệu cùng với phân cụm 3. 2. 1. Giới thiệu chung 3. 2. 1. Giới thiệu chung
Công cụ SPSS là phần mềm chuyên dụng xử lý thông tin sơ cấp-thông tin được thu thập trực tiếp từ đối tượng nghiên cứu. Thông tin được xử lý là thông tin định lượng (có ý nghĩa về mặt thống kê). Một vài nhận xét về công cụ này : • SPSS là một bộ chương trình mà nhiều người sử dụng ưa thích do nó rất dễ
sử dụng;
• SPSS có một giao diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem xét;
• SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá phức tạp và không trực giác.
• SPSS có một bộ soạn thảo dữ liệu tương tự như Excel, bộ soạn thảo cho phép vào các dữ liệu và mô tả các thuộc tính của chúng, tuy nhiên SPSS không có những công cụ quản lý dữ liệu thật. SPSS xử lý mỗi file dữ liệu ở một thời điểm và không mạnh khi thực hiện các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một lúc. Các file dữ liệu có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn trong dung lượng của đĩa cứng.
Sức mạnh lớn nhất của SPSS là lĩnh vực phân tích phương sai (SPSS cho phép thực hiện nhiều loại kiểm định tác động riêng biệt) và phân tích nhiều chiều (thí dụ phân tích phương sai nhiều chiều, phân tích nhân tố, phân tích cụm). SPSS phiên bản 11 còn bổ sung thêm một số khả năng phân tích các mô hình hỗn hợp. Cái yếu nhất của SPSS là khả năng xử lý đối với những vấn đề ước lượng phức tạp và do đó khó đưa ra được các ước lượng sai số đối với các ước lượng này. SPSS cũng không hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu.
SPSS có một giao diện giữa người và máy rất đơn giản để tạo ra các đồ thị và khi đã tạo được một đồ thị, nhờ giao diện này mà người sử dụng có thể tuỳ ý hiệu chỉnh đồ thị cũng như hoàn thiện chúng. Các đồ thị có chất lượng rất cao và có thể dán vào các tài liệu khác, thí dụ như Word hoặc Powerpoint. SPSS có ngôn ngữ cú pháp để tạo ra các đồ thị, nhưng nhiều điểm trong giao diện tạo đồ thị lại không sẵn sàng trong ngôn ngữ cú pháp. SPSS nhắm vào mục tiêu dễ sử dụng, nhưng nếu ta dự định sử dụng SPSS như một người sử dụng mạnh, thì nó có thể không đáp ứng được yêu cầu. SPSS mạnh về lĩnh vực đồ thị và lập biểu bảng, báo cáo tổng hợp số liệu.
3. 2. 2. Công cụ SPSS của IBM
Phần mềm SPSS có tất cả 4 dạng màn hình: