2.4.1 .Mạng truyền thẳng nhiều lớp
3.4. Phân tích và lựa chọn đặc trưng
Đối với mỗi đặc trưng tác giả đi vào nghiên cứu và vẽ biểu đồ để tìm hiểu sự ảnh hưởng của dữ liệu tới kết quả dự đoán.
-Họ và tên học sinh, ngày tháng năm sinh: Đây là nhóm trường dữ liệu thông tin chung của học sinh không có ảnh hưởng tới khả năng dự đoán của bài toán nên ta không lựa chọn nhóm đặc trưng này.
Dựa vào phân tích những tính chất của từng đặc trưng nhận thấy một số thông tin có ảnh hưởng tới mô hình dự báo khả năng nhập học như sau:
Hình 3.2. Biểu đồ thể hiện sự phân bổ của dữ liệu Nam tot nghiep
Qua biểu đồ ta thấy không chỉ có những học sinh mới tốt nghiệp Trung học cơ sở hoặc Trung học phổ thông đăng ký nhập học mà còn có cả những học sinh đã tốt nghiệp nhiều năm quay trở lại làm thủ tục nhâp học. Tuy số lượng này không nhiều nhưng khi đăng ký nộp hồ sơ thì khả năng nhập học rất cao. Do vậy dữ liệu “Nam tot nghiep” có ảnh hưởng tới kết quả dự đoán.
Hình 3.3. Biểu đồ thể hiện sự phân bổ của dữ liệu Năm xét tuyển
Biểu đồ năm xét tuyển trong vòng 3 năm gồm năm 2015, năm 2016, năm 2017 cho thấy quy mô tuyển sinh của trường. Đối với năm 2016 số lượng học sinh đăng ký xét tuyển cao nhất so với hai năm còn lại. Dữ liệu “Nam xet tuyen” chưa thể hiện được sự ảnh hưởng tới khả năng nhập học do vậy ta cần so sánh dữ liệu Nam xet tuyen với dữ liệu nam nhap hoc để tìm ra sự ảnh hưởng. Cụ thể:
- Năm tốt nghiệp của học sinh trùng với năm xét tuyển nhập học vào trường. Số lượng học sinh thuộc đối tượng này chiếm tỷ lệ nhập học là đông nhất.
- Năm tốt nghiệp của học sinh trước 1 năm so với năm xét tuyển nhập học vào trường. Số lượng học sinh thuộc đối tượng này có thể là đã nghỉ học ở trường khác hoặc gián đoạn việc học trong 1 năm.
- Năm tốt nghiệp của học sinh trước 2 năm trở lên so với năm xét tuyển nhập học vào trường. Số lượng học sinh thuộc đối tượng này sau 2 năm trở lên tính từ khi tốt nghiệp Trung học cơ sở hoặc Trung học phổ thông mới đăng ký nhập học vào trường.
- THCS và THPT: Trình độ đầu vào của học sinh là Trung học cơ sở (1) hoặc Trung học phổ thông (0).
Hình 3.4. Biểu đồ thể hiện sự phân bổ của dữ liệu Trình độ THCS và THPT Biểu đồ cho thấy số lượng học sinh tốt nghiệp Trung học cơ sở nhập học trong Biểu đồ cho thấy số lượng học sinh tốt nghiệp Trung học cơ sở nhập học trong những năm gần đây cao hơn số lượng học sinh tốt nghiệp Trung học phổ thông. Lý do là số học sinh tốt nghiệp THPT có sự lựa chọn học Đại học nhiều hơn do các trường Đại học đã bỏ điểm sàn. Còn học sinh THCS khi nộp hồ sơ sẽ có khả năng nhập học cao. Do vậy dữ liệu trình độ THCS và THPT có ảnh hưởng tới kết quả dự đoán.
- Nam: Giới tính của học sinh lựa chọn Nam (1) hoặc Nữ (0)
Số lượng học sinh nam nhiều hơn học sinh nữ rất nhiều. Học sinh nam có nhiều ngành nghề lựa chọn đăng ký học ví dụ như các nghề Cơ khí, Điện, Công nghệ thông tin còn học sinh nữ chỉ đăng ký vào ngành Chế biến thực phẩm. Điều này là do yếu tố sức khỏe và đặc thù ngành nghề nên mặc dù nhìn vào biểu đồ ta thấy giới tính có sự phân biệt rõ rệt, tuy nhiên dữ liệu này lại không có ảnh hưởng nhiều tới kết quả dự đoán.
- Co khi, Dien, CNTT, CBTP: Ngành nghề học bao gồm các nghề Cơ khí, Điện, Công nghệ thông tin,Chế biến thực phẩm.
Hình 3.6. Biểu đồ thể hiện sự phân bổ của dữ liệu Ngành Cơ khí
Hình 3.8. Biểu đồ thể hiện sự phân bổ của dữ liệu Ngành Công nghệ thông tin
Hình 3.9. Biểu đồ thể hiện sự phân bổ của dữ liệu Ngành Chế biến thực phẩm Qua biểu đồ ta thấy số lượng học sinh đăng ký vào học nghề Cơ khí chiếm số lượng cao nhất sau đó tới nghề Điện, Chế biến thực phẩm và Công nghệ thông tin. Do vậy dữ liệu ngành nghề học có khả năng ảnh hưởng tới kết quả dự đoán.
- Sinh vien o thanh pho: Hộ khẩu thường trú của học sinh là ở thành phố hoặc các huyện.
Hình 3.10. Biểu đồ thể hiện sự phân bổ của dữ liệu Sinh viên ở thành phố Qua biểu đồ ta thấy số lượng học sinh có hộ khẩu ở thành phố tỷ lệ nhâp học Qua biểu đồ ta thấy số lượng học sinh có hộ khẩu ở thành phố tỷ lệ nhâp học tương đối thấp. Có thể do mặt bằng chung những học sinh ở thành phố thường có nhu cầu chọn trường Đại học nên số lượng nhập học vào trường Cao đẳng rất thấp. Do vậy dữ liệu “Sinh vien o thanh pho” cũng là 1 đặc trưng có ảnh hưởng tới kết quả dự đoán.
- Sinh vien o trong tinh: Học sinh sinh viên có hộ khẩu ở khu vực trong tỉnh Bà Rịa – Vũng Tàu hoặc ngoài tỉnh.
Hình 3.11. Biểu đồ thể hiện sự phân bổ của dữ liệu Sinh vien o trong tinh Số lượng học sinh trong tỉnh nhập học rất cao. Do gần về vị trí địa lý, tâm lý phụ huynh cũng muốn cho học sinh học gần nhà nên đa số học sinh trong tỉnh đăng
ký nhập học vào trường. Chứng tỏ dữ liệu “Sinh vien ở trong tinh” có ảnh hưởng tới kết quả dự đoán.