Qua quá trình kh o sát, nghiên c u tìm hiểu thu thập thông tin, tôi nhận thấy có nhiều yếu tố tác động dẫn đến việc bỏ học c a học sinh. Trong ph m vi nghiên c u c a luận văn tôi trích chọn ra một số thông tin chính tác động trực tiếp và là nguyên nhân dẫn đến việc học sinh bỏ học là rất cao g̀m các nội dung đ ợc phân tích d ới đây:
2.1.4.1. Ḥc ḷc
Học sinh có thành tích học tập tốt th ng ngoan ngoãn, ham học ng ợc l i học sinh có thành tích không cao th ng chán học, bỏ bê và lâu dần càng mất kiến th c nên th ng dẫn đến việc bỏ học.
2.1.4.2. Ḥc sinh lưu ban
Là những học sinh có học lực kém hoặc có học lực yếu và h nh kiểm yếu ph i ̉ l i lớp hay những học sinh có học lực yếu hoặc h nh kiểm yếu mà sau khi thi l i hoặc rèn luyện l i trong hè và không đ điều kiện đ ợc lên lớp. Đây là đối t ợng th ng dễ bỏ học, học sinh rơi vào diện l u ban th ng có học lực yếu, kém hoặc hay vi ph m nội quy nhà tr ng. Tuy nhiên, cũng có những tr ng hợp l u ban vì lỦ do khách quan nh : s c khỏe không đ m b o, ốm đau, tai n n, số ngày ngh̉ quá qui đ̣nh,… nên dẫn đến học sinh không đ ợc lên lớp. Học sinh l u ban có tủi đ i lớn hơn các học sinh khác trong lớp nên th ng có t t ̉ng mặc c m với b n bè, chán học dẫn đến ý th c học tập thấp nên th ng bỏ học giữa chừng.
2.1.4.3. Ảnh hửng tṛc típ từgia đ̀nh
Kinh tếgia đình khó khăn: Do kinh tế gia đình khó khăn, bố mẹ không đ điều kiện cho con đến tr ng buộc các em thôi học. Một phần vì bố mẹ lo kiếm kế sinh nhai, có những gia đình bố mẹ chấp nhận đi làm ăn xa gửi con cái cho ông, bà hoặc bà con hàng xóm… nên không có th i gian quan tâm chăm sóc, nh́c nh̉ các em dẫn đến tình tr ng l i học, lâu dần sẽ mất kiến th c và tr̉ thành học sinh yếu kém, không muốn đến lớp. Tuy nhiên đây không hẳn là nguyên nhân tuyệt đối vì có nhiều gia đình
khó khăn nh ng con học vẫn rất giỏi, nh ng có nhiều gia đình khá gi rất quan tâm đến việc học tập c a con nh ng học sinh vẫn ngh̉ học.
Bố mẹ li hôn: nh h ̉ng rất lớn đến tâm lý c a học sinh, các em c m thấy tự ti, thiếu thốn tình c m bố mẹ, so sánh với b n bè c m thấy t i thân nên rất chán n n, khó hòa nhập trong cuộc sống, không muốn phấn đấu trong công việc cũng nh học tập và đây là những học sinh th ng có những vi ph m nội qui, nề nếp nhà tr ng và kết qu học tập th ng không cao.
Mô côi cha mẹ: Học sinh thuộc diện m̀ côi cha mẹlà tr ng hợp có hoàn c nh đặc biệt mà nhà tr ng quan tâm, đây là đối t ợng học sinh thiếu thốn đ th từ tình c m đến vấn đề kinh tế. Đối t ợng này dễ ngh̉ học sớm đểm u sinh vì vậy nếu không có chếđộ đưi ngộ t o điều kiện giúp đỡ để các em đến tr ng thì kh năng bỏ học rất cao.
Bố mẹốm đau, r ợu chè, c b c, b o lực gia đình cũng làm nh h ̉ng việc học tập c a các em.
2.1.4.4. Ý thức ḥc ṭp c̉a ḥc sinh
Nhiều học sinh không có Ủ chí v ơn lên trong học tập, ng i khó, đua đ̀i tham gia vào các cuộc ăn chơi nh : nghiện games, cá độ, đua xe… Học sinh không muốn học vì nhiều lý do l i không đ ợc sự quan tâm c a gia đình, bên c nh đó là sự ḍ dỗ lôi kéo c a bàn bè khiến các em không quan tâm đến việc học, ch̉ biết chơi suốt ngày và lâu dần tr̉ thành học sinh yếu kém, chán n n và bỏ học.
Mặc khác, đây là l a tủi tâm lý dễ dao động nhất, hiếu kì, muốn tìm hiểu cái mới nếu có biện pháp uốn ńn tốt thì các em sẽđi theo h ớng tích cực ng ợc l i dễ ḅ sa vào các tệ n n và dẫn đến ý th c học tập kém r̀i bỏ học.
2.1.4.5. Các nguyên nhân khác
Giao thông đi l i khó khăn: Sông n ớc, tr ng học cách xa nhà, đ ng đi khó khăn, mùa m a không đi xe đ ợc,…
Nhiều học sinh và gia đình có Ủ nghĩ học xong THPT r̀i học ngành nh ng ra tr ng vẫn thất nghiệp nên nhiều học sinh ngh̉ đến việc bỏ học ngay từ th i THPT, đây là nhận th c sai lầm trong xu thế c a xư hội hiện nay.
Giai đo n sau Tết Nguyên Đán cũng là th i gian có số l ợng học sinh ngh̉ học nhiều nhất, ngoài các lỦ do nh đư phân tích thì thêm lý do khác nữa là sự rũ rê c a b n bè, học sinh ngh̉ học đi làm để kiếm tiền.
2.1.5. Giải pháp xây dựng hệ thống
Có nhiều đề tài nghiên c u về tình tr ng bỏ học c a học sinh, nhìn chung các tác gi ch yếu đề cập nhiều đến vấn đề lỦ luận, b n chất c a tình tr ng bỏ học; các nguyên nhân dẫn đến bỏ học c a học sinh và từ đó đề xuất các biện pháp kh́c pḥc
trên bình diện quá trình d y học và giáo ḍc, bình diện xư hội, bình diện nhân cách cá nhân học sinh một cách chung chung ch ch a khai thác sâu về khía c nh qu n lí.
Các nhà làm qu n lí c nh báo về tình tr ng bỏ học c a học sinh th ng chậm trễ so với sự việc diễn ra trong thực tế, th ng thì khi học sinh ngh̉ học r̀i các nhà qu n lí mới ńm đ ợc các số liệu qua các con số thống kê và b́t đầu mới ch̉ đ o, tìm biện pháp ngăn chặn.
Hiện nay chúng ta ch̉ biết đ ợc những nguyên nhân c a tình tr ng học sinh bỏ học một cách đ i khái chung chung mà ch a có những công c̣ hỗ trợ để giúp nhà tr ng phát hiện, đánh giá kh năng học sinh đó có thể bỏ học hay không. Vì vậy cần có các gi i pháp công nghệ nhằm hỗ trợ các nhà qu n lí, GVCN phân tích dữ liệu về các thông tin c a học sinh để đ a ra kh năng dự báo về tình tr ng bỏ học c a học sinh.
Do đó, ṃc tiêu c a bài toán dựa vào những dữ liệu đư có trong công tác qu n lí học sinh ̉ tr ng để dự đoán học sinh có kh năng bỏ học hay không. Đây là một thông tin hữu ích giúp Nhà tr ng và gia đình có những biện pháp ḳp th i ngăn chặn tình tr ng các em bỏ học.
Xuất phát từ những vấn đề nêu trên, đề tài đ a ra gi i pháp xây dựng hệ thống dự báo học sinh bỏ học t i tr ng THPT V n T ng, t̉nh Qu ng Ngưi. Hệ thống đ ợc thiết kế ch y trên hệ điều hành Windows với máy tính có cấu hình ph̉ thông phù hợp với điều kiện cơ s̉ vật chất ̉ đơn ṿ. Giao diện làm việc c a ch ơng trình thân thiện, dễ sử ḍng đối với ng i dùng và có hỗ trợ các thao tác kiểm tra, trích xuất danh sách đáp ng yêu cầu trong công tác qu n lí.
Hệ thống dự báo kh năng bỏ học c a học sinh đ ợc mô t nh mô hình sau:
Việc xây dựng và sử ḍng hệ thống dự báo kh năng bỏ học c a học sinh ̉ tr ng THPT V n T ng t̉nh Qu ng Ngưi là gi i pháp sẽ giúp cho Cán bộ qu n lí, GVCN cũng nh pḥ huynh học sinh ńm b́t ḳp th i những học sinh có nguy cơ bỏ học, có t t ̉ng muốn bỏ học. Sự trợ giúp c a hệ thống là ngùn thông tin quan trọng và hữu ích giúp Nhà tr ng và gia đình có những biện pháp ḳp th i ngăn chặn tình tr ng các em bỏ học nhằm h n chế hiện t ợng bỏ học đang ph̉ biến hiện nay.
Hệ thống cũng góp phần nâng cao kĩ năng ng ḍng công nghệ thông tin trong công tác qu n lí t i đơn ṿ.
Hệ thống dự báo kh năng bỏ học c a học sinh với ḳch b n sử ḍng đ ợc mô t nh sau:
- Tiến hành cho máy họcvới tập dữ liệu huấn luyện đ ợc xây dựng từ việc phân tích nguyên nhân bỏ học c a học sinh. Sau đó hệ thống sẽ vẽ ra một cây quyết đ̣nh t ơng ng với tập dữ liệu huấn luyện, từ đó có thể rút ra tập luậtđể áp ḍng trong ng ḍng.
- Ng i sử ḍng nhập thông tin đầy đ c a học sinh vào CSDL. Sau đó hệ thống áp ḍng thuật toán cây quyết đ̣nh để xử lỦ và đ a ra kết qu là học sinh đó có kh năng bỏ học hay là không. Kết qu xử lỦ đ ợc hiển tḥ trên màn hình hoặc xuất ra Excel để ng i dùng thuận tiện trong việc xử lỦdữ liệu.
2.2. ngăd ngăcơyquy tăđ nhă
2.2.1. L ợng hóadữ liệu đ̉ đ a v̀o thuật toán C4.5
Để thuật toán C4.5 xây dựng đ ợc cây quyết đ̣nh hiệu qu , đáng tin cậy, tr ớc tiên ta ph i l ợng hóa dữ liệu nhằm có đ ợc tập dữ liệu huấn luyện tốt nhất. Tập dữ liệu huấn luyện có tầm quan trọng rất lớn, nếu nó chính xác, bao quát hầu hết các tr ng hợp x y trong thực tế thì cây quyết đ̣nh và tập luật rút ra sẽ chính xác và đ a ra kết qu độ tin cậy cao.
Để minh họa việc ng ḍng hệ hỗ trợ ra quyết đ̣nh trong việc dự báo kh năng bỏ học c a học sinh t i tr ng THPT V n T ng t̉nh Qu ng Ngưi, cần dựa vào dữ liệu về công tác qu n lí học sinh t i tr ng, từđó có các b ớc tính toán c̣ thểđể lập ra một b ng dữ liệu mẫu g̀m những thuộc tính có kh năng tác động trực tiếp dẫn đến học sinh có thể bỏ học.
Qua các thông tin đư kh o sát, ta thấy rằng các thông tin về học lực, h nh kiểm, hoàn c nh gia đình, diện l u ban có tác động rất lớn dẫn đến kh năng bỏ học c a học sinh nên cần chú Ủ quan tâm để có ph ơng pháp giáo ḍc phù hợp.
B ng 2.10. B ng dữ liệu thu gọn từ dữ liệu qu n lí học sinh TT Họ và tên Giới tính Lớp Học lực H nh kiểm Điểm TBM c nh gia Hoàn
đình
Diện
l u ban báo Dự
1 Nữ 10A1 G K 8.3 BT Co No
2 Nam 10A4 Ke Y 1.9 KTKK Co Yes
3 Nam 10A1 G T 8.5 KTKK Co No
4 Nữ 10A1 K T 6.5 KTKK Khong No
5 Nam 10A6 TB K 5.7 BT Khong No
6 Nữ 10A1 TB K 5.2 MCCM Co Yes
… … … …
2.2.2. Phân tích dữ liệu đ̉ xây dựng tập huấn luyện
Qua kết qu kh o sát cũng nh việc phân tích tình hình học sinh bỏ học hiện nay, ta thấy có nhiều yếu tố nh h ̉ng dẫn đến việc bỏ học c a các em. Tuy nhiên, trong luận văn ch̉ chọn lọc một số nguyên nhân ch yếu nh sau:
Học lực (HL): Đây là học học lực đ ợc đánh giá sơ bộ trong quá trình học tập c a học sinh (không nhất thiết là học lực cuối kì, cuối năm) dựa trên các cột điểmkiểm tra đ ợc giáo viên cập nhật liên ṭc trong học kì. Học lực này đ ợc t̉ng kết và xếp lo i t i th i điểm hiện th i khi thực hiện ch c năng dự báo c a hệ thống. Học lực đánh giá thành 5 m c là: G (Giỏi), K (Khá), TB (Trung bình), Y (Yếu), Ke (Kém).
Hạnh kỉm (HK): Là kết qu rèn luyện c a học sinh. H nh kiểm đ ợc xếp thành 4 m c t ơng ng là Tốt (T), Khá (K),Trung bình (Tb) và Yếu (Y).
Diện l u ban(LB): Chia làm hai tr ng hợp Co: Là những học sinh thuộc diện ̉ l i lớp.
Khong: Là những học sinh thuộc diện đ ợc lên lớp hoặc học sinh mới tuyển đầu cấp.
Hòn cảnh gia đình (HCGD): Cần xem xét đến các tr ng hợp sau:
Bình th ng (BT): Là những học sinh đang có bố mẹ nuôi d ỡng, quan tâm, có điều kiện để học tập.
Khó khăn (KTKK): Kinh tế gia đình c̀n khó khăn, bố mẹ làm ăn xa.
Bố mẹ li hôn (CMLH): Là những học sinh có bố mẹ đư li hôn, thiếu thốn tình c m từ gia đình, không ng i quan tâm đến việc học c a các em.
M̀ côi cha mẹ (MCCM): Học sinh m̀ côi cha mẹ hoặc ̉ với ông bà già yếu hoặc đang ̉ với ng i thân.
B o lực gia đình (BLGD): Là những học sinh trong gia đình th ng xuyên ḅ b o lực từ bố mẹhoặc ng i thân.
Bỏ học (Bo_hoc): Là kết qu c a việc áp ḍng cây quyết đ̣nh dự báo kh năng bỏ học c a học sinh. Ta chia thành 2 tr ng hợp: Những học sinh có thể bỏ học (Yes) hoặc không (No).
Ta có các giá tṛ c a các thuộc tính nh sau: HL = {G, K, TB, Y, Ke}
HK = {T, K, TB, Y} LB = {Co, khong}
HC_GD = {BT, KTKK, CMLH, MCCM, BLGD) Bo_hoc = {Yes, No}
Từ phân tích trên ta xây dựng b ng dữ liệu huấn luyện mẫu nh sau: B ng 2.11. B ng dữ liệu huấn luyện TT HL HK HCGD LB Bo_hoc 1 G K BT Co No 2 G T KTKK Co No 3 G TB BT Khong No 4 K K MCCM Co No 5 K T BLGD Khong No 6 K T BT Khong No 7 K TB BLGD Co Yes 8 K Y MCCM Co Yes 9 Ke TB MCCM Khong Yes 10 Ke Y KTKK Co Yes 11 Ke Y CMLH Khong Yes 12 Ke Y KTKK Khong Yes 13 TB K KTKK Co No 14 TB K BT Khong No 15 TB K BLGD Khong Yes 16 TB K MCCM Khong Yes 17 TB T BT Co No 18 TB T KTKK Co No 19 TB TB MCCM Khong Yes 20 TB Y KTKK Co Yes 21 TB Y MCCM Co Yes 22 TB Y CMLH Khong Yes 23 Y K CMLH Co Yes 24 Y T BT Khong No 25 Y TB CMLH Khong Yes 26 Y Y BT Khong Yes
Từ b ng dữ liệu huấn luyện trên, áp ḍng thuật toán C4.5 để xây dựng cây quyết đ̣nh cho bài toán dự báo kh năng bỏ học c a học sinh.
2.2.3. Trỉn khai giải thuật C4.5
Cây quyết đ̣nh đ ợc xây dựng bằng cách m̉ rộng cây xuất phát từ nút gốc. Nút gốc đ ợc đặt tên là nút 0, và ng với m c 0 c a cây. Các nút con c a nút gốc sẽ ng với nút 1, và tiếp ṭc nh vậy. Để thuận tiện cho việc xây dựng cây quyết đ̣nh, t i mỗi nút, ch a các thông tin cơ b n sau đây:
Dữ liệu huấn luyện ng với nút hiện th i. Tên c a nút cha c a nút hiện th i.
Thuộc tính dùng để phân tích dữ liệu hiện th i. Nếu nút hiện th i là nút lá, thuộc tính sẽ bằng rỗng. Nếu nút hiện th i không ph i nút lá, nó sẽ ch a tên các nút con xuất phát từ nút hiện th i, cũng nh các giá tṛ t ơng ng c a thuộc tính dùng để phân tích nút hiện th i. Nếu là nút lá thì có thêm quyết đ̣nh đầu ra ̉ t i nút hiện th i. Ng ợc l i, nếu không ph i là nút lá thì không có ch a thông tin này.
đây, ta chú Ủ rằng, dữ liệu huấn luyện t i từng nút thay đ̉i theo các nút khác nhau. Cây quyết đ̣nh đ ợc xây dựng bằng cách xem xét t i mỗi nút liệu nó có thể đ ợc m̉ rộng tiếp hay không. Nếu nó không đ ợc m̉ rộng nữa thì đ ợc gọi là nút lá (leaf). Một nút sẽ đ ợc xem xét là nút lá, nếu Entropy t i nút này bằng không (hoặc tất c các thuộc tính đều đ ợc duyệt). Trên mỗi đ ng đi từ nút gốcđến nút lá, mỗi thuộc tính ch̉ đ ợc duyệt tối đa một lần.
Dựa trên các thông tin ch a ̉ các nút và cách th c m̉ rộng cây quyết đ̣nh nh