1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng mô hình dự đoán kết quả học tập cuối năm của học sinh tại trường thpt trần nguyên hãn

87 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Mô Hình Dự Đoán Kết Quả Học Tập Cuối Năm Của Học Sinh Tại Trường THPT Trần Nguyên Hãn
Tác giả Nguyễn Thị Thủy
Người hướng dẫn TS. Phan Ngọc Hoàng
Trường học Trường Đại Học Bà Rịa - Vũng Tàu
Chuyên ngành Công nghệ thông tin
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2023
Thành phố Bà Rịa - Vũng Tàu
Định dạng
Số trang 87
Dung lượng 2,21 MB

Cấu trúc

  • CHƯƠNG 1: GIỚI THIỆU CHUNG (11)
    • 1.1. Mở đầu (11)
    • 1.2. Giới thiệu đề tài (12)
      • 1.2.1. Lý do chọn đề tài (12)
      • 1.2.2 Mục tiêu đề tài (13)
    • 1.3 Đối tượng và phạm vi nghiên cứu của đề tài (13)
    • 1.4 Phương pháp nghiên cứu (13)
      • 1.4.1 Phương pháp nghiên cứu lý thuyết (13)
      • 1.4.2 Phương pháp thực nghiệm (14)
    • 1.5 Cấu trúc luận văn (14)
  • CHƯƠNG 2: GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH THPT (16)
    • 2.1. Giới thiệu về bài toán dự đoán (16)
    • 2.2 Mục tiêu và nhiệm vụ (17)
      • 2.2.1 Mục tiêu (17)
      • 2.2.2 Nhiệm vụ (17)
    • 2.3 Giới thiệu Neural Network (18)
      • 2.3.1 Khái niệm (18)
      • 2.3.2 Khả năng ứng dụng của mạng nơron nhân tạo (20)
      • 2.3.3 Cấu tạo và phân loại mạng nơron nhân tạo (22)
        • 2.3.3.1 Cấu tạo mạng nơron nhân tạo (22)
        • 2.3.3.2 Phân loại mạng nơron nhân tạo (24)
      • 2.3.4 Các đơn vị xử lý cơ bản của mạng nơron nhân tạo (26)
        • 2.3.4.1. Đơn vị xử lý (26)
        • 2.3.4.2 Hàm kết hợp (27)
        • 2.3.4.3 Hàm kích hoạt (27)
      • 2.3.5 Mạng nơron truyền thẳng nhiều lớp (28)
        • 2.3.5.1 Kiến trúc mạng (28)
        • 2.3.5.2 Khả năng biểu diễn (30)
        • 2.3.5.3 Số lớp ẩn (30)
        • 2.3.4.4 Số nơron trong lớp ẩn (31)
      • 2.3.6 Thuật toán lan truyền ngược BP (Back - Propagation Algorithm) (32)
        • 2.3.6.1 Sử dụng thuật toán lan truyền ngược (32)
        • 2.3.6.2 Một số biến thể của mạng lan truyền ngược (37)
    • 2.4 Thuật toán hồi quy tuyến tính (39)
      • 2.4.1 Hồi quy tuyến tính đơn (39)
        • 2.4.1.1 Phương trình hồi quy tuyến tính đơn (39)
        • 2.4.1.2 Phương sai hồi quy (39)
        • 2.4.1.3 Dự báo trong phương trình hồi quy tuyến tính đơn (41)
      • 2.4.2 Hồi quy tuyến tính đa biến (41)
        • 2.4.2.1 Mô hình hồi quy tuyến tính đa biến (41)
        • 2.4.2.2 Phương trình hồi quy tuyến tính đa biến (41)
        • 2.4.2.3 Phân tích phương sai hồi quy (42)
        • 2.4.2.4 Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy đa biến (42)
    • 2.5 Một số hướng nghiên cứu về những bài toán dự đoán có sử dụng mạng nơron . 34 (43)
      • 2.5.1 Các nghiên cứu trên thế giới (43)
      • 2.5.2. Các nghiên cứu trong nước (44)
    • 2.6. Ứng dụng mạng nơron giải quyết bài toán (45)
    • 2.7 Ứng dụng hồi quy tuyến tính để giải quyết bài toán (46)
  • CHƯƠNG 3: XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃN (48)
    • 3.1. Xây dựng hệ thống dự đoán kết quả học tập cuối năm của học sinh THPT (48)
      • 3.1.1 Tiến trình thực hiện luận văn (49)
    • 3.2 Mô tả tiến trình (50)
      • 3.2.1 Dữ liệu luận văn (50)
      • 3.2.2 Phân tích và trích chọn đặc trưng (52)
      • 3.2.3 Chuẩn hoá dữ liệu (56)
      • 3.2.4 Cấu trúc mạng nơron (57)
      • 3.2.5 Huấn luyện mô hình (60)
      • 3.2.6 Kiểm tra mô hình với kết quả thực nghiệm (66)
  • CHƯƠNG 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (75)
  • TÀI LIỆU THAM KHẢO (77)

Nội dung

Trang 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÀ RỊA-VŨNG TÀU --- NGUYỄN THỊ THUỶ XÂY DỰNG MƠ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃNLUẬN VĂN TH

GIỚI THIỆU CHUNG

Mở đầu

Tại các trường Trungihọc phổ thông (THPT) kếtiquả học tập cả năm rất được quan tâm, là tiêu chí để Giáo viên chọniphương pháp dạy phù hợp vàilà bước tiến quan trọng của học sinh (HS) Kết quả tổng kết hàng năm là bước tiền đề để học sinh dự đoán khả năng đậu tốt nghiệp cũng như học sinh có cơ sở lựa chọn vàoicác trường đại học,icao đẳng hay trung họcichuyên nghiệp sau này Đểiđạt được kết quả học tậpicao thì cả Giáo viên vàiHọc sinh đều phải cố gắng, Giáo viên cố gắng chọn phương pháp dạyiphù hợp, dễ hiểu cho từngiđối tượng học sinh, họcisinh cũng phải có sự hợp tác Tình hình học tậpicủa từng học sinh thường đượcithể hiện qua điểm số thông quaicác bài kiểm tra

Theo thông tưisố 58/2011/TT-BGDĐT [1] ban hành ngàyi12/12/2011 củaiBộ Giáo dục vàiĐào tạo về quy chếiđánh giá,ixếp loạiihọc sinh Trungihọc cơisở (THCS) vàihọc sinh THPT, trong đó ở chương IV ban hành việc học sinh đủ điều kiện được lênilớp, thi lại hoặcikhông được lên lớp Những họcisinh có khả năng phải thi lại là những họcisinh có điểm trung bìnhi(TB) môn dưới 3.5 hoặc học lựcicả năm xếp loại Yếu, đượcichọn một sốimôn có điểm TB cảinăm dưới 5.0 để thiilại Trường hợp học sinh ở lại là những trường hợp học lựcicả năm loạiiKém hoặc học lựcivà hạnh kiểm cả nămiloại Yếu Tại trường THPTiTrần Nguyên Hãn VũngiTàu hàng năm đến gần cuối học kỳ 2 Ban giám hiệu (BGH) nhà trường sẽ rà soát và đưa dự đoán tổng kết cuối năm thông qua điểm tổng kết cuối học kỳ 1; điểm thường xuyên 1 (P1), điểm thường xuyên 2 (P2), điểm định kỳ lần 1 (V1) của học kỳ 2 nhằm khen thưởng những em có sự tiến bộ và cảnh báo đối với những em có các môn còn yếu, dự báo về vấn đề thi lại hoặc ở lại lớp với những học sinh có điểm kém Dựa vào dự đoán này BGH sẽ yêu cầu giáo viên chủ nhiệm thông tin tới HS và phụ huynh (PH) để tìm hướng bồi dưỡng thêm, giúp các em nâng cao kiến thức, vượt qua khó khăn các môn còn kém trong thời gianicòn lại của cuối học kỳivà đạt được thành tích cao nhất vào cuối năm học

Hàng năm tất cả các trường THPT đều muốn trường mình có tỉ lệihọc sinh đậu tốt nghiệp vàivào các trường cao đẳng,iđại học cao nhất, bởi tỉ lệ đậu tốt nghiệp, đại học là minh chứng của chất lượng giảng dạy của một trường Trong cácimôn học tạiicác trường

THPT thì 3imôn Toán, Ngữivăn, Tiếng Anh lài3 môn quan trọng nhất bắt buộc học Ba môn này liên quan đến việc thi xét tốt nghiệp và nằm nhiều nhất trong các tổ hợp để xét vào trường cao đẳng vàiđại học trên cảinước Ngoài việc 3 môn này ảnh hưởng trực tiếp tới việc ở lại, thi lại và lên lớp thì nó còniảnh hưởng tới tương lai của cáciem sau này nên việc phát hiện, nhắc nhở và có phương án cho những học sinh có điểm 3 môn này dưới trung bình là vấn đề cần thiết Trong luận văn này tác giả chọn ngưỡng cảnh báo đối vớii3 môn Toán, Ngữ văn,iTiếng Anh là điểm tổng kết cuối kì dưới 5.0

Tuy nhiên việc dự đoán và đưa ra cảnh báo nhà trường từ trước đến nay vẫn thực hiện trên phương pháp thủ công mà không dựaitrên một phương pháp phân tíchicó tính khoaihọc nhất định Vìivậy luận văn này xây dựngimô hình dự đoán kết quả cuối năm củaitừng môn theo đúng năng lựcihọc tập của học sinh trên cơisở khoa học làisử dụng thuật toánimạng nơron nhân tạo vàihồi quy tuyến tính.

Giới thiệu đề tài

1.2.1 Lý do chọn đề tài

Cùng vớiisự thay đổi vàiphát triển không ngừng của ngành Công nghệithông tin thì việc thu thập vàilưu trữ lượng thông tiningày càng lớn, việc tin học hoá nhanh chóng cácihoạt động trong sản xuất,ikinh doanh, quản lí cũng như trong lĩnh vựcihoạt động giáo dục đãitạo ra khối lượng lớnidữ liệu Dẫn đến yêu cầu cấp bách vàicần thiết phải cóinhững kỹ thuật và công cụimới để phân tích chuyển đổi lượngidữ liệu lớn đó thành cácitri thức có ích Từiđó, kỹ thuật khai pháidữ liệu đãitrở thành một trong những lĩnh vực thời sựicủa nền công nghệ thông tin.iVấn đề đặt railà làm sao trích chọn những thông tinicóiý nghĩa từ tập cơ sở dữ liệu lớn,iđể đáp ứng việc giải quyết được cáciyêu cầu trong thực tếinhư trợ giúp ra quyết định,idự đoán, … Chính vì vậy, khai pháidữ liệu đãira đời nhằm giải quyết cáciyêu cầu đó, vàitrở thànhimột trong nhữngixu hướng nghiênicứuiphổ biến trong lĩnhivực họcimáy.iMột trong những hướng nghiên cứuiphổ biến và quan trọngiđó là mạng nơron đa tầng và hồi quy tuyến tính

Mạng nơron đa tầng vớiidữ liệu đầu vào làitập dữ liệu các thuộc tínhiđiểm tổng kết thúc học kỳ 1 môn Toán,iNgữ văn, Tiếng anhicủa học sinh Các nơron nhậnitín hiệu vàoixử lýi(tính tổng trọngisố,igửi tớiihàm kích hoạt) rồi choira kết quải(là kết quảicủa hàm kích hoạt); kết quảinày sẽiđược truyền tớiicác nơronithuộcitầng ẩnithứ nhất;icác nơronitại đâyitiếp nhận nhưitín hiệuiđầu vào,ixử lýivà gửiikết quảiđến tầng ẩnithứ 2;

4 các nơron tại đâyitiếp nhận như tín hiệuiđầu vào, xử lýivà gửi kết quả đến tầngikết quả Những tầng ẩninằm giữa tầng vàoivà tầng ra nóithể hiện quá trình suy luậnilogic của mạng nơron Tác giả đặt ra ngưỡng cho bài toán cảnh báo là điểm tổng môn học dưới 5.0, nên trong luận văn này, mạng nơron sẽ được xây dựng với kết quả của luận văn cho tầng output sẽ có 2 đầu ra cảnh báo hoặc không

Hồi quyituyến tính với dữ liệu đầu vàoilà tập dữ liệu làicác thuộc tính điểm học sinh, với phương pháp họcicó giám sát sẽ trả vềikết quả là điểm cụ thể của học sinh cần dự đoán, nhờ đó việc cảnh báo về độ nghiêm trọng hay không sẽ dễ dàng và cụ thể hơn

Việc phân tíchivà đưa raidự đoán trước kết quảihọc tập cuối năm củaihọc sinh giúp nhà trường thấy được tổng quan học lực hiện tại của từng lớp, tiến độihọc tập của từng họcisinh BGH nhà trường sẽicó kế hoạch về khuyến khích khen thưởng những họcisinh có học lựcitốt, giúp các em phát huy kết quả hiện tại; có định hướng cho học sinh còn yếu kémiđể các emicố gắng rèn luyện thêm những môn còn yếu đồng thời giúp giáo viên bộ môn cũng để ýivà giúp đỡicác em nhiều hơn Đểicó được kết quảitốt vào cuối năm học,iđặc biệt là học sinhi12 có được tỷ lệ đậu tốtinghiệp cao, vào đượcicác trường đại học vàicao đẳng thì việc nhà trường cóisự quan tâm và đưa ra dự đoán sớm là rấticần thiết Vìivậy, luận văn củaitôi nghiên cứuiđề tài

“Xâyidựng mô hìnhidự đoán kết quả học tậpicuối năm củaihọc sinh tại trường THPT Trần Nguyên Hãn”

Nghiên cứuiđể đưa ra giải phápidự đoán kết quảimôn học cuối năm từiđó xây dựng chương trìnhicó thể sử dụng đểidự đoán kết quảitừng môn học cho từng học sinh các khối sử dụng dữ liệu của trường THPT Trần Nguyên Hãn.

Đối tượng và phạm vi nghiên cứu của đề tài

Dữ liệu để huấn luyện và kiểm tra: điểm HKI; P1, P2, V1 học kỳi2 của học sinhitừ năm họci2015 - 2016 đếninăm học 2018i- 2019 tại trường THPTiTrần Nguyên Hãn,iTP Vũng Tàu.

Phương pháp nghiên cứu

1.4.1 Phương pháp nghiên cứu lý thuyết

• Tìm hiểuitổng quan vềicác thuật toán máy học;

• Tham khảo cácitài liệu liên quan đếnithuật toán Neural Network, Hồi quy tuyến tính từinhiều nguồn khác nhau như:isách báo,igiáo trình, các bài báo khoa học và internet;

• Thu thậpivà xử lýisố liệu từ dữ liệu thực tếitại trường THPTiTrần Nguyên Hãn, TPiVũng Tàu

Xây dựngiứng dụng và dự báoikết quả học tậpicuối năm của học sinh cho từng môn học, từ đó cảnh báo tới học sinh,igiáo viên chủ nhiệmivàigiáo viên bộ môniđể kịp thời nhắc nhởivà cóiphương pháp giảng dạyiphù hợp với các học sinhicòn yếu, kém.

Cấu trúc luận văn

Luậnivăn gồm cói4 chương, đượcitrình bày với cấu trúc nhưisau:

CHƯƠNG 2: Giải pháp giảiiquyết bài toán dự đoánikếtiquả họcitập cuối năm củaihọc sinh THPT

CHƯƠNG 3: Xâyidựng mô hình dự đoánikết quả họcitập cuối năm của họcisinh THPT CHƯƠNG 4: Kết luận và hướng phát triển

Trongichương nàyitác giảiđã trình bàyilý doichọniđề tài,imục tiêuicủa đề tài,iđối tượng vàiphạm viinghiên cứu củaiđề tài, phương phápinghiên cứu của đề tàiivà kết cấu

GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH THPT

Giới thiệu về bài toán dự đoán

CNTT làimột tronginhững lĩnh vựciquan trọng gópiphần thúc đẩyisự phátitriển kinh tếicủa đấtinước.iỨng dụng CNTT có ở tất cả các lĩnh vực,ilà nền tảngicủa nghiên cứuivề công nghệ caoinhư khoa họcivũ trụ,icông nghệ điện tửivàitự độngihoá,icác hệ thốngithông minh,… Tại Việt Nam, hiện nayiCNTT được xác định làilĩnh vực thenichốt được đầuitư không những hiệniđại hoá cơ sởihạ tầng mà cònilà việc ứng dụngisâu rộng vào các lĩnh vựcikhác của cuộc sống xãihội

Nghị quyếtisố 36-NQ/TW ngày 1/07/2014 củaiBộ Chính trịivề đẩy mạnhiứng dụng,iphát triểniCNTT [2] đápiứng yêuicầu phát triểnibền vững vàihội nhậpiquốc tếitiếp tụcikhẳng địnhisự quan tâm,ichỉ đạoisát sao củaiĐảng đối vớiicông táciứng dụng,iphát triểniCNTT, khẳng địnhivị trí,ivai tròicủa CNTT trongisự nghiệpixây dựng vàibảo vệ

Tổ quốcithời kỳimới Nghị quyết nàyilà một văn bản rấtiquan trọng, làiđịnh hướng xuyên suốticho chiến lượciứng dụng,iphát triểniCNTT vàitruyền thôngitừ nayiđến nămi

2030, làitiền đềiquan trọng đểiCNTT ViệtiNam phát triểnimạnh mẽ,isâu rộng hơn,iđề rainhững định hướng lớnicho sựiphát triểniCNTT nước nhàitrong khoảng 10i– 20inăm tới Mục tiêu nămi2030,iđưa năng lựcinghiên cứu,iứng dụng,iphát triển,isản xuất vàicung ứngisản phẩm,idịch vụiCNTT đạtitrình độitiên tiếnithế giới.iViệt Nam trởithành quốc giaimạnh vềiCNTT trongikhu vực

Cuộc cáchimạng công nghệp lầnithứ tư (CMCNi4.0) thông qua cácicông nghệinhư trí tuệinhân tạo,iInternet vạnivật,ithực tế ảo,itương tácithực tại ảo,imạng xãihội, điện toán đám mây,idi động, phân tíchidữ liệu sớm,… đã chuyển hoáitoàn bộithế giớiithành thế giớiisố.iCác công nghệithông minh đang đượcitích hợpivào mọiikhía cạnh củaixã hội, xoáibỏ ranh giớiicông nghệithông thường,ithay đổiihình dạngimạng lướiicông nghệ vàisản xuất, thúc đẩyisự phát triển củaithời đại

Trí tuệinhân tạo làimột hướng nghiên cứuicủa lĩnh vựciCNTT vàikhoa họcimáy tính nhằmiphát triểnihệ thống thôngiminh đểigiải quyết cácibài toán thực tếigiống như hoạtiđộng bộinão của con người.iTrí tuệ nhân tạoiđược bắt đầu nghiênicứuitừ những năm 50icủa thếikỷ 20ivà trong khoảngi30 nămitrở lại đâyiđã đượcicộng đồngivà cácinhà

8 khoa họciquan tâmimạnh mẽ.iRất nhiềuicác hội thảoilớn về lĩnhivực này đượcitổ chức hàng nămitrên thế giới.iCác ứng dụngitiêu biểu củaitrí tuệinhân tạoivào đờiisống xãihội như: người máy,irobot, xử lý ngôn ngữitự nhiên, dự báo, dự đoán, nhận dạng,iphát hiện dịithường, an ninh quốc phòng, khoa họcivũ trụ vàitrái đất,…

Ngày nay, CNTT đượciứng dụng trong hầu hếticác lĩnh vực hoạt động xãihội Lĩnh vực giáoidục cũng không thể thiếu sự hỗitrợ đắc lực của khoa họcimáy tính nói chung hay tríituệ nhân tạoinói riêng Để giúp công việcigiảng dạy đạt hiệu quảicao hơn, luận văn nghiên cứu “Xây dựng dự đoán kết quả cuối năm của học sinh tại trường THPT

Trần Nguyên Hãn” Từ kếtiquả dự đoán đó, hỗ trợ BGH có kế hoạch phù hợp, đưaira phương phápidạy học cho từngiđối tượng học sinhicụ thể, giúp các emiđạt được kếtiquả học tậpitốt hơn.

Mục tiêu và nhiệm vụ

Mụcitiêu quan trọng nhất của bài toán dựiđoán kết quảihọc tập cuối năm củaihọc sinhilà giúp các em thấy được lực học của mình đến đâu, có những yếuitố nào ảnh hưởng đếnikết quả họcitập và tầm quan trọng củaiviệc đậu tốt nghiệp THPT Từ đó các em định hướng tốt hơn về việc học của mình ngay từ đầu cấp đốiivới học sinh khối 10, hay vớiihọc sinh khối 12 sẽ cần cố gắng nhưithế nào đểicó kết quả tốt nhất Thời gian dự đoán kết quả vào khoảng giữa HKII nên kết quả dự đoán có thể thay đổi bởi nhiều yếu tố tùy thuộcivào việc chăm chỉihọc tập hay sựicố gắng học hỏi của học sinh khác nhau, có em sẽ chăm chỉ hơn, cũng có em sẽ lơ là việc học hơn làm ảnh hưởng đến kết quả dự đoán đó.

• Thấy được học lực hiện tại củaihọc sinh, sựitiến bộ củaihọc sinh;

• Khuyếnikhích những học sinh cóihọc lực tốt giúp các em phát huy kết quả đó Động viên các em còn yếu kém để các em cố gắng rèn luyện thêm những môn học yếu, kém;

• Hỗ trợ, hướng dẫn học sinh, giúp cáciem định hướnginghề nghiệp trong tương laiiđể các em có mục tiêu phấn đấu mà cố gắng học tập;

• Theo sát, giúpiđỡ những học sinhicó hoàn cảnh đặc biệt, giúp cáciem ổn định

9 tâm lí, tiếp tục việc học, hoàn thành chương trình học của mình.

Giới thiệu Neural Network

Theo cácinhà nghiên cứuisinh học [3], hệithống thần kinh củaicon người baoigồm khoảng 10 11 tếibào thần kinh,ithường gọi làicác nơron Mỗi tếibào nơron gồmi3 phần:

• Thâninơron và nhân bênitrong (gọiilà soma), là nơiitiếp nhận hay phát raicác xung độngithần kinh;

• Mộtihệ thống dạng câyicác thần kinhivào (gọiilà dendrite) đểiđưa tín hiệuitới nhân nơron Cácidây thần kinh vàoitạo thành một lướiidày đặc xung quanhithân nơron, chiếmidiện tích 0.25mm 2 ;

• Đầuidây thần kinh rai(gọi làisợi trục axon)iphân nhánhidạng hìnhicây,icó thể dài từi1cm đến hàngimét Chúng nối vớiicác dây thần kinhivào hoặc trực tiếp vớiicác nơronikhác thông quaicác khớpinối (gọiilà synapse) Cóihai loạiikhớp nối,ikhớp nốiikích thíchi(excitatory) sẽicho tín hiệuiqua nóiđể tớiinơron,icòn khớp nốiiức chếi(inhibitory) cóitác dụngilàm cảnitín hiệu tớiinơron Người ta ướcitính mỗi nơron trong bộinão người có khoảng 10 4 ikhớp nối

Chức năngicơ bản của tếibào nơron làiliên kết với nhau đểitạo nênihệ thống thần kinhiđiều khiểnihoạt động củaicơ thểisống Cácitế bàoinơron truyềnitín hiệu choinhau thông quaicác dây thần kinh vàoivà ra, cácitín hiệu đóicó dạng xung điệnivà được tạoira từ cáciquá trình phản ứngihoá họciphức tạp.iTại nhân tếibào khiiđiện thế củaitín hiệu củaitín hiệu vàoiđạt tớiimột ngưỡng nàoiđó thìinó tạoira mộtixung điệnidẫn tới trụcidây thầnikinh ra.iXung nàyitruyền theo trụcira tới cácinhánh rẽivà tiếpitục truyền tớiicác nơronikhác [3]

Não người được coi như mộtihệ thống xửilý thông tin rất phức tạp,iphi tuyến và songisong Có thểigiải quyết được rấtinhiều vấn đề như: nghe,inói, nhìn, hồiiức thông tin,inhận dạng các mẫu, Não thựcihiện được những nhiệmivụ như vậy nhờicác phần từitính toán đóilà nơron

Ngoàiira,ido tínhimềm dẻoicủa sự kếtinối giữa cácitế bàoithần kinh màinão người cóikhả năng học hỏiiqua những kinh nghiệm từiquá khứ Học làimột đặc tínhicơ bản và thiết yếuicủa mạng nơronisinh học [4]

Dựa vàoicác đặc trưng cơibản của mạng nơronisinh học người ra đãixây dựng nên mạng nơroninhân tạo Mạng nơroninhân tạo (Artificial Neural Network, ANN)ingày nayigần giống với bộinão con người như: cóikhả năng học,itức là sửidụng nhữngikinh nghiệm đểicải thiệnihiệu suất.iKhi thuithập được đủimột lượng mẫuithì ANN cóithể khái quátihoá rất cao.iMột ANN cóithể nhận ra một ký tựiviết tay, có thểiphát hiện ra người có dấu hiệu bất thường nơi công cộng Chínhivì vậyimà mạnginơron cóithể giải quyết cácivấn đềiphức tạpicó quy mô lớnivà khó hiệninay [5]

Mạng nơroninhân tạo (ANN) làimô hình xửilý thông qua môiphỏng hoạtiđộng của hệithống thần kinhisinh vật,ibao gồmisố lượng lớnicác nơroniđược gắn kếtiđể xửilý thôngitin.iANN giốnginhư bộinão con người,iđược họcikinh nghiệm (quaihuấn luyện),i cóikhả năng lưuigiữ các kinh nghiệmihiểu biếti(triithức) vàisử dụnginhững triithức đó trong việcidự đoán cácidữ liệu chưa biết.iANN được huấn luyện hayiđược học theo các kỹithuật cơibản là họcicó giámisát vàihọc không giámisát [6]

Họcilà quáitrình cậpinhật trọng sốisao choigiá trịihàm lỗiilà nhỏinhất Mộtimạng nơroniđược huấn luyệnisao choivới mộtitập các vector đầuivào 𝑋, mạng cóikhả năng tạo raitập các vector đầuira mong muốn 𝑌 củainó Tập 𝑋 đượcisử dụng cho huấniluyện mạng được gọiilà tập huấniluyện (trainingiset).iCác phần tửi𝑥 thuộc 𝑋 được gọiilà các mẫuihuấn luyệni(training example).iQuá trìnhihuấn luyệnibản chất làisự thay đổiicác trọng sốiliên kếticủa mạng.iTrong quáitrình này,icác trọng sốicủa mạngisẽ hội tụidần tới cácigiá trịisao cho vớiimỗi vector đầuivào 𝑥 từ tậpihuấn luyện, mạng sẽicho ra vector đầuira 𝑦 nhưimong muốn [4]

- Học có giám sát: cóithể được xem nhưiviệc xấp xỉimột ánh xạ: 𝑋 -> 𝑌, trongiđó

𝑋 làitập các vấn đềivà 𝑌 tập cácilời giải tương ứngicho vấn đề đó.iCác mẫu (𝑥, 𝑦) với

𝑥 = (𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) ∈ 𝑋, 𝑦 = (𝑦 1 , 𝑦 2 , … , 𝑦 𝑛 ) ∈ 𝑌 đượcicho trước Học cóigiám sát trong cácimạng nơron thường đượcithực hiện theo các bướcisau:

- Bướci1: Xây dựngicấu trúc thích hợpicho mạng nơron, chẳng hạnicó 𝑛 nơroniđầu vào,

𝑚 nơroniđầu ra,ivà khởiitạo cácitrọng sốiliên kếticủa mạng;

- Bướci2: Đưaimột vector 𝑥 trong tậpimẫu huấn luyện 𝑋 vàoimạng;

- Bước 3:iTính vector đầuira 𝑧 củaimạng;

- Bước 4:iSo sánh vector đầuira mong muốn 𝑡 (làikết quả được cho trongitập huấn luyện) với vector đầuira 𝑧 do mạng tạoira; nếu cóithể thì đánh giáilỗi

- Bướci5: Hiệu chỉnh cácitrọng số liênikết theo mộticách nàoiđó sao choiở lầnitiếp theo khiiđưa vector 𝑥 vàoimạng, vector đầuira 𝑧 sẽigiốngivới 𝑡 hơn

- Bước 6:iNếu cần, lặp lạiicác bước từi2 đến 5icho đến khi mạng đạtitới trạng tháiihội tụ.iViệc đánhigiá lỗiicó thểithực hiện theoinhiều cách,icách dùnginhiều nhất làisử dụng lỗiitức thời: 𝐸𝑟𝑟 = (𝑧 − 𝑡), hoặci𝐸𝑟𝑟 = |𝑧 − 𝑡|; lỗiitrung bìnhibình phươngi(MSE: mean- squareierror):i𝐸𝑟𝑟 = (𝑧 − 𝑡) 2 /2

Thuật toánitổng quát trên choihọc cóigiám sát trongicác mạnginơron cóinhiều cài đặtikhác nhau,isự khácinhau chủ yếuilà cáchicác trọng sốiliên kếtiđược thay đổiitrong suốtithời gianihọc.iĐiển hìnhicho kỹ thuật nàyilà mạnginơron lanitruyền ngượci(backi- propagation)

- Họcikhông giámisát:iKhông sửidụng tri thứcibên ngoàiitrong quáitrình học, nênicòn gọi làitự tổichức (selfi- Organizing).iMạng nơroniđiển hìnhiđược huấniluyện theoikiểu không giám sátilà SOM [7], [6].

2.3.2 Khả năng ứng dụng của mạng nơron nhân tạo Đặcitrưng của mạnginơron nhân tạoilà khảinăng học.iMối quanihệ tương quan phứcitạp giữaicác yếu tốiđầu vàoivà đầuira củaicác quá trìnhicần nghiênicứu vàikhi đã họciđược thìiviệc kiểm traiđộc lập thường choikết quả tốt.iSau khi đãihọc xongimạng nơroninhân tạo cóithể tínhitoán kết quảiđầu raitương ứng với bộisố liệuiđầu vàoimới

Vềimặt cấu trúc,imạng nơron nhân tạoigồm nhiều phần xửilý đơnigiản cùng hoạt độngisong song Đặc tính nàyicủa ANNicho phép nóicó thểiđược ápidụng đểigiải các bài toánilớn

Vềikhía cạnh toán học,itheo định lýiKolmogorov, một hàmiliên tục bấtikỳ 𝑓(𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) xáciđịnh trên khoảng 𝐼 𝑛 (vớiiIi=i[0,1])icó thểiđược biểu diễnidưới dạng [8]:

Trongiđó: 𝑥 𝑗 , 𝛹 𝑖𝑗 làicác hàm liên tụcimột biến 𝛹 𝑖𝑗 làihàm đơniđiệu,ikhông phụ thuộc vàoihàm f Mặtikhác,imô hìnhimạng nơroninhân tạo choiphép liên kếticó trọngisố cáciphần tửiphi tuyến (cácinơron đơnilẻ) tạoinên dạng hàmitổng hợpitừ cácihàm thành phần Doivậy, sauimột quá trìnhiđiều chỉnhisự liên kếticho phù hợpi(quá trìnhihọc), các phần tửiphi tuyếniđó sẽitạo nênimột hàmiphi tuyến phứcitạp cóikhả năngixấp xỉihàm biểuidiễn quá trìnhicần nghiên cứu.iKết quảilà đầuira của nóisẽ tươngitự vớiikết quảiđầu raicủa tậpidữ liệu dùngiđể huấn luyệnimạng.iKhi đó tainói mạng nơroninhân tạoiđã học đượcimối quanihệ tương quaniđầu vàoi- đầu raicủa quá trình vàilưu lại mối quanihệ tương quan nàyithông qua bộitrọng sốiliên kết giữaicác nơron.iDo đó,imạng nơron nhân tạoicó thểitính toán trênibộ số liệuiđầu vào mớiiđể đưaikết quả đầuira tươngiứng

Vớiinhững đặc điểmiđó,imạng nơroninhân tạoiđã đượcisử dụng đểigiải quyết nhiều bàiitoán thuộcinhiều lĩnhivực khác nhau Cácinhóm ứng dụng cácimạng nơron nhânitạo đãiđược ápidụng rất cóihiệu quảilà:

- Bàiitoán phânilớp:iLoại bàiitoán này đòiihỏi giảiiquyết vấniđề phâniloại cáciđối tượngiquan sátiđược thànhicác nhóm dựaitrên cáciđặc điểm củaicác nhómiđối tượngiđó Đây làidạng bài toán cơisở của rấtinhiều bài toánitrong thực tế:inhận dạngichữ viết, tiếng nói,iphân loại gen,iphân loạiichất lượng sảniphẩm,

- Bàiitoán dựibáo:iMạng nơroninhân tạoiđã đượciứng dụngithành côngitrong việc xâyidựng cácimô hình dựibáo sửidụng tậpidữ liệuitrong quá khứiđể dựiđoán số liệuitrong tươngilai.iĐây làinhóm bài toán khóivà rấtiquan trọngitrong nhiềuingành khoaihọc

- Bàiitoán điều khiển vàitối ưuihoá:iNhờ khảinăng học vàixấp xỉihàm màimạng nơroninhân tạoiđã được sửidụng trong nhiềuihệ thốngiđiều khiển tựiđộng cũng nhưigóp phần giảiiquyết những bài toán tốiiưu trong thựcitế

- Mạnginơron đã được ứngidụng trong rất nhiềuilĩnh vực trong cuộc sống như:

+ Giáo dục: Dựibáo tình hình tuyển sinh, thôi học, bỏ học, tốt nghiệp tại các trường, dự báo chọn tổ hợp môn thi đại học, dự báo kết quả cuối năm học + Y tế: Chuẩn đoán được bệnh di truyền hiếm gặp

Thuật toán hồi quy tuyến tính

Phânitích hồiiquy tuyếnitính làinghiên cứuisự phụithuộc củaimột biếni(biếniphụ thuộcihay còniđượcigọi làibiến giảiithích) vàoimột biếnihay nhiềuibiến kháci(biếniđộc lậpihay cònigọi làibiến giảiithích)ivới ýitưởng cơibản làiước lượngihayidự đoánigiá trị trung bìnhicủa biếniphụ thuộcitrênicơ sởicác giáitrịiđã biếticủa biếniđộcilập.iDự đoán giá trịicủa biến phản hồi từicác biến giải thích (biến độc lập),ikhi có mối quan hệituyến tính giữa chỉ cóimột biến giải thíchivà một biến phản hồi,ichúng ta gọi đây làihồi quy tuyến tínhiđơn (simple linear regression).iKhi có nhiều hơn mộtibiến phản hồi và cóibất kỳ số lượng biến giải thích ta gọi là hồi quy đa biến (multivariate regression) [21]

2.4.1 Hồi quy tuyến tính đơn

2.4.1.1 Phương trình hồi quy tuyến tính đơn Đặt (𝑥 1 , 𝑦 1 ), (𝑥 2 , 𝑦 2 ), … , (𝑥 𝑛 , 𝑦 𝑛 ) làimẫuigồm 𝑛 cặpiquan sát trên đườngihồi quy tổngithể 𝑦 = 𝛼 + 𝛽𝑥 1 + 𝜀 1 [21].

Theo phương trình béinhất thì ước lượng của hệisố 𝛼 và 𝛽 làicác giá trị 𝑎 và 𝑏 sao choitổng bình phương sai sốicủa phương trìnhisau đây làibé nhất [21]:

Và phương trìnhihồi quy tuyến tính mẫuicủa 𝑦 trên 𝑥 là: 𝑦 = 𝑎 + 𝑏𝑥

Trongiước lượng cácitham sốicủa mô hình hồi quy tuyếnitính đơn theo phương phápibình quân nhỏ có thểichứng minh được rằng:

∑(𝑦 𝑖 − 𝑦 𝑡𝑏 ) 2 =iSSTi(Total Sumiof Squares) là tổngibiến động của 𝑦

∑(𝑦̃ 𝑖 − 𝑦 𝑡𝑏 ) 2 = SSR (Sum ofiSquares Residual) là tổngibình phương hồi quy,ilà đại lượng biếniđộng của 𝑦 được giải thíchibởi đường hồi quy

∑(𝑦 𝑖 − 𝑦̃ 𝑖 ) 2 = SSEi(Sum of Squares Error) làiphần biếniđộngicòn lạiihay cònigọiilà số dư,ilà đạiilượngibiến độngitổng gộpicủa nguồnibiến độngido cácinhân tốikhác gâyira mà khôngihiện diệnitrongimô hìnhihồi quy vàiphầnibiến độngingẫu nhiên

• SSRicàng lớnithìimô hìnhihồi quyicàngicó độitin cậyicao việcigiải thíchibiến độngicủa 𝑦

𝑆𝑆𝑇 làiphần trăm biến độngicủa 𝑦 được giải thíchibởi mối quan hệ tuyến tínhicủa 𝑦 đốiivới 𝑥

𝑀𝑆𝐸 cóiphân phối 𝐹 vàithường được dùng đểikiểm định mứciý nghĩa của mô hìnhihồi quy 𝐹 càngilớn thì mô hình càngicó ý nghĩa

* Hệ sốixác định: R 2 làihệ số nhằm xáciđịnh mức độ quan hệigiữa 𝑥 và 𝑦 cóiquan hệ hayikhông hoặcibao nhiêuiphần trămisự biếnithiênicủa 𝑦 cóithể giảiithíchibởi sựiphụ thuộcituyến tính của 𝑦 vàoi𝑥

Giá trịidự đoán theo phương trìnhihồi quy: 𝑦 = 𝑎 + 𝑏𝑥 1

Vậy 𝑒 1 làisự khác biệt giữaigiá trịithựcitế vớiigiá trịidự đoánicủaiphương trìnhihồi quy tuyếnitính.iNhư vậy 𝑒 1 thể hiệniphần biếnithiênicủa 𝑦 không thểigiải thíchibởiimối quanihệ tuyến tínhigiữa 𝑦 và 𝑥

SSRicàng lớnithìimô hìnhihồi quyituyến tínhicàngicó độitin cậyicaoitrong việcigiải thích sựibiến độngicủa 𝑦

𝑆𝑆𝑇 làiphần trămibiến độngicủa 𝑦 đượcigiải thích bởi mốiiquan hệ tuyến tính củai𝑦ivào 𝑥

2.4.1.3 Dự báo trong phương trình hồi quy tuyến tính đơn Ướcilượng khoảngigiáitrị thựcicủa 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )

∑ 𝑛 𝑖=1 𝑥 𝑖 2 − 𝑛𝑥̅ 2 Ướcilượng khoảng giá trịitrung bình 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )

2.4.2 Hồi quy tuyến tính đa biến

2.4.2.1 Mô hình hồi quy tuyến tính đa biến

Giảisử 𝑦 phụ thuộcivào 𝑘 biếniđộc lập 𝑥 1 … 𝑥 𝑘 Nếuigiá trị của 𝑘 biếniđộc lập

𝑥 1 … 𝑥 𝑘 thì mô hìnhihồi quy tuyến tính đa biến cóidạng [21]:

𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đối với bài toán của luận văn là dự đoánikết quả học tập cuối năm, thì ởiđây 𝑦 là kết quả và các biến:

- 𝑦 (biến phụ thuộc): Đầu ra điểm cả năm (CN) được dự đoán

- 𝛼 (biến độcilập): hệ số chặniphản ánhimứciảnh hưởngicủa cácinhân tốikhác đếnichỉ tiêuiphânitích

- 𝛽: hệ sốiước lượng,icácihệ sốihồi quyinàyiphản ánhimức độ ảnh hưởng của từnginhân tố đếnibiến giảiithích Nếu 𝛽>0 thìiảnh hưởngithuận vàingược lại thì ảnh hưởnginghịch

𝛽 càng lớnithì sựiảnhihưởng đếnichỉ tiêuiphân tíchicàng mạnh

- 𝑥 𝑘 là yếuitố ảnh hưởngiđến điểm cả năm (CN)

2.4.2.2 Phương trình hồi quy tuyến tính đa biến

Gọi các hệisố 𝑎, 𝑏 1 … 𝑏 𝑘 là ước lượng cho 𝛼, 𝛽 1 … 𝛽 𝑘 đượcixác địnhibởiiphương phápibình phươngibéinhất.iPhương trìnhihồi quy cóidạng:

2.4.2.3 Phân tích phương sai hồi quy

* Hệ sốixác định: 𝑅 2 làinói lênitínhichặt chẽigiữa biếniphụithuộc 𝑦 vàicác biến độcilập

𝑥 𝑖 , tức là nóithể hiện phần trămibiến thiên 𝑦 có thểiđược giảiithíchibởi sựibiến thiênicủa tất cảicác biến 𝑥 𝑖

SSEi= ∑ 𝑛 𝑖=1 𝑒 𝑖 2 : làiphần biến độngicòn lại hay còn gọi làisố dư

SSRi= ∑ 𝑛 𝑖=1 (𝑦 𝑖 − 𝑦̅) 2 : làitổng bìnhiphươngihồi quy,ilà đạiilượngibiến độngicủa 𝑦 được giảiithích bằng đường hồiiquy

SSRicàng lớnithìimô hìnhihồi quyicàng cóiđộitinicậy caoitrong việcigiải thíchibiến động

𝑅 nóiilên tính chặt chẽicủa mốiiquanihệ giữaibiến phụithuộc 𝑦 vàicác biếniđộc lập 𝑥 𝑖

2.4.2.4 Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy đa biến

Mô hìnhihồi quy đa biến choitổng thể có dạng:

𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đặt 𝑎, 𝑏 1 , 𝑏 2 , … , 𝑏 𝑘 làinhững tham số đượciước lượngicho tổng thể; 𝑆 𝑎 , 𝑆 𝑏 1 ,

𝑆 𝑏 2 , … , 𝑆 𝑏 𝑘 là nhữngiđộ lệch chuẩn đã được ướcilượng, 𝑢 coiilà phân phối chuẩnithì biếningẫu nhiên 𝑡 được tínhinhư sau:

Vì vậy,ikhoảng cách độ tin cậyi100(1 – 𝛼)% choicác hệ số hồi quy 𝛽 1 đượcitính như sau:

Một số hướng nghiên cứu về những bài toán dự đoán có sử dụng mạng nơron 34

Bài toánidự đoán cóinhiệm vụiphân tíchivàisử dụngisố liệuiđãicó trongiquá khứiđể dự đoánigiá trịitươngilai Hiệninay,icó rấtinhiềuiphương phápidự đoán đãiđược sửidụng trênimô hìnhivật lýivà môihình toánihọc tronginhiều trườngihợp,ikết quảinghiên cứuidự đoán theo cácimô hìnhitrêniđã đạtiđược nhữngithành cônginhấtiđịnh.iTuy nhiêniphương pháp nàoicũng cóinhững hạnichế,ido vậyibài toánidự đoán vẫn làinội dungiđượcinghiên cứuihiện nay.iTrênithế giớiicũng nhưitronginước, cáciphương phápikhai phá dữ liệu (đặc biệtilà các phương pháp máy học,imạng nơron)icũngiđược ápidụng nhiềuivào các bài toánidự đoán

2.5.1 Các nghiên cứu trên thế giới

Trênithế giớiicácinghiên cứuivề việcixây dựngimô hìnhidự đoán kết quả họcitập của học sinh,isinh viên các trường đại họcitrong các giai đoạn đầu củaihọc kỳ sử dụng kỹithuật máy học khá nhiều và đãibắt đầu cáchiđây khá lâu,ihiện tại vẫn còn đangiđược nghiên cứu và phát triểniđể giảm thiểuisai sót trong dự đoán Riêngitrong lĩnh vực ứng dụngimạng nơron choidự đoán có thểikể đến một số côngitrình liên quan dướiiđây: Tronginghiên cứu kết quảihọc tập sinhiviên tại đạiihọc Mansura Ai Cập năm 2021

[22], nhóm đồng tác giả SEYAM AYA NABIL, MOHAMMED, AND AHMED ABOU-ELFETOUH đã sử dụngimột số thuật toán như:imạng lưới DeepiNeural Network (DNN), câyiquyết định, rừng ngẫu nhiên,ihồi quy Logistic, (K-Nearest Neighbors – KNN) đểiso sánh các phương phápivà đưa ra kết quả cuối cùng cho bài toán dự đoán Từikết quả thực nghiệm tác giảiđã có kết luận môihình mạng nơron có thể dự đoánikết quả học tập chínhixác đến 89% cao hơniso với các phương phápikhác

Ngoài các bài báo dự đoánikết quả học tậpihọc sinh một sốidự báo liên quan tới giáo dục đã sửidụng mạng nơroniđa tầng truyền thẳng MLP Borad vàicác cộng sự đã đềixuất mộtihàmiđo lườngilựa chọnithuộcitính mớii(heuristic)itrên thuậtitoán câyiquyết địnhiC4.5ihiện có.iC4.5iđưa ra các giải phápiđầy hứaihẹn vềithông tiniphân táchicủa quá trìnhituyển sinhitại trườngicao đẳngikỹ thuật tại ẤniĐộ Cáchitiếp cậnikhác trong cácinghiên cứuinày làiso sánhiđộichính xácigiữa thuật toánicây quyếtiđịnh C4.5 vàithuật

35 toán lanitruyền ngược của mạng nơron MLP Kếtiquả cho thấy mạng nơron đãiđưa ra độ chính xácidự báoicaoinhất [23]

Nămi2018,iDesmond ChekwubeiBartholomew [24] đã công bốicông trình nghiên cứuivề dự đoán sinh viêninhập họcitạiiĐại họcicông nghệiLiên Bang, Owerrii(FUTO), bangiImo,iNigeria Tác giả xây dựngimột mạngiMLPidự báoisinh viêniđăng kýivào trường vàiso sánhiđộ chínhixác môihình.iKết quảicũng đượcikhẳng địnhilà tốtihơnikhi mô hìnhimạng MLPinày đượciso sánhivới cáciphươngipháp truyềnithống

2.5.2 Các nghiên cứu trong nước

Tronginhững năm gầniđây, trong nước cũng có nhiềuicông trình nghiên cứu dự đoánikết quả học tậpicủa học sinh, sinh viênisử dụng mạng nơron như:

Năm 2021 trên tạp chíiKhoa học tại trườngiĐại học CầniThơ [25] có bài củaitác giả Lưu Hoài Sang về dự báoikết quả học tập bằngikỹ thuật mạnginơron đaitầng truyền thẳng đượcihuấn luyệnivớiigiải thuậtilan truyềningược Mạng MLP trong luận văn gồm 6itầng: Tầng đầu tiênilà tầng input với 18inode, sử dụngihàm kích hoạt ReLU;itầng ẩn thứ nhất cói256inode, sử dụng hàmikích hoạt ReLU; tầng ẩn 2, 3icói256 node, sử dụng hàmikích hoạt Sigmoid; tầng ẩnithứi4 có 256 node, sử dụngihàm kích hoạt ReLU;iitầng ẩn thứi5 có 8 node, sử dụng hàm kíchihoạt ReLU; tầng thứ 6ilàitầng Output có 1inode, sử dụngihàm kích hoạt linearido giá trị đầu ra từi0 đến 4 Kết quảicủa mô hình MLPicho kết quả độ tin cậy 78.82% Kết quảicho thấy, việc dự đoánikết quả học tập nhằmixác định vàiphát hiện sớm các đối tượngisinh viên yếu kém cần đượcihỗ trợ, tránh việc cảnh báoihọc vụ và buộc thôi học.iNgoài ra dựiđoánikết quảihọc tậpicũng nhằm xáciđịnh đượcicác sinhiviên giỏi làm nòng cốtiđể bồi dưỡng đào tạo,itừ đó giúp ích rất nhiềuicho bảnithânisinh viên,igia đìnhivàixãihội

Trước đó, luận văn củaitác giả Lê Thị ThanhiVang tại Đồng Nai 2018 về “Xây dựng giải pháp dự đoánikết quả tốt nghiệp trong trường THPT” Tác giả đã sử dụng thuậtitoániK-mean để thực hiện quá trình gomicụm dữ liệu, dựa vào kết quảigom cụm và dữiliệu đã cập nhật chức năng thống kê theo nghề nghiệp của cha mẹ học sinh theo từng phân cụm Cuốiicùng tác giả dựa vàoikết quả gom cụm kết hợpivới kết quảithống kê về nghề nghiệp củaicha mẹ học sinh nhằm dự đoán kếtiquả tốt nghiệp của họcisinh

Ngoàiira còn có một sốiđề tài nghiên cứuidự đoán tương đương có sử dụng mạng MLP như tác giảiDương Thu Trang đã xâyidựng môihìnhidự báoikết quảituyển sinhisử dụng mạngiMLP 3 lớp Đầu vào gồmi10 nơron ứng vớiikết quảituyển sinhicủa 10inăm trước đó.iLớp ẩnigồmi10 nơron đượcichọn dựaitrêniquy tắci“thửivàisai” Lớpira chỉicó 1iđầu ra làikếtiquảidự báoituyểnisinh ởithời điểmitươngilai [10]

Trongithực tếicònirất nhiềuinghiên cứuikhác nữaivềivấn đềidự báoituyển sinhisử dụngimôihình mạngiMLP Quaicácicông trìnhikhảo sátiởitrong vàingoài nướcitrên cho thấy việciáp dụngiMLPicho bài toán xâyidựng mô hìnhikết quả học tập cuối nămicủa họcisinh tại trương THPTiTrần Nguyên Hãn làikhả thi và sẽ có kếtiquả tốt hơn các phương phápitruyền thống.

Ứng dụng mạng nơron giải quyết bài toán

Bàiitoán của luận văn có cấu trúcichung củaimột mạnginơron nhânitạoigồm 3ithành phầniđó làilớp đầuivào,ilớp ẩn 1, lớp ẩn 2 vàilớp đầu ra Trongiđó,ilớp ẩni(HiddeniLayer) gồmicác nơroninhậnidữ liệuiinput từicácinơron ởilớp trướciđóivàichuyển đổiicác input vàoicho các lớp xử lý tiếpitheo Đốiivới bài toánidự đoán điểm học tậpicuối năm của từng môn học với từng đối tượng học sinh tác giả đã dựa trên cấu trúc mạng nơron như sau:

Số nơron lớp đầu vào Đểilựa chọn được số nơronilớp vào tác giả luận văn phânitích các thông tinithu thập được.iDữ liệu thu thập điểm số học sinh của nhà trường được lấy từinăm học 2015 -i2016 đến năm họci2018i- 2019 trên trang quản lý điểm họcisinh tại trường THPTiTrần Nguyên Hãn -iTPiVũng Tàu Dữ liệu điểm họcisinh gồm có:

- Điểmitrung bình của họcikỳ 1 (HKI) các năm học;

- Điểm thường xuyên 1 (P1) của học kỳ 2;

- Điểm thường xuyên 2 (P2) của học kỳ 2;

- Điểm định kỳ (V1) của họcikỳi2;

-iĐiểmiTrung bình cả năm (CN)

Từ dữ liệu trên tiến hành phânitích chọn lọc cáciđặc trưng có ảnhihưởng tới việc học của thuật toán tương ứng với số nơron lớp vào

Số nơronilớp ẩn Đểilựa chọn được chính xácisố nơronichoilớp ẩnilà rất khóivìivậy sốinơron lớpiẩn sẽ được lựaichọn quaithựcinghiệm củaibài toán.iQuaithực nghiệmibài toán tác giảiluận vănilựa chọn số nơron lớpiẩni1 bằng 8; số nơron lớpiẩni2 là 4

Bàiitoán đặt ra làidự đoán điểm cuối năm từng môn cho từng học sinh đồng thời đưa ra cảnh báo nếu điểm số dưới 5.0 Do vậy sẽ có 2 đầu ra là: đối tượng cảnh báo hoặc an toàn.

Ứng dụng hồi quy tuyến tính để giải quyết bài toán

Trongibài toán này tác giảisử dụng phương phápiphân tích và thuật toán hồiiquy đa biến vào dựiđoán kết quả họcitập cuối năm củaihọc sinh

Mô hình đượcixây dựng trên cơ sở nghiên cứu thuật toán pháp hồiiquy tuyến tính đaibiến để dự đoán kết quả, cáciyếu tố chủ yếu tác động đến điểm CN, cụ thể:

Do dựiđoán kết quảihọc tập dựa vào 4 yếuitố trên mà 4 yếu tố này có tính độc lập với nhau nên ta xây dựng phương trình dự đoán điểm cả năm (CN) như sau:

• 𝑦 là điểm dự đoán CN

• 𝑥 1 : là P1 - điểm thường xuyên 1 của HK2

• 𝑥 2 : là P2 - điểm thường xuyên 2 của HK2

• 𝑥 3 : là V1 - điểm định kỳ của HK2

• 𝑥 4 : là HK1 - điểm tổng kết cuối HK1

Trongichương này đã trình bàyicác lý thuyết cơ bản nhất vềimạng nơron làm tham chiếuicho các khái niệm vềimạng nơron nhân tạoimô tả mô hình của mạng nơronivà mạng liên kếticác nơron cũng như các phương phápihuấn luyện mạng Mạng nhiềuilớp lan truyền thẳngicũng được mô tảikỹ để làm tiền đề cho việcigiải quyết bài toán củailuận văn Ngoài ra còn trìnhibày lý thuyết về hồi quyituyến tính và đề xuất phương án sử dụngihồi quy tuyến tính đa biến để giải quyết bài toán Bênicạnh đó, để đưaira được quyết địnhihợp lí cho ứng dụngimạng nơron giải quyếtibài toán dự báo kết quả học tập cuối năm, nộiidung chương đã đềicập đến các công trìnhicông bố trong vàingoài nước Luận văn đã ứng dụng cụ thể mạng nơron để đưa ra định hướng đúng đắn cácibước thực hiệniviệc giải quyết bàiitoán trong chương

XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃN

Xây dựng hệ thống dự đoán kết quả học tập cuối năm của học sinh THPT

Hiệninay có rất nhiều hệithống hỗ trợ về lĩnh vực giáo dục như: hệithống hỏi đáp tựiđộng, hệ thống quản lýikết quả học tập của học sinh,ihệ thống tư vấn chọn nghành, Mỗi hệ thống nàyichỉ phục vụ cho mộtikhía cạnh hỗ trợ học sinh, tác giảiluận văn thựcihiện đề tài “Xâyidựng mô hình dự đoánikết quả học tập cuối năm củaihọc sinh tại trườngiTHPT Trần Nguyên Hãn” để hỗ trợ một phần nào trong công việc giáo dục của nhà trường

3.1.1 Tiến trình thực hiện luận văn

Tiếnitrình nghiên cứu đượcithể hiện qua sơ đồisau:

Luận văn đượcithực hiện theo cácibước chính bao gồm:

Dữ liệu được thu thập trongi5 năm từ năm họci2015i- 2016 đến năm họci2019i-

2020 dưới dạng file excel dùng để nghiên cứu cho mô hình

Bước 2: Phân tích và trích chọn đặc trưng

Xáciđịnh kiểu dữ liệuicho mỗi cột,iphân tích để lựa chọn đặc trưng có khả năng ảnh hưởng đến mô hình

Bước 3: iChuẩn hoá dữ liệu

Quá trình làmisạchidữiliệu: thực hiện loại bỏ những dòng chứa tiêu đề, những dữ liệu dư thừa, chuyểniđổi một số kiểu dữiliệu về dạng số, ghép dữiliệu từ các môn rời rạc thành 1 bảng nhằm dễ huấn luyệnimô hình hơn

Sửidụng thiết kế trực quanimô hình mạng nơron và hồiiquy tuyến tính đểixây dựng môihình cho bài toán

Bước 5: iHuấn luyện mô hình

Choiphép người sử dụng đặticác thông số trước khi thực hiệnihuấn luyện

Thựcihiện kiểm tra trên tập dữ liệuikiểm tra, đưa ra kết quả so sánh mô hình với kết quả thực tế

Choiphép người sử dụng nhậpicác giá trị đầu vàoivà mô hình thực hiệnitính toán, xuất kết quảitrả về.

Mô tả tiến trình

Trong luận văn, dữiliệu được thu thậpitừ một hệithống quản lý kết quảihọc tập của học sinh, bảng điểm học kỳ 2 các khối 10, 11, 12; dữ liệu được lấy từinăm học 2015 - 2016iđến năm họci2019i- 2020 tại trườngiTHPT Trần Nguyên Hãn,iTP Vũng Tàu

- Dữ liệu từinăm học 2015 - 2016 đến 2018 - 2019 dùngiđể huấn luyện vàikiểm tra; dữiliệu năm học 2019 - 2020 dùng để xác thực (validation)

- Luận văn thu thập điểm của 3imôn học: Toán, Ngữ văn,iTiếng anh

Hình 3 1 Bảng điểm học kỳ 2 theo môn

- Các đặc trưng trong bảng kết quả từng môn gồm (Hình 3.1):

4 Họ và tên Họ và tên học sinh

5 M1 Điểm miệng Điểm từ 0.0 đến 10.0

6 P1 Điểm thường xuyên1 của học kỳ 2 Điểm từ 0.0 đến 10.0

7 P2 Điểm thường xuyên 2 của học kỳ 2 Điểm từ 0.0 đến 10.0

8 P3 Điểm thường xuyên 3 của học kỳ 2 Điểm từ 0.0 đến 10.0

9 V1 Điểm định kỳ 1 của học kỳ 2 Điểm từ 0.0 đến 10.0

10 V2 Điểm định kỳ 2 của học kỳ 2 Điểm từ 0.0 đến 10.0

11 V3 Điểm định kỳ 3 của học kỳ 2 Điểm từ 0.0 đến 10.0

12 Học kỳ Điểm thi học kỳ 2 Điểm từ 0.0 đến 10.0

13 HKI Điểm trung bình học kỳ 1 Điểm từ 0.0 đến 10.0

14 HKII Điểm trung bình học kỳ 2 Điểm từ 0.0 đến 10.0

15 CN Điểm trung bình cả năm Điểm từ 0.0 đến 10.0

3.2.2 Phân tích và trích chọn đặc trưng

Theo Hình 3.1 ở trên, số lượng đặc trưng ở một bảng điểm là 8 cột gồm: M1, P1, P2, P3, V1, V2, V3, HKI Tác giả luận văn tiếnihành xem xét mức độiảnh hưởng của từngiđặc trưng đến kết quả dự đoán là các cột: P1, P2, V1, HKI - đây là những điểm sẽ được giáo viên bộ môn nhập vào hệ thống giữa học kỳ 2, phù hợp việc dự đoán kết quả điểm cuối học kỳ 2

Hình 3 2 Biểu đồ hiển thị xếp loại học lực của 1 lớp

Với mỗi đặc trưng đưa vào nghiên cứu, luậnivăn tìm hiểu sựiảnh hưởng của dữ liệu đóiđến kết quả của dựiđoán

Qua biểu đồ trên ta thấy điểm tổng kết môn của 1 lớp với điểm TB và Yếu còn Khá nhiều, trong khi đó điểm Khá và Giỏi tỉ lệ chưa thực sự cao Vớiinhững học sinh có điểm họcilực loại Yếu khả năng thi lại là rất cao Điểm tổng kết cả năm là kếtiquả ra mong muốn,ikết quả ra của luận văn là 2 ngưỡng: học sinh diện cảnh báo hoặc an toàn Tác giả đã chuyển đổi điểm cả năm (CN) ra dạng nhị phân 0, 1 cụ thể như sau: nếu CN >= 5.0 ghi 1; CN < 5.0 ghi 0:

Biểu đồ thể hiện cột thấp là số lượng học sinh có điểm < 5.0, cột cao và cột số lượng học sinh có điểm >=5.0

Bảng 3.1 dưới đây thống kê kết quảihọc tập cuối năm củaihọc sinh khốii10, 11, 12 trườngiTHPT Trần Nguyên Hãn Mỗi học sinh như vậy sẽ có kếtiquả học tập cuốiinăm của 11 môn và sẽ có kết luận việc lênilớp hay không đượcilên lớp:

Hình 3 2 Biểu đồ hiển thị điểm CN >= 5.0 (cột 0), CN < 5.0 ( cột 1)

STT NĂM HỌC SĨ SỐ ĐƯỢC

TỶ LỆ % KHÔNG ĐƯỢC LÊN LỚP

Bảng 3 1: Thống kê số lượng học sinh cuối năm lên lớp và ở lại

- Năm học 2015 - 2016 tổng số lượng học sinh đầu năm là 1493, sau khi tổng kết cuối năm học có 1462 em học sinh được lên lớp và có 21 em ở lại lớp tỷ lệ 1.41%

- Nămihọc 2016 -i2017 tổng số lượng họcisinh đầu năm là 1527, sau khi tổng kết cuối năm học có 1509 em học sinh được lên lớp và có 18 em ở lại lớp tỷ lệ 1.18%

-iNăm học 2017 -i2018itổng số lượng họcisinh đầu năm là 1614, sau khi tổng kết cuối năm học có 1591 em học sinh được lên lớp và có 23 em ở lại lớp tỷ lệ 1.43%

- Năm học 2018 - 2019 tổng số lượng học sinh đầu năm là 1738, sau khi tổng kết cuối năm học có 1716 em học sinh được lên lớp và có 22 em ở lại lớp tỷ lệ 1.27%

- Năm họci2019i-i2020 tổng số lượng học sinh đầu năm là 1734, sau khi tổng kết cuối năm học có 1718 em học sinh được lên lớp và có 16 em ở lại lớp tỷ lệ 0.92%

Hàng năm học sinh tổng kết cuối năm sẽ có danh sách học sinh đạt danh hiệu, lên lớp, thi lại, ở lại Đây là bảng thống kê sau khi học sinh đã thi lại và chuẩn bị danh sách choihọc sinh bước vào năm họcimới

Quaibảng thống kê ta thấyisố lượng học sinhiở lại lớp hàng năm tuy không nhiều nhưng cũng ảnh hưởngitới tâm lý và tương lai củaicác em Do vậy việc cảnh báo sớm để điều chỉnh việc học rất là quan trọng

Dữiliệu thu thập bắt đầu từinăm học 2015 - 2016 đếninăm học 2019 - 2020 Luận văn sẽ lấy dữ liệu từinăm học 2015 -i2016 đến năm họci2018i-i2019 để huấn luyện, còn năm học 2019 - 2020 thì dùng để xác thực (validation)

Tại các trường THPT học sinhihọc 13 môn:iToán, Ngữ văn, Tiếng anh,iVật lí, Hoá học,iSinh học, Lịch sử,iĐịa lí, Tin học,iCông nghệ, GDCD, Thể dục,iGiáo dục quốc phòng Trong đó Toán, Ngữ văn, Tiếngianh là 3 mônibắt buộc trong kỳ thiitốt nghiệp và là 3 môn nằm trongicác khối xét tuyểniĐại học và Caoiđẳng nhiều nhất Luận văn đã sử dụng số lượng mẫu được khảo sát 18.885 trên kết quả 3imôn học (Toán,iNgữ văn, Tiếng anh)icủa 6.372 họcisinh thuộc 3 khối học 10, 11, 12 cho cả 4 năm học

Trong thực tế, bảng điểm môn học trên hệ thốngiquản lí kết quảihọc tập của học sinhicó rất nhiều thuộc tính,idựa trên các nghiên cứu vàitiền thực nghiệm, nghiênicứu này xác định mộtisố thuộc tính quan trọngiảnh hưởng đến dựiđoán là các điểm: P1, P2, V1, HK1, CN

Hình 3 3 Ví dụ bảng dữ liệu sau khi trích chọn đặc trưng

Sau khi trích rút đặc trưng tác giả đã chuyển đổi cột CN thành cột KQ tương ứng với điểm CN >=5.0 thì KQ sẽ ghi 1; điểm CN < 5.0 thì KQ sẽ ghi 0

Chuẩn hoáidữ liệuilà bước rất quan trọngitrong việc xây dựng môihình huấn luyện mạng nơron Hầuihết các bộ dữ liệu đượcisử dụng trong mạng nơron đều đượcilàm sạch và quy đổiitrước khi mạng nơron có thểihuấn luyện trên những bộidữ liệu này Ở mô hình này đầu ra chỉ là cảnh báo hoặc không nên sẽ được chuyển đổi về dạng

Dữ liệu có được chỉ là dữ liệu thô, muốn quá trình huấn luyện được tốt luận văn đã tiến hành quá trình làm sạch dữ liệu như sau:

• Tiêu đề trên các bảng điểm đã được lược bỏ;

Ngày đăng: 19/02/2024, 14:53

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w