GIỚI THIỆU CHUNG
Mở đầu
Tại các trường Trungihọc phổ thông (THPT) kếtiquả học tập cả năm rất được quan tâm, là tiêu chí để Giáo viên chọniphương pháp dạy phù hợp vàilà bước tiến quan trọng của học sinh (HS) Kết quả tổng kết hàng năm là bước tiền đề để học sinh dự đoán khả năng đậu tốt nghiệp cũng như học sinh có cơ sở lựa chọn vàoicác trường đại học,icao đẳng hay trung họcichuyên nghiệp sau này Đểiđạt được kết quả học tậpicao thì cả Giáo viên vàiHọc sinh đều phải cố gắng, Giáo viên cố gắng chọn phương pháp dạyiphù hợp, dễ hiểu cho từngiđối tượng học sinh, họcisinh cũng phải có sự hợp tác Tình hình học tậpicủa từng học sinh thường đượcithể hiện qua điểm số thông quaicác bài kiểm tra
Theo thông tưisố 58/2011/TT-BGDĐT [1] ban hành ngàyi12/12/2011 củaiBộ Giáo dục vàiĐào tạo về quy chếiđánh giá,ixếp loạiihọc sinh Trungihọc cơisở (THCS) vàihọc sinh THPT, trong đó ở chương IV ban hành việc học sinh đủ điều kiện được lênilớp, thi lại hoặcikhông được lên lớp Những họcisinh có khả năng phải thi lại là những họcisinh có điểm trung bìnhi(TB) môn dưới 3.5 hoặc học lựcicả năm xếp loại Yếu, đượcichọn một sốimôn có điểm TB cảinăm dưới 5.0 để thiilại Trường hợp học sinh ở lại là những trường hợp học lựcicả năm loạiiKém hoặc học lựcivà hạnh kiểm cả nămiloại Yếu Tại trường THPTiTrần Nguyên Hãn VũngiTàu hàng năm đến gần cuối học kỳ 2 Ban giám hiệu (BGH) nhà trường sẽ rà soát và đưa dự đoán tổng kết cuối năm thông qua điểm tổng kết cuối học kỳ 1; điểm thường xuyên 1 (P1), điểm thường xuyên 2 (P2), điểm định kỳ lần 1 (V1) của học kỳ 2 nhằm khen thưởng những em có sự tiến bộ và cảnh báo đối với những em có các môn còn yếu, dự báo về vấn đề thi lại hoặc ở lại lớp với những học sinh có điểm kém Dựa vào dự đoán này BGH sẽ yêu cầu giáo viên chủ nhiệm thông tin tới HS và phụ huynh (PH) để tìm hướng bồi dưỡng thêm, giúp các em nâng cao kiến thức, vượt qua khó khăn các môn còn kém trong thời gianicòn lại của cuối học kỳivà đạt được thành tích cao nhất vào cuối năm học
Hàng năm tất cả các trường THPT đều muốn trường mình có tỉ lệihọc sinh đậu tốt nghiệp vàivào các trường cao đẳng,iđại học cao nhất, bởi tỉ lệ đậu tốt nghiệp, đại học là minh chứng của chất lượng giảng dạy của một trường Trong cácimôn học tạiicác trường
3 THPT thì 3imôn Toán, Ngữivăn, Tiếng Anh lài3 môn quan trọng nhất bắt buộc học Ba môn này liên quan đến việc thi xét tốt nghiệp và nằm nhiều nhất trong các tổ hợp để xét vào trường cao đẳng vàiđại học trên cảinước Ngoài việc 3 môn này ảnh hưởng trực tiếp tới việc ở lại, thi lại và lên lớp thì nó còniảnh hưởng tới tương lai của cáciem sau này nên việc phát hiện, nhắc nhở và có phương án cho những học sinh có điểm 3 môn này dưới trung bình là vấn đề cần thiết Trong luận văn này tác giả chọn ngưỡng cảnh báo đối vớii3 môn Toán, Ngữ văn,iTiếng Anh là điểm tổng kết cuối kì dưới 5.0
Tuy nhiên việc dự đoán và đưa ra cảnh báo nhà trường từ trước đến nay vẫn thực hiện trên phương pháp thủ công mà không dựaitrên một phương pháp phân tíchicó tính khoaihọc nhất định Vìivậy luận văn này xây dựngimô hình dự đoán kết quả cuối năm củaitừng môn theo đúng năng lựcihọc tập của học sinh trên cơisở khoa học làisử dụng thuật toánimạng nơron nhân tạo vàihồi quy tuyến tính.
Giới thiệu đề tài
1.2.1 Lý do chọn đề tài
Cùng vớiisự thay đổi vàiphát triển không ngừng của ngành Công nghệithông tin thì việc thu thập vàilưu trữ lượng thông tiningày càng lớn, việc tin học hoá nhanh chóng cácihoạt động trong sản xuất,ikinh doanh, quản lí cũng như trong lĩnh vựcihoạt động giáo dục đãitạo ra khối lượng lớnidữ liệu Dẫn đến yêu cầu cấp bách vàicần thiết phải cóinhững kỹ thuật và công cụimới để phân tích chuyển đổi lượngidữ liệu lớn đó thành cácitri thức có ích Từiđó, kỹ thuật khai pháidữ liệu đãitrở thành một trong những lĩnh vực thời sựicủa nền công nghệ thông tin.iVấn đề đặt railà làm sao trích chọn những thông tinicóiý nghĩa từ tập cơ sở dữ liệu lớn,iđể đáp ứng việc giải quyết được cáciyêu cầu trong thực tếinhư trợ giúp ra quyết định,idự đoán, … Chính vì vậy, khai pháidữ liệu đãira đời nhằm giải quyết cáciyêu cầu đó, vàitrở thànhimột trong nhữngixu hướng nghiênicứuiphổ biến trong lĩnhivực họcimáy.iMột trong những hướng nghiên cứuiphổ biến và quan trọngiđó là mạng nơron đa tầng và hồi quy tuyến tính
Mạng nơron đa tầng vớiidữ liệu đầu vào làitập dữ liệu các thuộc tínhiđiểm tổng kết thúc học kỳ 1 môn Toán,iNgữ văn, Tiếng anhicủa học sinh Các nơron nhậnitín hiệu vàoixử lýi(tính tổng trọngisố,igửi tớiihàm kích hoạt) rồi choira kết quải(là kết quảicủa hàm kích hoạt); kết quảinày sẽiđược truyền tớiicác nơronithuộcitầng ẩnithứ nhất;icác nơronitại đâyitiếp nhận nhưitín hiệuiđầu vào,ixử lýivà gửiikết quảiđến tầng ẩnithứ 2;
4 các nơron tại đâyitiếp nhận như tín hiệuiđầu vào, xử lýivà gửi kết quả đến tầngikết quả Những tầng ẩninằm giữa tầng vàoivà tầng ra nóithể hiện quá trình suy luậnilogic của mạng nơron Tác giả đặt ra ngưỡng cho bài toán cảnh báo là điểm tổng môn học dưới 5.0, nên trong luận văn này, mạng nơron sẽ được xây dựng với kết quả của luận văn cho tầng output sẽ có 2 đầu ra cảnh báo hoặc không
Hồi quyituyến tính với dữ liệu đầu vàoilà tập dữ liệu làicác thuộc tính điểm học sinh, với phương pháp họcicó giám sát sẽ trả vềikết quả là điểm cụ thể của học sinh cần dự đoán, nhờ đó việc cảnh báo về độ nghiêm trọng hay không sẽ dễ dàng và cụ thể hơn
Việc phân tíchivà đưa raidự đoán trước kết quảihọc tập cuối năm củaihọc sinh giúp nhà trường thấy được tổng quan học lực hiện tại của từng lớp, tiến độihọc tập của từng họcisinh BGH nhà trường sẽicó kế hoạch về khuyến khích khen thưởng những họcisinh có học lựcitốt, giúp các em phát huy kết quả hiện tại; có định hướng cho học sinh còn yếu kémiđể các emicố gắng rèn luyện thêm những môn còn yếu đồng thời giúp giáo viên bộ môn cũng để ýivà giúp đỡicác em nhiều hơn Đểicó được kết quảitốt vào cuối năm học,iđặc biệt là học sinhi12 có được tỷ lệ đậu tốtinghiệp cao, vào đượcicác trường đại học vàicao đẳng thì việc nhà trường cóisự quan tâm và đưa ra dự đoán sớm là rấticần thiết Vìivậy, luận văn củaitôi nghiên cứuiđề tài
“Xâyidựng mô hìnhidự đoán kết quả học tậpicuối năm củaihọc sinh tại trường THPT Trần Nguyên Hãn”
Nghiên cứuiđể đưa ra giải phápidự đoán kết quảimôn học cuối năm từiđó xây dựng chương trìnhicó thể sử dụng đểidự đoán kết quảitừng môn học cho từng học sinh các khối sử dụng dữ liệu của trường THPT Trần Nguyên Hãn.
Đối tượng và phạm vi nghiên cứu của đề tài
Dữ liệu để huấn luyện và kiểm tra: điểm HKI; P1, P2, V1 học kỳi2 của học sinhitừ năm họci2015 - 2016 đếninăm học 2018i- 2019 tại trường THPTiTrần Nguyên Hãn,iTP Vũng Tàu.
Phương pháp nghiên cứu
1.4.1 Phương pháp nghiên cứu lý thuyết
• Tìm hiểuitổng quan vềicác thuật toán máy học;
• Tham khảo cácitài liệu liên quan đếnithuật toán Neural Network, Hồi quy tuyến tính từinhiều nguồn khác nhau như:isách báo,igiáo trình, các bài báo khoa học và internet;
• Thu thậpivà xử lýisố liệu từ dữ liệu thực tếitại trường THPTiTrần Nguyên Hãn, TPiVũng Tàu
Xây dựngiứng dụng và dự báoikết quả học tậpicuối năm của học sinh cho từng môn học, từ đó cảnh báo tới học sinh,igiáo viên chủ nhiệmivàigiáo viên bộ môniđể kịp thời nhắc nhởivà cóiphương pháp giảng dạyiphù hợp với các học sinhicòn yếu, kém.
Cấu trúc luận văn
Luậnivăn gồm cói4 chương, đượcitrình bày với cấu trúc nhưisau:
CHƯƠNG 2: Giải pháp giảiiquyết bài toán dự đoánikếtiquả họcitập cuối năm củaihọc sinh THPT
CHƯƠNG 3: Xâyidựng mô hình dự đoánikết quả họcitập cuối năm của họcisinh THPT CHƯƠNG 4: Kết luận và hướng phát triển
Trongichương nàyitác giảiđã trình bàyilý doichọniđề tài,imục tiêuicủa đề tài,iđối tượng vàiphạm viinghiên cứu củaiđề tài, phương phápinghiên cứu của đề tàiivà kết cấu
GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH THPT
Giới thiệu về bài toán dự đoán
CNTT làimột tronginhững lĩnh vựciquan trọng gópiphần thúc đẩyisự phátitriển kinh tếicủa đấtinước.iỨng dụng CNTT có ở tất cả các lĩnh vực,ilà nền tảngicủa nghiên cứuivề công nghệ caoinhư khoa họcivũ trụ,icông nghệ điện tửivàitự độngihoá,icác hệ thốngithông minh,… Tại Việt Nam, hiện nayiCNTT được xác định làilĩnh vực thenichốt được đầuitư không những hiệniđại hoá cơ sởihạ tầng mà cònilà việc ứng dụngisâu rộng vào các lĩnh vựcikhác của cuộc sống xãihội
Nghị quyếtisố 36-NQ/TW ngày 1/07/2014 củaiBộ Chính trịivề đẩy mạnhiứng dụng,iphát triểniCNTT [2] đápiứng yêuicầu phát triểnibền vững vàihội nhậpiquốc tếitiếp tụcikhẳng địnhisự quan tâm,ichỉ đạoisát sao củaiĐảng đối vớiicông táciứng dụng,iphát triểniCNTT, khẳng địnhivị trí,ivai tròicủa CNTT trongisự nghiệpixây dựng vàibảo vệ
Tổ quốcithời kỳimới Nghị quyết nàyilà một văn bản rấtiquan trọng, làiđịnh hướng xuyên suốticho chiến lượciứng dụng,iphát triểniCNTT vàitruyền thôngitừ nayiđến nămi
2030, làitiền đềiquan trọng đểiCNTT ViệtiNam phát triểnimạnh mẽ,isâu rộng hơn,iđề rainhững định hướng lớnicho sựiphát triểniCNTT nước nhàitrong khoảng 10i– 20inăm tới Mục tiêu nămi2030,iđưa năng lựcinghiên cứu,iứng dụng,iphát triển,isản xuất vàicung ứngisản phẩm,idịch vụiCNTT đạtitrình độitiên tiếnithế giới.iViệt Nam trởithành quốc giaimạnh vềiCNTT trongikhu vực
Cuộc cáchimạng công nghệp lầnithứ tư (CMCNi4.0) thông qua cácicông nghệinhư trí tuệinhân tạo,iInternet vạnivật,ithực tế ảo,itương tácithực tại ảo,imạng xãihội, điện toán đám mây,idi động, phân tíchidữ liệu sớm,… đã chuyển hoáitoàn bộithế giớiithành thế giớiisố.iCác công nghệithông minh đang đượcitích hợpivào mọiikhía cạnh củaixã hội, xoáibỏ ranh giớiicông nghệithông thường,ithay đổiihình dạngimạng lướiicông nghệ vàisản xuất, thúc đẩyisự phát triển củaithời đại
Trí tuệinhân tạo làimột hướng nghiên cứuicủa lĩnh vựciCNTT vàikhoa họcimáy tính nhằmiphát triểnihệ thống thôngiminh đểigiải quyết cácibài toán thực tếigiống như hoạtiđộng bộinão của con người.iTrí tuệ nhân tạoiđược bắt đầu nghiênicứuitừ những năm 50icủa thếikỷ 20ivà trong khoảngi30 nămitrở lại đâyiđã đượcicộng đồngivà cácinhà
8 khoa họciquan tâmimạnh mẽ.iRất nhiềuicác hội thảoilớn về lĩnhivực này đượcitổ chức hàng nămitrên thế giới.iCác ứng dụngitiêu biểu củaitrí tuệinhân tạoivào đờiisống xãihội như: người máy,irobot, xử lý ngôn ngữitự nhiên, dự báo, dự đoán, nhận dạng,iphát hiện dịithường, an ninh quốc phòng, khoa họcivũ trụ vàitrái đất,…
Ngày nay, CNTT đượciứng dụng trong hầu hếticác lĩnh vực hoạt động xãihội Lĩnh vực giáoidục cũng không thể thiếu sự hỗitrợ đắc lực của khoa họcimáy tính nói chung hay tríituệ nhân tạoinói riêng Để giúp công việcigiảng dạy đạt hiệu quảicao hơn, luận văn nghiên cứu “Xây dựng dự đoán kết quả cuối năm của học sinh tại trường THPT
Trần Nguyên Hãn” Từ kếtiquả dự đoán đó, hỗ trợ BGH có kế hoạch phù hợp, đưaira phương phápidạy học cho từngiđối tượng học sinhicụ thể, giúp các emiđạt được kếtiquả học tậpitốt hơn.
Mục tiêu và nhiệm vụ
Mụcitiêu quan trọng nhất của bài toán dựiđoán kết quảihọc tập cuối năm củaihọc sinhilà giúp các em thấy được lực học của mình đến đâu, có những yếuitố nào ảnh hưởng đếnikết quả họcitập và tầm quan trọng củaiviệc đậu tốt nghiệp THPT Từ đó các em định hướng tốt hơn về việc học của mình ngay từ đầu cấp đốiivới học sinh khối 10, hay vớiihọc sinh khối 12 sẽ cần cố gắng nhưithế nào đểicó kết quả tốt nhất Thời gian dự đoán kết quả vào khoảng giữa HKII nên kết quả dự đoán có thể thay đổi bởi nhiều yếu tố tùy thuộcivào việc chăm chỉihọc tập hay sựicố gắng học hỏi của học sinh khác nhau, có em sẽ chăm chỉ hơn, cũng có em sẽ lơ là việc học hơn làm ảnh hưởng đến kết quả dự đoán đó.
• Thấy được học lực hiện tại củaihọc sinh, sựitiến bộ củaihọc sinh;
• Khuyếnikhích những học sinh cóihọc lực tốt giúp các em phát huy kết quả đó Động viên các em còn yếu kém để các em cố gắng rèn luyện thêm những môn học yếu, kém;
• Hỗ trợ, hướng dẫn học sinh, giúp cáciem định hướnginghề nghiệp trong tương laiiđể các em có mục tiêu phấn đấu mà cố gắng học tập;
• Theo sát, giúpiđỡ những học sinhicó hoàn cảnh đặc biệt, giúp cáciem ổn định
9 tâm lí, tiếp tục việc học, hoàn thành chương trình học của mình.
Giới thiệu Neural Network
Theo cácinhà nghiên cứuisinh học [3], hệithống thần kinh củaicon người baoigồm khoảng 10 11 tếibào thần kinh,ithường gọi làicác nơron Mỗi tếibào nơron gồmi3 phần:
• Thâninơron và nhân bênitrong (gọiilà soma), là nơiitiếp nhận hay phát raicác xung độngithần kinh;
• Mộtihệ thống dạng câyicác thần kinhivào (gọiilà dendrite) đểiđưa tín hiệuitới nhân nơron Cácidây thần kinh vàoitạo thành một lướiidày đặc xung quanhithân nơron, chiếmidiện tích 0.25mm 2 ;
• Đầuidây thần kinh rai(gọi làisợi trục axon)iphân nhánhidạng hìnhicây,icó thể dài từi1cm đến hàngimét Chúng nối vớiicác dây thần kinhivào hoặc trực tiếp vớiicác nơronikhác thông quaicác khớpinối (gọiilà synapse) Cóihai loạiikhớp nối,ikhớp nốiikích thíchi(excitatory) sẽicho tín hiệuiqua nóiđể tớiinơron,icòn khớp nốiiức chếi(inhibitory) cóitác dụngilàm cảnitín hiệu tớiinơron Người ta ướcitính mỗi nơron trong bộinão người có khoảng 10 4 ikhớp nối
Chức năngicơ bản của tếibào nơron làiliên kết với nhau đểitạo nênihệ thống thần kinhiđiều khiểnihoạt động củaicơ thểisống Cácitế bàoinơron truyềnitín hiệu choinhau thông quaicác dây thần kinh vàoivà ra, cácitín hiệu đóicó dạng xung điệnivà được tạoira từ cáciquá trình phản ứngihoá họciphức tạp.iTại nhân tếibào khiiđiện thế củaitín hiệu củaitín hiệu vàoiđạt tớiimột ngưỡng nàoiđó thìinó tạoira mộtixung điệnidẫn tới trụcidây thầnikinh ra.iXung nàyitruyền theo trụcira tới cácinhánh rẽivà tiếpitục truyền tớiicác nơronikhác [3]
Não người được coi như mộtihệ thống xửilý thông tin rất phức tạp,iphi tuyến và songisong Có thểigiải quyết được rấtinhiều vấn đề như: nghe,inói, nhìn, hồiiức thông tin,inhận dạng các mẫu, Não thựcihiện được những nhiệmivụ như vậy nhờicác phần từitính toán đóilà nơron
Ngoàiira,ido tínhimềm dẻoicủa sự kếtinối giữa cácitế bàoithần kinh màinão người cóikhả năng học hỏiiqua những kinh nghiệm từiquá khứ Học làimột đặc tínhicơ bản và thiết yếuicủa mạng nơronisinh học [4]
10 Dựa vàoicác đặc trưng cơibản của mạng nơronisinh học người ra đãixây dựng nên mạng nơroninhân tạo Mạng nơroninhân tạo (Artificial Neural Network, ANN)ingày nayigần giống với bộinão con người như: cóikhả năng học,itức là sửidụng nhữngikinh nghiệm đểicải thiệnihiệu suất.iKhi thuithập được đủimột lượng mẫuithì ANN cóithể khái quátihoá rất cao.iMột ANN cóithể nhận ra một ký tựiviết tay, có thểiphát hiện ra người có dấu hiệu bất thường nơi công cộng Chínhivì vậyimà mạnginơron cóithể giải quyết cácivấn đềiphức tạpicó quy mô lớnivà khó hiệninay [5]
Mạng nơroninhân tạo (ANN) làimô hình xửilý thông qua môiphỏng hoạtiđộng của hệithống thần kinhisinh vật,ibao gồmisố lượng lớnicác nơroniđược gắn kếtiđể xửilý thôngitin.iANN giốnginhư bộinão con người,iđược họcikinh nghiệm (quaihuấn luyện),i cóikhả năng lưuigiữ các kinh nghiệmihiểu biếti(triithức) vàisử dụnginhững triithức đó trong việcidự đoán cácidữ liệu chưa biết.iANN được huấn luyện hayiđược học theo các kỹithuật cơibản là họcicó giámisát vàihọc không giámisát [6]
Họcilà quáitrình cậpinhật trọng sốisao choigiá trịihàm lỗiilà nhỏinhất Mộtimạng nơroniđược huấn luyệnisao choivới mộtitập các vector đầuivào 𝑋, mạng cóikhả năng tạo raitập các vector đầuira mong muốn 𝑌 củainó Tập 𝑋 đượcisử dụng cho huấniluyện mạng được gọiilà tập huấniluyện (trainingiset).iCác phần tửi𝑥 thuộc 𝑋 được gọiilà các mẫuihuấn luyệni(training example).iQuá trìnhihuấn luyệnibản chất làisự thay đổiicác trọng sốiliên kếticủa mạng.iTrong quáitrình này,icác trọng sốicủa mạngisẽ hội tụidần tới cácigiá trịisao cho vớiimỗi vector đầuivào 𝑥 từ tậpihuấn luyện, mạng sẽicho ra vector đầuira 𝑦 nhưimong muốn [4]
- Học có giám sát: cóithể được xem nhưiviệc xấp xỉimột ánh xạ: 𝑋 -> 𝑌, trongiđó
𝑋 làitập các vấn đềivà 𝑌 tập cácilời giải tương ứngicho vấn đề đó.iCác mẫu (𝑥, 𝑦) với
𝑥 = (𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) ∈ 𝑋, 𝑦 = (𝑦 1 , 𝑦 2 , … , 𝑦 𝑛 ) ∈ 𝑌 đượcicho trước Học cóigiám sát trong cácimạng nơron thường đượcithực hiện theo các bướcisau:
- Bướci1: Xây dựngicấu trúc thích hợpicho mạng nơron, chẳng hạnicó 𝑛 nơroniđầu vào,
𝑚 nơroniđầu ra,ivà khởiitạo cácitrọng sốiliên kếticủa mạng;
- Bướci2: Đưaimột vector 𝑥 trong tậpimẫu huấn luyện 𝑋 vàoimạng;
- Bước 3:iTính vector đầuira 𝑧 củaimạng;
- Bước 4:iSo sánh vector đầuira mong muốn 𝑡 (làikết quả được cho trongitập huấn luyện) với vector đầuira 𝑧 do mạng tạoira; nếu cóithể thì đánh giáilỗi
- Bướci5: Hiệu chỉnh cácitrọng số liênikết theo mộticách nàoiđó sao choiở lầnitiếp theo khiiđưa vector 𝑥 vàoimạng, vector đầuira 𝑧 sẽigiốngivới 𝑡 hơn
- Bước 6:iNếu cần, lặp lạiicác bước từi2 đến 5icho đến khi mạng đạtitới trạng tháiihội tụ.iViệc đánhigiá lỗiicó thểithực hiện theoinhiều cách,icách dùnginhiều nhất làisử dụng lỗiitức thời: 𝐸𝑟𝑟 = (𝑧 − 𝑡), hoặci𝐸𝑟𝑟 = |𝑧 − 𝑡|; lỗiitrung bìnhibình phươngi(MSE: mean- squareierror):i𝐸𝑟𝑟 = (𝑧 − 𝑡) 2 /2
Thuật toánitổng quát trên choihọc cóigiám sát trongicác mạnginơron cóinhiều cài đặtikhác nhau,isự khácinhau chủ yếuilà cáchicác trọng sốiliên kếtiđược thay đổiitrong suốtithời gianihọc.iĐiển hìnhicho kỹ thuật nàyilà mạnginơron lanitruyền ngượci(backi- propagation)
- Họcikhông giámisát:iKhông sửidụng tri thứcibên ngoàiitrong quáitrình học, nênicòn gọi làitự tổichức (selfi- Organizing).iMạng nơroniđiển hìnhiđược huấniluyện theoikiểu không giám sátilà SOM [7], [6].
2.3.2 Khả năng ứng dụng của mạng nơron nhân tạo Đặcitrưng của mạnginơron nhân tạoilà khảinăng học.iMối quanihệ tương quan phứcitạp giữaicác yếu tốiđầu vàoivà đầuira củaicác quá trìnhicần nghiênicứu vàikhi đã họciđược thìiviệc kiểm traiđộc lập thường choikết quả tốt.iSau khi đãihọc xongimạng nơroninhân tạo cóithể tínhitoán kết quảiđầu raitương ứng với bộisố liệuiđầu vàoimới
Vềimặt cấu trúc,imạng nơron nhân tạoigồm nhiều phần xửilý đơnigiản cùng hoạt độngisong song Đặc tính nàyicủa ANNicho phép nóicó thểiđược ápidụng đểigiải các bài toánilớn
Vềikhía cạnh toán học,itheo định lýiKolmogorov, một hàmiliên tục bấtikỳ 𝑓(𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) xáciđịnh trên khoảng 𝐼 𝑛 (vớiiIi=i[0,1])icó thểiđược biểu diễnidưới dạng [8]:
12 Trongiđó: 𝑥 𝑗 , 𝛹 𝑖𝑗 làicác hàm liên tụcimột biến 𝛹 𝑖𝑗 làihàm đơniđiệu,ikhông phụ thuộc vàoihàm f Mặtikhác,imô hìnhimạng nơroninhân tạo choiphép liên kếticó trọngisố cáciphần tửiphi tuyến (cácinơron đơnilẻ) tạoinên dạng hàmitổng hợpitừ cácihàm thành phần Doivậy, sauimột quá trìnhiđiều chỉnhisự liên kếticho phù hợpi(quá trìnhihọc), các phần tửiphi tuyếniđó sẽitạo nênimột hàmiphi tuyến phứcitạp cóikhả năngixấp xỉihàm biểuidiễn quá trìnhicần nghiên cứu.iKết quảilà đầuira của nóisẽ tươngitự vớiikết quảiđầu raicủa tậpidữ liệu dùngiđể huấn luyệnimạng.iKhi đó tainói mạng nơroninhân tạoiđã học đượcimối quanihệ tương quaniđầu vàoi- đầu raicủa quá trình vàilưu lại mối quanihệ tương quan nàyithông qua bộitrọng sốiliên kết giữaicác nơron.iDo đó,imạng nơron nhân tạoicó thểitính toán trênibộ số liệuiđầu vào mớiiđể đưaikết quả đầuira tươngiứng
Vớiinhững đặc điểmiđó,imạng nơroninhân tạoiđã đượcisử dụng đểigiải quyết nhiều bàiitoán thuộcinhiều lĩnhivực khác nhau Cácinhóm ứng dụng cácimạng nơron nhânitạo đãiđược ápidụng rất cóihiệu quảilà:
- Bàiitoán phânilớp:iLoại bàiitoán này đòiihỏi giảiiquyết vấniđề phâniloại cáciđối tượngiquan sátiđược thànhicác nhóm dựaitrên cáciđặc điểm củaicác nhómiđối tượngiđó Đây làidạng bài toán cơisở của rấtinhiều bài toánitrong thực tế:inhận dạngichữ viết, tiếng nói,iphân loại gen,iphân loạiichất lượng sảniphẩm,
- Bàiitoán dựibáo:iMạng nơroninhân tạoiđã đượciứng dụngithành côngitrong việc xâyidựng cácimô hình dựibáo sửidụng tậpidữ liệuitrong quá khứiđể dựiđoán số liệuitrong tươngilai.iĐây làinhóm bài toán khóivà rấtiquan trọngitrong nhiềuingành khoaihọc
- Bàiitoán điều khiển vàitối ưuihoá:iNhờ khảinăng học vàixấp xỉihàm màimạng nơroninhân tạoiđã được sửidụng trong nhiềuihệ thốngiđiều khiển tựiđộng cũng nhưigóp phần giảiiquyết những bài toán tốiiưu trong thựcitế
- Mạnginơron đã được ứngidụng trong rất nhiềuilĩnh vực trong cuộc sống như:
+ Giáo dục: Dựibáo tình hình tuyển sinh, thôi học, bỏ học, tốt nghiệp tại các trường, dự báo chọn tổ hợp môn thi đại học, dự báo kết quả cuối năm học + Y tế: Chuẩn đoán được bệnh di truyền hiếm gặp
Thuật toán hồi quy tuyến tính
Phânitích hồiiquy tuyếnitính làinghiên cứuisự phụithuộc củaimột biếni(biếniphụ thuộcihay còniđượcigọi làibiến giảiithích) vàoimột biếnihay nhiềuibiến kháci(biếniđộc lậpihay cònigọi làibiến giảiithích)ivới ýitưởng cơibản làiước lượngihayidự đoánigiá trị trung bìnhicủa biếniphụ thuộcitrênicơ sởicác giáitrịiđã biếticủa biếniđộcilập.iDự đoán giá trịicủa biến phản hồi từicác biến giải thích (biến độc lập),ikhi có mối quan hệituyến tính giữa chỉ cóimột biến giải thíchivà một biến phản hồi,ichúng ta gọi đây làihồi quy tuyến tínhiđơn (simple linear regression).iKhi có nhiều hơn mộtibiến phản hồi và cóibất kỳ số lượng biến giải thích ta gọi là hồi quy đa biến (multivariate regression) [21]
2.4.1 Hồi quy tuyến tính đơn
2.4.1.1 Phương trình hồi quy tuyến tính đơn Đặt (𝑥 1 , 𝑦 1 ), (𝑥 2 , 𝑦 2 ), … , (𝑥 𝑛 , 𝑦 𝑛 ) làimẫuigồm 𝑛 cặpiquan sát trên đườngihồi quy tổngithể 𝑦 = 𝛼 + 𝛽𝑥 1 + 𝜀 1 [21].
Theo phương trình béinhất thì ước lượng của hệisố 𝛼 và 𝛽 làicác giá trị 𝑎 và 𝑏 sao choitổng bình phương sai sốicủa phương trìnhisau đây làibé nhất [21]:
Và phương trìnhihồi quy tuyến tính mẫuicủa 𝑦 trên 𝑥 là: 𝑦 = 𝑎 + 𝑏𝑥
Trongiước lượng cácitham sốicủa mô hình hồi quy tuyếnitính đơn theo phương phápibình quân nhỏ có thểichứng minh được rằng:
∑(𝑦 𝑖 − 𝑦 𝑡𝑏 ) 2 =iSSTi(Total Sumiof Squares) là tổngibiến động của 𝑦
∑(𝑦̃ 𝑖 − 𝑦 𝑡𝑏 ) 2 = SSR (Sum ofiSquares Residual) là tổngibình phương hồi quy,ilà đại lượng biếniđộng của 𝑦 được giải thíchibởi đường hồi quy
∑(𝑦 𝑖 − 𝑦̃ 𝑖 ) 2 = SSEi(Sum of Squares Error) làiphần biếniđộngicòn lạiihay cònigọiilà số dư,ilà đạiilượngibiến độngitổng gộpicủa nguồnibiến độngido cácinhân tốikhác gâyira mà khôngihiện diệnitrongimô hìnhihồi quy vàiphầnibiến độngingẫu nhiên
• SSRicàng lớnithìimô hìnhihồi quyicàngicó độitin cậyicao việcigiải thíchibiến độngicủa 𝑦
𝑆𝑆𝑇 làiphần trăm biến độngicủa 𝑦 được giải thíchibởi mối quan hệ tuyến tínhicủa 𝑦 đốiivới 𝑥
𝑀𝑆𝐸 cóiphân phối 𝐹 vàithường được dùng đểikiểm định mứciý nghĩa của mô hìnhihồi quy 𝐹 càngilớn thì mô hình càngicó ý nghĩa
* Hệ sốixác định: R 2 làihệ số nhằm xáciđịnh mức độ quan hệigiữa 𝑥 và 𝑦 cóiquan hệ hayikhông hoặcibao nhiêuiphần trămisự biếnithiênicủa 𝑦 cóithể giảiithíchibởi sựiphụ thuộcituyến tính của 𝑦 vàoi𝑥
Giá trịidự đoán theo phương trìnhihồi quy: 𝑦 = 𝑎 + 𝑏𝑥 1
Vậy 𝑒 1 làisự khác biệt giữaigiá trịithựcitế vớiigiá trịidự đoánicủaiphương trìnhihồi quy tuyếnitính.iNhư vậy 𝑒 1 thể hiệniphần biếnithiênicủa 𝑦 không thểigiải thíchibởiimối quanihệ tuyến tínhigiữa 𝑦 và 𝑥
SSRicàng lớnithìimô hìnhihồi quyituyến tínhicàngicó độitin cậyicaoitrong việcigiải thích sựibiến độngicủa 𝑦
𝑆𝑆𝑇 làiphần trămibiến độngicủa 𝑦 đượcigiải thích bởi mốiiquan hệ tuyến tính củai𝑦ivào 𝑥
2.4.1.3 Dự báo trong phương trình hồi quy tuyến tính đơn Ướcilượng khoảngigiáitrị thựcicủa 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )
∑ 𝑛 𝑖=1 𝑥 𝑖 2 − 𝑛𝑥̅ 2 Ướcilượng khoảng giá trịitrung bình 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )
2.4.2 Hồi quy tuyến tính đa biến
2.4.2.1 Mô hình hồi quy tuyến tính đa biến
Giảisử 𝑦 phụ thuộcivào 𝑘 biếniđộc lập 𝑥 1 … 𝑥 𝑘 Nếuigiá trị của 𝑘 biếniđộc lập
𝑥 1 … 𝑥 𝑘 thì mô hìnhihồi quy tuyến tính đa biến cóidạng [21]:
𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đối với bài toán của luận văn là dự đoánikết quả học tập cuối năm, thì ởiđây 𝑦 là kết quả và các biến:
- 𝑦 (biến phụ thuộc): Đầu ra điểm cả năm (CN) được dự đoán
- 𝛼 (biến độcilập): hệ số chặniphản ánhimứciảnh hưởngicủa cácinhân tốikhác đếnichỉ tiêuiphânitích
- 𝛽: hệ sốiước lượng,icácihệ sốihồi quyinàyiphản ánhimức độ ảnh hưởng của từnginhân tố đếnibiến giảiithích Nếu 𝛽>0 thìiảnh hưởngithuận vàingược lại thì ảnh hưởnginghịch
𝛽 càng lớnithì sựiảnhihưởng đếnichỉ tiêuiphân tíchicàng mạnh
- 𝑥 𝑘 là yếuitố ảnh hưởngiđến điểm cả năm (CN)
2.4.2.2 Phương trình hồi quy tuyến tính đa biến
Gọi các hệisố 𝑎, 𝑏 1 … 𝑏 𝑘 là ước lượng cho 𝛼, 𝛽 1 … 𝛽 𝑘 đượcixác địnhibởiiphương phápibình phươngibéinhất.iPhương trìnhihồi quy cóidạng:
2.4.2.3 Phân tích phương sai hồi quy
* Hệ sốixác định: 𝑅 2 làinói lênitínhichặt chẽigiữa biếniphụithuộc 𝑦 vàicác biến độcilập
𝑥 𝑖 , tức là nóithể hiện phần trămibiến thiên 𝑦 có thểiđược giảiithíchibởi sựibiến thiênicủa tất cảicác biến 𝑥 𝑖
SSEi= ∑ 𝑛 𝑖=1 𝑒 𝑖 2 : làiphần biến độngicòn lại hay còn gọi làisố dư
SSRi= ∑ 𝑛 𝑖=1 (𝑦 𝑖 − 𝑦̅) 2 : làitổng bìnhiphươngihồi quy,ilà đạiilượngibiến độngicủa 𝑦 được giảiithích bằng đường hồiiquy
SSRicàng lớnithìimô hìnhihồi quyicàng cóiđộitinicậy caoitrong việcigiải thíchibiến động
𝑅 nóiilên tính chặt chẽicủa mốiiquanihệ giữaibiến phụithuộc 𝑦 vàicác biếniđộc lập 𝑥 𝑖
2.4.2.4 Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy đa biến
Mô hìnhihồi quy đa biến choitổng thể có dạng:
𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đặt 𝑎, 𝑏 1 , 𝑏 2 , … , 𝑏 𝑘 làinhững tham số đượciước lượngicho tổng thể; 𝑆 𝑎 , 𝑆 𝑏 1 ,
𝑆 𝑏 2 , … , 𝑆 𝑏 𝑘 là nhữngiđộ lệch chuẩn đã được ướcilượng, 𝑢 coiilà phân phối chuẩnithì biếningẫu nhiên 𝑡 được tínhinhư sau:
Vì vậy,ikhoảng cách độ tin cậyi100(1 – 𝛼)% choicác hệ số hồi quy 𝛽 1 đượcitính như sau:
Một số hướng nghiên cứu về những bài toán dự đoán có sử dụng mạng nơron 34
Bài toánidự đoán cóinhiệm vụiphân tíchivàisử dụngisố liệuiđãicó trongiquá khứiđể dự đoánigiá trịitươngilai Hiệninay,icó rấtinhiềuiphương phápidự đoán đãiđược sửidụng trênimô hìnhivật lýivà môihình toánihọc tronginhiều trườngihợp,ikết quảinghiên cứuidự đoán theo cácimô hìnhitrêniđã đạtiđược nhữngithành cônginhấtiđịnh.iTuy nhiêniphương pháp nàoicũng cóinhững hạnichế,ido vậyibài toánidự đoán vẫn làinội dungiđượcinghiên cứuihiện nay.iTrênithế giớiicũng nhưitronginước, cáciphương phápikhai phá dữ liệu (đặc biệtilà các phương pháp máy học,imạng nơron)icũngiđược ápidụng nhiềuivào các bài toánidự đoán
2.5.1 Các nghiên cứu trên thế giới
Trênithế giớiicácinghiên cứuivề việcixây dựngimô hìnhidự đoán kết quả họcitập của học sinh,isinh viên các trường đại họcitrong các giai đoạn đầu củaihọc kỳ sử dụng kỹithuật máy học khá nhiều và đãibắt đầu cáchiđây khá lâu,ihiện tại vẫn còn đangiđược nghiên cứu và phát triểniđể giảm thiểuisai sót trong dự đoán Riêngitrong lĩnh vực ứng dụngimạng nơron choidự đoán có thểikể đến một số côngitrình liên quan dướiiđây: Tronginghiên cứu kết quảihọc tập sinhiviên tại đạiihọc Mansura Ai Cập năm 2021 [22], nhóm đồng tác giả SEYAM AYA NABIL, MOHAMMED, AND AHMED ABOU-ELFETOUH đã sử dụngimột số thuật toán như:imạng lưới DeepiNeural Network (DNN), câyiquyết định, rừng ngẫu nhiên,ihồi quy Logistic, (K-Nearest Neighbors – KNN) đểiso sánh các phương phápivà đưa ra kết quả cuối cùng cho bài toán dự đoán Từikết quả thực nghiệm tác giảiđã có kết luận môihình mạng nơron có thể dự đoánikết quả học tập chínhixác đến 89% cao hơniso với các phương phápikhác
Ngoài các bài báo dự đoánikết quả học tậpihọc sinh một sốidự báo liên quan tới giáo dục đã sửidụng mạng nơroniđa tầng truyền thẳng MLP Borad vàicác cộng sự đã đềixuất mộtihàmiđo lườngilựa chọnithuộcitính mớii(heuristic)itrên thuậtitoán câyiquyết địnhiC4.5ihiện có.iC4.5iđưa ra các giải phápiđầy hứaihẹn vềithông tiniphân táchicủa quá trìnhituyển sinhitại trườngicao đẳngikỹ thuật tại ẤniĐộ Cáchitiếp cậnikhác trong cácinghiên cứuinày làiso sánhiđộichính xácigiữa thuật toánicây quyếtiđịnh C4.5 vàithuật
35 toán lanitruyền ngược của mạng nơron MLP Kếtiquả cho thấy mạng nơron đãiđưa ra độ chính xácidự báoicaoinhất [23]
Nămi2018,iDesmond ChekwubeiBartholomew [24] đã công bốicông trình nghiên cứuivề dự đoán sinh viêninhập họcitạiiĐại họcicông nghệiLiên Bang, Owerrii(FUTO), bangiImo,iNigeria Tác giả xây dựngimột mạngiMLPidự báoisinh viêniđăng kýivào trường vàiso sánhiđộ chínhixác môihình.iKết quảicũng đượcikhẳng địnhilà tốtihơnikhi mô hìnhimạng MLPinày đượciso sánhivới cáciphươngipháp truyềnithống
2.5.2 Các nghiên cứu trong nước
Tronginhững năm gầniđây, trong nước cũng có nhiềuicông trình nghiên cứu dự đoánikết quả học tậpicủa học sinh, sinh viênisử dụng mạng nơron như:
Năm 2021 trên tạp chíiKhoa học tại trườngiĐại học CầniThơ [25] có bài củaitác giả Lưu Hoài Sang về dự báoikết quả học tập bằngikỹ thuật mạnginơron đaitầng truyền thẳng đượcihuấn luyệnivớiigiải thuậtilan truyềningược Mạng MLP trong luận văn gồm 6itầng: Tầng đầu tiênilà tầng input với 18inode, sử dụngihàm kích hoạt ReLU;itầng ẩn thứ nhất cói256inode, sử dụng hàmikích hoạt ReLU; tầng ẩn 2, 3icói256 node, sử dụng hàmikích hoạt Sigmoid; tầng ẩnithứi4 có 256 node, sử dụngihàm kích hoạt ReLU;iitầng ẩn thứi5 có 8 node, sử dụng hàm kíchihoạt ReLU; tầng thứ 6ilàitầng Output có 1inode, sử dụngihàm kích hoạt linearido giá trị đầu ra từi0 đến 4 Kết quảicủa mô hình MLPicho kết quả độ tin cậy 78.82% Kết quảicho thấy, việc dự đoánikết quả học tập nhằmixác định vàiphát hiện sớm các đối tượngisinh viên yếu kém cần đượcihỗ trợ, tránh việc cảnh báoihọc vụ và buộc thôi học.iNgoài ra dựiđoánikết quảihọc tậpicũng nhằm xáciđịnh đượcicác sinhiviên giỏi làm nòng cốtiđể bồi dưỡng đào tạo,itừ đó giúp ích rất nhiềuicho bảnithânisinh viên,igia đìnhivàixãihội
Trước đó, luận văn củaitác giả Lê Thị ThanhiVang tại Đồng Nai 2018 về “Xây dựng giải pháp dự đoánikết quả tốt nghiệp trong trường THPT” Tác giả đã sử dụng thuậtitoániK-mean để thực hiện quá trình gomicụm dữ liệu, dựa vào kết quảigom cụm và dữiliệu đã cập nhật chức năng thống kê theo nghề nghiệp của cha mẹ học sinh theo từng phân cụm Cuốiicùng tác giả dựa vàoikết quả gom cụm kết hợpivới kết quảithống kê về nghề nghiệp củaicha mẹ học sinh nhằm dự đoán kếtiquả tốt nghiệp của họcisinh
36 Ngoàiira còn có một sốiđề tài nghiên cứuidự đoán tương đương có sử dụng mạng MLP như tác giảiDương Thu Trang đã xâyidựng môihìnhidự báoikết quảituyển sinhisử dụng mạngiMLP 3 lớp Đầu vào gồmi10 nơron ứng vớiikết quảituyển sinhicủa 10inăm trước đó.iLớp ẩnigồmi10 nơron đượcichọn dựaitrêniquy tắci“thửivàisai” Lớpira chỉicó 1iđầu ra làikếtiquảidự báoituyểnisinh ởithời điểmitươngilai [10]
Trongithực tếicònirất nhiềuinghiên cứuikhác nữaivềivấn đềidự báoituyển sinhisử dụngimôihình mạngiMLP Quaicácicông trìnhikhảo sátiởitrong vàingoài nướcitrên cho thấy việciáp dụngiMLPicho bài toán xâyidựng mô hìnhikết quả học tập cuối nămicủa họcisinh tại trương THPTiTrần Nguyên Hãn làikhả thi và sẽ có kếtiquả tốt hơn các phương phápitruyền thống.
Ứng dụng mạng nơron giải quyết bài toán
Bàiitoán của luận văn có cấu trúcichung củaimột mạnginơron nhânitạoigồm 3ithành phầniđó làilớp đầuivào,ilớp ẩn 1, lớp ẩn 2 vàilớp đầu ra Trongiđó,ilớp ẩni(HiddeniLayer) gồmicác nơroninhậnidữ liệuiinput từicácinơron ởilớp trướciđóivàichuyển đổiicác input vàoicho các lớp xử lý tiếpitheo Đốiivới bài toánidự đoán điểm học tậpicuối năm của từng môn học với từng đối tượng học sinh tác giả đã dựa trên cấu trúc mạng nơron như sau:
Số nơron lớp đầu vào Đểilựa chọn được số nơronilớp vào tác giả luận văn phânitích các thông tinithu thập được.iDữ liệu thu thập điểm số học sinh của nhà trường được lấy từinăm học 2015 -i2016 đến năm họci2018i- 2019 trên trang quản lý điểm họcisinh tại trường THPTiTrần Nguyên Hãn -iTPiVũng Tàu Dữ liệu điểm họcisinh gồm có:
- Điểmitrung bình của họcikỳ 1 (HKI) các năm học;
- Điểm thường xuyên 1 (P1) của học kỳ 2;
- Điểm thường xuyên 2 (P2) của học kỳ 2;
- Điểm định kỳ (V1) của họcikỳi2;
-iĐiểmiTrung bình cả năm (CN)
Từ dữ liệu trên tiến hành phânitích chọn lọc cáciđặc trưng có ảnhihưởng tới việc học của thuật toán tương ứng với số nơron lớp vào
Số nơronilớp ẩn Đểilựa chọn được chính xácisố nơronichoilớp ẩnilà rất khóivìivậy sốinơron lớpiẩn sẽ được lựaichọn quaithựcinghiệm củaibài toán.iQuaithực nghiệmibài toán tác giảiluận vănilựa chọn số nơron lớpiẩni1 bằng 8; số nơron lớpiẩni2 là 4
Bàiitoán đặt ra làidự đoán điểm cuối năm từng môn cho từng học sinh đồng thời đưa ra cảnh báo nếu điểm số dưới 5.0 Do vậy sẽ có 2 đầu ra là: đối tượng cảnh báo hoặc an toàn.
Ứng dụng hồi quy tuyến tính để giải quyết bài toán
Trongibài toán này tác giảisử dụng phương phápiphân tích và thuật toán hồiiquy đa biến vào dựiđoán kết quả họcitập cuối năm củaihọc sinh
Mô hình đượcixây dựng trên cơ sở nghiên cứu thuật toán pháp hồiiquy tuyến tính đaibiến để dự đoán kết quả, cáciyếu tố chủ yếu tác động đến điểm CN, cụ thể:
Do dựiđoán kết quảihọc tập dựa vào 4 yếuitố trên mà 4 yếu tố này có tính độc lập với nhau nên ta xây dựng phương trình dự đoán điểm cả năm (CN) như sau:
• 𝑦 là điểm dự đoán CN
• 𝑥 1 : là P1 - điểm thường xuyên 1 của HK2
• 𝑥 2 : là P2 - điểm thường xuyên 2 của HK2
• 𝑥 3 : là V1 - điểm định kỳ của HK2
• 𝑥 4 : là HK1 - điểm tổng kết cuối HK1
Trongichương này đã trình bàyicác lý thuyết cơ bản nhất vềimạng nơron làm tham chiếuicho các khái niệm vềimạng nơron nhân tạoimô tả mô hình của mạng nơronivà mạng liên kếticác nơron cũng như các phương phápihuấn luyện mạng Mạng nhiềuilớp lan truyền thẳngicũng được mô tảikỹ để làm tiền đề cho việcigiải quyết bài toán củailuận văn Ngoài ra còn trìnhibày lý thuyết về hồi quyituyến tính và đề xuất phương án sử dụngihồi quy tuyến tính đa biến để giải quyết bài toán Bênicạnh đó, để đưaira được quyết địnhihợp lí cho ứng dụngimạng nơron giải quyếtibài toán dự báo kết quả học tập cuối năm, nộiidung chương đã đềicập đến các công trìnhicông bố trong vàingoài nước Luận văn đã ứng dụng cụ thể mạng nơron để đưa ra định hướng đúng đắn cácibước thực hiệniviệc giải quyết bàiitoán trong chương
XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃN
Xây dựng hệ thống dự đoán kết quả học tập cuối năm của học sinh THPT
Hiệninay có rất nhiều hệithống hỗ trợ về lĩnh vực giáo dục như: hệithống hỏi đáp tựiđộng, hệ thống quản lýikết quả học tập của học sinh,ihệ thống tư vấn chọn nghành, Mỗi hệ thống nàyichỉ phục vụ cho mộtikhía cạnh hỗ trợ học sinh, tác giảiluận văn thựcihiện đề tài “Xâyidựng mô hình dự đoánikết quả học tập cuối năm củaihọc sinh tại trườngiTHPT Trần Nguyên Hãn” để hỗ trợ một phần nào trong công việc giáo dục của nhà trường
3.1.1 Tiến trình thực hiện luận văn
Tiếnitrình nghiên cứu đượcithể hiện qua sơ đồisau:
Luận văn đượcithực hiện theo cácibước chính bao gồm:
Dữ liệu được thu thập trongi5 năm từ năm họci2015i- 2016 đến năm họci2019i-
2020 dưới dạng file excel dùng để nghiên cứu cho mô hình
Bước 2: Phân tích và trích chọn đặc trưng
Xáciđịnh kiểu dữ liệuicho mỗi cột,iphân tích để lựa chọn đặc trưng có khả năng ảnh hưởng đến mô hình
Bước 3: iChuẩn hoá dữ liệu
Quá trình làmisạchidữiliệu: thực hiện loại bỏ những dòng chứa tiêu đề, những dữ liệu dư thừa, chuyểniđổi một số kiểu dữiliệu về dạng số, ghép dữiliệu từ các môn rời rạc thành 1 bảng nhằm dễ huấn luyệnimô hình hơn
41 Sửidụng thiết kế trực quanimô hình mạng nơron và hồiiquy tuyến tính đểixây dựng môihình cho bài toán
Bước 5: iHuấn luyện mô hình
Choiphép người sử dụng đặticác thông số trước khi thực hiệnihuấn luyện
Thựcihiện kiểm tra trên tập dữ liệuikiểm tra, đưa ra kết quả so sánh mô hình với kết quả thực tế
Choiphép người sử dụng nhậpicác giá trị đầu vàoivà mô hình thực hiệnitính toán, xuất kết quảitrả về.