1. Trang chủ
  2. » Luận Văn - Báo Cáo

[LUẬN VĂN THẠC SĨ] Xây dựng mô hình dự đoán kết quả học tập cuối năm của học sinh tại trường THPT Trần Nguyên Hãn

87 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng mô hình dự đoán kết quả học tập cuối năm của học sinh
Tác giả Nguyễn Thị Thuỷ
Người hướng dẫn TS. Phan Ngọc Hoàng
Trường học Trường Đại học Bà Rịa-Vũng Tàu
Chuyên ngành Công nghệ thông tin
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2023
Thành phố Bà Rịa - Vũng Tàu
Định dạng
Số trang 87
Dung lượng 2,21 MB

Cấu trúc

  • CHƯƠNG 1: GIỚI THIỆU CHUNG (11)
    • 1.1. Mở đầu (11)
    • 1.2. Giới thiệu đề tài (12)
      • 1.2.1. Lý do chọn đề tài (12)
      • 1.2.2 Mục tiêu đề tài (13)
    • 1.3 Đối tượng và phạm vi nghiên cứu của đề tài (13)
    • 1.4 Phương pháp nghiên cứu (13)
      • 1.4.1 Phương pháp nghiên cứu lý thuyết (13)
      • 1.4.2 Phương pháp thực nghiệm (14)
    • 1.5 Cấu trúc luận văn (14)
  • CHƯƠNG 2: GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH THPT (16)
    • 2.1. Giới thiệu về bài toán dự đoán (16)
    • 2.2 Mục tiêu và nhiệm vụ (17)
      • 2.2.1 Mục tiêu (17)
      • 2.2.2 Nhiệm vụ (17)
    • 2.3 Giới thiệu Neural Network (18)
      • 2.3.1 Khái niệm (18)
      • 2.3.2 Khả năng ứng dụng của mạng nơron nhân tạo (20)
      • 2.3.3 Cấu tạo và phân loại mạng nơron nhân tạo (22)
        • 2.3.3.1 Cấu tạo mạng nơron nhân tạo (22)
        • 2.3.3.2 Phân loại mạng nơron nhân tạo (24)
      • 2.3.4 Các đơn vị xử lý cơ bản của mạng nơron nhân tạo (26)
        • 2.3.4.1. Đơn vị xử lý (26)
        • 2.3.4.2 Hàm kết hợp (27)
        • 2.3.4.3 Hàm kích hoạt (27)
      • 2.3.5 Mạng nơron truyền thẳng nhiều lớp (28)
        • 2.3.5.1 Kiến trúc mạng (28)
        • 2.3.5.2 Khả năng biểu diễn (30)
        • 2.3.5.3 Số lớp ẩn (30)
        • 2.3.4.4 Số nơron trong lớp ẩn (31)
      • 2.3.6 Thuật toán lan truyền ngược BP (Back - Propagation Algorithm) (32)
        • 2.3.6.1 Sử dụng thuật toán lan truyền ngược (32)
        • 2.3.6.2 Một số biến thể của mạng lan truyền ngược (37)
    • 2.4 Thuật toán hồi quy tuyến tính (39)
      • 2.4.1 Hồi quy tuyến tính đơn (39)
        • 2.4.1.1 Phương trình hồi quy tuyến tính đơn (39)
        • 2.4.1.2 Phương sai hồi quy (39)
        • 2.4.1.3 Dự báo trong phương trình hồi quy tuyến tính đơn (41)
      • 2.4.2 Hồi quy tuyến tính đa biến (41)
        • 2.4.2.1 Mô hình hồi quy tuyến tính đa biến (41)
        • 2.4.2.2 Phương trình hồi quy tuyến tính đa biến (41)
        • 2.4.2.3 Phân tích phương sai hồi quy (42)
        • 2.4.2.4 Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy đa biến (42)
    • 2.5 Một số hướng nghiên cứu về những bài toán dự đoán có sử dụng mạng nơron . 34 (43)
      • 2.5.1 Các nghiên cứu trên thế giới (43)
      • 2.5.2. Các nghiên cứu trong nước (44)
    • 2.6. Ứng dụng mạng nơron giải quyết bài toán (45)
    • 2.7 Ứng dụng hồi quy tuyến tính để giải quyết bài toán (46)
  • CHƯƠNG 3: XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃN (48)
    • 3.1. Xây dựng hệ thống dự đoán kết quả học tập cuối năm của học sinh THPT (48)
      • 3.1.1 Tiến trình thực hiện luận văn (49)
    • 3.2 Mô tả tiến trình (50)
      • 3.2.1 Dữ liệu luận văn (50)
      • 3.2.2 Phân tích và trích chọn đặc trưng (52)
      • 3.2.3 Chuẩn hoá dữ liệu (56)
      • 3.2.4 Cấu trúc mạng nơron (57)
      • 3.2.5 Huấn luyện mô hình (60)
      • 3.2.6 Kiểm tra mô hình với kết quả thực nghiệm (66)
  • CHƯƠNG 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (14)
  • TÀI LIỆU THAM KHẢO (77)

Nội dung

GIỚI THIỆU CHUNG

Mở đầu

Tại các trường Trungihọc phổ thông (THPT) kếtiquả học tập cả năm rất được quan tâm, là tiêu chí để Giáo viên chọniphương pháp dạy phù hợp vàilà bước tiến quan trọng của học sinh (HS) Kết quả tổng kết hàng năm là bước tiền đề để học sinh dự đoán khả năng đậu tốt nghiệp cũng như học sinh có cơ sở lựa chọn vàoicác trường đại học,icao đẳng hay trung họcichuyên nghiệp sau này Đểiđạt được kết quả học tậpicao thì cả Giáo viên vàiHọc sinh đều phải cố gắng, Giáo viên cố gắng chọn phương pháp dạyiphù hợp, dễ hiểu cho từngiđối tượng học sinh, họcisinh cũng phải có sự hợp tác Tình hình học tậpicủa từng học sinh thường đượcithể hiện qua điểm số thông quaicác bài kiểm tra

Theo thông tưisố 58/2011/TT-BGDĐT [1] ban hành ngàyi12/12/2011 củaiBộ Giáo dục vàiĐào tạo về quy chếiđánh giá,ixếp loạiihọc sinh Trungihọc cơisở (THCS) vàihọc sinh THPT, trong đó ở chương IV ban hành việc học sinh đủ điều kiện được lênilớp, thi lại hoặcikhông được lên lớp Những họcisinh có khả năng phải thi lại là những họcisinh có điểm trung bìnhi(TB) môn dưới 3.5 hoặc học lựcicả năm xếp loại Yếu, đượcichọn một sốimôn có điểm TB cảinăm dưới 5.0 để thiilại Trường hợp học sinh ở lại là những trường hợp học lựcicả năm loạiiKém hoặc học lựcivà hạnh kiểm cả nămiloại Yếu Tại trường THPTiTrần Nguyên Hãn VũngiTàu hàng năm đến gần cuối học kỳ 2 Ban giám hiệu (BGH) nhà trường sẽ rà soát và đưa dự đoán tổng kết cuối năm thông qua điểm tổng kết cuối học kỳ 1; điểm thường xuyên 1 (P1), điểm thường xuyên 2 (P2), điểm định kỳ lần 1 (V1) của học kỳ 2 nhằm khen thưởng những em có sự tiến bộ và cảnh báo đối với những em có các môn còn yếu, dự báo về vấn đề thi lại hoặc ở lại lớp với những học sinh có điểm kém Dựa vào dự đoán này BGH sẽ yêu cầu giáo viên chủ nhiệm thông tin tới HS và phụ huynh (PH) để tìm hướng bồi dưỡng thêm, giúp các em nâng cao kiến thức, vượt qua khó khăn các môn còn kém trong thời gianicòn lại của cuối học kỳivà đạt được thành tích cao nhất vào cuối năm học

Hàng năm tất cả các trường THPT đều muốn trường mình có tỉ lệihọc sinh đậu tốt nghiệp vàivào các trường cao đẳng,iđại học cao nhất, bởi tỉ lệ đậu tốt nghiệp, đại học là minh chứng của chất lượng giảng dạy của một trường Trong cácimôn học tạiicác trường

3 THPT thì 3imôn Toán, Ngữivăn, Tiếng Anh lài3 môn quan trọng nhất bắt buộc học Ba môn này liên quan đến việc thi xét tốt nghiệp và nằm nhiều nhất trong các tổ hợp để xét vào trường cao đẳng vàiđại học trên cảinước Ngoài việc 3 môn này ảnh hưởng trực tiếp tới việc ở lại, thi lại và lên lớp thì nó còniảnh hưởng tới tương lai của cáciem sau này nên việc phát hiện, nhắc nhở và có phương án cho những học sinh có điểm 3 môn này dưới trung bình là vấn đề cần thiết Trong luận văn này tác giả chọn ngưỡng cảnh báo đối vớii3 môn Toán, Ngữ văn,iTiếng Anh là điểm tổng kết cuối kì dưới 5.0

Tuy nhiên việc dự đoán và đưa ra cảnh báo nhà trường từ trước đến nay vẫn thực hiện trên phương pháp thủ công mà không dựaitrên một phương pháp phân tíchicó tính khoaihọc nhất định Vìivậy luận văn này xây dựngimô hình dự đoán kết quả cuối năm củaitừng môn theo đúng năng lựcihọc tập của học sinh trên cơisở khoa học làisử dụng thuật toánimạng nơron nhân tạo vàihồi quy tuyến tính.

Giới thiệu đề tài

1.2.1 Lý do chọn đề tài

Cùng vớiisự thay đổi vàiphát triển không ngừng của ngành Công nghệithông tin thì việc thu thập vàilưu trữ lượng thông tiningày càng lớn, việc tin học hoá nhanh chóng cácihoạt động trong sản xuất,ikinh doanh, quản lí cũng như trong lĩnh vựcihoạt động giáo dục đãitạo ra khối lượng lớnidữ liệu Dẫn đến yêu cầu cấp bách vàicần thiết phải cóinhững kỹ thuật và công cụimới để phân tích chuyển đổi lượngidữ liệu lớn đó thành cácitri thức có ích Từiđó, kỹ thuật khai pháidữ liệu đãitrở thành một trong những lĩnh vực thời sựicủa nền công nghệ thông tin.iVấn đề đặt railà làm sao trích chọn những thông tinicóiý nghĩa từ tập cơ sở dữ liệu lớn,iđể đáp ứng việc giải quyết được cáciyêu cầu trong thực tếinhư trợ giúp ra quyết định,idự đoán, … Chính vì vậy, khai pháidữ liệu đãira đời nhằm giải quyết cáciyêu cầu đó, vàitrở thànhimột trong nhữngixu hướng nghiênicứuiphổ biến trong lĩnhivực họcimáy.iMột trong những hướng nghiên cứuiphổ biến và quan trọngiđó là mạng nơron đa tầng và hồi quy tuyến tính

Mạng nơron đa tầng vớiidữ liệu đầu vào làitập dữ liệu các thuộc tínhiđiểm tổng kết thúc học kỳ 1 môn Toán,iNgữ văn, Tiếng anhicủa học sinh Các nơron nhậnitín hiệu vàoixử lýi(tính tổng trọngisố,igửi tớiihàm kích hoạt) rồi choira kết quải(là kết quảicủa hàm kích hoạt); kết quảinày sẽiđược truyền tớiicác nơronithuộcitầng ẩnithứ nhất;icác nơronitại đâyitiếp nhận nhưitín hiệuiđầu vào,ixử lýivà gửiikết quảiđến tầng ẩnithứ 2;

4 các nơron tại đâyitiếp nhận như tín hiệuiđầu vào, xử lýivà gửi kết quả đến tầngikết quả Những tầng ẩninằm giữa tầng vàoivà tầng ra nóithể hiện quá trình suy luậnilogic của mạng nơron Tác giả đặt ra ngưỡng cho bài toán cảnh báo là điểm tổng môn học dưới 5.0, nên trong luận văn này, mạng nơron sẽ được xây dựng với kết quả của luận văn cho tầng output sẽ có 2 đầu ra cảnh báo hoặc không

Hồi quyituyến tính với dữ liệu đầu vàoilà tập dữ liệu làicác thuộc tính điểm học sinh, với phương pháp họcicó giám sát sẽ trả vềikết quả là điểm cụ thể của học sinh cần dự đoán, nhờ đó việc cảnh báo về độ nghiêm trọng hay không sẽ dễ dàng và cụ thể hơn

Việc phân tíchivà đưa raidự đoán trước kết quảihọc tập cuối năm củaihọc sinh giúp nhà trường thấy được tổng quan học lực hiện tại của từng lớp, tiến độihọc tập của từng họcisinh BGH nhà trường sẽicó kế hoạch về khuyến khích khen thưởng những họcisinh có học lựcitốt, giúp các em phát huy kết quả hiện tại; có định hướng cho học sinh còn yếu kémiđể các emicố gắng rèn luyện thêm những môn còn yếu đồng thời giúp giáo viên bộ môn cũng để ýivà giúp đỡicác em nhiều hơn Đểicó được kết quảitốt vào cuối năm học,iđặc biệt là học sinhi12 có được tỷ lệ đậu tốtinghiệp cao, vào đượcicác trường đại học vàicao đẳng thì việc nhà trường cóisự quan tâm và đưa ra dự đoán sớm là rấticần thiết Vìivậy, luận văn củaitôi nghiên cứuiđề tài

“Xâyidựng mô hìnhidự đoán kết quả học tậpicuối năm củaihọc sinh tại trường THPT Trần Nguyên Hãn”

Nghiên cứuiđể đưa ra giải phápidự đoán kết quảimôn học cuối năm từiđó xây dựng chương trìnhicó thể sử dụng đểidự đoán kết quảitừng môn học cho từng học sinh các khối sử dụng dữ liệu của trường THPT Trần Nguyên Hãn.

Đối tượng và phạm vi nghiên cứu của đề tài

Dữ liệu để huấn luyện và kiểm tra: điểm HKI; P1, P2, V1 học kỳi2 của học sinhitừ năm họci2015 - 2016 đếninăm học 2018i- 2019 tại trường THPTiTrần Nguyên Hãn,iTP Vũng Tàu.

Phương pháp nghiên cứu

1.4.1 Phương pháp nghiên cứu lý thuyết

• Tìm hiểuitổng quan vềicác thuật toán máy học;

• Tham khảo cácitài liệu liên quan đếnithuật toán Neural Network, Hồi quy tuyến tính từinhiều nguồn khác nhau như:isách báo,igiáo trình, các bài báo khoa học và internet;

• Thu thậpivà xử lýisố liệu từ dữ liệu thực tếitại trường THPTiTrần Nguyên Hãn, TPiVũng Tàu

Xây dựngiứng dụng và dự báoikết quả học tậpicuối năm của học sinh cho từng môn học, từ đó cảnh báo tới học sinh,igiáo viên chủ nhiệmivàigiáo viên bộ môniđể kịp thời nhắc nhởivà cóiphương pháp giảng dạyiphù hợp với các học sinhicòn yếu, kém.

Cấu trúc luận văn

Luậnivăn gồm cói4 chương, đượcitrình bày với cấu trúc nhưisau:

CHƯƠNG 2: Giải pháp giảiiquyết bài toán dự đoánikếtiquả họcitập cuối năm củaihọc sinh THPT

CHƯƠNG 3: Xâyidựng mô hình dự đoánikết quả họcitập cuối năm của họcisinh THPT CHƯƠNG 4: Kết luận và hướng phát triển

Trongichương nàyitác giảiđã trình bàyilý doichọniđề tài,imục tiêuicủa đề tài,iđối tượng vàiphạm viinghiên cứu củaiđề tài, phương phápinghiên cứu của đề tàiivà kết cấu

GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH THPT

Giới thiệu về bài toán dự đoán

CNTT làimột tronginhững lĩnh vựciquan trọng gópiphần thúc đẩyisự phátitriển kinh tếicủa đấtinước.iỨng dụng CNTT có ở tất cả các lĩnh vực,ilà nền tảngicủa nghiên cứuivề công nghệ caoinhư khoa họcivũ trụ,icông nghệ điện tửivàitự độngihoá,icác hệ thốngithông minh,… Tại Việt Nam, hiện nayiCNTT được xác định làilĩnh vực thenichốt được đầuitư không những hiệniđại hoá cơ sởihạ tầng mà cònilà việc ứng dụngisâu rộng vào các lĩnh vựcikhác của cuộc sống xãihội

Nghị quyếtisố 36-NQ/TW ngày 1/07/2014 củaiBộ Chính trịivề đẩy mạnhiứng dụng,iphát triểniCNTT [2] đápiứng yêuicầu phát triểnibền vững vàihội nhậpiquốc tếitiếp tụcikhẳng địnhisự quan tâm,ichỉ đạoisát sao củaiĐảng đối vớiicông táciứng dụng,iphát triểniCNTT, khẳng địnhivị trí,ivai tròicủa CNTT trongisự nghiệpixây dựng vàibảo vệ

Tổ quốcithời kỳimới Nghị quyết nàyilà một văn bản rấtiquan trọng, làiđịnh hướng xuyên suốticho chiến lượciứng dụng,iphát triểniCNTT vàitruyền thôngitừ nayiđến nămi

2030, làitiền đềiquan trọng đểiCNTT ViệtiNam phát triểnimạnh mẽ,isâu rộng hơn,iđề rainhững định hướng lớnicho sựiphát triểniCNTT nước nhàitrong khoảng 10i– 20inăm tới Mục tiêu nămi2030,iđưa năng lựcinghiên cứu,iứng dụng,iphát triển,isản xuất vàicung ứngisản phẩm,idịch vụiCNTT đạtitrình độitiên tiếnithế giới.iViệt Nam trởithành quốc giaimạnh vềiCNTT trongikhu vực

Cuộc cáchimạng công nghệp lầnithứ tư (CMCNi4.0) thông qua cácicông nghệinhư trí tuệinhân tạo,iInternet vạnivật,ithực tế ảo,itương tácithực tại ảo,imạng xãihội, điện toán đám mây,idi động, phân tíchidữ liệu sớm,… đã chuyển hoáitoàn bộithế giớiithành thế giớiisố.iCác công nghệithông minh đang đượcitích hợpivào mọiikhía cạnh củaixã hội, xoáibỏ ranh giớiicông nghệithông thường,ithay đổiihình dạngimạng lướiicông nghệ vàisản xuất, thúc đẩyisự phát triển củaithời đại

Trí tuệinhân tạo làimột hướng nghiên cứuicủa lĩnh vựciCNTT vàikhoa họcimáy tính nhằmiphát triểnihệ thống thôngiminh đểigiải quyết cácibài toán thực tếigiống như hoạtiđộng bộinão của con người.iTrí tuệ nhân tạoiđược bắt đầu nghiênicứuitừ những năm 50icủa thếikỷ 20ivà trong khoảngi30 nămitrở lại đâyiđã đượcicộng đồngivà cácinhà

8 khoa họciquan tâmimạnh mẽ.iRất nhiềuicác hội thảoilớn về lĩnhivực này đượcitổ chức hàng nămitrên thế giới.iCác ứng dụngitiêu biểu củaitrí tuệinhân tạoivào đờiisống xãihội như: người máy,irobot, xử lý ngôn ngữitự nhiên, dự báo, dự đoán, nhận dạng,iphát hiện dịithường, an ninh quốc phòng, khoa họcivũ trụ vàitrái đất,…

Ngày nay, CNTT đượciứng dụng trong hầu hếticác lĩnh vực hoạt động xãihội Lĩnh vực giáoidục cũng không thể thiếu sự hỗitrợ đắc lực của khoa họcimáy tính nói chung hay tríituệ nhân tạoinói riêng Để giúp công việcigiảng dạy đạt hiệu quảicao hơn, luận văn nghiên cứu “Xây dựng dự đoán kết quả cuối năm của học sinh tại trường THPT

Trần Nguyên Hãn” Từ kếtiquả dự đoán đó, hỗ trợ BGH có kế hoạch phù hợp, đưaira phương phápidạy học cho từngiđối tượng học sinhicụ thể, giúp các emiđạt được kếtiquả học tậpitốt hơn.

Mục tiêu và nhiệm vụ

Mụcitiêu quan trọng nhất của bài toán dựiđoán kết quảihọc tập cuối năm củaihọc sinhilà giúp các em thấy được lực học của mình đến đâu, có những yếuitố nào ảnh hưởng đếnikết quả họcitập và tầm quan trọng củaiviệc đậu tốt nghiệp THPT Từ đó các em định hướng tốt hơn về việc học của mình ngay từ đầu cấp đốiivới học sinh khối 10, hay vớiihọc sinh khối 12 sẽ cần cố gắng nhưithế nào đểicó kết quả tốt nhất Thời gian dự đoán kết quả vào khoảng giữa HKII nên kết quả dự đoán có thể thay đổi bởi nhiều yếu tố tùy thuộcivào việc chăm chỉihọc tập hay sựicố gắng học hỏi của học sinh khác nhau, có em sẽ chăm chỉ hơn, cũng có em sẽ lơ là việc học hơn làm ảnh hưởng đến kết quả dự đoán đó.

• Thấy được học lực hiện tại củaihọc sinh, sựitiến bộ củaihọc sinh;

• Khuyếnikhích những học sinh cóihọc lực tốt giúp các em phát huy kết quả đó Động viên các em còn yếu kém để các em cố gắng rèn luyện thêm những môn học yếu, kém;

• Hỗ trợ, hướng dẫn học sinh, giúp cáciem định hướnginghề nghiệp trong tương laiiđể các em có mục tiêu phấn đấu mà cố gắng học tập;

• Theo sát, giúpiđỡ những học sinhicó hoàn cảnh đặc biệt, giúp cáciem ổn định

9 tâm lí, tiếp tục việc học, hoàn thành chương trình học của mình.

Giới thiệu Neural Network

Theo cácinhà nghiên cứuisinh học [3], hệithống thần kinh củaicon người baoigồm khoảng 10 11 tếibào thần kinh,ithường gọi làicác nơron Mỗi tếibào nơron gồmi3 phần:

• Thâninơron và nhân bênitrong (gọiilà soma), là nơiitiếp nhận hay phát raicác xung độngithần kinh;

• Mộtihệ thống dạng câyicác thần kinhivào (gọiilà dendrite) đểiđưa tín hiệuitới nhân nơron Cácidây thần kinh vàoitạo thành một lướiidày đặc xung quanhithân nơron, chiếmidiện tích 0.25mm 2 ;

• Đầuidây thần kinh rai(gọi làisợi trục axon)iphân nhánhidạng hìnhicây,icó thể dài từi1cm đến hàngimét Chúng nối vớiicác dây thần kinhivào hoặc trực tiếp vớiicác nơronikhác thông quaicác khớpinối (gọiilà synapse) Cóihai loạiikhớp nối,ikhớp nốiikích thíchi(excitatory) sẽicho tín hiệuiqua nóiđể tớiinơron,icòn khớp nốiiức chếi(inhibitory) cóitác dụngilàm cảnitín hiệu tớiinơron Người ta ướcitính mỗi nơron trong bộinão người có khoảng 10 4 ikhớp nối

Chức năngicơ bản của tếibào nơron làiliên kết với nhau đểitạo nênihệ thống thần kinhiđiều khiểnihoạt động củaicơ thểisống Cácitế bàoinơron truyềnitín hiệu choinhau thông quaicác dây thần kinh vàoivà ra, cácitín hiệu đóicó dạng xung điệnivà được tạoira từ cáciquá trình phản ứngihoá họciphức tạp.iTại nhân tếibào khiiđiện thế củaitín hiệu củaitín hiệu vàoiđạt tớiimột ngưỡng nàoiđó thìinó tạoira mộtixung điệnidẫn tới trụcidây thầnikinh ra.iXung nàyitruyền theo trụcira tới cácinhánh rẽivà tiếpitục truyền tớiicác nơronikhác [3]

Não người được coi như mộtihệ thống xửilý thông tin rất phức tạp,iphi tuyến và songisong Có thểigiải quyết được rấtinhiều vấn đề như: nghe,inói, nhìn, hồiiức thông tin,inhận dạng các mẫu, Não thựcihiện được những nhiệmivụ như vậy nhờicác phần từitính toán đóilà nơron

Ngoàiira,ido tínhimềm dẻoicủa sự kếtinối giữa cácitế bàoithần kinh màinão người cóikhả năng học hỏiiqua những kinh nghiệm từiquá khứ Học làimột đặc tínhicơ bản và thiết yếuicủa mạng nơronisinh học [4]

10 Dựa vàoicác đặc trưng cơibản của mạng nơronisinh học người ra đãixây dựng nên mạng nơroninhân tạo Mạng nơroninhân tạo (Artificial Neural Network, ANN)ingày nayigần giống với bộinão con người như: cóikhả năng học,itức là sửidụng nhữngikinh nghiệm đểicải thiệnihiệu suất.iKhi thuithập được đủimột lượng mẫuithì ANN cóithể khái quátihoá rất cao.iMột ANN cóithể nhận ra một ký tựiviết tay, có thểiphát hiện ra người có dấu hiệu bất thường nơi công cộng Chínhivì vậyimà mạnginơron cóithể giải quyết cácivấn đềiphức tạpicó quy mô lớnivà khó hiệninay [5]

Mạng nơroninhân tạo (ANN) làimô hình xửilý thông qua môiphỏng hoạtiđộng của hệithống thần kinhisinh vật,ibao gồmisố lượng lớnicác nơroniđược gắn kếtiđể xửilý thôngitin.iANN giốnginhư bộinão con người,iđược họcikinh nghiệm (quaihuấn luyện),i cóikhả năng lưuigiữ các kinh nghiệmihiểu biếti(triithức) vàisử dụnginhững triithức đó trong việcidự đoán cácidữ liệu chưa biết.iANN được huấn luyện hayiđược học theo các kỹithuật cơibản là họcicó giámisát vàihọc không giámisát [6]

Họcilà quáitrình cậpinhật trọng sốisao choigiá trịihàm lỗiilà nhỏinhất Mộtimạng nơroniđược huấn luyệnisao choivới mộtitập các vector đầuivào 𝑋, mạng cóikhả năng tạo raitập các vector đầuira mong muốn 𝑌 củainó Tập 𝑋 đượcisử dụng cho huấniluyện mạng được gọiilà tập huấniluyện (trainingiset).iCác phần tửi𝑥 thuộc 𝑋 được gọiilà các mẫuihuấn luyệni(training example).iQuá trìnhihuấn luyệnibản chất làisự thay đổiicác trọng sốiliên kếticủa mạng.iTrong quáitrình này,icác trọng sốicủa mạngisẽ hội tụidần tới cácigiá trịisao cho vớiimỗi vector đầuivào 𝑥 từ tậpihuấn luyện, mạng sẽicho ra vector đầuira 𝑦 nhưimong muốn [4]

- Học có giám sát: cóithể được xem nhưiviệc xấp xỉimột ánh xạ: 𝑋 -> 𝑌, trongiđó

𝑋 làitập các vấn đềivà 𝑌 tập cácilời giải tương ứngicho vấn đề đó.iCác mẫu (𝑥, 𝑦) với

𝑥 = (𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) ∈ 𝑋, 𝑦 = (𝑦 1 , 𝑦 2 , … , 𝑦 𝑛 ) ∈ 𝑌 đượcicho trước Học cóigiám sát trong cácimạng nơron thường đượcithực hiện theo các bướcisau:

- Bướci1: Xây dựngicấu trúc thích hợpicho mạng nơron, chẳng hạnicó 𝑛 nơroniđầu vào,

𝑚 nơroniđầu ra,ivà khởiitạo cácitrọng sốiliên kếticủa mạng;

- Bướci2: Đưaimột vector 𝑥 trong tậpimẫu huấn luyện 𝑋 vàoimạng;

- Bước 3:iTính vector đầuira 𝑧 củaimạng;

- Bước 4:iSo sánh vector đầuira mong muốn 𝑡 (làikết quả được cho trongitập huấn luyện) với vector đầuira 𝑧 do mạng tạoira; nếu cóithể thì đánh giáilỗi

- Bướci5: Hiệu chỉnh cácitrọng số liênikết theo mộticách nàoiđó sao choiở lầnitiếp theo khiiđưa vector 𝑥 vàoimạng, vector đầuira 𝑧 sẽigiốngivới 𝑡 hơn

- Bước 6:iNếu cần, lặp lạiicác bước từi2 đến 5icho đến khi mạng đạtitới trạng tháiihội tụ.iViệc đánhigiá lỗiicó thểithực hiện theoinhiều cách,icách dùnginhiều nhất làisử dụng lỗiitức thời: 𝐸𝑟𝑟 = (𝑧 − 𝑡), hoặci𝐸𝑟𝑟 = |𝑧 − 𝑡|; lỗiitrung bìnhibình phươngi(MSE: mean- squareierror):i𝐸𝑟𝑟 = (𝑧 − 𝑡) 2 /2

Thuật toánitổng quát trên choihọc cóigiám sát trongicác mạnginơron cóinhiều cài đặtikhác nhau,isự khácinhau chủ yếuilà cáchicác trọng sốiliên kếtiđược thay đổiitrong suốtithời gianihọc.iĐiển hìnhicho kỹ thuật nàyilà mạnginơron lanitruyền ngượci(backi- propagation)

- Họcikhông giámisát:iKhông sửidụng tri thứcibên ngoàiitrong quáitrình học, nênicòn gọi làitự tổichức (selfi- Organizing).iMạng nơroniđiển hìnhiđược huấniluyện theoikiểu không giám sátilà SOM [7], [6].

2.3.2 Khả năng ứng dụng của mạng nơron nhân tạo Đặcitrưng của mạnginơron nhân tạoilà khảinăng học.iMối quanihệ tương quan phứcitạp giữaicác yếu tốiđầu vàoivà đầuira củaicác quá trìnhicần nghiênicứu vàikhi đã họciđược thìiviệc kiểm traiđộc lập thường choikết quả tốt.iSau khi đãihọc xongimạng nơroninhân tạo cóithể tínhitoán kết quảiđầu raitương ứng với bộisố liệuiđầu vàoimới

Vềimặt cấu trúc,imạng nơron nhân tạoigồm nhiều phần xửilý đơnigiản cùng hoạt độngisong song Đặc tính nàyicủa ANNicho phép nóicó thểiđược ápidụng đểigiải các bài toánilớn

Vềikhía cạnh toán học,itheo định lýiKolmogorov, một hàmiliên tục bấtikỳ 𝑓(𝑥 1 , 𝑥 2 , … , 𝑥 𝑛 ) xáciđịnh trên khoảng 𝐼 𝑛 (vớiiIi=i[0,1])icó thểiđược biểu diễnidưới dạng [8]:

12 Trongiđó: 𝑥 𝑗 , 𝛹 𝑖𝑗 làicác hàm liên tụcimột biến 𝛹 𝑖𝑗 làihàm đơniđiệu,ikhông phụ thuộc vàoihàm f Mặtikhác,imô hìnhimạng nơroninhân tạo choiphép liên kếticó trọngisố cáciphần tửiphi tuyến (cácinơron đơnilẻ) tạoinên dạng hàmitổng hợpitừ cácihàm thành phần Doivậy, sauimột quá trìnhiđiều chỉnhisự liên kếticho phù hợpi(quá trìnhihọc), các phần tửiphi tuyếniđó sẽitạo nênimột hàmiphi tuyến phứcitạp cóikhả năngixấp xỉihàm biểuidiễn quá trìnhicần nghiên cứu.iKết quảilà đầuira của nóisẽ tươngitự vớiikết quảiđầu raicủa tậpidữ liệu dùngiđể huấn luyệnimạng.iKhi đó tainói mạng nơroninhân tạoiđã học đượcimối quanihệ tương quaniđầu vàoi- đầu raicủa quá trình vàilưu lại mối quanihệ tương quan nàyithông qua bộitrọng sốiliên kết giữaicác nơron.iDo đó,imạng nơron nhân tạoicó thểitính toán trênibộ số liệuiđầu vào mớiiđể đưaikết quả đầuira tươngiứng

Vớiinhững đặc điểmiđó,imạng nơroninhân tạoiđã đượcisử dụng đểigiải quyết nhiều bàiitoán thuộcinhiều lĩnhivực khác nhau Cácinhóm ứng dụng cácimạng nơron nhânitạo đãiđược ápidụng rất cóihiệu quảilà:

- Bàiitoán phânilớp:iLoại bàiitoán này đòiihỏi giảiiquyết vấniđề phâniloại cáciđối tượngiquan sátiđược thànhicác nhóm dựaitrên cáciđặc điểm củaicác nhómiđối tượngiđó Đây làidạng bài toán cơisở của rấtinhiều bài toánitrong thực tế:inhận dạngichữ viết, tiếng nói,iphân loại gen,iphân loạiichất lượng sảniphẩm,

- Bàiitoán dựibáo:iMạng nơroninhân tạoiđã đượciứng dụngithành côngitrong việc xâyidựng cácimô hình dựibáo sửidụng tậpidữ liệuitrong quá khứiđể dựiđoán số liệuitrong tươngilai.iĐây làinhóm bài toán khóivà rấtiquan trọngitrong nhiềuingành khoaihọc

- Bàiitoán điều khiển vàitối ưuihoá:iNhờ khảinăng học vàixấp xỉihàm màimạng nơroninhân tạoiđã được sửidụng trong nhiềuihệ thốngiđiều khiển tựiđộng cũng nhưigóp phần giảiiquyết những bài toán tốiiưu trong thựcitế

- Mạnginơron đã được ứngidụng trong rất nhiềuilĩnh vực trong cuộc sống như:

+ Giáo dục: Dựibáo tình hình tuyển sinh, thôi học, bỏ học, tốt nghiệp tại các trường, dự báo chọn tổ hợp môn thi đại học, dự báo kết quả cuối năm học + Y tế: Chuẩn đoán được bệnh di truyền hiếm gặp

Thuật toán hồi quy tuyến tính

Phânitích hồiiquy tuyếnitính làinghiên cứuisự phụithuộc củaimột biếni(biếniphụ thuộcihay còniđượcigọi làibiến giảiithích) vàoimột biếnihay nhiềuibiến kháci(biếniđộc lậpihay cònigọi làibiến giảiithích)ivới ýitưởng cơibản làiước lượngihayidự đoánigiá trị trung bìnhicủa biếniphụ thuộcitrênicơ sởicác giáitrịiđã biếticủa biếniđộcilập.iDự đoán giá trịicủa biến phản hồi từicác biến giải thích (biến độc lập),ikhi có mối quan hệituyến tính giữa chỉ cóimột biến giải thíchivà một biến phản hồi,ichúng ta gọi đây làihồi quy tuyến tínhiđơn (simple linear regression).iKhi có nhiều hơn mộtibiến phản hồi và cóibất kỳ số lượng biến giải thích ta gọi là hồi quy đa biến (multivariate regression) [21]

2.4.1 Hồi quy tuyến tính đơn

2.4.1.1 Phương trình hồi quy tuyến tính đơn Đặt (𝑥 1 , 𝑦 1 ), (𝑥 2 , 𝑦 2 ), … , (𝑥 𝑛 , 𝑦 𝑛 ) làimẫuigồm 𝑛 cặpiquan sát trên đườngihồi quy tổngithể 𝑦 = 𝛼 + 𝛽𝑥 1 + 𝜀 1 [21].

Theo phương trình béinhất thì ước lượng của hệisố 𝛼 và 𝛽 làicác giá trị 𝑎 và 𝑏 sao choitổng bình phương sai sốicủa phương trìnhisau đây làibé nhất [21]:

Và phương trìnhihồi quy tuyến tính mẫuicủa 𝑦 trên 𝑥 là: 𝑦 = 𝑎 + 𝑏𝑥

Trongiước lượng cácitham sốicủa mô hình hồi quy tuyếnitính đơn theo phương phápibình quân nhỏ có thểichứng minh được rằng:

∑(𝑦 𝑖 − 𝑦 𝑡𝑏 ) 2 =iSSTi(Total Sumiof Squares) là tổngibiến động của 𝑦

∑(𝑦̃ 𝑖 − 𝑦 𝑡𝑏 ) 2 = SSR (Sum ofiSquares Residual) là tổngibình phương hồi quy,ilà đại lượng biếniđộng của 𝑦 được giải thíchibởi đường hồi quy

∑(𝑦 𝑖 − 𝑦̃ 𝑖 ) 2 = SSEi(Sum of Squares Error) làiphần biếniđộngicòn lạiihay cònigọiilà số dư,ilà đạiilượngibiến độngitổng gộpicủa nguồnibiến độngido cácinhân tốikhác gâyira mà khôngihiện diệnitrongimô hìnhihồi quy vàiphầnibiến độngingẫu nhiên

• SSRicàng lớnithìimô hìnhihồi quyicàngicó độitin cậyicao việcigiải thíchibiến độngicủa 𝑦

𝑆𝑆𝑇 làiphần trăm biến độngicủa 𝑦 được giải thíchibởi mối quan hệ tuyến tínhicủa 𝑦 đốiivới 𝑥

𝑀𝑆𝐸 cóiphân phối 𝐹 vàithường được dùng đểikiểm định mứciý nghĩa của mô hìnhihồi quy 𝐹 càngilớn thì mô hình càngicó ý nghĩa

* Hệ sốixác định: R 2 làihệ số nhằm xáciđịnh mức độ quan hệigiữa 𝑥 và 𝑦 cóiquan hệ hayikhông hoặcibao nhiêuiphần trămisự biếnithiênicủa 𝑦 cóithể giảiithíchibởi sựiphụ thuộcituyến tính của 𝑦 vàoi𝑥

Giá trịidự đoán theo phương trìnhihồi quy: 𝑦 = 𝑎 + 𝑏𝑥 1

Vậy 𝑒 1 làisự khác biệt giữaigiá trịithựcitế vớiigiá trịidự đoánicủaiphương trìnhihồi quy tuyếnitính.iNhư vậy 𝑒 1 thể hiệniphần biếnithiênicủa 𝑦 không thểigiải thíchibởiimối quanihệ tuyến tínhigiữa 𝑦 và 𝑥

SSRicàng lớnithìimô hìnhihồi quyituyến tínhicàngicó độitin cậyicaoitrong việcigiải thích sựibiến độngicủa 𝑦

𝑆𝑆𝑇 làiphần trămibiến độngicủa 𝑦 đượcigiải thích bởi mốiiquan hệ tuyến tính củai𝑦ivào 𝑥

2.4.1.3 Dự báo trong phương trình hồi quy tuyến tính đơn Ướcilượng khoảngigiáitrị thựcicủa 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )

∑ 𝑛 𝑖=1 𝑥 𝑖 2 − 𝑛𝑥̅ 2 Ướcilượng khoảng giá trịitrung bình 𝑦 𝑛+1 vớiiđộ tin cậyi(1 − 𝛼 )

2.4.2 Hồi quy tuyến tính đa biến

2.4.2.1 Mô hình hồi quy tuyến tính đa biến

Giảisử 𝑦 phụ thuộcivào 𝑘 biếniđộc lập 𝑥 1 … 𝑥 𝑘 Nếuigiá trị của 𝑘 biếniđộc lập

𝑥 1 … 𝑥 𝑘 thì mô hìnhihồi quy tuyến tính đa biến cóidạng [21]:

𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đối với bài toán của luận văn là dự đoánikết quả học tập cuối năm, thì ởiđây 𝑦 là kết quả và các biến:

- 𝑦 (biến phụ thuộc): Đầu ra điểm cả năm (CN) được dự đoán

- 𝛼 (biến độcilập): hệ số chặniphản ánhimứciảnh hưởngicủa cácinhân tốikhác đếnichỉ tiêuiphânitích

- 𝛽: hệ sốiước lượng,icácihệ sốihồi quyinàyiphản ánhimức độ ảnh hưởng của từnginhân tố đếnibiến giảiithích Nếu 𝛽>0 thìiảnh hưởngithuận vàingược lại thì ảnh hưởnginghịch

𝛽 càng lớnithì sựiảnhihưởng đếnichỉ tiêuiphân tíchicàng mạnh

- 𝑥 𝑘 là yếuitố ảnh hưởngiđến điểm cả năm (CN)

2.4.2.2 Phương trình hồi quy tuyến tính đa biến

Gọi các hệisố 𝑎, 𝑏 1 … 𝑏 𝑘 là ước lượng cho 𝛼, 𝛽 1 … 𝛽 𝑘 đượcixác địnhibởiiphương phápibình phươngibéinhất.iPhương trìnhihồi quy cóidạng:

2.4.2.3 Phân tích phương sai hồi quy

* Hệ sốixác định: 𝑅 2 làinói lênitínhichặt chẽigiữa biếniphụithuộc 𝑦 vàicác biến độcilập

𝑥 𝑖 , tức là nóithể hiện phần trămibiến thiên 𝑦 có thểiđược giảiithíchibởi sựibiến thiênicủa tất cảicác biến 𝑥 𝑖

SSEi= ∑ 𝑛 𝑖=1 𝑒 𝑖 2 : làiphần biến độngicòn lại hay còn gọi làisố dư

SSRi= ∑ 𝑛 𝑖=1 (𝑦 𝑖 − 𝑦̅) 2 : làitổng bìnhiphươngihồi quy,ilà đạiilượngibiến độngicủa 𝑦 được giảiithích bằng đường hồiiquy

SSRicàng lớnithìimô hìnhihồi quyicàng cóiđộitinicậy caoitrong việcigiải thíchibiến động

𝑅 nóiilên tính chặt chẽicủa mốiiquanihệ giữaibiến phụithuộc 𝑦 vàicác biếniđộc lập 𝑥 𝑖

2.4.2.4 Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy đa biến

Mô hìnhihồi quy đa biến choitổng thể có dạng:

𝑦 = 𝛼 + 𝛽 1 𝑥 1 + 𝛽 2 𝑥 2 + ⋯ + 𝛽 𝑘 𝑥 𝑘 + 𝑢 Đặt 𝑎, 𝑏 1 , 𝑏 2 , … , 𝑏 𝑘 làinhững tham số đượciước lượngicho tổng thể; 𝑆 𝑎 , 𝑆 𝑏 1 ,

𝑆 𝑏 2 , … , 𝑆 𝑏 𝑘 là nhữngiđộ lệch chuẩn đã được ướcilượng, 𝑢 coiilà phân phối chuẩnithì biếningẫu nhiên 𝑡 được tínhinhư sau:

Vì vậy,ikhoảng cách độ tin cậyi100(1 – 𝛼)% choicác hệ số hồi quy 𝛽 1 đượcitính như sau:

Một số hướng nghiên cứu về những bài toán dự đoán có sử dụng mạng nơron 34

Bài toánidự đoán cóinhiệm vụiphân tíchivàisử dụngisố liệuiđãicó trongiquá khứiđể dự đoánigiá trịitươngilai Hiệninay,icó rấtinhiềuiphương phápidự đoán đãiđược sửidụng trênimô hìnhivật lýivà môihình toánihọc tronginhiều trườngihợp,ikết quảinghiên cứuidự đoán theo cácimô hìnhitrêniđã đạtiđược nhữngithành cônginhấtiđịnh.iTuy nhiêniphương pháp nàoicũng cóinhững hạnichế,ido vậyibài toánidự đoán vẫn làinội dungiđượcinghiên cứuihiện nay.iTrênithế giớiicũng nhưitronginước, cáciphương phápikhai phá dữ liệu (đặc biệtilà các phương pháp máy học,imạng nơron)icũngiđược ápidụng nhiềuivào các bài toánidự đoán

2.5.1 Các nghiên cứu trên thế giới

Trênithế giớiicácinghiên cứuivề việcixây dựngimô hìnhidự đoán kết quả họcitập của học sinh,isinh viên các trường đại họcitrong các giai đoạn đầu củaihọc kỳ sử dụng kỹithuật máy học khá nhiều và đãibắt đầu cáchiđây khá lâu,ihiện tại vẫn còn đangiđược nghiên cứu và phát triểniđể giảm thiểuisai sót trong dự đoán Riêngitrong lĩnh vực ứng dụngimạng nơron choidự đoán có thểikể đến một số côngitrình liên quan dướiiđây: Tronginghiên cứu kết quảihọc tập sinhiviên tại đạiihọc Mansura Ai Cập năm 2021 [22], nhóm đồng tác giả SEYAM AYA NABIL, MOHAMMED, AND AHMED ABOU-ELFETOUH đã sử dụngimột số thuật toán như:imạng lưới DeepiNeural Network (DNN), câyiquyết định, rừng ngẫu nhiên,ihồi quy Logistic, (K-Nearest Neighbors – KNN) đểiso sánh các phương phápivà đưa ra kết quả cuối cùng cho bài toán dự đoán Từikết quả thực nghiệm tác giảiđã có kết luận môihình mạng nơron có thể dự đoánikết quả học tập chínhixác đến 89% cao hơniso với các phương phápikhác

Ngoài các bài báo dự đoánikết quả học tậpihọc sinh một sốidự báo liên quan tới giáo dục đã sửidụng mạng nơroniđa tầng truyền thẳng MLP Borad vàicác cộng sự đã đềixuất mộtihàmiđo lườngilựa chọnithuộcitính mớii(heuristic)itrên thuậtitoán câyiquyết địnhiC4.5ihiện có.iC4.5iđưa ra các giải phápiđầy hứaihẹn vềithông tiniphân táchicủa quá trìnhituyển sinhitại trườngicao đẳngikỹ thuật tại ẤniĐộ Cáchitiếp cậnikhác trong cácinghiên cứuinày làiso sánhiđộichính xácigiữa thuật toánicây quyếtiđịnh C4.5 vàithuật

35 toán lanitruyền ngược của mạng nơron MLP Kếtiquả cho thấy mạng nơron đãiđưa ra độ chính xácidự báoicaoinhất [23]

Nămi2018,iDesmond ChekwubeiBartholomew [24] đã công bốicông trình nghiên cứuivề dự đoán sinh viêninhập họcitạiiĐại họcicông nghệiLiên Bang, Owerrii(FUTO), bangiImo,iNigeria Tác giả xây dựngimột mạngiMLPidự báoisinh viêniđăng kýivào trường vàiso sánhiđộ chínhixác môihình.iKết quảicũng đượcikhẳng địnhilà tốtihơnikhi mô hìnhimạng MLPinày đượciso sánhivới cáciphươngipháp truyềnithống

2.5.2 Các nghiên cứu trong nước

Tronginhững năm gầniđây, trong nước cũng có nhiềuicông trình nghiên cứu dự đoánikết quả học tậpicủa học sinh, sinh viênisử dụng mạng nơron như:

Năm 2021 trên tạp chíiKhoa học tại trườngiĐại học CầniThơ [25] có bài củaitác giả Lưu Hoài Sang về dự báoikết quả học tập bằngikỹ thuật mạnginơron đaitầng truyền thẳng đượcihuấn luyệnivớiigiải thuậtilan truyềningược Mạng MLP trong luận văn gồm 6itầng: Tầng đầu tiênilà tầng input với 18inode, sử dụngihàm kích hoạt ReLU;itầng ẩn thứ nhất cói256inode, sử dụng hàmikích hoạt ReLU; tầng ẩn 2, 3icói256 node, sử dụng hàmikích hoạt Sigmoid; tầng ẩnithứi4 có 256 node, sử dụngihàm kích hoạt ReLU;iitầng ẩn thứi5 có 8 node, sử dụng hàm kíchihoạt ReLU; tầng thứ 6ilàitầng Output có 1inode, sử dụngihàm kích hoạt linearido giá trị đầu ra từi0 đến 4 Kết quảicủa mô hình MLPicho kết quả độ tin cậy 78.82% Kết quảicho thấy, việc dự đoánikết quả học tập nhằmixác định vàiphát hiện sớm các đối tượngisinh viên yếu kém cần đượcihỗ trợ, tránh việc cảnh báoihọc vụ và buộc thôi học.iNgoài ra dựiđoánikết quảihọc tậpicũng nhằm xáciđịnh đượcicác sinhiviên giỏi làm nòng cốtiđể bồi dưỡng đào tạo,itừ đó giúp ích rất nhiềuicho bảnithânisinh viên,igia đìnhivàixãihội

Trước đó, luận văn củaitác giả Lê Thị ThanhiVang tại Đồng Nai 2018 về “Xây dựng giải pháp dự đoánikết quả tốt nghiệp trong trường THPT” Tác giả đã sử dụng thuậtitoániK-mean để thực hiện quá trình gomicụm dữ liệu, dựa vào kết quảigom cụm và dữiliệu đã cập nhật chức năng thống kê theo nghề nghiệp của cha mẹ học sinh theo từng phân cụm Cuốiicùng tác giả dựa vàoikết quả gom cụm kết hợpivới kết quảithống kê về nghề nghiệp củaicha mẹ học sinh nhằm dự đoán kếtiquả tốt nghiệp của họcisinh

36 Ngoàiira còn có một sốiđề tài nghiên cứuidự đoán tương đương có sử dụng mạng MLP như tác giảiDương Thu Trang đã xâyidựng môihìnhidự báoikết quảituyển sinhisử dụng mạngiMLP 3 lớp Đầu vào gồmi10 nơron ứng vớiikết quảituyển sinhicủa 10inăm trước đó.iLớp ẩnigồmi10 nơron đượcichọn dựaitrêniquy tắci“thửivàisai” Lớpira chỉicó 1iđầu ra làikếtiquảidự báoituyểnisinh ởithời điểmitươngilai [10]

Trongithực tếicònirất nhiềuinghiên cứuikhác nữaivềivấn đềidự báoituyển sinhisử dụngimôihình mạngiMLP Quaicácicông trìnhikhảo sátiởitrong vàingoài nướcitrên cho thấy việciáp dụngiMLPicho bài toán xâyidựng mô hìnhikết quả học tập cuối nămicủa họcisinh tại trương THPTiTrần Nguyên Hãn làikhả thi và sẽ có kếtiquả tốt hơn các phương phápitruyền thống.

Ứng dụng mạng nơron giải quyết bài toán

Bàiitoán của luận văn có cấu trúcichung củaimột mạnginơron nhânitạoigồm 3ithành phầniđó làilớp đầuivào,ilớp ẩn 1, lớp ẩn 2 vàilớp đầu ra Trongiđó,ilớp ẩni(HiddeniLayer) gồmicác nơroninhậnidữ liệuiinput từicácinơron ởilớp trướciđóivàichuyển đổiicác input vàoicho các lớp xử lý tiếpitheo Đốiivới bài toánidự đoán điểm học tậpicuối năm của từng môn học với từng đối tượng học sinh tác giả đã dựa trên cấu trúc mạng nơron như sau:

Số nơron lớp đầu vào Đểilựa chọn được số nơronilớp vào tác giả luận văn phânitích các thông tinithu thập được.iDữ liệu thu thập điểm số học sinh của nhà trường được lấy từinăm học 2015 -i2016 đến năm họci2018i- 2019 trên trang quản lý điểm họcisinh tại trường THPTiTrần Nguyên Hãn -iTPiVũng Tàu Dữ liệu điểm họcisinh gồm có:

- Điểmitrung bình của họcikỳ 1 (HKI) các năm học;

- Điểm thường xuyên 1 (P1) của học kỳ 2;

- Điểm thường xuyên 2 (P2) của học kỳ 2;

- Điểm định kỳ (V1) của họcikỳi2;

-iĐiểmiTrung bình cả năm (CN)

Từ dữ liệu trên tiến hành phânitích chọn lọc cáciđặc trưng có ảnhihưởng tới việc học của thuật toán tương ứng với số nơron lớp vào

Số nơronilớp ẩn Đểilựa chọn được chính xácisố nơronichoilớp ẩnilà rất khóivìivậy sốinơron lớpiẩn sẽ được lựaichọn quaithựcinghiệm củaibài toán.iQuaithực nghiệmibài toán tác giảiluận vănilựa chọn số nơron lớpiẩni1 bằng 8; số nơron lớpiẩni2 là 4

Bàiitoán đặt ra làidự đoán điểm cuối năm từng môn cho từng học sinh đồng thời đưa ra cảnh báo nếu điểm số dưới 5.0 Do vậy sẽ có 2 đầu ra là: đối tượng cảnh báo hoặc an toàn.

Ứng dụng hồi quy tuyến tính để giải quyết bài toán

Trongibài toán này tác giảisử dụng phương phápiphân tích và thuật toán hồiiquy đa biến vào dựiđoán kết quả họcitập cuối năm củaihọc sinh

Mô hình đượcixây dựng trên cơ sở nghiên cứu thuật toán pháp hồiiquy tuyến tính đaibiến để dự đoán kết quả, cáciyếu tố chủ yếu tác động đến điểm CN, cụ thể:

Do dựiđoán kết quảihọc tập dựa vào 4 yếuitố trên mà 4 yếu tố này có tính độc lập với nhau nên ta xây dựng phương trình dự đoán điểm cả năm (CN) như sau:

• 𝑦 là điểm dự đoán CN

• 𝑥 1 : là P1 - điểm thường xuyên 1 của HK2

• 𝑥 2 : là P2 - điểm thường xuyên 2 của HK2

• 𝑥 3 : là V1 - điểm định kỳ của HK2

• 𝑥 4 : là HK1 - điểm tổng kết cuối HK1

Trongichương này đã trình bàyicác lý thuyết cơ bản nhất vềimạng nơron làm tham chiếuicho các khái niệm vềimạng nơron nhân tạoimô tả mô hình của mạng nơronivà mạng liên kếticác nơron cũng như các phương phápihuấn luyện mạng Mạng nhiềuilớp lan truyền thẳngicũng được mô tảikỹ để làm tiền đề cho việcigiải quyết bài toán củailuận văn Ngoài ra còn trìnhibày lý thuyết về hồi quyituyến tính và đề xuất phương án sử dụngihồi quy tuyến tính đa biến để giải quyết bài toán Bênicạnh đó, để đưaira được quyết địnhihợp lí cho ứng dụngimạng nơron giải quyếtibài toán dự báo kết quả học tập cuối năm, nộiidung chương đã đềicập đến các công trìnhicông bố trong vàingoài nước Luận văn đã ứng dụng cụ thể mạng nơron để đưa ra định hướng đúng đắn cácibước thực hiệniviệc giải quyết bàiitoán trong chương

XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM KẾT QUẢ HỌC TẬP CUỐI NĂM CỦA HỌC SINH TẠI TRƯỜNG THPT TRẦN NGUYÊN HÃN

Xây dựng hệ thống dự đoán kết quả học tập cuối năm của học sinh THPT

Hiệninay có rất nhiều hệithống hỗ trợ về lĩnh vực giáo dục như: hệithống hỏi đáp tựiđộng, hệ thống quản lýikết quả học tập của học sinh,ihệ thống tư vấn chọn nghành, Mỗi hệ thống nàyichỉ phục vụ cho mộtikhía cạnh hỗ trợ học sinh, tác giảiluận văn thựcihiện đề tài “Xâyidựng mô hình dự đoánikết quả học tập cuối năm củaihọc sinh tại trườngiTHPT Trần Nguyên Hãn” để hỗ trợ một phần nào trong công việc giáo dục của nhà trường

3.1.1 Tiến trình thực hiện luận văn

Tiếnitrình nghiên cứu đượcithể hiện qua sơ đồisau:

Luận văn đượcithực hiện theo cácibước chính bao gồm:

Dữ liệu được thu thập trongi5 năm từ năm họci2015i- 2016 đến năm họci2019i-

2020 dưới dạng file excel dùng để nghiên cứu cho mô hình

Bước 2: Phân tích và trích chọn đặc trưng

Xáciđịnh kiểu dữ liệuicho mỗi cột,iphân tích để lựa chọn đặc trưng có khả năng ảnh hưởng đến mô hình

Bước 3: iChuẩn hoá dữ liệu

Quá trình làmisạchidữiliệu: thực hiện loại bỏ những dòng chứa tiêu đề, những dữ liệu dư thừa, chuyểniđổi một số kiểu dữiliệu về dạng số, ghép dữiliệu từ các môn rời rạc thành 1 bảng nhằm dễ huấn luyệnimô hình hơn

41 Sửidụng thiết kế trực quanimô hình mạng nơron và hồiiquy tuyến tính đểixây dựng môihình cho bài toán

Bước 5: iHuấn luyện mô hình

Choiphép người sử dụng đặticác thông số trước khi thực hiệnihuấn luyện

Thựcihiện kiểm tra trên tập dữ liệuikiểm tra, đưa ra kết quả so sánh mô hình với kết quả thực tế

Choiphép người sử dụng nhậpicác giá trị đầu vàoivà mô hình thực hiệnitính toán, xuất kết quảitrả về.

Ngày đăng: 19/08/2024, 05:26

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] "thuvienphapluat," [Online]. Available: https://thuvienphapluat.vn/van-ban/Quyen-dan-su/Nghi-quyet-36-NQ-TW-cong-tac-nguoi-Viet-Nam-o-nuoc-ngoai-66727.aspx Sách, tạp chí
Tiêu đề: thuvienphapluat
[18] "Morioka Y., Sakurai K., Yokoyama A. Sekine Y. (1993), “Next Day Peak Load Forecasting Using a Multilayer Neural Network with an Additional Learning”, IEEE, 0-7803-1217-1/93, 1993&#34 Sách, tạp chí
Tiêu đề: Morioka Y., Sakurai K., Yokoyama A. Sekine Y. (1993), “Next Day Peak Load Forecasting Using a Multilayer Neural Network with an Additional Learning
Tác giả: Morioka Y., Sakurai K., Yokoyama A. Sekine Y
Năm: 1993
[19] "David Silverman, Jonh A. Dracup (2000), “Artificial Neural Networks and Long-Range Precipitation Prediction in California”, Journal of Applied Meteorology, vol 39 (Jan 2000), pp. 57-66. 51&#34 Sách, tạp chí
Tiêu đề: David Silverman, Jonh A. Dracup (2000), “Artificial Neural Networks and Long-Range Precipitation Prediction in California
Tác giả: David Silverman, Jonh A. Dracup
Năm: 2000
[20] "Dipti Srinivasan, A.C. Liew, Jonh S., P. Chen (1991), “Short Term Forecasting Using Neural Networks Approach”, IEEE 91TH0374-9/91/0000-0012, pp 12- 16, 1991&#34 Sách, tạp chí
Tiêu đề: Dipti Srinivasan, A.C. Liew, Jonh S., P. Chen (1991), “Short Term Forecasting Using Neural Networks Approach
Tác giả: Dipti Srinivasan, A.C. Liew, Jonh S., P. Chen
Năm: 1991
[25] "Lưu Hoài Sang, "Dự báo kết quả học tập bằng kỹ thuật học sâu với mạng nơron đa tầng," Tạp chí khoa học trường Đại Học Cần Thơ, 2021&#34 Sách, tạp chí
Tiêu đề: Lưu Hoài Sang, "Dự báo kết quả học tập bằng kỹ thuật học sâu với mạng nơron đa tầng
[11] "John C. Chambers, Satinder K. Mullick and Donald D. Smith (1971), How to Choose the Right Forecasting Technique, https://hbr.org/1971/07/how-tochoosethe-right-forecasting-techniqu&#34 Link
[1] "Bộ Giáo dục và Đào tạo, Thông tư số 58/2011/TT-BGDĐT của Bộ trưởng Bộ Giáo dục và Đào tạo, về việc ban hành quy chế đánh giá, xếp loại học sinh trung học cơ sở và học sinh trung học phổ thông, ngày 12 tháng 12 năm 2011.&#34 Khác
[3] "Nguyễn Quang Hoan (2005), Giáo trình mạng nơron nhân tạo, Học viện công nghệ bưu chính viễn thông.&#34 Khác
[4] "Fico Corporation (2009), Understanding Predictive Analytics&#34 Khác
[5] "Nguyễn Thanh Tuấn (2019), Deep learning cơ bản, Nhà xuất bản Khoa học và Kỹ thuật.&#34 Khác
[6] "Lê Mỹ Hà, Giáo trình mạng nơ ron học sâu và ứng dụng, Nhà xuất bản Đại học Quốc gia thành phố Hồ Chí Minh.&#34 Khác
[7] "Vũ Hữu Tiệp, (2018). Machine Learning cơ bản, Nhà xuất bản Khoa học và Kỹ thuật.&#34 Khác
[8] "Kolmogorov A. N. On the representation of continuous functions of many variables by superposition of continuous function of one variable and addition, Dokl, Akad, Nauk SSSR, 114, 953-956, Trans. Am. Math-Soc. 2(28), 55-59, (1957)&#34 Khác
[9] "Trần Đức Minh (2002), Ứng dụng mạng nơron truyền thẳng trong dự báo dữ liệu, Luận văn thạc sỹ, Viện Công nghệ Thông tin.&#34 Khác
[10] "Dương Thu Trang (2017), Ứng dụng mạng nơron nhân tạo dự báo số học sinh tuyển vào Trung tâm GDNN-GDTX quận Đống Đa, Luận văn thạc sỹ, trường Đại học Công nghệ – Đại học Quốc gia Hà Nội.&#34 Khác
[12] "Dương Minh Trí (2003), Giáo trình Trí tuệ nhân tạo, Đại học Sư phạm Kỹ thuật thành phố Hồ Chí Minh.&#34 Khác
[13] "Đinh Mạnh Tường(2002), Trí tuệ nhân tạo, Nhà xuất bản Khoa học và Kỹ thuậ&#34 Khác
[14] "Nguyễn Đình Thúc (2000), Mạng nơron nhân tạo – phương pháp và ứng dụng, Nhà xuất bản Giáo dục&#34 Khác
[15] "Đinh Văn Nhượng, (2013). Một số ứng dụng mạng nơron xây dựng mô hình nhận dạng và dự báo, Nhà xuất bản Khoa học và Kỹ thuật&#34 Khác
[16] "Robert J. Schallkoff (1997), Artificial Neural Networks, The McGraw – Hill Companies, Inc 1997&#34 Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w