Phát biểu bài toán

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu mạng nơ ron và ứng dụng trong bài toán dự báo tuyển sinh trường THPT lê quý đôn (Trang 49 - 52)

4. Nội dung và bố cục của luận văn

3.2 Phát biểu bài toán

Qua phân tích trong chương 1 và chương 2, để xây dựng mô hình dự báo tuyển sinh cho Trường THPT Lê Quý Đôn, luận văn sẽ lựa chọn dựa trên số học sinh tuyển vào trường trong một số năm của cơ sở đào tạo.

Dữ liệu tuyển sinh của trường từ năm 2000 đến năm 2019 được thống kê trong Bảng 3.2 như sau:

Bảng 3.2. Dữ liệu tuyển sinh của Trường PTTH Lê Quý Đôn

TT Năm Số HS tuyển sinh

1 2000 307 2 2001 248 3 2002 247 4 2003 310 5 2004 421 6 2005 342 7 2006 242

8 2007 354 9 2008 277 10 2009 465 11 2010 387 12 2011 387 13 2012 354 14 2013 287 15 2014 250 16 2015 348 17 2016 308 18 2017 300 19 2018 368 20 2019 349

Dựa trên số liệu thống kê này, ta cần thiết kế phần mềm để xây dựng mô hình dự báo tuyển sinh ứng dụng mạng nơ ron MLP.

Như đã phân tích trong các phần trước, sẽ là rất khó để xác định các tham số nhằm xây dựng mô hình dự báo chính xác nhất. Phương pháp thông thường nhất là dựa trên “thử và sai”. Chính vì vậy, phần mềm thiết kế phải linh hoạt để cho người dùng chọn lựa một số các tham số sau:

 Về tham số của dự báo:

- Lựa chọn khoảng thời gian quan sát trước (n), là số mẫu cần thiết thu thập trước khi đưa ra kết quả dự báo hiện tại. Ví dụ, nếu n=10 thì để cho kết quả dự báo tuyển sinh của năm 2020 cần 10 mẫu của các năm trước từ 2010 đến 2019

- Lựa chọn cửa số dự báo (s). Đây chính là số thời điểm dự báo trong tương lai. Ví dụ, nếu s=3 thì tại thời điểm có số liệu thực về tuyển sinh cập nhật đến năm 2020 cho phép ta dự báo kết quả của ba năm 2021, 2022 và 2023.

 Về tham số của mạng nơ ron:

- Bao gồm các tham số được trình bày trong phần 2.2.3 như: số nơ ron lớp ẩn, hệ số học, hệ số mô men, số chu kỳ luyện mạng tối đa.

Pha 1: Pha học

Dữ liệu dùng để học sẽ lấy từ năm 2000 đến năm 2015. Tùy theo việc lựa chọn khoảng thời gian quan sát trước (n) và cửa số dự báo (s), ta sẽ chuẩn bị một tập các mẫu cho việc luyện mạng. Giả sử với n=6, s=3, từ cơ sở dữ liệu ta sẽ tạo ra 14 mẫu mỗi mẫu gồm 6 đầu vào là số học sinh của 6 năm và 3 đầu ra là số học sinh của 3 năm dự báo. Mẫu 1 là số học sinh từ năm 2000 đến năm 2005 và đầu ra là số học sinh năm 2006, 2007, 2008. Mẫu 2 lấy tiến lên 1 năm là số học sinh từ năm 2001 đến năm 2006 và đầu ra là số học sinh của ba năm 2007, 2008, 2009. Cứ như vậy ta sẽ có đến mẫu dữ liệu 14 là số học sinh từ năm 2001 đến năm 2011. Dữ liệu từ năm 2012 đến năm 2017 sẽ được sử dụng để làm dữ liệu kiểm tra độ chính xác của dự báo. Ta có bảng dữ liệu học như sau:

Bảng 3.3. Bảng dữ liệu học (với n=6, s=3)

Đầu vào Đầu ra

x1 x2 x3 x4 x5 x6 y1 y2 y3 k=1 307 248 247 310 421 342 242 354 277 k=2 248 247 310 421 342 242 354 277 465 k=3 247 310 421 342 242 354 277 465 387 k=4 310 421 342 242 354 277 465 387 387 k=5 421 342 242 354 277 465 387 387 354 k=6 342 242 354 277 465 387 387 354 287 k=7 242 354 277 465 387 387 354 287 250 k=8 354 277 465 387 387 354 287 250 348

Pha 2: Pha chạy đánh giá

Từ kết quả của pha 1, sau khi luyện mạng ta tìm được cấu trúc mạng với các

trong số W = [wij] phù hợp.

Cho tập dữ liệu năm [2000 … 2019]. Cho tập dữ liệu số học sinh [307…349].

Bài toán xác định y1, y2, y3 là số học sinh dự kiến của các từ năm 2016 đến 2019. Kiểm tra sai số so với số liệu thực tế. Nếu sai số là chấp nhận được thì đưa ra dự báo cho các năm 2020, 2021, 2022 dựa trên các số liệu từ 2014 đến 2019.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu mạng nơ ron và ứng dụng trong bài toán dự báo tuyển sinh trường THPT lê quý đôn (Trang 49 - 52)