Bộ não con người có khả năng đặc biệt như tự điều khiển, lập kế hoạch, lập luận, suy nghĩ, hồi ức thông tin, phân biệt các mẫu mặc dù bị méo mó, thiếu hụt. Chính vì vậy, việc nghiên cứu bộ não con người, cụ thể là các tế bào thần kinh (nơron) là ước muốn từ lâu của nhân loại. Từ đó, các nhà khoa học không ngừng tìm hiểu về mạng nơron và xây dựng mô hình mô phỏng hoạt động của não người, phát triển để tạo ra các sản phẩm công nghệ ngày một thông minh hơn, hoạt động gần giống với bộ óc con người, có tốc độ xử lý thông tin cao, chính xác.
LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp thầy giáo hướng dẫn PGS.TS Nguyễn Quang Hoan Mọi tham khảo dùng luận văn trích dẫn rõ ràng tác giả, tên cơng trình, thời gian, địa điểm cơng bố Hưng n, ngày tháng năm 2017 TÁC GIẢ LUẬN VĂN Bùi Khắc Trúng LỜI CẢM ƠN Trong suốt trình làm luận văn nhận giúp đỡ cộng tác nhiệt tình nhiều tập thể cá nhân người trường Đại học Sư phạm Kỹ thuật Hưng Yên Đến luận văn hoàn thành, tơi xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Nguyễn Quang Hoan tận tình trực tiếp hướng dẫn, bảo cung cấp tài liệu hữu ích để tơi hồn thành luận văn Tôi xin cảm ơn Thầy giáo, Cô giáo khoa Cơng nghệThơng tin, phòng Đào tạo sau Đại học trường Đại học Sư phạm Kỹ thuật Hưng Yên tạo điều kiện giúp đỡ mặt suốt trình thực luận văn Hưng Yên, ngày tháng năm 2017 TÁC GIẢ LUẬN VĂN Bùi Khắc Trúng MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT TT TÊN VIẾT TẮT 1ANN TÊN ĐẦY ĐỦ Artificial Neural Network DIỄN GIẢI Mạng nơron nhân tạo BP BackproPagation Algorithm Thuật toán lan truyền ngược DAG DirectedAcyclic Graph Đồ thị không chu trình, có hướng ML Maximum Likelihood Tiêu chuẩn cựcđại MLP Multilayer LayerPerceptron Mạng nơron Perceptron nhiều lớp MSE Mean Square Error Sai số quân phương MAE Mean Absolute Error Sai số tuyệt đối NB Naïve Bayes Naïve Bayes NBC NaiveBayesClassifier Bộ phân lớpNaïve Bayes 10 RMSE Root Mean Square Error Sai số quân phương trung bình 11 PAS Population Analysis Spreadsheets Các bảng tính phân tích dân số DANH MỤC HÌNH VẼ, ĐỒ THỊ DANH MỤC CÁC BẢNG BIỂU MỞ ĐẦU LÝ DO CHỌN ĐỀ TÀI Trong điều kiện cách mạng khoa học kỹ thuật nay, dự báo nhiệm vụ quan trọng lĩnh vực hoạt động đời sống xã hội Vì khoa học dự báo ngày mở rộng phát triển Dự báo đơn giản phức tạp Sự đơn giản hay phức tạp tùy thuộc vào mục đích yêu cầu, mức độ xác tỉ mỉ dự báo Dân số vừa chủ thể, vừa khách thể xã hội, vừa người tổ chức thực mặt hoạt động đời sống xã hội, vừa yếu tố chủ yếu định mặt hoạt động, vừa động lực, vừa mục tiêu hoạt động kinh tế - xã hội Do quy mơ, cấu chất lượng dân số có ảnh hưởng lớn đến hoạt động đời sống xã hội dự báo dân số công việc thiếu quốc gia, ngành địa phương Dự báo dân số việc tính tốn (xác định) dân số tương lai dựa vào giả thiết định sinh, chết di dân Dự báo dân số không đơn giản để trả lời câu hỏi dân số vùng, nước vào thời gian tương lai bao nhiêu, bao gồm hàng loạt vấn đề mối quan hệ tác động qua lại yếu tố dân số dân số với phát triển Dựa vào kết dự báo xác định khoảng cách khả mong muốn tượng dân số, từ đề xuất biện pháp điều chỉnh phù hợp, sở để xây dựng sách dân số Dân số ảnh hưởng trực tiếp đến phát triển kinh tế, xã hội Dự báo dân số phương pháp khoa học cho công tác quy hoạch mang lại hiệu cao Mỹ Hào có lợi giao thơng, có khu công nghiệp phụ cận phát triển rầm rộ, kéo theo mật độ dân số ngày tăng Trước tình hình đó, việc phân luồng dân cư, sở hạ tầng phải bắt kịp với tình hình gia tăng dân số thị xã tương lai Chính vậy, để giải vấn đề quy hoạch chung Mỹ Hào, việc dự báo dân số ngắn hạn dài cần thiết Phân tích đánh giá số liệu thống kê bước bền vững tương lai Do đó, dự báo dân số Mỹ Hào trước trở thành thị xã dựa công nghê tiên tiến mạng nơron nhân tạo với mong muốn giải toán MỤC TIÊU NGHIÊN CỨU Mục tiêu nghiên cứu đề tài dự báo dân số huyện Mỹ Hào đến 2020 sử dụng công cụ mạng nơron nhân tạo, công cụ tiên tiến thay cho phương pháp dự báo kinh điển Chương trình thử nghiệm dựa tập liệu thống kê tư năm 2010 đến 2016, để dự báo đến năm 2020 Phương pháp thử nghiệm đánh giá so sánh với phương pháp dự báo khác ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU - Đối tượng dự báo dân số huyện Mỹ Hào Nghiên cứu yếu tố ảnh hưởng trực tiếp đến phát triển dân số gồm: • Tỷ lệ sinh • Tỷ lệ tử • Số nhập cư • Số di cư • Thu nhập • Tốc độ thị hóa • Nhóm tuổi sinh sản • Tuổi thọ trung bình • Cùng với số liệu thực tế thống kê Mỹ Hào năm gần - đề tàidự kiến sử dụng thuật toán lan truyền ngược Số liệu dân số có từ 2010–2015 huyện Mỹ Hào vào cơng tác dự báo đến 2020 (cố gắng thu thập thêm trước 2010) Đảm bảo sai số phạm vi chấp nhận PHƯƠNG PHÁP NGHIÊN CỨU - Nghiên cứu, tìm hiểu kết phương pháp dự báo dân số Lựa chọn mơ hình, thiết kế mạng lan truyền ngược cho dự báo dân số Thống kê, thu thập, phân tích liệu cho tốn Đánh giá tiêu chí để dự báo dân số So sánh kết dự báo dân số với phương pháp dự báo khác Đề xuất nghiên cứu, đánh giá kêt luận Dự kiến thử nghiệm toán dự báo dân số ngắn hạn Mỹ Hào Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI Đề tài cho thấy khả ứng dụng mạng nơron việc dự báo nói chung tốn dự báo dân số nói riêng có độ xác cao; kết ứng dụng thực tế BỐ CỤC CỦA LUẬN VĂN Nội dung luận văn tổ chức thành ba chương có nội dung sau: Chương Tổng quan phương pháp dự báo phương pháp dự báo áp dụng cho toán dự báo dân số Chương Cơ sở lý thuyết thuật toán lan truyền ngược Chương Ứng dụng mạng nơron lan truyền ngược vào toán dự báo dân số Kết luận hướng nghiên cứu toán CHƯƠNG I TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO 1.1 GIỚI THIỆU CHUNG Dự báo sử dụng thơng tin có cách hiệu để định hướng họat động tương lai nhằm đạt mục đích, yêu cầu tổ chức Dự báo dân số tiên đốn, ước lượng, có đánh giá sai lệch kiện xảy tương lai vấn đề quan tâm kết dự báo tác động đến đời sống hàng ngày Trong tổ chức sản xuất, dự báo thường dùng để dự đoán doanh thu, chi phí, lợi nhuận, giá cả, thay đổi công nghệ, đặc biệt nhu cầu Hầu hết công ty không chờ nhận đơn đặt hàng bắt đầu hoạch định sản xuất, thu mua nguyên vật liệu Khách hàng thường chịu chờ nhà sản xuất đáp ứng yêu cầu, nên để tăng cạnh tranh, nhà sản xuất phải làm đáp ứng nhu cầu khách hàng nhanh chóng Để thực điều này, nhà sản xuất phải dự báo nhu cầu tốt Dự báo manh nha từ trước, song thực phát triển vào cuối kỷ 19 số ngành hàng hải, nông nghiệp Nhiều kỹ thuật dự báo ngày bắt đầu phát triển vào kỷ 19 [6] Dự báo thường gồm vấn đề sau: - Đối tượng đơn vị dự báo Chiều dự báo Phương pháp dự báo Thời gian chu kỳ dự báo Độ xác dự báo Báo cáo đặc biệt Mơ hình điều chỉnh mơ hình dự báo Đối tượng dự báo dân số, thời tiết, số chứng khoán, vật tư, hay sức tiêu thụ sản phẩm v.v… Chiều dự báo xuống hay lên Dự báo từ xuống dự báo số kinh tế tổng sản phẩm quốc gia, thu nhập đầu người, sau dự báo cho ngành công nghiệp mà tổ chức tham gia, dự báo cho thị phần tổ chức, dự báo cho dòng sản phẩm cuối dự báo cho sản phẩm Dự báo từ lên dự báo theo chiều ngược lại Phương pháp dự báo dựa vào kiện chia thành phương pháp định tính phương pháp định lượng Phương pháp định lượng bao gồm Phương pháp phân tích theo chuỗi thời gian Phương pháp nguyên nhân Thời gian dự báo bao gồm nhiều chu kỳ dự báo Chu kỳ dự báo tuần, tháng, hay q Thời gian dự báo ngắn hạn, trung hạn hay dài hạn Dự báo ngắn hạn có thời gian thường không tháng, dùng cho nhà quản lý cấp thấp hoạch định mua sắm, lên lịch sản xuất, điều độ công việc, phân công nhiệm vụ,… Dự báo ngắn hạn thường sử dụng phương pháp chuỗi thời gian, dùng phương pháp nguyên nhân Dự báo trung hạn có thời gian thường từ tháng đến năm, dùng cho nhà quản lý cấp trung hoạch định sản xuất phân phối đánh giá mức độ tồn kho cần thiết Dự báo trung hạn sử dụng phương pháp chuỗi thời gian, phương pháp nguyên nhân phương pháp định tính Dự báo dài hạn thường có thời gian trên2 năm, dùng cho nhà quản lý cấp cao hoạch định chiến lược đánh giá mục tiêu dài hạn, tham gia vào thị trường mới, phát triển kỹ thuật điều kiện mới, thiết kế mạng lưới sản xuất kinh doanh Dự báo dài hạn thường sử dụng phương pháp nguyên nhân phương pháp định tính 1.2 QUY TRÌNH THỰC HIỆN DỰ BÁO Dự báo trình phức tạp qui trình thực theo bước sau: Bắt đầu ↓ Lập kế hoạch 10 56 Mức sinh thay là mức sinh mà đoàn hệ phụ nữ có trung bình vừa đủ số gái để “thay thế” vào chu kỳ sản xuất dân số Có thể dựa tổng tỷ suất sinh (TFR) để đánh giá dân số đạt mức sinh thay hay chưa Nếu TFR đạt khoảng 2,1 con/1 phụ nữ, đạt mức sinh thay Có nhiều nhân tố ảnh hưởng đến mức sinh Có thể chia thành nhóm sau: nhóm yếu tố thuộc tự nhiên sinh học; nhóm yếu tố thuộc kinh tế; nhóm yếu tố văn hóa – xã hội (phong tục tập quán, giáo dục tiến phụ nữ) Nhóm yếu tố thuộc tiến y học y tế nhóm yếu tố thuộc yếu tố trị, sách, kinh tế-xã hội dân số[5] 3.1.2 Số lượng người chết Số tử yếu tố tác động lớn đến quy mô, cấu phân bố dân số Chết điều tránh khỏi với thể sống Song phấn đấu giảm mức chết lại nhiệm vụ hàng đầu quốc gia thời kỳ Vì vậy, nghiên cứu mức chết giữ vai trò quan trọng nghiên cứu dân số để tính tiềm gia tăng dân số Mức chết khác biệt theo tuổi giới tính Cho đến khác biệt mức chết theo giới tính nghiêng xu nam giới chết nhiều nữ giới độ tuổi Ngoài ra, mức chết khác biệt theo mức sống, theo thành thị nông thôn Các nhân tố ảnh hưởng đến mức chết phân thành nhóm sau: Các yếu tố thuộc tự nhiên sinh học (tuổi, giới tính điều kiện khí hậu vùng khác nhau); mức sống dân cư; tiến khoa học, kỹ thuật y học trình độ hệ thống y tế, sách bảo trợ xã hội, sách chăm sóc sức khỏe nhân dân Quá trình sản xuất dân số chịu ảnh hưởng nhiều nhân tố phức tạp thuộc lĩnh vực kinh tế, khoa học kỹ thuật, trị xã hỗ dự báo dân số có quan hệ chặt chẽ với dự báo khác đặc mối quan hệ qua lại với dự báo Phát xu hướng vận động tiêu tái sản xuất dân số, sở xác định phương án có phát triển dân số tương lai : Số lượng, cấu, phân bổ theo lãnh thổ 56 57 3.1.3 Xuất cư, nhập cư tốc độ đô thị hóa Di dân vấn đề phức tạp mang chất kinh tế-xã hội sâu sắc Có nhiều định nghĩa di dân, định nghĩa sử dụng nhiều là: di chuyển người dân từ đơn vị lãnh thổ sang đơn vị lãnh thổ khác có kèm theo thay đổi nơi vĩnh viễn theo chuẩn mực định không gian thời gian Để nghiên cứu di dân người ta sử dụng tỷ suất di dân đến, di dân di dân túy Có nhiều phương pháp tính tốn số lượng người di cư, phương pháp tính tốn dựa vào tổng điều tra dân số xác tốn khó thực Các điều tra mẫu di cư cho phép nghiên cứu sâu nguyên nhân di chuyển, động lực di chuyển không cho phép tính tốn số lượng người di cư Vì vậy, để ước lượng số lượng người di cư người ta thường dùng phương pháp gián tiếp dựa vào tỷ suất di dân Có nhiều nguyên nhân khiến người ta di cư đến nơi khác, nguyên nhân phổ biến tìm việc làm có thu nhập cao hơn, tìm đến nơi có điều kiện học tập để nâng cao trình độ, đến nơi có điều kiện sống tốt hơn, di chuyển lý kết hơn… Có xu hướng phụ nữ hố dòng di dân bên cạnh dòng di cư người có trình độ học vấn cao, lại có di cư người có trình độ học vấn thấp Đặc biệt di dân nông thôn - đô thị trở thành xu hướng di dân chủ yếu Việt Nam Có nhiều lý thuyết nghiên cứu động lực di cư Trong lý thuyết sức hút, sức đẩy thuyết chi phí lợi ích dường nhiều người quan tâm Có nhiều định nghĩa thị hóa, định nghĩa thị hóa q trình phát triển thành phố kể chiều rộng chiều sâu nâng cao vị kinh tế, trị, văn hóa xã hội thị kinh tế-xã hội sử dụng giáo trình Các báo để đánh giá trình độ thị hóa tỷ trọng dân số thị tổng số dân tỷ trọng sản phẩm quốc nội khu vực đô thị sản xuất tổng sản phẩm quốc nội 57 58 Di dân thị hóa hai q trình gắn bó mật thiết với có ảnh hưởng qua lại với trình phát triển dân số kinh tế-xã hội Tóm lại, q trình phát triển dân số điều kiện kinh tế phát triển đặt quy trình có quản lý điều khiển, gắn liền với hệ thống kinh tế xã hội định Vì nhiệm vụ dụ báo đề xuất sách biện pháp nhằm phát triển tối ưu số dân, nguồn lao động xã hội, giải việc làm đầy đủ, nâng cao phục vụ vật chất tinh thần cho người, thúc đẩy trình tăng trưởng với tốc độ nhanh, hiệu , bền vững phù hợp với trình chuyển dịch cấu theo hướng cơng nghiệp đại[6] 3.2 TÌNH HÌNH DÂN SỐ MỸ HÀO Quy mơ dân số Mỹ Hào mức trung bình phát triển mạnh, theo điều tra thống kê dân số năm 2010 90 000 người, năm 2015 số 1100000 người, huyện đông dân thứ tỉnh Theo nghiên cứu tính tốn rằng, để sống thuận lợi, bình quân 1km 2, nên có từ 35 đến 40 người Thực tế mật độ dân số Mỹ Hào gấp khoảng 3,4 lần 3.2.1 Dữ liệu dân số Qua trình tìm hiểu, làm việc với trung tâm dân số huyện, học viên nhân thấy để thống kê, quản lý số liệu thông qua trung tâm dân số xã, thôn để thu thập thông tin tỷ lệ sinh, tử, bên cạnh việc điều tra dân số thống kê số dân nhập cư di cư địa phương hiệu 3.2.2 Thống kê liệu dân số Trong khuôn khổ luận văn, học viên sử dụng số liệu tổng hợp số lượng tử, số lượng sinh, số lượng di cư số lượng nhập cư Số lượng thống kê theo năm 3.2.3 Các yếu tố ảnh hưởng đến số liệu - Sự phát triển khu thị, nhà máy 58 59 - Chính sách dân số - Sự phát triển sở hạ tầng 3.3 XÂY DỰNG MƠ HÌNH MẠNG NƠ RON NHÂN TẠO Bước 1: Chuẩn hóa liệu đầu vào thu đầu vào Dữ liệu đầu vào mạng gồm bốn thông số làsố sinh, số tử, số nhập cư, số di cư đầu mạng tổng số dân Các giá trị bốn thông số tương đối chênh lệch nhau, dao động từ 300 đến 97000 Ta cầu phải chuẩn hóa liệu đầu vào để thơng số đầu vào mạng có vai trò chúng ảnh hưởng đến kết đầu mức độ định Chuẩn hóa luận văn thực cho biến đầu vào dao động khoảng [0,1], Ta chi toàn liệu thu thập cho 200000, ta bảng số liệu sau: Bảng 3.1 Chuẩn hóa liệu NAM 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 TONG DAN SO 0.27 0.284 0.3003 0.31455 0.33105 0.34665 0.36815 0.38865 0.41065 0.43415 0.46165 0.4889 SO SINH 0.016 0.018 0.0175 0.018 0.016 0.02 0.0215 0.0225 0.025 0.0245 0.025 0.0255 SO TU 0.0045 0.00465 0.006 0.005 0.0049 0.0045 0.005 0.006 0.00625 0.005 0.006 0.00625 SO NHAP CU 0.004 0.00395 0.0045 0.005 0.0065 0.0075 0.006 0.007 0.0065 0.01 0.0105 0.01 SO DI CU 0.0015 0.001 0.00175 0.0015 0.002 0.0015 0.002 0.0015 0.00175 0.002 0.00225 0.0025 Bước 2: Xây dựng mạng noron - Chọn nút đầu vào - Chọn nút ẩn - Chọn nút đầu 59 60 - Chọn sai số thỏa mãn - Chọn hệ số học - Khởi tạo giá trị ngẫu nhiên cho trọng số Bước 3: Lan truyền tiến Bước 4: Tính sai số học đầu định xem có học tiếp hay khơng, học tiếp chuyển đến bước Bước 5: Tính sai số nút cập nhật trọng số tiếp tục lặp lại bước 3.3.1 Lựa chọn biến số thông tin đầu vào Số liệu thu thập bao gồm thông tin là: Số sinh, số tử, số nhập cư số xuất cư Cả thông tin học viên lựa chọn Học viên chọn thông tin đầu vào sau: - Tổng dân số: Sẽ sử dụng kỳ đầu mạng Ví dụ ta định dự báo đến năm 2020 có tổng dân số cần tính - Số liệu 15năm trước từ năm 2005 + Tổng số dân + Số sinh + Số tử + Số di cư + Số nhập cư 3.3.2 Thống kê làm liệu Chuẩn hóa liệu đầu vào: Bảng 3.2 Dữ liệu đầu vào NAM 2005 2006 2007 2008 2009 2010 2011 2012 2013 TONG DAN SO 54000 56800 60060 62910 66210 69330 73630 77730 82130 SO SINH 3200 3600 3500 3600 3200 4000 4300 4500 5000 SO TU 900 930 1200 1000 980 900 1000 1200 1250 SO NHAP CU 800 790 900 1000 1300 1500 1200 1400 1300 SO DI CU 300 200 350 300 400 300 400 300 350 60 61 2014 2015 2016 86830 92330 97780 4900 5000 5100 1000 1200 1250 2000 2100 2000 400 450 500 3.3.3 Xác định cấu trúc mạng Luật học truyền ngược có ý nghĩa quan trọng việc cập nhật trọng số mạng nhiều lớp truyền thẳng Nền tảng thuật toán cập nhật trọng số phương pháp hạ Gradient Với cặp mẫu đầu vào-đầu mong muốn (x(k), d(k)) Trong toán, ta xác định cặp đầu vào (x(k), d(k))trong k =1 giá trị liệu số lượng sinh, số lượng tử, số lượng di cư, số lượng nhập cư d liệu dân số năm 2005, 2006, ….2016 Ta xác định trọng số đầu vào đầu tương ứng w1,1; w1,2; w1,3… w4,4 Từ ta xác định cấu trúc mạng toán dân số Mỹ Hào d W11 x1 W0 W12 W13 W W14 21 W22 W1 W0 61 62 x2 W23 W2 W24 W31 y W0 W3 W32 x3 W33 W34 W41 W0 W4 E=d-y W42 x4 W43 W44 Luật học lan truyền ngược chỉnh W11, W12, W13… W44 Luật học lan truyền ngược chỉnh W1, W2, W3, W4 Hình 3.1 Cấu trúc mạng toán dân số Mỹ Hào Số lớp nơron Dựa cơng trình nghiên cứu tham khảo số tác giả làm dự báo qua thửnghiệm thực tế học viên nhận thấy: Các mạng có lớp ẩn xấp xỉ hàm với dáng điệu nên mặt lý thuyết khơng có lý cần sử dụng nhiều lớp ẩn Mặt khác với tốn có số đầu vào, đầu toán dự báo dân số, việc lựa chọn lớp không hiệu không cần thiết Học viên đề xuất mơ hình mạng nơ ron với lớp (1 lớp vào, lớp ẩn, lớp ra) cấu trúc toán Số nơron lớp vào Đầu vào x, nơron thứ q lớp ẩn nhận tổng đầu vào là: 62 63 m net q = ∑ v qj x j (3.2) j =1 Trong đóchọn số nơ ron (q=1, ,4 thực nghiệm chọn nơ ron) q nơ ron thứ q lớp vào vqj trọng số đầu vào thứ j nối với nơ ron thứ q (tổng số có qj = 4x4=16trọng số thực nghiệm) Trong toán, học viên sử dụng nơron lớp vào ứng với giá trị đầu vào mạng bảng sau: Bảng 3.3 Số Nơron lớp vào Nơron lớp vào Giá trị x1 Số sinh x2 Sổ tử x3 Số nhập cư x4 Số di cư Các giá trị thống kê từ 2005-2016 với tổng số dân năm tương ứng tập giá trị đầu vào toán Số nơron lớp ẩn Hiện tại, chưa có cơng thức hay lý thuyết để xác định số lượng nơron lớp ẩn cách hiệu quảvà xác Để phân tích xác sốlượng nơron cần thiết khơng khả thi tính phức tạp sơ đồ mạng đường giá trị đầu Vì kích thước lớp ẩn thường xác định theo thử nghiệm dựa toán cụ thể Trong ứng dụng dự báo dân số học viên thay đổi số nơron lớp ẩn từ02 – 10để thử nghiệm thực nghiệm cho thấy số nơron lớp ẩn từ khoảng đến 10 nơron cho kết xác Nếu số lượng nơron lớp ẩn mạng khơng học số lượng nơron q lớn mạng học chậm cho kết xác không cao Trong ứng dụng học viên chọn noron lớpẩn là4 Số nơron lớp 63 64 Giá trị nơron lớp dự báo số dân biết thông số đầu vào.Trong bối cảnh toán nêu, số nơ ron lớp n=1ứng với tổng số dân năm Hằng số học Hằng số học ảnh hưởng đến hiệu quảvà tốc độ hội tụ thuật toán lan truyền ngược Giá trị số học phụthuộc vào cấu trúc mạng, số liệu chuẩn hóa tốn cần giải quyết, khơng có cơng thực hay phương pháp đểxác định xác giá trị số học thích hợp Trong trình huấn luyện, cực tiểu nằm bề mặt rộng tạo giá trị gradient nhỏ, số lớn làm cho hội tụ nhanh Tuy nhiên, cực tiểu nằm bề mặt dốc hẹp, giá trị phải nhỏ để tránh tượng bỏ qua lời giải Khi số học lớn, tốc độ hội tụ tăng q trình học xác khó ổn định cực tiểu Do đó, số học thường lựa chọn phương pháp thực nghiệm Bằng thực nghiệm luận văn chọn Lựa chọn hàm kích hoạt Hàm kích hoạt sử dụng lớp vào lớp ẩn Hàm log-sigmoid, hàm thuận lợi sử dụng cho mạng huấn luyện thuật toán lan truyền ngược BP, dễ lấy đạo hàm f q (net q ) = −net 1+ e q f(x) = 1.0/(1.0 + exp(−x)) Hàm log-sigmoid phù hợp với tốn có đầu mong muốn rơi vào khoảng [0, 1] Hàm kích hoạt sử dụng lớp hàm tổng: SUM giá trị đầu giá trị thực tế chuẩn hóa theo đơn vị đầu trình bày phần chuẩn hóa Dự báo dân số năm 2017, 2018, 2019, 2020 Để dự báo dân số năm tiếp theo, liệu toàn cần biết số liệu sinh, số liệu tử, số liệu nhập cư số liệu di cư để tính tổng số dân Tuy nhiên thời gian có hạn, việc sử dụng số liệu học viên ước lượng dựa theo số liệu 64 65 năm trước Để có hướng phát triển tiếp theo, học viên xây dựng mơ hình mạng nơron với đầu số sinh, số tử, số di cư, số nhập cư Đây phần hạn chế luận văn 3.3.4 Các bước thực nghiệm mạng nơron Bước 1: Tải liệu mẫu Bảng 3.4 Tải liệu mẫu Bước 2: Huấn luyện mạng Bảng 3.5 Huấn luyện training liệu 65 66 Bảng 3.6 Kết quả dự báovới noron lớpẩn là4 Bảng 3.7 Kết quả dự báo dân số NAM Y X1 X2 X3 X4 66 67 2017 2018 2019 2020 TONG DAN SO SO SINH SO TU SO NHAP CU SO DI CU 94617 96364 97334 98201 5500 6100 6400 7000 1000 1200 1250 1300 2500 3000 3200 3700 400 450 430 420 Bảng 3.8 So sánh kết quả dự báo với thực tế Năm 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 Sai số MSE Kết thực tế 69330 73630 77730 82130 86830 92330 97780 Kết thử nghiệm 69068 73547 78173 82370 86108 91965 97366 101766 104763 108343 110933 3.56 Trong luận văn học viên đánh giá sai sốkết dự báo với n=7 (theo bảng 3.5) Hồn tồn đánh giá với n số KẾT LUẬN, KIẾN NGHỊ VÀ HƯỚNG PHÁT TRIỂN 67 68 KẾT LUẬN Luận văn nghiên cứu mạng nơ ron lan truyền thẳng bao gồm: mạng lớp, mạng nhiều lớp, giải thuật lan truyền ngược sai số yếu tố ảnh hưởng đến trình học lan truyền ngược sai số để ứng dụng vào toán dự báo dân số huyện Mỹ Hào Luận văn xây dựng chương trình demo tốn dự báo dân số Mỹ Hào sử dụng mơ hình thuật tốn lan truyền ngược sai số Tuy nhiên, luận văn dừng lại mức dự báo dân số với liệu đầu vào hạn chế Tuy nhiên học viên khơng xin liệu đẩy đủ tốc độ già hóa dân số, tốc độ phát triển công nghiệp v.v mức độ dự báo xác Các đóng góp khoa học luận văn: Hệ thống hóa phương pháp dự báo sử dụng toán dự báo số tác giả Nghiên cứu tổng quan mạng nơ ron nhân tạo sâu vào nghiên cứu mạng nơ ron lan truyền thẳng huấn luyện thuật toán lan truyền ngược sai số nhằm đạt tới kết trọn vẹn toán tối ưu trọng số mạng nơ ron nhân tạo Xây dựng phần mềm dự báo dân số cho kết thử nghiệm dự báo dân số năm 2017 KIẾN NGHỊ Từ kết luận đề cập trên, ta đưa số kiến nghị sau: - Hoàn thiện phương pháp dựa kết nghiên cứu đạt kết hợp với phươngpháp khác để để kết dự báo xác - Đánh giá tối ưu hóa hiệu suất thực thuật tốn đề xuất trongluận văn (phân chia tối ưu bước thực hiện, tối ưu hóa việc sử dụng, chiasẻ tài nguyên, sở liệu, lực tính tốn, xây dựng chương trình dự báo với nhiều thơng số đầu vào đầu ra, thực song song số bướccủa thuật toán HƯỚNG PHÁT TRIỂN TIẾP THEO Những kết nghiên cứu khả quan ứng dụng mạng nơ-ron nhân tạo với thuật toán học lan truyền ngược sai sốtrong toán dự báo dân số chứng tỏ 68 69 mơ hình ứng dụng hiệu quảđối với tốn Tuy nhiên, câu hỏi đặt là: Liệu phương pháp khác như:Giải thuật di truyền, lai Nơron - Mờ, v.v có thu kết tốt hay khơng? Đã có nhiều nghiên cứu giới thành công sử dụng phương pháp tốn dự báo Vì vậy, hướng phát triển đề tài nghiên cứu, cải tiến thử nghiệm phương pháp học máy tiên tiến khác để nâng cao kết dự báo thời gian dự báo TÀI LIỆU THAM KHẢO 69 70 [1] Nguyễn Quang Hoan, Hoàng Thị Lan Phương (2006), Dự báo giá chứng khoán sử dụng công nghệ mạng nơron, Kỷ yếu Hội nghị Khoa học lần Nghiên cứu, Phát triển Ứng dụng Công nghệ Thông tin Truyền thông ICT.rda’06 (20-21/5/2006) [2] Nguyễn Quang Hoan (2012), Mạng nơron nhân tạo, Học viện Bưu Viễn thơng [3] Bin Li (2002), Spatial Interpolation of Weather Variables Using Artificial Neural Network, master dissertation of Science, University of Georgia, Greece [4] Warren S Sarle (1994), Neural Networks and Statistical Models, SAS Institute Inc., Cary, NC, USA [5] Trần Cao Sơn (1997), Một số vấn đề mối quan hệ dân số phát triển, Nhà xuất Khoa học Xã hội, Hà Nội [6] Tổng cục Thống kê (2005), Điều tra di cư Việt Nam năm 2004: Những kết chủ yếu, Nhà xuất Thống kê, Hà Nội [7] Nguyễn Đình Cử (2007), Những xu hướng biến đổi dân số Việt Nam, Nhà xuất Nơng Nghiệp, Hà Nội [8] Nguyễn Đình Cử (1997), Giáo trình dân số phát triển, Nhà xuất Nông nghiệp, Hà Nội [9] David Silverman, John A Dracup (2000), Artificial Neural Networks and LongRange Precipitation Prediction in California, Journal of Applied Meteorology, vol 39 [10] Vũ Văn Hải (2013), Dự báo nhiệt độ sử dụng mạng nơron nhân tạo, Luận văn thạc sĩ khoa học 70 ... tạo điều kiện giúp đỡ mặt suốt trình thực luận văn Hưng Yên, ngày tháng năm 2017 TÁC GIẢ LUẬN VĂN Bùi Khắc Trúng MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT TT TÊN VIẾT TẮT 1ANN TÊN ĐẦY ĐỦ Artificial... thành luận văn Tơi xin cảm ơn Thầy giáo, Cô giáo khoa Cơng nghệThơng tin, phòng Đào tạo sau Đại học trường Đại học Sư phạm Kỹ thuật Hưng Yên tạo điều kiện giúp đỡ mặt suốt trình thực luận văn Hưng...LỜI CẢM ƠN Trong suốt trình làm luận văn nhận giúp đỡ cộng tác nhiệt tình nhiều tập thể cá nhân người trường Đại học Sư phạm Kỹ thuật Hưng n Đến luận văn hồn thành, tơi xin bày tỏ lòng biết