Trang 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NƠNG LÂM THÀNH PHỐ HỒ CHÍ MINH KHÓA LUẬN TỐT NGHIỆP NGHIÊN CỨU ÁP DỤNG MẠNG NEURON NHÂN TẠO PHỤC VỤ BÀI TOÁN NHẬN DẠNG TRONG GIS Họ và tên s
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH KHĨA LUẬN TỐT NGHIỆP KLTN Thông tin địa lý NGHIÊN CỨU ÁP DỤNG MẠNG NEURON NHÂN TẠO PHỤC VỤ BÀI TOÁN NHẬN DẠNG TRONG GIS Họ tên sinh viên: NGUYỄN NGỌC MINH TIẾN Ngành: Hệ thống Thơng tin Địa lý Niên khóa: 2012 - 2016 Tp Hồ Chí Minh, tháng 06 / 2016 Minh Tiến NGHIÊN CỨU ÁP DỤNG MẠNG NEURON NHÂN TẠO PHỤC VỤ BÀI TOÁN NHẬN DẠNG TRONG GIS Tác giả NGUYỄN NGỌC MINH TIẾN Khóa luận đƣợc đệ trình để đáp ứng yêu cầu cấp Kỹ sƣ ngành Hệ thống Thông tin Địa lý KLTN Thông tin địa lý Giáo viên hƣớng dẫn Th.S Khƣu Minh Cảnh Tp.Hồ Chí Minh, tháng 06 / 2016 i Minh Tiến LỜI CẢM ƠN Trƣớc hết, xin chân thành cảm ơn thầy Th.S Khƣu Minh Cảnh, cán công tác Sở Khoa học Cơng nghệ thành phố Hồ Chí Minh, ngƣời hƣớng dẫn tơi hồn thành đề tài tốt nghiệp Cảm ơn thầy tận tình bảo, hỗ trợ động viên suốt thời gian qua Đồng thời xin gửi lời cảm ơn đến thầy ThS NCS Cao Duy Trƣờng góp ý, chia sẻ thêm kinh nghiệm luận Tôi xin chân trọng cảm ơn Ban lãnh đạo Sở Khoa học Cơng nghệ thành phố Hồ Chí Minh tạo điều kiện cho đƣợc thực tập, làm việc quý quan Đặc biệt, xin gửi lời cảm ơn đến phòng Trung tâm Ứng dụng Hệ thống Thơng tin Địa lý TP.HCM (HCMGIS) tận tình trao đổi kiến thức, kinh nghiệm quý báu nhƣ chia sẻ tài liệu, liệu Tôi xin gửi lời tri ân sâu sắc đến thầy PGS.TS Nguyễn Kim Lợi, thầy Th.S Lê KLTN Thông tin địa lý Văn Phận, cô Th.S Nguyễn Thị Huyền, thầy Ks Nguyễn Duy Liêm, thầy Ks Lê Hồng Tú, anh chị phịng Trung tâm nghiên cứu khí hậu RICC, q thầy trƣờng đại học Nơng Lâm thành phố Hồ Chí Minh với tập thể lớp DH12GI Cảm ơn quý thầy cô, quý anh chị bạn kiến thức, kinh nghiệm giúp đỡ chân tình dành cho suốt bốn năm học tập trƣờng Cuối cùng, xin nói lời biết ơn sâu sắc đến với cha mẹ, ngƣời chăm sóc, nuôi dạy thành ngƣời động viên tinh thần, hỗ trợ thứ cho để yên tâm học tập Nguyễn Ngọc Minh Tiến Chuyên ngành Hệ thống Thông tin Địa lý Khoa Môi trƣờng & Tài ngun Trƣờng đại học Nơng Lâm Tp Hồ Chí Minh Tp Hồ Chí Minh, Tháng 06 / 2016 ii Minh Tiến TĨM TẮT Khóa luận tốt nghiệp “Nghiên cứu áp dụng mạng neuron nhân tạo phục vụ toán nhận dạng GIS” đƣợc thực khoảng thời gian từ ngày 01/03/2016 đến ngày 07/06/2016 Phƣơng pháp tiếp cận đề tài kết hợp công nghệ GIS với mạng Neuron nhân tạo (ANN) tập trung mạng lan truyền ngƣợc (BP), mảng trí thơng minh nhân tạo (AI) Theo GIS với khả hỗ trợ mạnh mẽ việc quản lý tƣơng tác tốt hai loại liệu thuộc tính liệu không gian với thay đổi thời gian mạng Neuron có tốc độ xử lý nhanh, có khả học hỏi, cho phép học mà ta yêu cầu lợi lớn ANN khả đƣợc sử dụng nhƣ chế xấp xỉ hàm tùy ý mà 'học' đƣợc từ liệu quan sát Việc kết hợp mạnh GIS mạng Neuron nói riêng nhƣ trí thơng minh nhân tạo nói chung mang đến giải pháp để giải vấn đề lớn, mang nhiều đặc điểm khác vớiKLTN tính cấp Thơng bách điển hình vấn tinlà địa lýđề liên quan đến tai nạn giao thông Luận văn đề cập đến nội dung sau: Tìm hiểu, xây dựng liệu tai nạn giao thơng thành phố Hồ Chí Minh Tìm hiểu nắm đƣợc quy trình xây dựng mạng neuron để phân tích khai phá liệu khơng gian (data mining) Thực thử nghiệm phân tích mạng thần kinh nhân tạo để nhận dạng liệu tai nạn giao thơng xây dựng Tìm hiểu lập trình ngơn ngữ Python Tìm hiểu, sử dụng cơng cụ MATLAB Kết đạt đƣợc luận văn gồm: Xây dựng sở liệu không gian vụ tai nạn giao thơng thành phố Hồ Chí Minh Xây dựng đƣợc đồ vụ tai nạn giao thông TPHCM iii Minh Tiến Tiếp cận đƣợc phƣơng pháp phân tích mạng neuron nhân tạo Nắm bắt đƣợc cấu hình mạng neuron dựa liệu tai nạn giao thông TPHCM KLTN Thông tin địa lý iv Minh Tiến MỤC LỤC LỜI CẢM ƠN ii TÓM TẮT iii MỤC LỤC v DANH MỤC VIẾT TẮT viii DANH MỤC BẢNG BIỂU ix DANH MỤC HÌNH ẢNH x CHƢƠNG ĐẶT VẤN ĐỀ 1.1 Tính cấp thiết đề tài 1.2 Mục tiêu đề tài 1.3 Kết mong đợi 1.4 Đối tƣợng phạm vi nghiên cứu KLTN Thông tin địa lý 1.5 Ý nghĩa khoa học thực tiễn 1.5.1 Ý nghĩa khoa học 1.5.2 Ý nghĩa thực tiễn .3 CHƢƠNG TỔNG QUAN ĐỀ TÀI 2.1 Khái quát khu vực nghiên cứu 2.1.1 Vị trí địa lý 2.1.2 Tình hình tai nạn giao thông TPHCM 2.2 Trí tuệ nhân tạo 2.2.1 Định nghĩa trí tuệ nhân tạo .7 2.2.2 Lịch sử trí tuệ nhân tạo .8 2.2.3 Các lĩnh vực AI 2.2.4 Các thành tựu AI 2.3 Mạng noron nhân tạo (Artificial Neural Network) 10 2.3.1 Giới thiệu mạng Nơ-ron 10 2.3.2 Hàm xử lý .12 v Minh Tiến 2.3.3 Chọn lớp ẩn 14 2.3.4 Giải thuật lan truyền ngƣợc .16 2.3.5 Dừng trình huấn luyện đánh giá sai số mạng .17 2.3.6 Vấn đề mạng lan truyền ngƣợc 18 2.3.7 Các nghiên cứu thực .19 2.4 Phân tích hồi quy tƣơng quan 20 2.4.1 Phƣơng trình hồi quy 20 2.4.2 Hệ số xác định R2 20 2.4.3 Hệ số tƣơng quan bội 21 2.5 Ngôn ngữ Python 21 2.5.1 Python .21 2.5.2 Ƣu, nhƣợc điểm Python 22 2.5.3 Python GIS 22 2.6 Phần mềm MATLAB 23 KLTN Thông tin địa lý 2.6.1 Giới thiệu MATLAB 23 2.6.2 Cấu trúc 23 2.6.3 Đặc điểm MATLAB .23 2.6.4 Khả ứng dụng MATLAB 24 CHƢƠNG DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 26 3.1 Dữ liệu thu thập 26 3.2 Phƣơng pháp nghiên cứu 29 CHƢƠNG KẾT QUẢ, THẢO LUẬN 31 4.1 Giai đoạn 31 4.2 Giai đoạn 33 4.3 Giai đoạn 35 4.4 Giai đoạn 45 CHƢƠNG KẾT LUẬN 53 5.1 Kết luận 53 vi Minh Tiến 5.2 Cấu hình mạng đề tài 54 5.3 Khả mở rộng đề tài 55 TÀI LIỆU THAM KHẢO 57 PHỤ LỤC 60 KLTN Thông tin địa lý vii Minh Tiến DANH MỤC VIẾT TẮT AI Artificial Intelligence (Trí thơng minh nhân tạo) ANN Artificial Neural Network (Mạng Nơ-ron nhân tạo) BP Back Propagation (Mạng lan truyền ngƣợc) CSDL Cơ sở liệu DD Decimal Degree (Phép chiếu tọa độ theo dạng độ thập phân) ESRI Environmental Systems Research Institute (Viện nghiên cứu hệ thống môi trƣờng) GIS Geographic Information System (Hệ thống Thông tin Địa lý) MATLAB Matrix Laboratory (Phần mềm tính tốn Neural) OSM OpenStreetMap (Bản đồ đƣờng sá mở) SQL Structured Query Language (Ngôn ngữ truy vấn mang tính cấu trúc) TNGT KLTN Tai nạn giao thơng Thơng tin địa lý TPHCM Thành phố Hồ Chí Minh UTM Universal Trasverse Mercator (Phép chiếu tọa độ theo dạng mét) WHO World Health Organization (Tổ chức y tế giới) viii Minh Tiến DANH MỤC BẢNG BIỂU Bảng 2.1: Bảng đánh giá mức độ tƣơng quan 20 Bảng 2.2: Bảng đánh giá liên hệ tƣơng quan 21 Bảng 3.1: Thông tin lớp liệu sử dụng luận 26 Bảng 4.1: Mô tả liệu sau chọn lọc 35 Bảng 4.2: Bảng tóm tắt sơ sở chuyển liệu sang nhị phân 44 Bảng 4.3: Bảng biến động sai số lớp ẩn 48 Bảng 4.4: Bảng biến động sai số lớp ẩn 51 Bảng 5.1: Bảng cấu hình mạng đề tài 54 Biểu đồ 4.1: Biểu đồ số vụ TNGT theo thứ tuần 41 Biểu đồ 4.2: Biểu đồ số vụ TNGT theo khoảng thời gian ngày TPHCM 42 Biểu đồ 4.3: Biểu đồ số lƣợng TNGT quận huyện TPHCM 43 KLTN Thông tin địa lý Biểu đồ 4.4: Biểu đồ phân trăm sai số lớp ẩn 47 Biểu đồ 4.5: Biểu đồ phần tram sai số lớp ẩn 50 ix