1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp hệ thống thông tin địa lý nghiên cứu áp dụng mạng neuron nhân tạo phục vụ bài toán nhận dạng trong gis

89 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Áp Dụng Mạng Neuron Nhân Tạo Phục Vụ Bài Toán Nhận Dạng Trong GIS
Tác giả Nguyễn Ngọc Minh Tiến
Người hướng dẫn Th.S Khưu Minh Cảnh
Trường học Trường Đại Học Nông Lâm
Chuyên ngành Hệ Thống Thông Tin Địa Lý
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2016
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 89
Dung lượng 3,18 MB

Cấu trúc

  • CHƯƠNG 1 ĐẶT VẤN ĐỀ (12)
    • 1.1 Tính cấp thiết của đề tài (12)
    • 1.2 Mục tiêu của đề tài (13)
    • 1.3 Kết quả mong đợi (13)
    • 1.4 Đối tƣợng và phạm vi nghiên cứu (13)
    • 1.5 Ý nghĩa khoa học và thực tiễn (13)
      • 1.5.1 Ý nghĩa khoa học (13)
      • 1.5.2 Ý nghĩa thực tiễn (14)
  • CHƯƠNG 2 TỔNG QUAN ĐỀ TÀI (15)
    • 2.1 Khái quát khu vực nghiên cứu (15)
      • 2.1.1 Vị trí địa lý (15)
      • 2.1.2 Tình hình tai nạn giao thông tại TPHCM (16)
    • 2.2 Trí tuệ nhân tạo (18)
      • 2.2.1 Định nghĩa về trí tuệ nhân tạo (18)
      • 2.2.2 Lịch sử về trí tuệ nhân tạo (19)
      • 2.2.3 Các lĩnh vực của AI (20)
      • 2.2.4 Các thành tựu của AI (20)
    • 2.3 Mạng noron nhân tạo (Artificial Neural Network) (21)
      • 2.3.1 Giới thiệu mạng Nơ-ron (21)
      • 2.3.2 Hàm xử lý (23)
      • 2.3.3 Chọn lớp ẩn (25)
      • 2.3.4 Giải thuật lan truyền ngƣợc (27)
      • 2.3.5 Dừng quá trình huấn luyện và đánh giá sai số mạng (28)
      • 2.3.6 Vấn đề của mạng lan truyền ngƣợc (29)
      • 2.3.7 Các nghiên cứu đã thực hiện (0)
    • 2.4 Phân tích hồi quy tương quan (31)
      • 2.4.1 Phương trình hồi quy (31)
      • 2.4.2 Hệ số xác định R 2 (31)
      • 2.4.3. Hệ số tương quan bội (32)
    • 2.5 Ngôn ngữ Python (32)
      • 2.5.1 Python là gì (32)
      • 2.5.2 Ƣu, nhƣợc điểm của Python (0)
      • 2.5.3 Python trong GIS (33)
    • 2.6 Phần mềm MATLAB (34)
      • 2.6.1 Giới thiệu về MATLAB (34)
      • 2.6.2 Cấu trúc (34)
      • 2.6.3 Đặc điểm của MATLAB (34)
      • 2.6.4 Khả năng ứng dụng của MATLAB (35)
  • CHƯƠNG 3 DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU (37)
    • 3.1 Dữ liệu thu thập (37)
    • 3.2 Phương pháp nghiên cứu (40)
  • CHƯƠNG 4 KẾT QUẢ, THẢO LUẬN (42)
    • 4.1 Giai đoạn 1 (42)
    • 4.2 Giai đoạn 2 (44)
    • 4.3 Giai đoạn 3 (46)
    • 4.4 Giai đoạn 4 (56)
  • CHƯƠNG 5 KẾT LUẬN (64)
    • 5.1 Kết luận (64)
    • 5.2 Cấu hình mạng của đề tài (65)
    • 5.3 Khả năng mở rộng của đề tài (0)
  • TÀI LIỆU THAM KHẢO (68)
  • PHỤ LỤC (57)

Nội dung

Trang 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NƠNG LÂM THÀNH PHỐ HỒ CHÍ MINH KHÓA LUẬN TỐT NGHIỆP NGHIÊN CỨU ÁP DỤNG MẠNG NEURON NHÂN TẠO PHỤC VỤ BÀI TOÁN NHẬN DẠNG TRONG GIS Họ và tên s

DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Dữ liệu thu thập

Bảng 3.1: Thông tin các lớp dữ liệu sử dụng trong bài luận

STT Tên dữ liệu Mô tả chi tiết Nguồn - Link

Ranh giới hành chính 63 tỉnh thành cả nước

Hệ tọa độ: decimal degree (dd)

Dữ liệu dạng vùng (polygon) thể hiện chi tiết ranh giới hành chính 63 tỉnh thành trong cả nước

Nguồn: diva-gis Link: http://www.diva- gis.org/gdata

2 Mạng lưới giao thông cả nước

Hệ tọa độ: decimal degree (dd)

Dữ liệu dạng đường (polyline) bao gồm các tuyến đường giao thông trên cả nước

Nguồn: OSM Link: http://download.geofab rik.de/asia/vietnam.ht ml

KLTN Thông tin địa lý

Tọa độ các điểm tai nạn giao thông tại

Dữ liệu bao gồm các thông tin chi tiết về các vụ TNGT tại TPHCM gồm:

 Số lượng người bị / gây tai nạn

 Quê quán người bị / gây tai nạn

 Tuổi người bị / gây tai nạn

 Thời gian, địa chỉ (tên đường, phường, huyện, tỉnh)xảy ra tai nạn

 Nguyên nhân xảy ra tai nạn

Nguồn: Trung tâm Ứng dụng Hệ thống Thông tin Địa lý TPHCM

Thông tin về các điểm TNGT tại TPHCM xin xem phần phụ lục

KLTN Thông tin địa lý

Hình 3.1: Shapeflie dữ liệu ranh giới hành chính và hệ thống giao thông cả nước.

KLTN Thông tin địa lý

Phương pháp nghiên cứu

Việc thực hiện đề tài đƣợc chia thành 4 giai đoạn chính cụ thể nhƣ sau:

 Giai đoạn 1: Thu thập, xây dựng, xử lý dữ liệu không gian và thông tin các vụ TNGT

 Giai đoạn 2: Số hóa các tọa độ TNGT và đánh giá độ chính xác

 Giai đoạn 3: Phân tích dữ liệu, chọn yếu tố đều vào / ra phù hợp và chuyển dữ liệu sang mã nhị phân

Giai đoạn 4 tập trung vào việc phân tích mạng neuron dựa trên dữ liệu đã mã hóa và đánh giá sai số Mục tiêu của nghiên cứu là áp dụng mạng neural nhân tạo để nhận diện các vụ tai nạn giao thông (TNGT) tại TPHCM, vì vậy dữ liệu mô tả chi tiết các vụ TNGT là rất quan trọng Bên cạnh đó, dữ liệu không gian về ranh giới và giao thông của TPHCM cũng được thu thập để đánh giá độ chính xác của dữ liệu TNGT và trực quan hóa thông tin trên bản đồ Cuối cùng, dữ liệu các vụ TNGT đã thu thập sẽ được xây dựng để phục vụ cho quá trình phân tích.

Giai đoạn 2 bao gồm việc số hóa dữ liệu và kiểm tra tính chính xác của dữ liệu trong không gian Đồng thời, chúng tôi sẽ tính toán lại các điểm tai nạn giao thông (TNGT) bị sai sót và phân bố không hợp lý về mặt không gian để phục vụ cho việc phân tích.

Giai đoạn 3 được thực hiện ngay sau khi hoàn tất việc lựa chọn dữ liệu Do dữ liệu gốc chứa nhiều thông tin, cần phân tích và lựa chọn thông tin thiết yếu để tránh rối và quá tải Mặc dù dữ liệu đã hoàn tất, để phân tích bằng mạng Neuron, dữ liệu phải ở dạng số, cụ thể là nhị phân 0 và 1 Hiện tại, dữ liệu vẫn chứa thông tin chữ, vì vậy cần dựa vào lớp dữ liệu giao thông, ranh giới hành chính các quận/huyện, thông tin thống kê TNGT và kiến thức cá nhân để chuyển đổi dữ liệu sang dạng 0 và 1, cũng như lựa chọn lớp dữ liệu vào/ra phù hợp.

Sau khi mã hóa dữ liệu sang dạng nhị phân 0 và 1, giai đoạn 4 sẽ đưa dữ liệu vào công cụ MATLAB để phân tích mạng neuron Mục tiêu là lấy cấu hình mạng và tiến hành các bước tiếp theo trong quá trình phân tích.

KLTN Thông tin địa lý

Để tối ưu hóa cấu hình mạng cho bộ dữ liệu đã xây dựng, cần thực hiện 30 đánh giá sai số và chạy lại mạng nhiều lần nhằm đạt được kết quả tốt nhất.

Hình 3.2: Sơ đồ phương pháp nghiên cứu KLTN Thông tin địa lý

KẾT QUẢ, THẢO LUẬN

Giai đoạn 1

Hình 4.1: Giai đoạn thu thập dữ liệu

Việc thu thập, xây dựng, xử lý dữ liệu thu đƣợc những kết quả nhƣ sau:

Dữ liệu về các vụ tai nạn giao thông (TNGT) tại TPHCM đã được thu thập và xây dựng từ 339 vụ, bao gồm các thông tin quan trọng như kinh độ, vĩ độ, thông tin cá nhân của người bị và gây tai nạn (tuổi, nghề nghiệp, giới tính, quê quán, phương tiện giao thông, tình trạng), thời gian và địa điểm xảy ra tai nạn, số lượng người liên quan, cũng như nguyên nhân gây ra tai nạn.

Dữ liệu không gian cho bài luận về TPHCM yêu cầu tách ranh giới hành chính và hệ thống giao thông bằng công cụ clip Hệ tọa độ dữ liệu thu thập được ở dạng decimal degree cần được chuyển đổi sang hệ tọa độ UTM Kết quả của quá trình này được mô tả trong hình 4.1.

KLTN Thông tin địa lý

Hình 4.2: Ranh giới hành chính quận (trái) và hệ thống giao thông (phải) TPHCM

KLTN Thông tin địa lý

Giai đoạn 2

Hình 4.3: Sơ đồ xây dựng dữ liệu không gian

Sau khi xác định tọa độ các điểm tai nạn giao thông (TNGT), bước tiếp theo là số hóa những điểm này Đồng thời, cần xem xét ranh giới hành chính của TPHCM và vị trí của các điểm tai nạn so với hệ thống giao thông để đánh giá xem liệu các điểm tai nạn có nằm ngoài ranh giới thành phố hoặc không thuộc đường giao thông hay không.

Vấn đề xác định tọa độ các điểm tai nạn giao thông (TNGT) qua Google Map phụ thuộc vào thông tin vị trí như số nhà, tên đường, phường xã và quận huyện Do đó, việc xác định liệu các điểm tai nạn có nằm trên đường giao thông hay không chỉ mang tính tương đối, và chỉ thực hiện chỉnh sửa khi các điểm tai nạn lệch quá xa so với các tuyến đường Dù vậy, hơn 95% thông tin tọa độ cho thấy các điểm này đều nằm trên đường giao thông, với chỉ khoảng 15 điểm cần được chỉnh sửa.

Để nâng cao khả năng quan sát và đánh giá vị trí các điểm tai nạn trên các tuyến đường, một số con đường giao thông sẽ được loại bỏ để giảm bớt sự phức tạp.

Kết quả số hóa các vụ TNGT đƣợc mô tả trong hình 4.2

KLTN Thông tin địa lý

Hình 4.4: Các vụ TNGT tại TPHCM sau khi đƣợc số hóa (trái)

Hệ thống giao thông sau khi đơn giản hóa (phải)

KLTN Thông tin địa lý

Giai đoạn 3

Giai đoạn phân tích mối quan hệ không gian là rất quan trọng, vì không phải tất cả các trường dữ liệu về các vụ tai nạn giao thông đều đầy đủ thông tin Do đó, cần loại bỏ những trường dữ liệu thiếu sót Dữ liệu còn lại sẽ bao gồm các trường thông tin cần thiết để phục vụ cho việc phân tích.

Bảng 4.1: Mô tả dữ liệu sau khi chọn lọc

Tên trường Định dạng dữ liệu Mô tả

Kinh độ Decimal Degree (dd) Kinh độ các vụ TNGT tại

Vĩ độ Decimal Degree (dd) Vĩ độ các vụ TNGT tại TPHCM

Mô tả vị trí địa điểm các vụ xảy ra TNGT gồm: Tên đường, tên quận/ huyên, tên tỉnh

(Với h là giờ và m là phút)

Thời gian xảy ra các vụ TNGT

KLTN Thông tin địa lý

Số lượng người bị tai nạn Dạng number

Tổng số người bị tai nạn trong 1 vụ tai nạn gồm chết, bị thương, không bị thương

Phương tiện bị tai nạn Dạng text Mô tả, phân loại chi tiết các loại xe: xe máy, xe khách, xe buýt,…

Phương tiện gây tai nạn Dạng text Mô tả, phân loại chi tiết các loại xe: xe máy, xe khách, xe buýt,…

Tình trạng người bị tai nạn Dạng text

Mô tả tình trạng của nạn nhân ngay lúc ghi nhận tại hiện trường vụ tai nạn (chết, bị thương, không)

Tình trạng người gây tai nạn Dạng text

Mô tả tình trạng của người gây tai nạn ngay lúc ghi nhận tại hiện trường vụ tai nạn (chết, bị thương, không)

Bài viết này sẽ xây dựng dữ liệu dựa trên các yếu tố cấu trúc hạ tầng giao thông và tần suất xảy ra các vụ tai nạn giao thông (TNGT) tại từng vị trí theo thời gian Để thực hiện điều này, nghiên cứu sẽ dựa vào các cơ sở dữ liệu liên quan.

Cấu trúc hạ tầng giao thông đóng vai trò quan trọng trong việc xảy ra tai nạn giao thông (TNGT), không chỉ do lỗi của người điều khiển như thiếu quan sát, ý thức kém, vượt tốc độ hay say xỉn Các yếu tố cấu trúc giao thông như mặt đường gồ ghề, đường gấp khúc, các giao điểm ngã 3, ngã 4, vòng xoay, cũng như tín hiệu giao thông có thể ảnh hưởng đến an toàn Tuy nhiên, một số yếu tố khách quan như cấu trúc mặt đường và tín hiệu giao thông không thể kiểm tra thực tế Do đó, nghiên cứu này tập trung vào vị trí các điểm TNGT và dữ liệu giao thông tại TPHCM để phân tích và xây dựng dữ liệu, như được mô tả trong hình 4.4.

KLTN Thông tin địa lý

Nghiên cứu này tập trung vào tần suất xảy ra của các vụ tai nạn giao thông (TNGT) có tính lặp lại, không chỉ tại vị trí cũ mà có thể xảy ra trong khoảng cách 30m đến 50m Dựa trên dữ liệu không gian, chúng tôi xác định những vụ TNGT xảy ra nhiều lần (trên 2 lần) tại một vị trí cụ thể Để nâng cao độ chính xác và tốc độ phân tích, chúng tôi tạo vùng đệm 25m cho các vụ TNGT, sau đó tìm kiếm các vụ tai nạn có vùng đệm trùng lắp Kết quả được trình bày trong hình 4.5.

Hình 4.6: Bản đồ TNGT tại vị trí giao cắt tại TPHCM

KLTN Thông tin địa lý

Bản đồ TNGT có tính lặp lại tại TPHCM cho thấy sự phân bố các khu vực thường xảy ra tai nạn giao thông Hình 4.7 minh họa rõ ràng các vùng TNGT có tính lặp lại, giúp nhận diện các điểm nóng và nâng cao hiệu quả trong công tác quản lý và phòng ngừa tai nạn Việc phân tích bản đồ này là cần thiết để cải thiện an toàn giao thông tại thành phố.

KLTN Thông tin địa lý

Hình 4.8: Sơ đồ phân tích lựa chọn các yếu tố phù hợp

Sau khi thu thập đầy đủ dữ liệu, đề tài sẽ tiến hành đánh giá hệ số tương quan để xác định các yếu tố có mối liên hệ cao trong số 8 yếu tố: Số lượng người bị tai nạn, Thời gian, Thứ, Khu vực, Giao cắt, Tính lặp lại, Phương tiện và Tình trạng Những yếu tố này sẽ được chọn lọc để phục vụ cho việc phân tích mạng neural.

Mặc dù hệ số tương quan được đánh giá là rất thấp, nhưng điều này không cung cấp cơ sở vững chắc để xác định các yếu tố tối ưu cho phân tích mạng neural.

Hình 4.9: Chỉ số tương quan

Đề tài sẽ chuyển hướng từ việc đánh giá tương quan để chọn yếu tố tốt nhất cho phân tích mạng neural sang việc tổ hợp các yếu tố và thực hiện phân tích mạng neural, nhằm lựa chọn tổ hợp mang lại kết quả tốt nhất cho mạng neural.

Việc tổ hợp sẽ cho ra rất nhiều trường hợp chọn yếu tốt đầu ra và đầu vào như sau:

KLTN Thông tin địa lý

 Yếu tố đầu vào có: = 336 cách chọn nếu chọn trước

 Yếu tố đầu ra có: = 56 cách chọn nếu chọn trước

Trong lần tổ hợp đầu tiên, đề tài sẽ lựa chọn các yếu tố đầu vào bao gồm: Thời gian, Thứ và Khu vực Các yếu tố đầu ra sẽ bao gồm: Tính lặp lại và Tình trạng.

Trong lần tổ hợp thứ 2, đề tài tập trung vào các yếu tố đầu vào như số lượng người bị tai nạn, giao cắt và phương tiện, trong khi đầu ra được xác định theo tính lặp lại và tình trạng Điều này cho thấy rằng đầu ra được lựa chọn dựa trên những vấn đề mà nhiều người quan tâm, như tình trạng tai nạn giao thông hiện tại và lý do vì sao tai nạn xảy ra liên tục tại những địa điểm cụ thể, được gọi là điểm đen hay điểm nóng Đầu vào sẽ được phân loại theo hai nguyên nhân chính.

 Nhóm 1: Nhóm theo yếu tố không gian thời gian

 Nhóm 2: Nhóm theo yếu tố con người và tính chất khu vực xảy ra tai nạn

Hình 4.10: Sơ đồ xây dựng dữ liệu nhị phân

KLTN Thông tin địa lý

Sau khi lựa chọn các yếu tố đầu vào và đầu ra, đề tài sẽ tiến hành chuyển đổi dữ liệu sang dạng nhị phân 0 và 1 Để xác định thông số nào sẽ là 0 và thông số nào sẽ là 1, đề tài sẽ dựa vào việc đánh giá thống kê sơ bộ từng yếu tố dựa trên dữ liệu đã xây dựng, kết hợp với kiến thức cá nhân và các thống kê từ các cơ quan liên quan tại TPHCM.

Theo thống kê sơ bộ, TPHCM ghi nhận số vụ tai nạn giao thông (TNGT) cao nhất vào thứ 4, thứ 5 và thứ 6, với số vụ vượt mức trung bình toàn thành phố (48,43 vụ) Cụ thể, thứ 4 xảy ra 60 vụ, thứ 5 là 61 vụ và thứ 6 có 50 vụ.

Thống kê cho thấy, thứ 4 và thứ 5 là hai ngày có số vụ tai nạn giao thông xảy ra cao nhất, vượt trội so với các ngày khác trong tuần Ngược lại, thứ 6 chỉ cao hơn mức trung bình khoảng 2 vụ, trong khi các ngày còn lại trong tuần đều có số vụ tai nạn giao thông xảy ra ít hơn mức trung bình của cả thành phố.

Biểu đồ 4.1: Biểu đồ số vụ TNGT theo các thứ trong tuần

Theo thống kê, các vụ tai nạn giao thông (TNGT) tại TPHCM thường xảy ra nhiều nhất trong khoảng thời gian từ 6h đến 13h, 14h đến 15h, 16h đến 18h và 21h đến 22h.

Biểu đồ số vụ tai nạn giao thông theo các thứ trong tuần

Trung bình số vụ tai nạn

KLTN Thông tin địa lý

42 với số vụ tai nạn xảy ra từ 15 vụ đến 30 vụ cao hơn mức trung bình 14,13 vụ của thành phố

Biểu đồ 4.2: Biểu đồ số vụ TNGT theo khoảng thời gian trong ngày tại TPHCM

Theo dữ liệu khu vực

Biểu đồ số vụ tai nạn giao thông theo khoảng thời gian trong ngày

Trung bình số vụ tai nạn mỗi giờ

KLTN Thông tin địa lý

Giai đoạn 4

Hình 4.12: Sơ đồ phương pháp chạy mạng, đánh giá kết quả

KLTN Thông tin địa lý

Sau khi đã có dữ liệu nhị phân, đề tài sẽ tiếp tục phân tích mạng neural

Về vấn đề chọn số đơn vị trong lớp ẩn thì căn cứ vào các vấn đề đã nêu ở chương

Việc lựa chọn số lớp mạng trong mỗi bài luận phụ thuộc vào nhiều yếu tố khác nhau Do đó, đề tài sẽ xác định số lớp ẩn dao động từ bằng số lớp đầu ra (2 lớp) cho đến 3 lần tổng số lớp đầu ra và đầu vào.

Số lớp ẩn được chọn cho đề tài sẽ nằm trong khoảng từ 2 đến 15 lớp Để đảm bảo độ chính xác, đề tài sẽ thực hiện chạy mạng khoảng 10 lần cho mỗi cấu hình lớp và lấy trung bình kết quả Phần mềm MATLAB sẽ được sử dụng để phân tích mạng neural, và quy trình thực hiện phân tích bằng công cụ mạng neuron trên MATLAB sẽ được trình bày chi tiết trong phụ lục.

 Nhóm dữ liệu thứ nhất:

 Đầu vào: Giờ, Thứ, Khu vực

 Đầu ra: Tính lặp lại, Tình trạng

Bảng quá trình phân tích sai số lớp ẩn xin xem phụ lục KLTN Thông tin địa lý

Biểu đồ 4.4: Biểu đồ phân trăm sai số của các lớp ẩn

BIỂU ĐỒ PHẦN TRĂM SAI SỐ CỦA CÁC LỚP ẨN Minh Tiến Sai số trung bình

Sai số cao nhất Sai số thấp nhất

KLTN Thông tin địa lý

Bảng 4.3: Bảng biến đ ng sai số của các lớp ẩn

Số lớp ẩn Biến động sai số (%)

Kết quả đánh giá sai số của các lớp ẩn cho thấy sai số trung bình đều thấp hơn 22% Trong 14 phương pháp chọn lớp ẩn, phương pháp chọn 7 lớp ẩn có sai số trung bình thấp nhất là 11,5%, cho thấy đây là lựa chọn tối ưu nhất Hơn nữa, sai số thấp nhất của tất cả các lớp ẩn đều bằng nhau là 10,5%, cho thấy rằng sai số thấp nhất dường như không bị ảnh hưởng bởi cách chọn số lớp ẩn.

Khi so sánh biến động giữa sai số lớn nhất và sai số thấp nhất, phương pháp chọn 7 lớp ẩn cho thấy hiệu quả tốt nhất với biến động chỉ 5%, dao động từ 10,5% đến 15,5% Ngược lại, phương pháp chọn 13 lớp ẩn có độ biến động lớn hơn nhiều, lên đến 48,3%, với phạm vi từ 10,5% đến 58,8%.

KLTN Thông tin địa lý

 Nhóm dữ liệu thứ hai:

 Đầu vào: Số lượng người bị nạn, Phương tiện, Giao cắt

 Đầu ra: Tính lặp lại, Tình trạng

Bảng quá trình phân tích sai số lớp ẩn xin xem phụ lục

KLTN Thông tin địa lý

Biểu đồ 4.5: Biểu đồ phần trăm sai số của các lớp ẩn

BIỂU ĐỒ PHÂN TRĂM SAI SỐ CÁC LỚP ẨN Minh Tiến

Sai số trung bình Sai số cao nhất Sai số thấp nhất

KLTN Thông tin địa lý

Nguyễn Ngọc Minh Tiến DH12GI 12162073 51

Bảng 4.4: Bảng biến đ ng sai số của các lớp ẩn

Số lớp ẩn Biến động sai số (%)

Kết quả đánh giá sai số của các lớp ẩn cho thấy sai số trung bình đều thấp hơn 21% Trong 14 phương pháp chọn lớp ẩn, phương pháp chọn 12 lớp ẩn đạt sai số trung bình thấp nhất là 11,3%, chứng tỏ đây là lựa chọn tối ưu Ngoài ra, sai số thấp nhất của tất cả các lớp ẩn đều bằng nhau ở mức 10,5%, cho thấy rằng sai số thấp nhất dường như không bị ảnh hưởng bởi cách chọn số lớp ẩn.

Khi xem xét biến động giữa sai số lớn nhất và sai số thấp nhất, việc chọn 12 lớp ẩn là phương pháp tối ưu nhất với biến động chỉ 3,0%, dao động trong khoảng từ 10,5% đến 13,5% Ngược lại, phương pháp chọn 4 lớp ẩn có độ biến động lớn hơn nhiều, lên tới 37,8%, với biên độ từ 10,5% đến 48,3%.

KLTN Thông tin địa lý

Nguyễn Ngọc Minh Tiến DH12GI 12162073 52

 Kết luận sau 4 giai đoạn:

Trong quá trình phân tích mạng neural với hai lựa chọn tổ hợp khác nhau, sai số thấp nhất của các lớp ẩn không phụ thuộc vào số lượng lớp ẩn được chọn Kết quả sai số trung bình của từng lựa chọn trong mỗi tổ hợp đều đạt được kết quả mong muốn với mức sai số chấp nhận được.

Mặc dù đã nêu ở trên, thời gian và điều kiện hạn chế đã khiến chúng tôi không thể thử nghiệm tất cả các tổ hợp Do đó, mặc dù sai số của hai tổ hợp lựa chọn ngẫu nhiên này có thể chấp nhận trong nghiên cứu, nhưng chúng chưa chắc đã tốt hơn so với các tổ hợp chưa được thử nghiệm khác.

Dựa trên phân tích và đánh giá sai số của hai tổ hợp, đề tài lựa chọn tổ hợp thứ 2 là tốt nhất nhờ vào sai số trung bình thấp nhất (11,3%) so với tổ hợp đầu (11,5%) Hơn nữa, tổ hợp thứ 2 cũng cho thấy mức độ biến động sai số thấp hơn (3,0%) và ổn định hơn, với phần trăm biến động chỉ dao động từ 3,0% đến 37,8%, trong khi tổ hợp thứ nhất dao động từ 5% đến 48,3%.

KLTN Thông tin địa lý

Nguyễn Ngọc Minh Tiến DH12GI 12162073 53

Ngày đăng: 24/01/2024, 15:46

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN