ĐỒ ÁN CƠ SỞ NGHIÊN CỨU NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURAL NHÂN TẠO.

41 35 6
ĐỒ ÁN CƠ SỞ  NGHIÊN CỨU NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURAL NHÂN TẠO.

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CƠ SỞ NGHIÊN CỨU NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURAL NHÂN TẠO Giảng viên hướng dẫn ThS VƯƠNG XUÂN CHÍ Sinh. LỜI CẢM ƠN Em bày tỏ lòng biết ơn sâu sắc tới Thầy Vương Xuân Chí đã tận tình hỗ trợ em hết mình trong quá trình thực hiện đồ án cơ sở. Thầy đã tạo điều kiện rất tốt từ khâu chuẩn bị đến việc hoàn thành đồ án. Cùng với những buổi học trên lớp lý thuyết và thực hành giúp em tiếp thu thêm nhiều kiến thức mới. Với điều kiện thời gian cũng như kinh nghiệm còn hạn chế của chúng em, bài báo cáo này không thể tránh được những thiếu sót. Em rất mong nhận được sự chỉ bảo, đóng góp ý kiến của các quý thầy cô để bổ sung kiến thức và khắc phục những sai sót để làm tốt hơn khi làm những bài đồ án hay tiểu luận sau này. LỜI MỞ ĐẦU Hiện nay, với hệ thống dữ liệu hình ảnh khổng lồ trên toàn thế giới, việc phân tích, xử lý để khai thác sử dụng thông tin trong ảnh là một nhu cầu thiết yếu. Tuy nhiên, với số lượng dữ liệu khổng lồ, việc phân tích, xử lý thủ công sẽ mất rất nhiều thời gian và nguồn nhân lực. Thực tiễn đã chứng minh, việc ứng dụng trí tuệ nhân tạo nói chung hay Deep Learning nói riêng vào các nhiệm vụ trên đã giúp tiết kiệm được nhiều thời gian và công sức. Từ giữa năm 2011, Google đã giới thiệu dự án Deep Learning sử dụng mạng neural nhân tạo dùng cho nhận dạng giọng nói và sau đó mở rộng lên các lĩnh vực khác như Gmail, Google dịch, Google ảnh. Đối với bài toán nhận dạng chữ số viết tay, mạng neural nhiều lớp sẽ được huấn luyện dựa trên các pixel, đơn vị nhỏ nhất của hình ảnh. Vì vậy mạng neural nhân tạo là công cụ vô cùng thích hợp cho việc xử lý, phân tích hình ảnh và mang lại kết quả rất khả quan. MỤC LỤC CHƯƠNG 1 : Giới thiệu khái niệm Mạng Neural, Deep Learning 12 1.1 Mạng neural 12 1.2 Deep Learning 14 Chương 2: Mô hình và các dạng mạng neural, ứng dụng vào thực tiễn. 15 2.1 Mô hình Neural Network 15 2.2 Các dạng mạng Nerual 17 2.3 Mạng nơ ron nhân tạo được ứng dụng cho rất nhiều lĩnh vực như : 23 Chương 3 : Các thuật toán liên quan đến nhận dạng Deep Learning. 24 3.1 Mạng nơron tích chập 24 3.2 Mạng CNN 24 3.3 Object Detection 26 3.4 Image Segmentation – Phân đoạn ảnh 27 3.5 Hệ thống nhận dạng khuôn mặt (Face recognition) 29 Chương 4: Ý tưởng về nhận dạng chữ viết tay, đơn vị cấu tạo nhỏ nhất tạo thành mạng neural nhân tạo đa lớp và cấu trúc, thông số của mô hình mạng neural đa lớp. 30 4.1 Đơn vị cấu tạo nhỏ nhất tạo thành mạng neural nhân tạo đa lớp và cấu trúc(multilayer perceptronMLP), thông số của mô hình mạng neural đa lớp 30 4.2 Thực nghiệm ý tưởng và kết quả 32 Chương 5: KẾT LUẬN 36

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CƠ SỞ NGHIÊN CỨU NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURAL NHÂN TẠO Giảng viên hướng dẫn: ThS VƯƠNG XUÂN CHÍ Sinh viên thực hiện: Nguyễn Lê Tài MSSV: 2000001633 Chuyên ngành: KHOA HỌC DỮ LIỆU Môn học: ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU Khóa: 2020 Tp.HCM, tháng năm 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CƠ SỞ NGHIÊN CỨU NHẬN DẠNG CHỮ SỐ VIẾT TAY DÙNG MẠNG NEURAL NHÂN TẠO Giảng viên hướng dẫn: ThS VƯƠNG XUÂN CHÍ Sinh viên thực hiện: Nguyễn Lê Tài MSSV: 2000001633 Chuyên ngành: KHOA HỌC DỮ LIỆU Môn học: ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU Khóa: 2020 Tp.HCM, tháng năm 2022 LỜI CẢM ƠN Em bày tỏ lòng biết ơn sâu sắc tới Thầy Vương Xn Chí tận tình hỗ trợ em trình thực đồ án sở Thầy tạo điều kiện tốt từ khâu chuẩn bị đến việc hoàn thành đồ án Cùng với buổi học lớp lý thuyết thực hành giúp em tiếp thu thêm nhiều kiến thức Với điều kiện thời gian kinh nghiệm hạn chế chúng em, báo cáo tránh thiếu sót Em mong nhận bảo, đóng góp ý kiến quý thầy cô để bổ sung kiến thức khắc phục sai sót để làm tốt làm đồ án hay tiểu luận sau Họ tên sinh viên Nguyễn Lê Tài LỜI MỞ ĐẦU Hiện nay, với hệ thống dữ liệu hình ảnh khổng lồ trên tồn thế giới, việc phân tích, xử lý để khai thác sử dụng thơng tin trong ảnh là một nhu cầu thiết yếu. Tuy nhiên, với số lượng dữ liệu khổng lồ, việc phân tích, xử  lý thủ  cơng sẽ  mất rất nhiều thời gian và nguồn nhân lực. Thực tiễn đã chứng minh, việc  ứng dụng trí tuệ  nhân tạo nói chung hay Deep Learning nói riêng vào các nhiệm vụ  trên đã giúp tiết kiệm nhiều thời gian và cơng sức. Từ  giữa năm 2011, Google đã giới thiệu dự  án Deep Learning sử dụng mạng neural nhân tạo dùng cho nhận dạng giọng nói và sau đó mở rộng lên các lĩnh vực khác như Gmail, Google dịch, Google ảnh. Đối với bài tốn nhận dạng chữ số viết tay, mạng neural nhiều lớp sẽ được huấn luyện dựa trên pixel, đơn vị nhỏ nhất của hình ảnh. Vì vậy mạng neural nhân tạo là cơng cụ vơ cùng thích hợp cho việc xử lý, phân tích hình ảnh và mang lại kết quả rất khả quan TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH TRUNG TÂM KHẢO THÍ KỲ THI KẾT THÚC HỌC PHẦN HỌC KỲ … … NĂM HỌC …… -….… PHIẾU CHẤM THI TIỂU LUẬN/ĐỒ ÁN Môn thi: Đồ án sở Lớp học phần: 20DTH2A Nhóm sinh viên thực : Tham gia đóng góp: Nguyễn Lê Tài Tham gia đóng góp: Lưu Phi Tường Ngày thi: Phòng thi: Đề tài tiểu luận/báo cáo sinh viên : Nghiên cứu nhận dạng chữ số viết tay dùng mạng neural nhân tạo Phần đánh giá giảng viên (căn thang rubrics môn học): Tiêu chí (theo CĐR HP) Cấu trúc báo cáo Đánh giá GV Điểm tối đa Điểm đạt Nội dung ● Các nội dung thành phần ● Lập luận ● Kết luận Trình bày TỔNG ĐIỂM Giảng viên chấm thi (ký, ghi rõ họ tên) PHẦN NHẬN XÉT CỦA GIẢNG VIÊN TPHCM, Ngày … tháng … năm 2022 Trường Đại học Nguyễn Tất Thành CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Khoa Công Nghệ Thông Tin Độc lập – Tự – Hạnh phúc 🙟🙟🙟🙟 🙟🙟🙟🙟 NHIỆM VỤ ĐỒ ÁN CƠ SỞ (Sinh viên phải đóng tờ vào báo cáo) Họ tên: Nguyễn Lê Tài MSSV: 2000001633 Chuyên ngành: Khoa học liệu Lớp: 20DTH2A Email: nguyenletai23102002@gmail.com SĐT:0845000423 Tên đề tài: nghiên cứu nhận dạng chữ số viết tay dùng mạng neural nhân tạo Gíao viên hướng dẫn: Vương Xuân Chí Thời gian thực hiện: 20 /6 /2022 đến 20 /9 /2022 MÔ TẢ ĐỀ TÀI: Nghiên cứu khái niệm, cách thức tạo mạng Neural nhận tạo nhiều lớp, áp dụng cho việc nhận dạng chữ số từ đến 10, chữ số viết tay xây dựng mơ hình nhận diện chữ số viết tay mạng neural nhân tạo cho tỷ lệ nhận dạng NỘI DUNG VÀ PHƯƠNG PHÁP: - Giới thiệu khái niệm Mạng neural, Deep learning - Mơ hình dạng mạng neural, ứng dụng vào thực tiễn - Các thuật toán liên quan đến nhận dạng Deep learning - Ý tưởng nhận dạng chữ viết tay, đơn vị cấu tạo nhỏ tạo thành mạng neural nhân tạo đa lớp cấu trúc, thơng số mơ hình mạng neural đa lớp - Kết luận YÊU CẦU: - Có kiến thức, đam mê, hiểu biết công nghệ Mạng neural, Machine Learning, Deep Learning… Đọc hiểu tài liệu tiếng Anh, kỹ trình bày văn máy tính tốt - Có tác phong làm việc chăm chỉ, tinh thần trách nhiệm cao, có khả làm việc độc lập làm việc nhóm tốt Nội dung yêu cầu thông qua Bộ môn TP.HCM, ngày 26 tháng 06 năm 2022 TRƯỞNG BỘ MÔN GIÁO VIÊN HƯỚNG DẪN (Ký ghi rõ họ tên) (Ký ghi rõ họ tên) ThS Vương Xuân Chí ThS Vương Xuân Chí MỤC LỤC CHƯƠNG : Giới thiệu khái niệm Mạng Neural, Deep Learning 12 1.1 Mạng neural 12 1.2 Deep Learning 14 Chương 2: Mơ hình và dạng mạng neural, ứng dụng vào thực tiễn 15 2.1 Mơ hình Neural Network 15 2.2 Các dạng mạng Nerual 17 2.3 Mạng nơ ron nhân tạo ứng dụng cho nhiều lĩnh vực : 23 Chương : Các thuật toán liên quan đến nhận dạng Deep Learning 24 3.1 Mạng nơron tích chập 24 3.2 Mạng CNN 24 3.3 Object Detection 26 3.4 Image Segmentation – Phân đoạn ảnh 27 3.5 Hệ thống nhận dạng khuôn mặt (Face recognition) 29 Chương 4: Ý tưởng nhận dạng chữ viết tay, đơn vị cấu tạo nhỏ tạo thành mạng neural nhân tạo đa lớp và cấu trúc, thông số mơ hình mạng neural đa lớp 30 4.1  Đơn vị cấu tạo nhỏ tạo thành mạng neural nhân tạo đa lớp cấu trúc(multilayer perceptron-MLP), thông số mơ hình mạng neural đa lớp 30 4.2 Thực nghiệm ý tưởng và kết quả 32 Chương 5: KẾT LUẬN 36 MỤC LỤC HÌNH ẢNH Hình 1.2 Deep Learning hoạt động……………………………………………… 13 Hình 1.2 Deep Learning hoạt động……………………………………………… 13 Hình 2.2 Mơ hình Multilayer Perceptron……………………………………… 17 Hình 2.3 Mạng Rơ-ron tích chập (CNN)………………………………………… 18 Hình 2.4 Mạng nơ-ron hồi quy (RNN)………………………………………… 20 Hình 2.5 Autoencoder…………………………………………………………… 20 Hình 2.6 Backpropagation……………………………………………………… 21 Hình 3.1 CNN ứng dụng vơ rộng rãi………………………………… 25 Hình 3.2: So sánh đầu tốn classification với locolization detection 25 Hình 3.3: Phân biết toán classification, object localization, object detection 26 Hình 3.4: Phân biệt đầu toán Detection Segmentation…………… 27 3.5 Kết tốn Semantic segmentation………………………………… 27 Hình 3.6 Kết tốn Instance segmentation…………………………… 28 Hình 3.7 Face recognition steps………………………………………………… 29 Hình 4.1 Một mơ hình mạng neural nhân tạo bản…………………………… 30 Hình 4.2 Một số ảnh gắn nhãn tương ứng……………………………… 32 Hình 4.3 Tỷ lệ nhận dạng mạng MLP với tỷ lệ học LR = 0,3 (a) tỷ lệ học LR = (b)…………………………………………………………….………… 33 Hình 4.4 Kết mạng MLP kết hợp giá trị LR khác nhau……….……… 34 Hình 4.5 Tỷ lệ nhận dạng với số lượng lớp ẩn khác nhau……….…… 34 Chương : Các thuật toán liên quan đến nhận dạng Deep Learning 3.1 Mạng nơron tích chập Mạng nơron tích chập (cịn gọi ConvNet / CNN) thuật tốn Deep Learning lấy hình ảnh đầu vào, gán độ quan trọng (các trọng số - weights độ lệch bias học được) cho đặc trưng/đối tượng khác hình ảnh phân biệt đặc trưng/đối tượng với Công việc tiền xử lý u cầu cho mạng nơron tích chập nhiều so với thuật toán phân loại khác Trong phương thức sơ khai, lọc thiết kế tay (hand engineered), với trình huấn luyện để chọn lọc/đặc trưng phù hợp mạng nơron tích chập lại có khả tự học để chọn lọc/ đặc trưng tối ưu Kiến trúc nơron tích chập tương tự mơ hình kết nối nơron não người lấy cảm hứng từ hệ thống vỏ thị giác não (visual cortex) Các nơ-ron riêng lẻ phản ứng với kích thích khu vực hạn chế trường thị giác gọi Trường tiếp nhận (Receptive Field) Một tập hợp trường chồng lên để bao phủ toàn khu vực thị giác 3.2 Mạng CNN Mạng CNN tập hợp lớp Convolution bị chồng lên sử dụng hàm nonlinear activation ReLU để kích hoạt trọng số node Lớp sau thông qua hàm trọng số node Những lớp sau thơng qua hàm kích hoạt tạo thơng tin trừu tượng cho lớp Trong mơ hình CNN có tính bất biến tích kết hợp Nếu bạn có đối tượng mà lại chiếu theo nhiều góc độ khác độ xác bị ảnh 26 hưởng Với chuyển dịch, quay co giãn pooling layer sử dụng để giúp làm bất biến tính chất Vì vậy, CNN đưa kết có độ xác tương ứng mơ hình Trong đó, pooling layer cho bạn tính bất biến phép dịch chuyển, phép co dãn phép quay Cịn tính kết hợp cục cho bạn thấy cấp độ biểu diễn, thông tin từ thấp đến mức độ cao với độ trừu tượng thông qua convolution từ filter Mơ hình CNN có layer liên kết với dựa vào chế convolution Những layer kết từ convolution từ layer trước đó, mà bạn có kết nối cục phù hợp Vậy, neural lớp sinh từ kết filter áp đặt lên vùng ảnh cục neural có trước Trong huấn luyện mạng, CNN tự động học hỏi giá trị thông qua lớp filter dựa vào cách thức mà người dùng thực Trong đó, cấu trúc CNN thường bao gồm phần là: ● Local receptive field (trường cục bộ): Lớp có nhiệm vụ tách lọc liệu, thơng tin ảnh lựa chọn vùng ảnh có giá trị sử dụng cao ● Shared weights and bias (trọng số chia sẻ): Lớp giúp làm giảm tối đa lượng tham số có tác dụng yếu tố mạng CNN Trong convolution có feature map khác feature lại có khả giúp detect vài feature ảnh ● Pooling layer (lớp tổng hợp): Pooling layer lớp cuối có tác dụng làm đơn giản thơng tin đầu Có nghĩa là, sau hồn tất tính tốn qt qua lớp đến pooling layer để lược bớt thông tin không cần thiết Từ đó, cho kết theo ý mà người dùng mong muốn 27 Hình 3.1 CNN ứng dụng vô rộng rãi 3.3 Object Detection Khác với toán Classification with Localization xác định vị trí đối tượng hình, tốn detection hay Object Detection xác định vị trí tất đối tượng có hình Theo Input toán ảnh danh sách đối tượng quan tâm Đầu toán vị trí đối tượng kèm theo nhãn đối tượng Hình 3.2: So sánh đầu toán classification với locolization detection Object Detection có nhiều ứng dụng khác nhau: Image Annotation (Chú thích hình ảnh), Face Detection (Phát khn mặt ), License Plate Identification (Nhận diện biển số xe), People Counting (Đếm số lượng người),… Như xét khía cạnh ta nhận xét toán Classification tiền đề toán Localization thơng tin tốn Localization hữu ích cho toán Detection Để phân biệt tốn khác ta xác định dựa việc kết toán trả lời câu hỏi (Hình 3.3) 28 Hình 3.3: Phân biết toán classification, object localization, object detection 3.4 Image Segmentation – Phân đoạn ảnh Nếu kết tốn Object Detection bounding boxes – thường hình chữ nhật vị trí đối tượng hình (có thể bao gồm phần bao quanh đối tượng), kết tốn Image Segmentation – phân đoạn ảnh khơng vị trí mà rõ đối tượng cách vẽ đường biên (boudaires) bao quanh đối tượng Cụ thể hơn, Image Segmentation trình xác định – gán nhãn cho điểm ảnh (pixel) ảnh cho pixel có nhãn thuộc nhóm Ví dụ: tưởng tượng bác sĩ áp dụng Computer Vision vào việc chữa bệnh ung thư, việc xác định kích thước vùng bị ung thư thực quan trọng 29 Hình 3.4: Phân biệt đầu toán Detection Segmentation Bài toán Image Segmentation chia làm loại : ● Semantic Segmentation: Phân tách lớp, đối tượng lớp gom vào nhóm Ví dụ cụ thể hình pixel person gom vào chung nhóm thể hiển màu sắc khác 3.5 Kết toán Semantic segmentation ● Instance Segmentation: Phân tách đối tượng lớp Khi Semantic Segmentation gom chung đối tượng lớp tốn Instance Segmentation có phân biệt đối tượng trongcùng lớp 30 Hình 3.6 Kết toán Instance segmentation 3.5 Hệ thống nhận dạng khuôn mặt (Face recognition) Face recognition (nhận diện khn mặt) q trình lấy ảnh chứa mặt người xác định Ban đầu hệ thống nhận diện khuôn mặt dựa facial landmarks từ ảnh vị trí, kích thước mắt, mũi, miệng, má Tuy nhiên độ xác phương pháp khơng cao Sau kỹ thuật tốn ML phát triển đặc trưng tách từ khuôn mặt, model huấn luyện để phân loại từ xác định khn mặt tương ứng với Gần kỹ thuật Deep Learning sử dụng để nhận dạng khuôn mặt model FaceNet, OpenFace dựa kiến trúc Siamese Network cho kết tốt Nhận diện khuôn mặt khác phát khuôn mặt Phát khn mặt xác định vị trí khn mặt hình ảnh, video Nhận diện khn mặt vừa xác định vị trí khn mặt vừa xác định Bài tồn phức tạp bao trùm phát khn mặt (face detection) Q trình nhận diện khuôn mặt bao gồm bước: ● Face detection: sử dụng phương pháp Harr cascades, HOG + Linear SVM, deep learning (MTCNN…) ● Lấy khuôn mặt phát xác định đó: ví dụ sử dụng model FaceNet dựa Siamese Network, Local Bianry Patterns (LBPs), Eigenfaces… 31 Hình 3.7 Face recognition steps Thực chất gộp bước làm nhiên làm ảnh có nhiều nhiễu (background) ảnh hưởng đến độ xác Chương 4: Ý tưởng nhận dạng chữ viết tay, đơn vị cấu tạo nhỏ tạo thành mạng neural nhân tạo đa lớp cấu trúc, thơng số mơ hình mạng neural đa lớp 4.1  Đơn vị cấu tạo nhỏ tạo thành mạng neural nhân tạo đa lớp cấu trúc(multilayer perceptron-MLP), thơng số mơ hình mạng neural đa lớp 4.1.1 Cấu trúc và thơng số mơ hình mạng neural đa lớp Về bản, MLP có tối thiểu lớp: lớp đầu vào, lớp đầu nhiều lớp ẩn [5] Trong đó, lớp đầu vào tiếp nhận liệu vào mạng neural; lớp ẩn (hidden layer) dùng để tính tốn thơng số dựa liệu từ lớp đầu vào 32 chuyển tiếp kết đến lớp tiếp theo; lớp đầu thực đánh giá đưa kết dựa thuật tốn thích hợp Các mơ hình mạng MLP sử dụng đầu lớp trước làm đầu vào lớp sau, khơng có phản hồi từ lớp đầu lại lớp đầu vào gọi mạng feed-forward [6] liên kết neural lớp gọi fully connected hay mạng kết nối hồn tồn Mạng fully connected có ưu điểm đơn giản, dễ triển khai nhiên nhược điểm số lượng thơng số số lượng phép tính mạng lớn Ví dụ, với mơ hình mạng hình 3, bỏ qua thông số bias, số lượng trọng số là: x + x = 35 trọng số Hình 4.1 Một mơ hình mạng neural nhân tạo 4.1.2 Phương pháp “học” mạng MLP Hiệu suất mạng đánh giá cách sử dụng hàm tổn hao hay cost function (5) Dựa vào hàm để đánh giá mơ hình mạng “học” tốt hay khơng tốt.Giá trị hàm tổn hao có giá trị lớn ngõ dự đoán mạng khác với nhãn thực ngược lại 33 (5) Trong đó: c(w,b): hàm tổn hao; n : tổng số nhãn; a: ngõ mạng dự đoán; y(x): giá trị ngõ thực tương ứng với ngõ vào x Việc huấn luyện mạng neural nhân tạo tìm giá trị phù hợp trọng số bias sau vòng lặp từ giá trị ngẫu nhiên khởi tạo ban đầu để có ngõ mong muốn Bằng phương pháp Gradient Descent cho phép thay đổi trọng số bias cách lấy đạo hàm hàm tổn hao Cụ thể, tham số cập nhật sau: Trong đó: w’, b’ : tương ứng trọng số bias neuron cập nhật; η: tỷ lệ học; m : mini-batch size tạo cách chia nhỏ số lượng liệu Các thông số khảo sát rõ mục kế 4.2 Thực nghiệm ý tưởng và kết quả 4.2.1 Cơ sở liệu 34 Bài báo sử dụng tập liệu MNIST (7) (Modified National Institute of Standards and Technology) để làm sở liệu đánh giá hệ thống Bộ liệu MNIST chia thành hai phần: liệu dành cho trình huấn luyện liệu dành cho trình kiểm tra Dữ liệu huấn luyện gồm 50000 ảnh, liệu kiểm tra gồm 10000 ảnh Tất hình ảnh đen trắng chữ số viết tay từ tới có kích thước 28 pixel x 28 pixel gắn nhãn Một số hình ảnh ngẫu nhiên trích xuất từ liệu MNIST: Hình 4.2 Một số ảnh gắn nhãn tương ứng 4.2.2 Lựa chọn thông số ban đầu Ngõ vào ngõ mạng thông số cố định mơ hình mạng neural nhân tạo Ở tốn nhận diện chữ số viết tay sử dụng liệu MNIST, mục đích mạng nhận dạng 10 chữ số khác từ đến 9, từ lớp ngõ cuối cần 10 neural thể 10 chữ số khác Với ảnh chiều có kích thước 28 pixel x 28 pixel chuyển dạng liệu chiều 784 pixel x pixel cho hình ảnh Ta xây dựng mơ hình mạng neural với 784 neuron đầu vào tương ứng với 784 pixel Với 10 giá trị ngõ (tương ứng với nhãn 0, 1, 2,

Ngày đăng: 28/10/2022, 09:10

Tài liệu cùng người dùng

Tài liệu liên quan