Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
1,13 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA HUỲNH MINH VŨ NGHIÊNCỨUVÀTHỰCHIỆNMẠNG NƠ-RON NHÂNTẠOLANTRUYỀNTHẲNGNHIỀULỚPCÓKIẾNTRÚCTÙYBIẾNTRÊNFPGA Chuyên ngành: Kỹ thuật điện tử Mã số: 60.52.02.03 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ Đà Nẵng - Năm 2017 Cơng trình hoàn thành TRƢỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: TS Huỳnh Việt Thắng Phản biện 1: Phản biện 2: Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật điện tử họp Trường Đại học Bách khoa vào ngày 15 tháng 07 năm 201 Có thể tìm hiểu luận văn tại: Trung tâm Học liệu, Đại học Đà Nẵng Trường Đại học Bách khoa Thư viện Khoa Điện tử-Viễn thông, Trường Đại học Bách khoa – ĐHĐN MỞ ĐẦU Tính cấp thiết đề tài Mạng nơ-ron nhântạo sử dụng nhiều ứng dụng khoa học công nghệ Thực thi mạng nơ-ron nhântạoFPGAmang lại tính mềm dẻo mà tiết kiệm thời gian thiết kế chi phí sản xuất Thách thứcthựckiếntrúcmạng nơ-ron sâu DNN tăng vọt số lượng lớp, số lượng nơron lớp số lượng liên kết lớp, việc triển khai mạng nơ-ron sâu phần cứng (chẳng hạn FPGA) đòi hỏi người kỹ sư thiết kế cần tính tốn đến việc cân yếu tố: tài nguyên phần cứng, thời gian tính tốn mạng, cơng suất tiêu thụ tỉ lệ nhận dạng mong muốn Mục tiêu nghiêncứu Mục tiêu đề tài nghiêncứukiếntrúcmạng nơ-ron nhântạolantruyềnthẳngnhiềulớpcókiếntrúctùybiến thử nghiệm FPGA, thực đánh giá thông số tài ngun phần cứng tốc độ tính tốn, đồng thời ứng dụng kiếntrúcmạng nơ-ron nhiềulớpnhận dạng mẫu Đối tƣợng phạm vi nghiêncứu 3.1 Đối tượng nghiêncứu - Mơ hình mạng nơ-ron nhântạolantruyềnthẳngnhiềulớp ứng dụng hệ thống nhận dạng mẫu - Công nghệ FPGA, công cụ hỗ trợ thiết kế số phát triển hệ thống nhúng FPGA - Cơ sở lý thuyết, kỹ thuật công cụ để thực tính tốn với số thực dấu phẩy động FPGA - Các tập liệu để phục vụ tốn nhận dạng mẫu - Tiêu chí phương pháp đánh giá mạng nơ-ron nhântạothực phần cứng FPGA 3.2 Phạm vi nghiêncứu - Thực đánh giá khối nhận dạng sử dụng mạng nơ-ron nhântạonhiềulớp hệ thống nhận dạng mẫu dựa FPGA Phƣơng pháp nghiêncứu nội dung nghiêncứu 4.1 Phương pháp nghiêncứu Phương pháp nghiêncứu xuyên suốt luận văn kết hợp nghiêncứu lý thuyết, tính tốn, viết chương trình VHDL, kết hợp mơ phần mềm, thực thi phần cứng để đánh giá kết đạt so sánh với cơng trình nghiêncứu liên quan cơng bố 4.2 Nội dung nghiêncứu - Thu thập nghiêncứu tài liệu cơng trình tác giả ngồi nước có liên quan đến đề tài - Nghiêncứu lý thuyết: lý thuyết mạng nơ-ron nhântạo ứng dụng, thuật toán lantruyền ngược (Back Propagation) cho huấn luyện mạng nơ-ron, thư viện để thực phép toán dấu phẩy động FPGA - Tìm hiểu kiếntrúc phân tích hoạt động kiếntrúcmạng nơ-ron nhântạonhiềulớp (với lớp ẩn) FPGA thiết kế Phân tích, đánh giá hiệu kiếntrúc thông qua thông số tài ngun phần cứng, tốc độ tính tốn tương ứng với mơ hình mạng nơ-ron khác (thay đổi số lớp, số nơ-ron lớp), đánh giá khả thựckiếntrúcmạng nơ-ron board mạch FPGAcó - Huấn luyện mạng nơ-ron nhântạonhiềulớp toán nhận dạng mẫu phần mềm Matlab để tìm trọng số tối ưu, sau tổng hợp thựckiếntrúc FPGA, mô kiểm tra - Thực thi đánh giá mạng nơ-ron thiết kế board mạch FPGA Ý nghĩa khoa học thực tiễn đề tài Việc nghiêncứuthực thi mạng nơ-ron nhântạonhiềulớpFPGA nhằm xây dựng mạng nơ-ron ứng dụng nhận dạng mẫu Việc xây dựng mạng nơ-ron phần cứng FPGA làm sở cho việc thực hóa tốn nhận dạng mẫu ứng dụng mạng nơ-ron chip từ mở hướng thiết kế ứng dụng mang tính thực tiễn cao với tích hợp hệ thống xử lý thông minh chip Kết cấu luận văn Luận văn bao gồm có chương tóm tắt sau: Chương - Tổng quan Chương - Cơ sở thực hóa mạng nơ-ron nhântạoFPGA Chương - Nghiêncứukiếntrúcmạng nơ-ron nhântạolantruyềnthẳngnhiềulớptùybiếnFPGA Chương - Thực đánh giá CHƢƠNG 1-TỔNG QUAN 1.1 Mạng nơ-ron sinh học 1.2 Mạng nơ-ron nhântạo Xét mặt toán học, mạng nơ-ron nhântạolantruyềnthẳng với M lớp (không kể lớp vào), kết đầu lớp thứ k tính sau: xk+1 = f (Wkxk); k = 1, 2, 3…, M, đó: xk Wk vector liệu vào ma trận trọng số (đặc trưng cho liên kết hai lớp) lớp thứ k; xk+1 vector kết đầu lớp thứ k vector liệu vào cho lớp k+1; f hàm kích hoạt (activation function, thường hàm phi tuyến) Theo công thức (1.1), trình lantruyềnthẳngmạng nơ-ron nhântạonhiềulớpthực phép nhân ma trận – vector Wkxk sau áp dụng hàm kích hoạt phần tử kết nhận được, hai phép toán lặp lại cho lớp tính đến lớp cuối 1.3 Thựcmạng nơ-ron nhântạo phần cứng Nhiều vấn đề kỹ thuật (cũng kinh tế) cần xem xét kỹ lưỡng cân nhắc lựa chọn thiết kế thựcmạng nơ-ron nhântạo phần cứng hướng đến ứng dụng hay nhóm ứng dụng cụ thể, kể sau: Kiếntrúcmạng (neural network architecture): mạnglantruyềnthẳng hay mạng hồi quy, số lớp số lượng nơ-ron lớp, dạng hàm kích hoạt, mạngcó chức học để tự động cập nhật trọng số hay việc học thực off-line trước máy tính Định dạng số (number format) phù hợp cho biểu diễn liệu tính toán mạng nơ-ron: sử dụng số nguyên, sử dụng số thực, hay sử dụng định dạng nhị phân; sử dụng định dạng số thực dùng định dạng dấu chấm tĩnh (fixed-point format) hay định dạng dấu chấm động (floating-point format); số lượng bit tối thiểu (bitwidth) cho toán hạng phép toán; sử dụng đồng định dạng số cho liệu phép toán hay sử dụng nhiều định dạng khác cho liệu vào ra, trọng số phép tốn Độ xác/Tỷ lệ nhận dạng (accuracy/recognition rate) ứng dụng yêu cầu Tốc độ xử lý yêu cầu mạng nơ-ron (performance) Công suất Chi phí thiết kế chế tạo Nền tảng phần cứng tài nguyên phần cứng cần thiết để thực thiết kế Khả thương mại hóa yếu tố khác có liên quan 1.4 Phạm vi nhiệm vụ luận văn Với giới hạn thời gian hoàn thành luận văn hạn chế điều kiện tiến hành thực nghiệm nên luận văn tập trung nghiêncứukiếntrúcmạng nơ-ron lantruyềnthẳngnhiều lớp, thựckiếntrúc tảng FPGA dựa vào cơng cụ sẵn có, đánh giá mạng nơ-ron lựa chọn thực cho toán nhận dạng chữ số viết tay dựa vào tiêu chí đánh giá gồm tỉ lệ nhận dạng đúng, tài nguyên phần cứng sử dụng hiệu năng, từ đánh giá khả ứng dụng kiếntrúcmạng nơ-ron khảo sát ứng dụng thực tế CHƢƠNG - CƠ SỞ HIỆNTHỰC HÓA MẠNG NƠ-RON NHÂNTẠOTRÊNFPGA 2.1 Mở đầu chƣơng 2.2 Hệ thống nhận dạng mẫu dựa mạng nơ-ron nhântạo Trong năm gần đây, với phát triển nhanh chóng lĩnh vực chip FPGA, toàn cấu trúc ANN thực mạch phần cứng, dẫn đến việc loại bỏ khối trích chọn đặc trưng Sơ đồ khối chức hệ thống nhận dạng sử dụng mạng nơ-ron nhântạo ANN khơng có khối trích chọn đặc trưng hình 2.2 2.3 Mơ hình tính tốn mạng nơ-ron nhântạolantruyềnthẳngnhiềulớp 2.3.1 Nơ-ron nhântạo Tương tự nơ-ron sinh học, nơ-ron nhântạo đơn vị xử lý thông tin thành phần mạng nơ-ron nhântạo Cấu trúc nơ-ron nhântạo thể hình 2.3.Xét mặt tốn học, cấu trúc nơ-ron mơ tả cặp biểu thức sau: ∑ () 2.3.2 Mô hình tính tốn mạng nơ-ron nhântạo [10] 2.3.2.1 Mơ hình tính tốn mạng nơ-ron lớp Vector đầu mạng nơ-ron dạng ma trận: r = f(Wx + b) 2.3.2.2 Mạng nơ-ron nhiềulớp 2.3.3 Hàm truyền 2.4 Huấn luyện mạng nơ-ron nhântạonhiềulớp [12, 16] Cónhiều thuật tốn dùng để huấn luyện mạng, luận văn tác giả nghiêncứumạnglantruyềnthẳngnhiềulớp để nhận dạng nên thuật toán phù hợp để huấn luyện thuật toán lantruyền ngược BP (Back Propagation) với SGD (stochastic gradient descent) 2.4.1 Mô hình nơ-ron 2.4.2 Mơ hình mạng nơ-ron 2.5 Công nghệ FPGA ngôn ngữ mô tả phần cứng VHDL [1] 2.5.1 Công nghệ FPGA 2.5.1.1 KiếntrúcFPGA 2.5.1.2 Ứng dụng 2.5.2 Ngôn ngữ mô tả phần cứng VHDL 2.5.2.1 Giới thiệu ngôn ngữ VHDL 2.5.2.2 Ưu điểm ngôn ngữ VHDL 2.5.2.3 Mô tả thiết kế VHDL 2.6 Thực phép toán số thực dấu phẩy động FPGA Kết nghiêncứu [7] cho thấy việc thực thi mạng nơrôn nhântạocó trọng số với định dạng số thực dấu chấm phẩy động bán xác 16-bit đảm bảo cho tỷ lệ nhận dạng hiệu việc sử dụng tài nguyên FPGA 2.6.1 Thư viện mã nguồn mở FloPoCo [13] 2.6.2 Các phép toán số thực dấu phẩy động FPGA 2.6.2.1 Bộ cộng Addition 2.6.2.2 Bộ nhân Multiplication 2.6.2.3 Bộ chia Divider 2.6.2.4 Bộ thực hàm mũ Exponential 2.7 Thực phép toán sở cho mạng nơ-ron [2, 6] 11 Một nơ-ron tính tốn thực tính tốn cơng thức (2.5), cụ thể sử dụng nhân cộng tích lũy MAC để nhân vector trọng số w (được lưu trữ nhớ ROM) vector đầu vào x, kết MAC đưa vào thực hàm truyền Logsigmoid cho kết đầu r 3.3 Kiếntrúcmạng nơ-ron nhântạo với nhiềulớp tính toán phần cứng Sơ đồ khối chức kiếntrúcmạng nơ-ron nhântạo với nhiềulớp tính tốn phần cứng (MHL-ANN) để thực tính tốn cho cấu hình mạng nơ-ron lớp N-M1-M2-M3 (Hình 2.6) với R số đầu vào, số nơ-ron lớp M1, M2, M3 trình bày hình 3.4 [2, 6] 3.4 Kiếntrúcmạng nơ-ron nhântạo với lớp tính tốn phần cứng Hình 3.5 trình bày sơ đồ khối chức kiếntrúcmạng nơ-ron nhântạo với lớp tính tốn phần cứng SHL-ANN (Single hardware-layer ANN) sử dụng để thực tính tốn cho cấu 12 hình ANN ba lớp R-M1-M2-M3 (Hình 2.6) Khác với kiếntrúc MHLANN, kiếntrúc SHL-ANN cólớp phần cứng vật lý bao gồm M nơ-ron tính tốn (với M giá trị lớn giá trị M1, M2, M3) để thực tính tốn chuyển tiếp cho nơ-ron lớp ẩn nơ-ron lớp ngõ ANN Kiếntrúc SHLANN bao gồm thành phần chính: khối nơ-ron tính tốn Hardware Layer khối điều khiển Control Unit 3.4.1 Khối nơ-ron tính tốn Hardware_Layer Khối nơ-ron tính tốn Hardware_Layer thực việc tính tốn cho lớp nơ-ron theo Ở lần tính tốn đầu tiên, tín hiệu ngõ vào mạng nơ-ron chọn làm tín hiệu ngõ vào Hardware_Layer Sau đó, tín hiệu ngõ Hardware_Layer 13 hồi tiếp làm tín hiệu ngõ vào Hardware_Layer để thựclần tính tốn Theo vậy, khối nơ-ron tính tốn thực phép tính tốn cho tồn mạng nơ-ron 3.4.2 Khối điều khiển Control Unit Khối điều khiển Control Unit sử dụng để kiểm sốt tính tốn chuyển tiếp lớp nơ-ron logic, chọn vector trọng số vector đầu vào thích hợp cho lớp phần cứng vật lý Sơ đồ khối mức chuyển ghi RTL thể hình 3.8 Khối điều khiển hoạt động máy trạng thái hữu hạn FSM (Finite State Machine), sơ đồ khối FSM mơ tả hình 3.9 3.4.3 Kết mô Sơ đồ khối mức chuyển ghi RTL kiếntrúc SHL_ANN thể hình 3.10, chân vào/ra kiếntrúc mô tả bảng 3.3 14 Mô dạng sóng mạng nơ-ron cókiếntrúc 784-4040-10 cho ứng dụng nhận dạng chữ số viết tay, đầu vào mẫu thử thứ sở liệu MNIST Thời gian thực tính tốn mẫu 11371 chu kỳ máy Nơ-ron thứ lớp ngõ có giá trị lớn 15 = 0.999 (tương ứng chuỗi nhị phân 010011101111111110), cho kết nhận dạng chữ số “7” với sở liệu MNIST 3.5 Công cụ AutogenDNN cho tùybiếnkiếntrúcmạng nơ-ron lantruyềnthẳngnhiềulớpFPGA Để thực thi mạng nơ-ron lantruyềnthẳngnhiềulớpcó cấu trúctùybiến (về số lớp ẩn, số lượng nơ-ron lớp) FPGA sử dụng kiếntrúc SHL_ANN, luận văn sử dụng công cụ AutogenDNN để tạo tự động file mã mô tả phần cứng VHDL Công cụ AutogenDNN phần mềm phát triển MatLab bao gồm file mẫu (template) VHDL component cấu thành nên kiếntrúc SHL_ANN: Nơ-ron tính tốn Khối nhớ lưu trọng số Khối nơ-ron tính toán Khối điều khiển Khi thực thi, AutogenDNN đọc ma trận lưu trọng số ngưỡng mạng nơ-ron có cấu trúctùybiến (thu từ huấn luyện mạng nơ-ron tạo ngẫu nhiên) kết hợp với template để tạo thành tập tin mã VHDL mô tả phần cứng kiếntrúc SHL_ANN 3.6 Kết luận chƣơng Tóm lại chương giới thiệu phân tích hoạt động kiếntrúcmạng nơ-ron nhântạo với lớp tính tốn phần cứng SHLANN (Single Hardware-Layer ANN) để thực thi mạng nơ-ron nhântạolantruyềnthẳngnhiềulớptùybiến (thay đổi số lớpmạng hay số nơ-ron lớp) FPGA Phần cuối chương giới thiệu công cụ AutogenDNN để tạo tự động file mã mô tả phần 16 cứng cấu trúc SHL_ANN để thực thi mạng nơ-ron nhântạolantruyềnthẳngnhiềulớptùybiếnFPGA CHƢƠNG - THỰCHIỆNVÀ ĐÁNH GIÁ 4.1 Mở đầu chƣơng 4.2 Quy trình thiết kế thựcmạng nơ-ron nhântạoFPGA Để đánh giá hoạt động hiệu kiếntrúcmạng SHLANN, tác giả xây dựng qui trình thiết kế thựcmạng nơ-ron nhântạoFPGA thể hình 4.1 4.2.1 Huấn luyện mạng nơ-ron MatLab Luận văn thực toán nhận dạng chữ số viết tay với sở liệu MNIST [14] để đánh giá hiệu suất hệ thống Cơ sở liệu MNIST chữ số viết tay gồm có tập 60000 mẫu huấn luyện 10000 mẫu kiểm tra Có 10 chữ số khác từ đến tập sở liệu MNIST Mỗi số ảnh đa cấp xám chuẩn hóa với kích thước 28x28 hay có tổng cộng 784 điểm ảnh đặc trưng Luận văn sử dụng 784 pixel hình ảnh làm đầu vào trực tiếp đưa vào mạng nơ-ron, cho phép loại bỏ khối trích chọn đặc trưng (PCA) Kết là, mạng nơ-ron thiết kế có 784 đầu vào lớp đầu vào 10 nơ-ron lớp đầu Số lớp ẩn số nơ-ron lớp ẩn khác để nghiêncứu việc sử dụng tài nguyên hiệu hệ thống 17 4.2.2 Tạo mã chương trình mơ tả phần cứng VHDL cho mạng ANN 4.2.3 Tổng hợp mô 4.2.4 Thực thi phần cứng Luận văn chọn board mạch FPGA Virtex-5 XC5VLX-110T hãng Xilinx phát triển để thực thi kiếntrúcmạng SHL_ANN Tài nguyên board mạch FPGA Virtex-5 XC5VLX-110T mô tả bảng 4.1 4.3 Các thơng số (tiêu chí) đánh giá trƣờng hợp đánh giá Để đánh giá hiệu kiếntrúc SHL_ANN triển khai phần cứng toán nhận dạng, cụ thể luận văn toán nhận dạng chữ số viết tay cần xây dựng thơng số, tiêu chí trường hợp cụ thể Các thông số sử dụng để đánh giá luận văn bao gồm: Sử dụng tài nguyên phần cứng Tần số hoạt động cực đại Fmax Số chu kỳ máy/mẫu Tốc độ nhận dạng đỉnh kFPS Tỉ lệ nhận dạng Các trường hợp đánh giá 4.4 Kết thực nghiệm 4.4.1 Kết huấn luyện mạng nơ-ron nhântạo MatLab Các hình 4.3, 4.4 4.5 hiển thị kết huấn luyện Matlab với mạng nơ-ron ANN có từ đến lớp ẩn, với số nơ-ron lớp ẩn 12, 40 126 nơ-ron theo thứ tự Thông thường, tỷ lệ nhận dạng tỉ lệ với kích thước số lớpmạngTuy nhiên, tăng số lượng lớp ẩn không thiết đem lại tỉ lệ nhận dạng tăng đáng kể 18 sở liệu MNIST Kết huấn luyện cho thấy mạng nơ-ron ANN với lớp ẩn có tỷ lệ nhận dạng tốt nhất, tương ứng với 94,14% , 97,20% 98,16% sử dụng 12, 40 126 nơron lớp ẩn 4.4.2 Kết tổng hợp mô Số Kiếntrúcmạng FFs nơron LUTs BRAMs DSPs MHL-ANN 20-12-10 [6] 22 24025 28340 22 22 SHL-ANN 784-12-10 12 13164 19055 12 12 SHL-ANN 784-12-12-10 12 13168 19549 12 12 SHL-ANN 784-12-12-12-10 12 13168 19762 12 12 SHL-ANN 784-40-10 40 44059 62579 40 40 SHL-ANN 784-40-40-10 40 44079 63454 40 40 SHL-ANN 784-40-40-40-10 40 44049 63591 40 40 SHL-ANN 784-126-10 126 139364 211692 126 126 SHL-ANN 784-126-126-10 126 139364 214583 126 126 126 139364 218528 126 126 SHL-ANN 784-126-126-12610 Bảng 4.2 Chi tiết độ sử dụng tài nguyên FPGA Sử dụng Kiếntrúcmạng tài nguyên (%) fmax (MHz) Tốc độ Tỉ lệ đỉnh nhận (kFPS) dạng MHL-ANN 20-12-10 [6] 41,1 205 404,34 90,88 SHL-ANN 784-12-10 27,6 193 18,49 93,70 19 SHL-ANN 784-12-12-10 28,3 193 18,14 94,13 SHL-ANN 784-12-12-12-10 28,6 193 17,80 93,17 SHL-ANN 784-40-10 90,6 180 16,67 97,07 SHL-ANN 784-40-40-10 91,8 179 15,81 97,20 SHL-ANN 784-40-40-40-10 92,0 178 14,98 96,76 Bảng 4.3 Tỉ lệ sử dụng tài nguyên, tốc độ nhận dạng tỉ lệ nhận dạng board mạch Virtex-5 XC5VLX-110T Kiếntrúc SHL-ANN lớn triển khai Như thể bảng 4.3 4.4, cấu hình SHL-ANN mạng nơron 784-40-40-40-10 với lớp ẩn, lớp ẩn có 40 nơ-ron, tương ứng với 40 nơ-ron máy tính chiếm 92% tài nguyên phần cứng thực thành công FPGA Virtex-5 Xét hiệu thựcnhận dạng, tốc độ đỉnh (peak performance) kiếntrúc SHL-ANN giảm xuống với kích thước mạng tăng lên Kiếntrúc SHL-ANN 784-40-40-10 tương ứng với tỷ lệ nhận dạng MNIST tốt 97,20%, đạt tốc độ đỉnh 15,81 nghìn mẫu giây (kFPS) sử dụng FPGA Virtex-5 Kiếntrúc SHL-ANN 784126-126-10 tương ứng với tỷ lệ nhận dạng MNIST tốt 98,16%, đạt tốc độ đỉnh 15,92 nghìn mẫu giây (kFPS) sử dụng FPGAZynQ-7 7Z045 Lưu ý, việc triển khai kiếntrúc MHL-ANN có tốc độ nhận dạng tốt kiếntrúc SHL-ANN tính toán lớp phần cứng khác thực pipelined 4.4.3 Kết thực thi phần cứng Để kiểm tra kết tính tốn đánh giá tỉ lệ nhận dạng kiếntrúc SHL_ANN, tác giả xây dựng hệ thống nhúng mạng nơ- 20 ronnhântạocó kích cỡ 784-12-12-10 784-40-40-10 cho tốn nhận dạng chữ số viết tay board mạch FPGA Virtex-5 XC5VLX-110T dựa vi xử lý MicroBlaze Xilinx Trên máy tính PC sử dụng phần mềm terminal Hercules để nhận kết tính tốn nhận dạng mạng Mơ hình thực thi thực tế board FPGA thể hình 4.9, kết tính tốn nhận dạng thu phần mềm Hercules thể hình 4.10 4.11 21 Kết tổng hợp thực thi thể bảng 4.5 cho thấy, hệ thống nhúng mạng nơ-ron 784-40-40-10 chiếm dụng đến 99,7% tài nguyên board mạch FPGA với điều kiện sử dụng ngoại vi bản, tần số hoạt động tối đa fmax giảm xuống có đệm InputBuffer đặt trước kiếntrúc SHL_ANN, nhiên kết nhận dạng với kết mô phần mềm ISim 94,13% 97,20% tương ứng với mạng nơ-ron lớp ẩn có 12 nơron 40 nơ-ron lớp ẩn 22 4.4.4 So sánh với số kết nghiêncứu khác Bảng 4.5 thể so sánh kết đạt với số nghiêncứu khác Với board mạch FPGA Virtex-5 XC5VLX-110T, sử dụng định dạng số thực dấu phẩy động 16 bit cho trọng số liệu đầu vào, kiếntrúc SHL_ANN cho phép triển khai mạng nơ-ron có kích cỡ lớn dẫn đến kết đạt tỉ lệ nhận dạng cao nhiều so với [2] (97,20% so với 90,88% toán nhận dạng chữ số viết tay MNIST) nhiên tốc độ nhận dạng giảm xuống Với board mạch FPGA ZynQ-7 7Z045, kiếntrúc SHL_ANN triển khai mạng nơ-ron 784-126-126-10 cho tỉ lệ nhận dạng MNIST 98,16%, kết [4] sử dụng định dạng số thực dấu chấm tĩnh 3-8 bits nên triển khai mạng nơron kích cỡ lớn nhiều (784-1022-1022-1022-10) cho tỉ lệ 23 nhận dạng cao 98,92% Kết [5] giới thiệu kiếntrúcmạng nơ-ron nhị phân tích chập, kích cỡmạng nơ-ron 784-256-256256-10 cho tỉ lệ nhận dạng MNIST thấp với 95,8% có tốc độ nhận dạng cao với 12630 kFPS, nhiên thuật toán huấn luyện mạng nơ-ron phức tạp đòi hỏi tài nguyên lớn 4.5 Kết luận chƣơng Chương trình bày qui trình thựcmạng nơ-ron nhântạolớp tính tốn phần cứng FPGA, thực mô đánh giá hiệu kiếntrúcmạng SHL_ANN Kết mô cho thấy kiếntrúcmạng hoạt động ổn định, tỉ lệ nhận dạng phần mềm mô với tỉ lệ nhận dạng MatLab cho thấy việc tính tốn kiếntrúc SHL_ANN xác Kết tổng hợp mô đánh giá hiệu kiếntrúc SHL_ANN mạng nơ-ron nhântạolantruyềnthẳngcókiếntrúctùybiến board mạch FPGA khác nhau, đồng thời so sánh kết đạt với số nghiêncứu khác 24 KẾT LUẬN VÀ ĐỀ XUẤT Trên sở tìm hiểu, nghiêncứukiếntrúcmạng nơ-ron nhântạolantruyềnthẳngnhiềulớpcókiếntrúctùybiến FPGA, đặt tên kiếntrúcmạng nơ-ron nhântạolớp tính tốn phần cứng SHL_ANN, đồng thời ứng dụng kiếntrúcmạng vào toán nhận dạng chữ số viết tay dựa sở liệu MNIST, đề tài đạt mục tiêu nghiêncứu ban đầu đề Cụ thể, đề tài đạt kết sau đây: Nghiên cứu, phân tích hoạt động kiếntrúcmạng nơ-ron nhântạolớp tính tốn phần cứng SHL_ANN triển khai cho mạng nơ-ron nhântạolantruyềnthẳngnhiềulớpcó cấu trúctùybiến số lớp số nơ-ron lớp Thực mô thành công hoạt động kiếntrúc mạng, áp dụng cho toán nhận dạng chữ số viết tay dựa sở liệu MNIST Đánh giá hiệu kiếntrúc SHL_ANN cho mạng nơ-ron nhântạocó kích cỡ khác qua thông số: sử dụng tài nguyên phần cứng, tốc độ đỉnh, tỉ lệ nhận dạng, xác định kích cỡ đối đa kiếntrúcthực thi board mạch FPGA cụ thể Tổng hợp thực thi thành công kiếntrúc SHL_ANN board mạch Virtex-5 XC5VLX-110T hãng Xilinx Bên cạnh đó, giới hạn thời gian hồn thành luận, thời gian tiếp cận với FPGA không nhiều, tác giả chưa cónhiều kinh nghiệm thực hành lĩnh vực nên luận văn dừng lại việc nghiêncứumạng nơ-ron nhântạolantruyềnthẳng 25 nhiềulớp toán nhận dạng chữ số viết tay từ tập MNIST FPGA Chính vậy, tác giả xin đề xuất số hướng nghiêncứu sau đây: Tối ưu hóa kiếntrúc SHL_ANN theo hướng tăng tốc độ nhận dạng Xây dựng ứng dụng nhận dạng mẫu kiếntrúc SHL_ANN như: nhận dạng tiếng nói, khn mặt hay dấu vân tay Nghiêncứu xây dựng mạng nơ-ron nhântạo tích chập CNN (Convolutional Neural Network) FPGA Cuối tác giả mong nhận giúp đỡ đóng góp ý kiến tất thầy hội đồng bảo vệ bạn quan tâm để luận văn hoàn thiện Tác giả xin gởi lời cảm ơn chân thành sâu sắc đến người hướng dẫn khoa học Thầy giáo TS Huỳnh Việt Thắng, người gợi ý hướng đề tài, cung cấp tài liệu tham khảo, hướng dẫn cho phương pháp làm việc khoa học tận tình giúp đỡ động viên tơi suốt trình thực luận văn Xin gởi lời cảm ơn chân thành đến Tập thể Thầy Cô giáo khoa Điện Tử Viễn Thông, trường Đại học Bách Khoa, thuộc Đại học Đà Nẵng giúp đỡ tạo điều kiện thuận lợi cho tác giả suốt q trình học tập hồn thành đề tài Tuycố gắng, nỗ lực đạt kết đáp ứng mục tiêu nghiêncứu đặt ra, song chắn không tránh khỏi thiếu sót q trình thực luận văn Tác giả mong nhận ý kiến đóng góp trao đổi người đọc để tiếp tục hồn thiện nghiêncứu tương lai ... cho tùy biến kiến trúc mạng nơ- ron lan truyền thẳng nhiều lớp FPGA Để thực thi mạng nơ- ron lan truyền thẳng nhiều lớp có cấu trúc tùy biến (về số lớp ẩn, số lượng nơ- ron lớp) FPGA sử dụng kiến trúc. .. hiểu, nghiên cứu kiến trúc mạng nơ- ron nhân tạo lan truyền thẳng nhiều lớp có kiến trúc tùy biến FPGA, đặt tên kiến trúc mạng nơ- ron nhân tạo lớp tính tốn phần cứng SHL_ANN, đồng thời ứng dụng kiến. .. Cơ sở thực hóa mạng nơ- ron nhân tạo FPGA Chương - Nghiên cứu kiến trúc mạng nơ- ron nhân tạo lan truyền thẳng nhiều lớp tùy biến FPGA Chương - Thực đánh giá CHƢƠNG 1-TỔNG QUAN 1.1 Mạng nơ- ron sinh