GIẢI PHÁP HỌC THÍCH ỨNG TRÊN NỀN TẢNG MẠNG HỌC SÂU ỨNG DỤNG NHẬN DẠNG ĐỐI TƯỢNG TÓM TẮT LUẬN ÁN TIẾN SĨ

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN TRẦN DIỄM PHÚC GIẢI PHÁP HỌC THÍCH ỨNG TRÊN NỀN TẢNG MẠNG HỌC SÂU ỨNG DỤNG NHẬN DẠNG ĐỐI TƯỢNG Chuyên ngành Mã số : Khoa học máy tính : 9480101 TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG - NĂM 2020 Cơng trình hoàn thành Trường Đại học Duy Tân Người hướng dẫn khoa học: PGS.TS Hoàng Văn Dũng TS Võ Nguyên Sơn Phản biện 1: Phản biện 2: Phản biện 3: Luận án bảo vệ trước Hội đồng chấm luận án họp vào lúc ngày tháng năm Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam Trung tâm Thông tin tư liệu Trường Đại học Duy Tân MỞ ĐẦU Trí tuệ nhân tạo hay trí thơng minh nhân tạo trí tuệ biểu diễn hệ thớng nhân tạo Ngày nay, trí tuệ nhân tạo xuất khắp nơi, ứng dụng văn phòng, hệ thống trả lời tự động, quản lý giao thông thông minh, quản lý nhà thông minh…Cùng với phát triển hệ thống phần cứng máy tính, trí tuệ nhân tạo có bước phát triển vượt bậc, ứng dụng ngày sâu rộng lĩnh vực đời sớng xã hội Trí tuệ nhân tạo tập trung vào phát triển giải thuật, ứng dụng hỗ trợ người việc định tự định trình nhận biết thu nạp liệu Một hướng nghiên cứu nhà khoa học, tập đồn cơng nghệ hàng đầu nhắm đến nhận dạng đối tượng, hành động đối tượng người (Human Action Recognition), như: hệ thống giám sát an ninh, hệ thống điều khiển từ xa thao tác, hệ thớng hỗ trợ người mù, hệ thớng phân tích liệu thể thao, robot tự động, xe ô tô tự lái [2], [3], [4], [5], [6], [7] Đã có nhiều nghiên cứu đưa nhiều phương pháp khác để phát triển trí tuệ nhân tạo (giải thuật heurictis, giải thuật tiến hóa, giải thuật Support Vector Machine, giải thuật Hidden Markov Model, phương pháp hệ chuyên gia, phương pháp mạng nơron, [8], [9], [10] ), nhiên phương pháp truyền thống cần can thiệp người, đòi hỏi lượng liệu phân tích, lưu trữ vơ lớn, đưa đến độ xác khơng cao giới hạn số trường hợp nhận dạng định Để khắc phục hạn chế nói trên, trí tuệ nhân tạo nhận dạng đối tượng hành động sử dụng phương pháp học máy (Machine Learing), tập trung vào phương pháp học sâu (Deep Learing) Deep learning chủ đề AI bàn luận sôi Là phạm trù nhỏ Machine Learning, Deep Learning tập trung giải vấn đề liên quan đến mạng thần kinh nhân tạo nhằm nâng cấp cơng nghệ nhận diện giọng nói, nhận dạng hình ảnh xử lý ngơn ngữ tự nhiên Chỉ vài năm, Deep Learning thúc đẩy tiến đa dạng lĩnh vực nhận biết vật (Object Perception), dịch tự động (Machine Translation), nhận diện giọng nói, [11]… vấn đề khó khăn với nhà nghiên cứu trí tuệ nhân tạo Tuy nhiên, giải tốn tương đới lớn khoa học đại AI, Deep Learning tồn nhiều hạn chế cần phải khắc phục nghiên cứu: - Thứ nhất, để tạo hệ thớng có khả nhận dạng đa dạng đối tượng, Deep Learning cần lượng liệu đầu vào khổng lồ để máy tính học hỏi Quy trình nhiều thời gian cần xử lý lớn mà có hệ thớng máy chủ cỡ lớn làm - Thứ hai, Deep Learning chưa thể nhận biết thứ phức tạp, ví dụ mối liên hệ thông thường xã hội Chúng gặp khó khăn cần nhận biết thứ tương tự Lý chưa có kỹ thuật đủ tớt để trí tuệ nhân tạo rút kết luận cách logic Bên cạnh đó, cịn nhiều thách thức việc tích hợp kiến thức trừu tượng vào hệ thớng Machine Learning, ví dụ thơng tin vật gì, dùng để làm gì, người ta hay dùng Nói cách khác, Machine Learningchưa có kiến thức thơng thường người Câu hỏi đặt để hệ thớng Machine Learning có thể, học hỏi tri thức, chọn lọc cập nhật kiến thức phù hợp tự xây dựng tập liệu có tính ràng buộc, xâu chuỗi người Hướng nghiên cứu Adaptive Learning[12], [13], [14], [15], [16], [17] giải pháp nhằm cải tiến hạn chế Deep Learing, khai phá vấn đề mà Deep Leaning chưa làm Một mơ hình Adaptive Learning hồn chỉnh cho phép hệ thớng auto robot có khả tự học hỏi, tự thông minh mô theo hoạt động não người Sự thông minh hệ thống tăng lên theo thời gian theo trình hoạt động thiết bị Hệ thống tự động chọn lọc liệu cho phù hợp, tự huấn luyện lại mơ hình tự cập nhật thay mơ hình cũ CHƯƠNG TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO 1.1 Trí tuệ nhân tạo Trên giới có nhiều định nghĩa khác trí tuệ nhân tạo hay cịn gọi AI (Artificial Intelligence), cụ thể: • Về tổng quan, trí tuệ nhân tạo trí tuệ biểu diễn hệ thống nhân tạo Thuật ngữ thường dùng để nói đến máy tính có mục đích không định ngành khoa học nghiên cứu lý thuyết ứng dụng trí tuệ nhân tạo • Bellman (1978) định nghĩa: trí tuệ nhân tạo tự động hoá hoạt động phù hợp với suy nghĩ người, chẳng hạn hoạt động định, giải tốn, … • Rich anh Knight (1991) cho rằng: Trí tuệ nhân tạo khoa học nghiên cứu xem làm để máy tính thực cơng việc mà người cịn làm tớt máy tính Mỗi khái niệm, định nghĩa có điểm riêng, để đơn giản hiểu trí tuệ nhân tạo ngành khoa học máy tính Nó xây dựng tảng lý thuyết vững ứng dụng việc tự động hóa hành vi thơng minh máy tính Giúp máy tính có trí tuệ người như: biết suy nghĩ lập luận để giải vấn đề, biết giao tiếp hiểu ngơn ngữ, tiếng nói, biết học tự thích nghi 1.2 Nghiên cứu nước quốc tế 1.2.1 Trong nước Ở nước ta, từ thập kỷ 90 đến năm đầu kỷ 20, lĩnh vực nghiên cứu trí tuệ nhân tạo đặc biệt lĩnh vực xử lý ảnh nhận dạng, có tham gia nhà nghiên cứu tiếng PGS.TS Ngô Quốc Tạo, PGS TS Đỗ Năng Tồn, PGS TS Lương Chi Mai… Có thể kể đến cơng trình nghiên cứu tiếng có tính ứng dụng cao nhận dạng chữ viết [20], [21], chữ viết tay tiếng Việt [22], [23], nhận dạng giọng nói, nhận dạng mặt người [24], [25], [26], mô thể người [27]…đa số nghiên cứu cơng trình cơng bớ sử dụng khai phá giải thuật truyền thống SVM , RandomForest, mơ hình Markov ẩn, mạng noron nhân tạo,…Những nghiên cứu tiền đề tảng quan trọng cho sinh viên, học viên cao học nghiên cứu sinh tham khảo, phát triển thành công trình nghiên cứu lớn Song song với việc cơng bớ cơng trình, nhà khoa học xuất nhiều ấn phẩm, sách chuyên khảo lĩnh vực xử lý ảnh, nhận dạng đối tượng Sau thập kỷ kỷ 20, với phát triển trí tuệ nhân tạo phần cứng máy tính cho phép lĩnh vực học máy (machine learning) nhận dạng đối tượng phát triển mạnh mẽ Tuy nhiên nước ta, năm đầu, nghiên cứu mạng nơron nhân tạo, mạng học sâu nhân chập (Convolution Neural Network) sơ khai, chưa có nghiên cứu nước lĩnh vực cụ thể Các nghiên cứu công bố hầu hết nghiên cứu sinh người Việt Nam nước Từ năm 2015 trở lại đây, bắt đầu xuất nhóm nghiên cứu như: Đại học Bách khoa Hà Nội [28], [29], Đại học Tơn Đức Thắng, Đại học Q́c gia TP Hồ Chí Minh, Đại học Duy Tân – Đà Nẵng,…có nhiều cơng bớ tạp chí uy tín q́c tế ISI, Scopus Ngồi nhóm nghiên cứu viện Lab trường đại học lớn, nhiều cơng trình nghiên cứu độc lập cơng bớ, đổi bật nghiên cứu xe ô tô tự hành, robot, nhận dạng hành động người, phân loại đối tượng, [30], [31], [32]…hỗ trợ lĩnh vực y tế, giao thông, nông nghiệp q́c phịng 1.2.2 Quốc tế Lịch sử phát triển trí tuệ nhân tạo học máy có từ lâu Từ năm 1950, Alan Turing mô biểu diễn trí thơng minh máy Đến năm 1955, John McCarthy, nhà khoa học máy tính khoa học nhận thức Mỹ lần đưa khái niệm Trí tuệ nhân tạo, mà theo có nghĩa mơn khoa học kĩ thuật chế tạo máy thông minh Một năm sau đó, ơng đứng tổ chức Hội nghị Dartmouth, hội nghị chủ đề Các chuyên gia đến từ nhiều trường đại học công ty khác Carnegie Mellon University, Massachusetts Institute of Technology IBM tham gia hội nghị Từ đó, khái niệm “Trí tuệ nhân tạo” sử dụng rộng rãi Trải qua nhiều giai đoạn khác nhau, trí tuệ nhân tạo nói chung lĩnh vực học máy nói riêng ngày phát triển, nghiên cứu khai phá nhiều giải thuật quan trọng như: Support vector machine, Random Forest, Neural network, K-mean, Decision tree, Booting, Hog…đây giải thuật tảng cho phát triển giải thuật ứng dụng nhận dạng, phân loại đối tượng, xử lý số liệu,…Cùng với phát triển phần cứng máy tính, giai đoạn từ sau năm 1998, DeepLearning, với mạng nơron nhân chập (Convolution neural network) – thành phần Machine learning có bước phát triển vượt bậc, tạo nhiều sản phẩm ứng dụng đời sống xã hội Một người tiên phong lĩnh vực cụ thể Yann LeCun Với LeNet[33] mạng CNN lâu đời tiếng Yann LeCun phát triển vào năm 1998s Cấu trúc LeNet gồm layer (Convolution + maxpooling) layer fully connected layer output softmax layer, độ xác q trình nhận dạng lên đến 99% Đến năm 2012, Alex Krizhevsky cộng nghiên cứu cho đời mô hình AlexNet [34] AlexNet mạng CNN dành chiến thắng thi ImageNet LSVRC-2012 năm 2012 với large margin (15.3% VS 26.2% error rates) AlexNet mạng CNN traning với số lượng parameter lớn (60 triệu) so với LeNet Tiếp theo sau mơ hình đề xuất, cải tiến tỷ lệ phần trăm lỗi, độ phức tạp mơ hình tăng lên, kiến trúc sâu Có thể kể đến mơ hình như: VggNet năm 2014, GoogleNet năm 2014, MicrosoftResNet năm 2015, Densenet năm 2016, …Song song với cải tiến kiến trúc mạng, mơ hình cho thực nghiệm huấn luyện nhận dạng hầu hết đới tượng có thực tế với độ xác cao, ví dụ với AlexNet nhận dạng phân loại 1.000 đối tượng khác Ngồi ra, nhiều cơng trình từ viện nghiên cứu, trường đại học giới cơng bớ, giải tốn cụ thể liên quan đến trí tuệ nhân tạo robotic, auto vehicle, …Mỗi lĩnh vực tiếp tục chia nhỏ theo cấp độ khác nhau, chuyên biệt giải trường hợp cụ thể toán thực tế Ví dụ, đới với tốn Xe tơ tự lái phân thành trường hợp nghiên cứu: - Bài tốn xe tơ tự lái nhận dạng phát đường - Bài toán xe ô tô tự lái nhận dạng phát đới tượng tham gia giao thơng Bài tốn xe ô tô tự lái nhận dạng biển báo giao thông Bài tốn xe tơ tự lái tính tốn khoảng cách với đới tượng Bài tốn xe tơ tự lái phát dự báo hành động người Bài tốn xe tơ tự lái phát chướng ngại vật, Đến thời điểm tại, nói trí tuệ nhân tạo sử dụng mạng học sâu nhân chập tiến bước dài đường “thông minh”, nhiên cịn vách ngăn lớn chưa thể vượt qua, khả “tự thông minh” Các nhà khoa học tích cực nghiên cứu giải pháp cho phép hệ thớng có khả tự học, tự cải thiện trí thơng minh khả người Đó hướng khai phá mà mục tiêu luận án nghiên cứu hướng đến, góp phần nhỏ bé đường chinh phục đỉnh cao trí tuệ nhân tạo - CHƯƠNG 2:NHẬN DẠNG ĐỐI TƯỢNG BẰNG HỌC SÂU 2.1 Bài toán dự đoán hành động người 2.1.1 Bài toán Trong tất đới tượng xuất q trình di chuyển xe tự lái, việc nhận dạng đối tượng người xem khó khăn độ phức tạp nhận dạng, phạm vi di chuyển quỹ đạo di chuyển người Chính vậy, khả dự đốn xác hành động người tốc độ đưa cảnh báo đặt lên hàng đầu nhằm giải tốn với độ xác cao, đảm bảo an toàn cho người phương tiện Qua nghiên cứu thực tế ta thấy rằng, có nhiều trường hợp người khác tựu chung lại có trường hợp cụ thể là: crossing pedestrian, walking pedestrian, waiting pedestrian; trường hợp đại diện bao quát cho tất trường hợp tương tác người xe tơ tự lái xảy Khi người di chuyển (hoặc đứng yên) đường, đặc trưng thể rõ tư người bộ, vị trí người ngữ cảnh khung hình (đường, lề đường, mép đường, ); vậy, việc trích rút đặc trưng từ hình ảnh có người bộ, sử dụng đặc trưng để huấn luyện liệu phục vụ cho việc dự đoán nhận dạng hành động người thực 2.1.2 Giải pháp Giải pháp đề xuất gồm bước: (i) Huấn luyên mô hình phân loại người thơng qua tư người sử dụng đặc trưng trích xuất từ mơ hình CNN; (ii) Từ hình ảnh trích xuất từ camera AV di chuyển đường, thứ tự xử lý sau: xác định người bộ, trích xuất vùng quan tâm (ROI), trích xuất đặc trưng ROI dự đoán hành động người ROI (Hình 2.2) Để trích xuất đặc trưng, sử dụng mơ hình CNN AlexNet [11].Để xác định người bộ, sử dụng giải thuật ACF [3],[4],[49] để huấn luyện, dự đoán hành đồng người sử dụng mơ hình phân loại SVM Hình 2.1 Tiến trình trích xuất đặc trưng với mơ hình CNN từ tập liệu hình ảnh Hình 2.2 Tiến trình dự đốn hành động người Thiết bị Camera sử dụng q trình thực nghiệm có độ phân giải từ 02 Megapixel trở lên, độ phân giải ảnh thu thập tối thiểu từ 72 dpi 2.1.3 Thực nghiệm 2.1.3.1 Trích xuất đặc trưng huấn luyện mơ hình phân loại Q trình thực nghiệm với 3,000 ảnh sử dụng trích xuất đặc trưng mơ hình CNN Các đặc trưng sử dụng để huấn luyện mơ hình phân loại SVM Hình 2.2 hiển thị tập liệu trích xuất đặc trưng huấn luyện 90% sớ lượng hình ảnh tập liệu sử dụng cho huấn luyện 10% lại sử dụng để đánh giá 2.1.3.2 Xác định người dự đoán hành động người Với hình ảnh thực tế (ví dụ hình 2.6), sau xác định người với giải thuật ACF, kết xử lý hình 2.11 Trong trường hợp này, nhiều người xuất khung hình, chúng tơi tiến hành trích xuất vùng quan tâm (ROI) thành hình ảnh độc lập để tiến hành dự đoán hành động người sử dụng mơ hình phân loại SVM (Hình 2.11) Mỗi hình ảnh hình 2.11 trích xuất đặc trưng cuối hệ thống sử dụng mơ hình phân loại SVM để dự đốn hành động người bộ, đưa cảnh báo phù hợp cho AV (Hình 2.9) Hình 2.11 Xác định người trích xuất vùng quan tâm Độ xác cao q trình phân loại dự đốn hành động người với tập liệu Bảng 2.2 thể Bảng 2.3 11 liệu phía trước phía sau phương tiện tham gia giao thông thu thập từ bối cảnh thực tế khác tuyến đường giao thông khác Tập liệu huấn luyện chia thành loại xe khác nhau, bao gồm: mô tô, ô tô con, xe khách, xe tải mô Hình 2.10, với 8.558 hình ảnh phương tiện Tập liệu chia thành 60% để huấn luyện 40% lại để đánh Bảng 2.4 2.3.2.2 Huấn luyện mơ hình CNN Kết thu sau đào tạo mơ hình CNN thể sau:(i) Tham sớ lọc: Lớp tích chập sử dụng 64 lọc, có trọng sớ lọc thể Hình 2.12: Hình 2.12 Các giá trị trọng số lọc lớp tích chập Lớp bao gồm 64 lọc kích thước 7x7, lọc kết nới với ba kênh đầu vào hình ảnh RGB 12 (ii) Kết nhân chập: Hình ảnh mẫu đưa vào mạng thơng qua lọc tích chập liệu thu hiển thị thành phần khác biệt với hình ảnh RGB ban đầu với kết đặc trưng khác nhau, tạo nhiều đặc trưng phương tiện Giá trị đầu tập hợp chập có chứa giá tiêu cực, giá trị chuẩn hóa điều chỉnh tuyến tính Đầu số lớp hiển thị bên dưới, với mẫu đầu vào xe mơ tơ (a) (b) (c) Hình 2.13 Một sớ kết tích chập tuyến tính hiệu chỉnh tuyến tính cho hình ảnh đầu vào xe mô tô (a) Đầu 64 lần chập lớp chập đầu tiên, (b) Giá trị hiệu chỉnh tuyến tính sau lớp chập đầu tiên, (c) Đầu 64 mẫu lớp chập thứ hai 2.3.2.3 Nhận dạng chủng loại phương tiện Dựa kết thực nghiệm, ba phương pháp khác đánh giá tập liệu mẫu Bảng 2.4 Các phương pháp bao gồm: (i) Các phương pháp truyền thống HOG SVM; (ii) Mạng CNN; (iii) Mạng CNN kết hợp với tăng cường liệu Độ xác phương pháp HOG SVM tập liệu mẫu 89,31% Chi tiết kết nhận dạng thể Bảng 2.6 13 Độ xác đánh giá phương pháp CNN dựa liệu gớc đạt trung bình 90,10%, thể Bảng 2.7 Đánh giá độ xác phương pháp CNN dựa gia tăng liệu đạt trung bình 95,59%, thể Bảng 2.8 Trong nghiên cứu này, chúng tơi đánh giá mơ hình CNN đề xuất theo cách tiếp cận truyền thống khác dựa mơ tả tính HOG phân loại SVM Kết so sánh thể Hình 2.14 Hình 2.14 So sánh kết phương pháp HOG+SVM, mơ hình CNNvà CNN với tăng cường liệu 14 CHƯƠNG PHÁT TRIỂN KỸ THUẬT HỌC THÍCH ỨNG TRONG NHẬN DẠNG ĐỐI TƯỢNG 3.1 Bài tốn giải pháp tổng quan Nội dung nghiên cứu Chương đề xuất giải pháp dựa học thích ứng mơ hình CNN Phương pháp đề xuất tự động cập nhật mơ hình nhận dạng thay mơ hình cũ cách thu thập tập liệu trực tiếp trình hoạt động bình thường ADAS, tiến hành huấn luyện, so sánh độ xác cập nhật mơ hình Nhiệm vụ cập nhật liệu tập trung vào mẫu liệu giớng với mẫu huấn luyện trước Mục đích giải pháp cập nhật mơ hình mơ hình thích ứng hơn, đạt độ xác cao Trong phương pháp học tập thích ứng, hệ thớng nhận dạng có khả tự học bổ sung liệu, mà không cần chuyên gia gán nhãn liệu Đặc biệt, với công nghệ lưu trữ trực tuyến ngày phát triển, hạ tầng giải pháp đường truyền liệu tảng (5G, Cloud data, ) việc lữu trữ, cập nhật liệu trực tuyếnsẽ giải khó khăn mơ hình đề xuất Giải pháp đề xuất bao gồm 05 giai đoạn chính: (1) Phát nhận biết đới tượng với độ tin cậy thấp; (2) Theo dõi đối tượng n khung hình tiến trình để xác định chúng có phải đới tượng quan tâm hay không (3) Trường hợp đối tượng nhận dạng với độ chắn cao: gán nhãn Positive (cùng loại đối tượng) cho mẫu liệu tương ứng phát với độ xác thấp theo dõi (tracking) q trình trước Trong trường hợp đối tượng xác định đối tượng quan tâm, tiến hành dán nhãn Negative cho tất mẫu theo dõi n khung hình trước đó; (4) Khởi tạo tập liệu huấn luyện dựa kết hợp có chọn lọc liệu huấn luyện trước liệu (5) Huấn luyện lại cập nhật mơ hình so sánh có độ xác cao Tiến hành thí nghiệm để so sánh kết mơ hình đề xuất mơ hình PDnet số phương pháp đại AlexNet Vgg Các kết thử nghiệm chứng minh phương pháp đề xuất 15 cung cấp độ xác cao mơ hình tự học theo thời gian Mặt khác, giải pháp học tập thích ứng đề xuất áp dụng cho mơ hình nhận dạng truyền thớng mơ hình AlexNet Vgg để cải thiện độ xác 3.2 Kiến trúc tổng quan hệ thống Ý tưởng chung học tập thích ứng cho mơ hình nhận dạng sử dụng cơng nghệ CNN minh họa Hình 3.1 Hệ thớng nhận dạng áp dụng cho loại đới tượng khác Tuy nhiên, để thuận tiện việc phân tích phương pháp đề xuất, chúng tơi áp dụng cho toán phân loại phương tiện biển báo giao thông để minh họa cho giải pháp đề xuất Có hai mơ hình CNN sử dụng phương pháp này, mơ hình IONet để phát phương tiện biển báo giao thơng mơ hình PDNet để xác định độ tin cậy nhận dạng đối tượng Hình 3.1 Mơ hình tổng qt hệ thớng Mô tả vấn đề: Giả sử huấn luyện hai mơ hình CNN ban đầu, IONet PDNet Trong śt hành trình đường, ADAS sử dụng mơ hình để nhận biết phương tiện, biển báo giao thông đưa định phù hợp Tuy nhiên, q trình xử lý nhận dạng, có số trường hợp hệ thống nhận diện phương tiện biển báo giao 16 thông với độ tin cậy thấp Tình h́ng xảy hệ thớng gặp phải liệu không giống với tập liệu đào tạo thông tin không đầy đủ Dữ liệu không giống với liệu gốc bị nhiễu thường khoảng cách xa, phương tiện biển báo giao thông bị che khuất vật thể khác, biển báo bị cong vênh mờ, phương tiện di chuyển điều kiện thiếu ánh sáng, mưa, tuyết, độ rung chuyển động, v.v Đây thời điểm để bắt đầu học tập thích ứng Hệ thớng lưu trữ hình ảnh có điểm tin cậy thấp (IO) tiếp tục theo dõi (theo dõi tự tin) đối tượng Quá trình theo dõi nhằm xác định trường hợp: (i) Mất đối tượng; (ii) Không phải đối tượng; (iii) Xác định đối tượng Khi lượng liệu tập Positive Data Negative Data đủ lớn, tác vụ huấn luyện lại mơ hình CNN xử lý Mơ hình huấn luyện chọn so sánh với mơ hình huấn luyện trước đó, mơ hình tớt sử dụng để cập nhật mơ hình nhận dạng hệ thớng Q trình học tập thích ứng diễn liên tục śt q trình làm việc ADAS Sau cập nhật, mô hình CNN nhận dạng đới tượng xác 3.3 Kết thực nghiệm Mơ hình thực nghiệm hệ thớng thiết bị có cấu hình tương đới thấp, tương ứng với cấu hình trang bị cho phương tiện xe tự lái thực tế, thể bảng 3.1 Bảng 3.1 Cấu hình thiết bị Thiết bị CPU GPU RAM HDD Cấu hình I3 3.6 GHz Geforce 1060 Gb 16 Gb SSD 160 Gb Kết thực nghiệm cho thấy có nhiều thay đổi độ xác mơ hình so sánh kết nhận dạng phương tiện biển báo giao thơng mơ hình ban đầu (PDNet-Vehicle0, PDNet-TrafficSign0) mơ hình đào tạo lại (PDNet-Vehicle1, PDNet-TrafficSign1 PDNet-Vehicle2, PDNet-TrafficSign2) trình huấn luyện lại tập liệu Retrain (70% liệu sử dụng lại từ mơ hình huấn 17 luyện trước 30% liệu thu nhận từ trình xác định độ tin cậy theo vết đới tượng), hiển thị Hình 3.8 Kết thực nghiệm chứng minh số kết thử nghiệm phương pháp đề xuất sớ mơ hình lý tưởng phương pháp học sâu, chẳng hạn Alexnet Vgg Kết ban đầu cho thấy mơ hình PDnet mang lại độ xác thấp so với mơ hình AlexNet Vgg Tuy nhiên, sau q trình học tập thích ứng, mơ hình PDnet mang lại độ xác cao so với mơ hình AlexNet Vgg ban đầu (Hình 3.9) Tớc độ xử lý mơ hình AlexNet Vgg chậm so với mơ hình PDNet (Bảng 3.22), mơ hình PDnet có kích thước hình ảnh đầu vào nhỏ (64 × 64), mơ hình AlexNet Vgg có kích thước hình ảnh lớn (227 × 227 224 × 224) Phương pháp học tập thích ứng đề xuất chúng tơi áp dụng cho mơ hình AlexNet, Vgg, kết cho thấy mơ hình Adap-AlexNet1, Adap-AlexNet2và Adap-Vgg1, Adap-Vgg2 (sau đào tạo lại) mang lại độ xác cao so với AlexNet0và Vgg0 ban đầu (Hình 3.10) Kết minh họa đồ thị Hình 3.9, Hình 3.10 cho thấy mơ hình sử dụng để đào tạo, q trình học tập thích ứng cải thiện mơ hình ban đầu để mang lại độ xác tiệm cận tới đa theo thời gian Hình 3.8So sánh độ xác sau huấn luyện lại mơ hình nhận dạng Phương tiện Biển báo giao thơng 18 Hình 3.9 So sánh kết cách tiếp cận đề xuất phương pháp khác Hình 3.10 So sánh kết cách áp dụng phương pháp học thích ứng với phương pháp khác CHƯƠNG TỐI ƯU HĨA BỘ SIÊU THAM SỐ TRONG HỌC THÍCH ỨNG 4.1 Bài toán tối ưu siêu tham số Trong giai đoạn nay, nghiên cứu trí tuệ nhân tạo nói chung hệ thớng tự động nói riêng tập trung vào việc nghiên cứu, xây dựng giải pháp tới ưu hóa mơ hình học máy tham sớ mơ hình Trong đó, lên hai xu hướng lựa chọn mơ hình Model selection (CNN, ANN, LSTM , Segment, ) lựa chọn ... tích, nhận dạng hình ảnh mơ hình học sâu cần thiết 10 2.2.2 Giải pháp Giải pháp đề xuất bắt đầu với việc thu nhận hình ảnh từ camera giám sát ITS Hình ảnh thu thập sử dụng để nhận đối tượng. .. tạo - CHƯƠNG 2:NHẬN DẠNG ĐỐI TƯỢNG BẰNG HỌC SÂU 2.1 Bài toán dự đoán hành động người 2.1.1 Bài toán Trong tất đới tượng xuất q trình di chuyển xe tự lái, việc nhận dạng đối tượng người xem... chế nói trên, trí tuệ nhân tạo nhận dạng đối tượng hành động sử dụng phương pháp học máy (Machine Learing), tập trung vào phương pháp học sâu (Deep Learing) Deep learning chủ đề AI bàn luận sôi

Định dạng
Số trang	27
Dung lượng	1,11 MB