(Luận văn) nghiên cứu phân loại độ tuổi của người bằng hình ảnh sử dụng mạng nơ ron tích chập

77 0 0
(Luận văn) nghiên cứu phân loại độ tuổi của người bằng hình ảnh sử dụng mạng nơ ron tích chập

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - lu SOULINSOMPHOU OUPALA an n va gh tn to p ie NGHIÊN CỨU PHÂN LOẠI ĐỘ TUỔI CỦA NGƯỜI BẰNG HÌNH ẢNH SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP d oa nl w ll u nf va an lu oi m LUẬN VĂN THẠC SĨ KỸ THUẬT z at nh (Theo định hướng ứng dụng) z m co l gm @ an Lu Hà Nội-Năm 2020 n va ac th si HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - SOULINSOMPHOU OUPALA lu an n va NGHIÊN CỨU PHÂN LOẠI ĐỘ TUỔI CỦA NGƯỜI BẰNG HÌNH ẢNH SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP p ie gh tn to d oa nl w CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 8.48.01.04 an lu va LUẬN VĂN THẠC SĨ KỸ THUẬT ll u nf (Theo định hướng ứng dụng) oi m z at nh NGƯỜI HƯỚNG DẪN KHOA HỌC z TS NGUYỄN ĐÌNH HĨA m co l gm @ an Lu Hà Nội-Năm 2020 n va ac th si lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si i LỜI CAM ĐOAN Tôi cam đoan nghiên cứu phân loại độ tuổi người hình ảnh sử dụng mạng nơ ron tích chập cơng trình nghiên cứu riêng chưa nộp khóa luận, luận văn hay luận án Học viện Cơng Nghệ Bưu Chính Viễn Thơng trường đại học khác Những tơi viết khơng chép từ tài liệu, không sử dụng kết người khác mà khơng trích dẫn cụ thể Nếu sai tơi hồn tồn chịu trách nhiệm theo quy định Học viện Cơng Nghệ Bưu Chính Viễn Thông lu an n va Tác giả luận văn gh tn to p ie SOULINSOMPHOU OUPALA d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si ii LỜI CẢM ƠN Học viên xin chân thành cảm ơn Thầy Cô Khoa Đào tạo Sau Đại học Khoa Công nghệ thơng tin 1, Học Viện Cơng Nghệ Bưu Chính Viễn Thông tạo điều kiện thuận lợi cho học viên trình học tập nghiên cứu Học viên đặc biệt xin chân thành cảm ơn TS Nguyễn Đình Hóa người trực tiếp tận tình hướng dẫn học viên hoàn thành luận văn Trong trình nghiên cứu thực đề tài với tâm cao hạn chế kinh nghiệm kiến thức vốn tiếng việt chưa phong phú nên lu an luận văn em chắn khơng tránh khỏi thiếu xót Em mong nhận n va ý kiến đóng góp từ quý Thầy Cơ bạn để đề tài hồn thiện tn to Học viên xin chân thành cảm ơn bạn bè sát cánh giúp học viên có Xin chân thành cảm ơn! p ie gh kết ngày hôm d oa nl w Tác giả luận văn an lu ll u nf va SOULINSOMPHOU OUPALA oi m z at nh z m co l gm @ an Lu n va ac th si iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC TỪ VIẾT TẮT v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU lu an CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN PHÂN LOẠI ĐỘ TUỔI CỦA NGƯỜI BẰNG HÌNH ẢNH va n 1.1 Giới thiệu toán phân loại độ tuổi người qua hình ảnh .3 to 1.1.2 Các nghiên cứu liên quan ie gh tn 1.1.1 Tổng quan p 1.2 Khó khăn thách thức Hướng tiếp cận giải toán .7 nl w 1.3 oa 1.3.1 Phương pháp học máy truyền thống d 1.3.2 Phương pháp học sâu lu Kết chương .9 va an 1.4 ll u nf CHƯƠNG 2: PHÂN LOẠI ĐỘ TUỔI CỦA NGƯỜI BẰNG HÌNH ẢNH SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP 10 Giới thiệu mạng nơ ron tích chập .10 oi m 2.1 z at nh 2.2 Cấu trúc mạng nơ ron tích chập số mơ hình mạng thông dụng thực tế 19 Convolutional 21 2.2.2 Poolling 22 2.2.3 Lớp kết nối đầy đủ (Fully connected layer) 23 2.2.4 Hàm Kích hoạt (Activation Function) 24 2.2.5 Một số mơ hình mạng thơng dụng thực tế .26 z 2.2.1 m co l gm @ an Lu n va ac th si iv 2.3 Ứng dụng mạng nơ ron tích chập toán thực tế xử lý phân loại ảnh 28 2.4 Xây dựng tập liệu cho toán 29 2.4.1 Giới thệu liệu sử dụng toán 29 2.4.2 Tiền xử lý chuẩn bị liệu 32 2.5 Xây dựng mơ hình mạng nơ ron tích chập để giải tốn phân loại độ tuổi người hình ảnh .36 2.5.1 Cấu trúc mơ hình .36 2.5.2 Các hàm kỹ thuật sử dụng .38 lu 2.5.3 Định nghĩa mơ hình 41 an 2.5.4 Chuẩn bị liệu 46 va 2.5.5 Huấn luyện mơ hình 51 n Kết chương 54 tn to 2.6 3.1 Cài đặt môi trường thực huấn luyện thử nghiệm mạng nơ ron tích chập áp dụng liệu thực tế .55 p ie gh CHƯƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM 55 Phương pháp đánh giá 56 nl w 3.2 Đánh giá kết 57 3.4 Kết chương 61 d oa 3.3 an lu va KẾT LUẬN 62 ll u nf DANH MỤC CÁC TÀI LIỆU THAM KHẢO 63 oi m z at nh z m co l gm @ an Lu n va ac th si v DANH MỤC CÁC TỪ VIẾT TẮT lu an n va Tiếng Anh Tiếng Việt AI Artificial Intelegent Trí tuệ nhân tạo CNN Convolutional Neural Network Mạng nơ ron tích chập CNTT Information Technology Cơng nghệ thơng tin Conv Convolutional layer Lớp tích chập Deep Learning Học sâu Indian Movies Face Database Bộ liệu ảnh khuôn mặt phim ấn độ Learning rate Chỉ số học gh tn to Từ viết tắt p ie DL d Lr oa nl w IMFDB va an lu Machine Learning Học máy OCR Optical Character Recognition ll u nf ML m oi Nhận dạng ký tự quang học z at nh z m co l gm @ an Lu n va ac th si vi DANH MỤC CÁC BẢNG Bảng 2.1 Mẫu liệu IMFDB 31 Bảng 2.2 Phân chia liệu thành hai tập .35 Bảng 2.3 Phân chia liệu thành hai tập .35 Bảng 2.4 Tỷ lệ số mẫu liệu nhãn 41 Bảng 2.5 Định dạng nhãn phân loại thành véc tơ 50 Bảng 3.2 Kết phân loại mơ hình .58 lu Bảng 3.3 Confusion matrix 59 an n va Bảng 3.4 Kết phân loại theo nhãn 60 p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si vii DANH MỤC CÁC HÌNH Hình 1.1 So sánh phương pháp học máy với phương pháp học sâu Hình 2.1 Minh học phép tốn tích chập 11 Hình 2.2 Minh họa phép tích chập với lọc 12 Hình 2.3 Minh họa phép tích chập với lọc cạnh .12 Hình 2.4 Bộ lọc W (kernel) 14 Hình 2.5 Các Bộ lọc cạnh với kích thước x .15 Hình 2.6 Minh họa phép nhân chập với lọc cạnh .16 Hình 2.7 Kết phép tích chập với lọc cạnh 17 lu an Hình 2.8 Ví dụ lọc cạnh 17 n va Hình 2.9 Phép tích chập với giá trị padding .18 Hình 2.11 Phép tích chập hình ảnh màu 19 gh tn to Hình 2.10 Phép tích chập hình ảnh với giải màu .18 p ie Hình 2.12 Mơ cấu trúc mạng nơ ron tích chập 20 Hình 2.13 Việc thực lấy mẫu tầng Pooling 23 nl w Hình 2.14 Minh họa lớp kết nối đầy đủ 24 d oa Hình 2.15 Các hàm kích hoạt phổ biết mơ hình mạng nơ ron 25 an lu Hình 2.16 Hàm kích hoạt ReLU 25 va Hình 2.17 Kiến trúc mạng LeNet 27 u nf Hình 2.18 Kiến trúc mạng Alexnet 27 ll Hình 2.19 Kiến trúc mạng VGGNet 28 m oi Hình 2.20 Một số hình ảnh ví dụ liệu IMFDB 30 z at nh Hình 2.21 Dữ liệu sau loại bỏ thuộc tính khơng cần thiết 32 Hình 2.22 Ví dụ hình ảnh bị thiếu sáng sáng chói 33 z gm @ Hình 2.23 Ví dụ hình ảnh có kích thước q bé q mờ 33 Hình 2.24 Một số hình ảnh bị lệch khuôn mặt bị che khuôn mặt 34 l m co Hình 2.25 Hình ảnh sau chỉnh sửa kích thước 34 Hình 2.26 Minh họa phương thức làm phẳng (Flatten) 37 an Lu Hình 2.27 Minh họa mơ hình mạng sử dụng toán 38 n va ac th si 52 Kết nhận cuối sau thực phương pháp chuẩn bị liệu có :  mảng “train_x” và “train_y” là tập huấn luyện Mơ hình học từ liệu mảng  mảng “valid_x” vả “valid_y” là tập kiểm thử Sau mơ hình huấn luyện xong, chạy thử mô hình với liệu đầu vào từ valid_x để lấy kết quả, so sánh kết với liệu đối ứng từ valid_y để kiểm thử chất lượng mạng neuron lu 2.5.5 Huấn luyện mơ hình an n va Sau chuẩn bị liệu định nghĩa mơ hình mạng CNN liệu vào mơ hình để thực huấn luyện áp dụng kỹ thuật để hỗ trợ gh tn to sử dụng để phân loại độ tuổi xong mục Nhưng trước đưa p ie mơ hình huấn luyện hiệu đưa kết phân loại với độ xác cao hơn, số trường hợp để tránh Overfitting liệu huấn luyện Các kỹ nl w thuật sử dụng gồm có: tăng cường liệu (Data Augmentation) cân trọng d oa số (Weight balancing) lu va an  Tăng cường liệu: u nf Đầu tiên khai báo hàm “ImageDataGenerator()” để thực sinh liệu ll từ tập liệu huấn luyện mà dụng Để sử dụng hàm m oi phải nhập phương thức từ thư viện “Keras”: z at nh z m co l gm @ an Lu n va ac th si 53 lu an Trong hàm sinh liệu bao gồm nhiều tham số để thao tác với liệu n va chúng ta, thực phép quay hình ảnh với số tn to “rotation_rage” 30 tương đương với quay với góc 30 độ, phép dịch chiều ngang “width_shift” 20% phép dịch chiều dọc “height_shift” 20% p ie gh  Cân trọng số: nl w Chúng ta khai báo biến “weights” để lưu giá trị trọng số nhãn d oa mà thay đổi: ll u nf va an lu m oi Bước định nghĩa biến hàm sử dụng z at nh trình huấn luyện, bao gồm biến số vịng chạy huấn luyện mơ hình số batch, hàm lỗi hàm tối ưu Đầu tiên khai báo biến: z : Số lượng mẫu liệu batch m co l gm “batch_size” @ “epoch_num” : Số vịng chạy mơ hình 64 an Lu Với số vòng chạy “epoch” khai báo với 30 vòng “batch_size” n va ac th si 54 Tiếp theo khai báo hai hàm sử dụng trình huấn luyện cách gọi hàm “compile()” với tham số hàm “loss” hàm lỗi mà sử dụng, “optimizer” hàm tối ưu “metrics” độ đo Trong mơ hình khai báo hàm lỗi “categorical_crossentropy”, với thuật toán tối ưu sử dụng “Adam” với tham số “lr” hay “learning rate” 0,0002, độ đo khai báo Accuracy độ xác mơ hình lu Trong thư viện keras thực q trình huấn luyện mơ hình an phương thức “Fit()”, với tham số “x” liệu huấn luyện, “y” nhãn va n liệu huấn luyện, “batch size” số mẫu liệu batch, “epoch” số vịng huấn tn to luyện mơ hình, “validation data” tập liệu kiểm thử “class weight” mảng p ie gh giá trị trọng số thấy cụ thể sau: d oa nl w u nf va an lu ll Thực huấn luyện mơ hình, q trình huấn luyện minh họa với hình ảnh oi m bên (Hình 2.34) z at nh z m co l gm @ an Lu n va ac th si 55 lu an n va p ie gh tn to d oa nl w ll u nf va an lu m oi Hình 2.34 Q trình huấn luyện mơ hình Kết chương z at nh 2.6 Trong chương II, Luận văn trình bày giới thiệu mạng nơ ron tích chập, z gm @ cấu trúc mạng ứng dụng thực tế sử dụng mạng nơ ron tích chập Giới thiệu liệu sử dụng luận văn tiền xử lý liệu chuẩn bị cho mơ l m co hình mạng, sau xây dựng mơ hình mạng để giải toán phân loại độ tuổi người thực huấn luyện mơ hình Trong chương tơi đánh giá an Lu kết huấn luyện kiểm chứng mơ hình n va ac th si 56 CHƯƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM 3.1 Cài đặt môi trường thực huấn luyện thử nghiệm mạng nơ ron tích chập áp dụng liệu thực tế Trong q trình triển khai xây dựng mơ hình luận văn tơi áp dụng giải pháp phần mềm sau: Ngơn ngữ lập trình Python Python ngơn ngữ lập trình phổ biến cho nghiên cứu phát triển lĩnh vực học máy học sâu Python có nhiều thư viện hỗ trợ việc lu tính tốn số học, xử lý liệu, xử lý hình ảnh, dễ dàng triển khai thuật tốn an xây dựng mơ hình học máy va n Trong luận văng tơi ta sử dụng ngơn ngữ lập trình Python với phiên tn to Python 3.x cụ thể phiên 3.6.1 ie gh Cơng cụ mơi trường tích hợp mã nguồn Python sử dụng Jupyter p Notebook w Jupyter Notebook mơi trường tính tốn tương tác dựa web để tạo oa nl tài liệu sổ ghi chép Jupyter Nó hỗ trợ số ngôn ngữ Python (IPython), Julia, d R, v.v phần lớn sử dụng để phân tích liệu, trực quan hóa liệu tính lu va an toán tương tác, khám phá u nf Các thư viện hỗ trợ Python: ll - Keras: Framework mã nguồn mở hỗ trợ xây dựng thuật toán m oi học máy học sâu tảng ngôn ngữ Python Đặc biệt tập trung vào z at nh thử nghiệm với mơ hình mạng học sâu Thư viện đơn giản hóa việc thực mạng thần kinh Nó có chức tốt cho mơ z gm @ hình điện tốn, đánh giá tập liệu, hiển thị biểu đồ nhiều - Tensorflow: thư viện sử dụng phổ biến việc viết l cao liên quan đến mạng nơ-ron m co thuật toán học máy thực tính tốn mà u cầu chi phí tính tốn an Lu n va ac th si 57 - Pandas: Một thư viện khoa học liệu mã nguồn mở Python mạnh mẽ, hỗ trợ việc thu thập liệu vào cấu trúc (data frame) rõ ràng, cung cấp phân tích trực quan dễ dàng thao tác - OpenCV: (Open Source Computer Vision Library) thư viện mã nguồn mở thị giác máy (computer vision) học máy Cung cấp nhiều tính thao tác với liệu ảnh, xử lý ảnh - Mathplotlib: thư viện hỗ trợ Python xây dựng riêng cho việc biểu diễn liệu tạo biểu đồ mạnh mẽ Có nhiều công cụ để tạo nhãn, lưới, biểu tượng v.v lu - Numpy: thư viện python sử dụng đặc biệt để tính tốn an va liệu khoa học phép tính tốn học cung cấp nhiều tính hữu n ích cho phần thực phép toán n-arrays ma trận Thư to array NumPy, giúp cải thiện hiệu suất theo tốc độ tính tốn p ie gh tn viện cung cấp khả vector hóa vận hành toán định dạng - Scikit-learn: Là thư viện phần mềm miễn phí cho học máy, bao nl w gồm thuật toán phân loại, hồi quy phân cụm khác Được coi d oa thư viện tốt để làm việc với liệu phức tạp Ngoài ra, - Máy tính hệ điều hành Windows 10 - CPU Intel core i7 2680U 2.0GHz - RAM GB - SSD 256 GB ll u nf z at nh z Phương pháp đánh giá oi m 3.2 va Mối trường cài đặt: an lu Scikit-learn sử dụng kết hợp với NumPy SciPy @ gm Để đánh giá hiệu suất toán phân loại văn sử dụng độ l đo như: Accuracy, Precision, Recall, bảng Confusion matrix Được định nghĩa m co phần Để ước lượng độ đo này, dựa vào bảng sau: an Lu n va ac th si 58 Bảng 3.1 Bảng Confusion matrix Dự đoán Nhãn TN FP FN TP lu an Một số tiêu chí mơ tả độ hiệu mơ hình phân loại bao gồm có: n va  Accuracy : Khả mơ hình phân loại dự báo xác, phân loại tn to xác hay xác định nhãn lớp liệu cần phân loại Được ie gh tính công thức: p Accuracy= TP+TN ( TP+TN ) +(FP + FN ) nl w  Precision : Được định nghĩa xác suất mà liệu phân loại là d oa phân loại (độ xác lần dự đốn) Được tính toán ước an lu lượng sau: u nf va Precision= TP TP+ FP ll  Recall : Được định nghĩa xác suất mà liệu với nhãn m oi phân loại (độ xác dự đốn cho nhãn) Được tính z at nh tốn ước lượng sau: Recall= z TP TP+ FN m co l Đánh giá kết gm @ 3.3 Từ kết trình huấn luyện trên, thực kiểm chứng mơ an Lu hình sau huấn luyện với liệu kiểm chứng chuẩn bị trước sau: n va ac th si 59 Kết nhận được thể đây: lu an n va to tn Từ kết kiểm chứng với số đánh giá độ xác phân lớp mơ ie gh hình nhận mức tương đương 86.37% với liệu kiểm chứng p Chúng ta xem xét với độ đo khác Precision Recall từ kết đây: d oa nl w ll u nf va an lu oi m z at nh Hình 3.1 Kết kiểm chứng mơ hình Kết nhận từ ba độ đo thể bảng sau: z Recall 0.84 0.82 0.91 0.86 m co an Lu Precision 0.92 0.78 0.82 0.84 l Nhãn Middle Old Young Trung bình gm @ Bảng 3.2 Kết phân loại mô hình n va ac th si 60 Với số đo độ Precision cho thấy liệu kiểm chứng 84% liệu phân loại nhãn Độ đo Recall cho thấy mẫu liệu có nhãn phân loại phân loại nhãn với xác suất 86% Để đánh giá mô hình cụ thể xem kết phân loại nhãn, xem mơ hình có tỷ lệ phân nhãn nhãn với độ xác cách sinh bảng Confusion matrix đây: Bảng 3.3 Confusion matrix Dự đoán Old Young Middle 1346 73 178 Old 49 305 20 Young 73 13 921 lu Middle an n va to p ie gh tn Nhãn d oa nl w an lu Bảng 3.3 ma trận phân tích độ xác dự đốn nhãn sau chạy va mơ hình Chúng ta nhận xét thấy có số mẫu liệu phân loại sai u nf đặc biệt với mẫu có nhãn phân loại “Middle” thường nhận dạng sai sang ll Young nhiều so với “Old”, ngược lại mẫu có nhãn phân loại “Young” oi m nhận dạng sai nhiều sang mẫu có nhãn “Middle” so với nhãn “Old”.Ở z at nh thấy lý xảy lỗi phần hai độ tuổi gần nhau, z mức tuổi gần sát với nhau, nhãn phân loại “Young” phân loại cho gm @ người có độ tuổi từ 13 đến 30, với nhãn “Middle” người có l mức tuổi từ 31 đến 50 Do làm cho có tương tự người có m co mức tuổi gần 29, 30 với 31 tuổi Một nguyên nhân việc dự đoán sai nhãn bắt nguồn từ liệu ảnh đầu vào Các ảnh mặt người an Lu liệu IMFDB chưa thực rõ ràng để nhận độ tuổi xác người n va ac th si 61 hình ảnh dù người Có thể nhận thấy điều với ví dụ sau (Hình 3.2): lu an n va gh tn to p ie Hình 3.2 Ví dụ hình ảnh có độ tuổi trẻ “Young” (trái) ảnh có độ tuổi trung bình (Phải) nl w Từ bảng thấy kết phân loại đúng, sai d oa nhãn bảng 3.4 đây: phân Phân loại sai Tổng số mẫu 1346 251 1597 69 374 86 1007 ll Young 921 z at nh 305 oi Old m Middle Phân loại u nf loại va Nhãn an lu Bảng 3.4 Kết phân loại theo nhãn z gm @ Tại lớp có nhãn phân loại độ tuổi “Old” mơ hình phân loại 305 l mẫu tất 374 mẫu, tương đương với 81.55% Với lớp có nhãn phân loại m co Middle, mơ hình phân loại 1346 mẫu tổng số 1597 mẫu, chiếm 84,28% Tương tự, xác suất phân loại mẫu xác nhãn “Young” 91,46% an Lu n va ac th si 62 Nhận xét: Với kết đạt từ mơ hình cho thấy độ xác phân loại mơ hình tương đối ổn định chưa đạt kết tốt nhất, độ xác phân lớp nhãn độ tuổi già (Old) có độ xác tương đối thấp so với lớp khác Từ tơi nhận thấy hai vấn đề chưa giải đo toán là: Vấn đề xử lý liệu cân bằng, số tổng số mẫu liệu mang nhãn độ tuổi già chiếm 12% tất liệu Vấn đề thứ hai mơ hình phân loại, chưa xây dựng mơ hình tốt để thực toán phân loại độ tuổi với liệu này, hạn chế tài nguyên máy tính nên khơng khả xử lý mơ hình mơ hình với độ phức tạp cao với lu số tham số mơ hình cao an Kết chương n va 3.4 tn to Trong chương này, tơi trình bày mơi trường cài đặt, ngơn ngữ lập trình gh thư viện hỗ trợ sử dụng đưa kết quả, phương pháp p ie phân tích đánh giá mơ hình từ đánh giá kết đạt Ngoài ra, w đưa vấn đề ảnh hưởng đến độ xác mơ hình huấn luyện, từ d oa nl cải thiện độ xác mơ hình nghiên cứu sau tốt ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 63 KẾT LUẬN Trong luận văn này, tơi đề xuất mơ hình học sâu sử dụng mạng CNN để nhận diện độ tuổi người dựa vào hình ảnh khn mặt Mơ hình cho phép sử dụng số lượng nhỏ tham số đạt hiệu suất 86% Trong tương lai gần, tơi có kế hoạch cải thiện độ xác mơ hình, đặc biệt ước lượng độ tuổi cách thử áp dụng liệu tự thu thập giải vấn đề nhận dạng thời gian thực Mặt khác, áp dụng mơ hình tơi cho tốn khác lĩnh vực thị giác máy tính học sâu lu Những kết hoạt động luận văn: an Trong phạm vi luận văn , Tôi tìm hiểu hai phương pháp tiếp cận để va n giải toán phân loại độ tuổi dựa vào ảnh mặt người, phương pháp tn to học sâu phương pháp học máy truyền thống Từ đó, lựa chọn phương pháp học ie gh sâu để giải toán phân loại độ tuổi Tiếp theo, sâu vào tìm hiểu nghiên p cứu mơ hình mạng phổ biến học sâu – mạng nơ ron tích chập bao w gồm thành phần, kiến trúc mơ hình mạng, chức ứng dụng thực tế oa nl Cuối thực xây dụng mơ hình mạng nơ ron tích chập cho d tốn phân loại độ tuổi người hình ảnh Trong thực huấn luyện, điều lu va an chỉnh thông số mạng áp dụng kỹ thuật để đạt khả dự đoán độ tuổi với độ xác 86% u nf ll Luận văn cịn số vấn đề tiếp tục phát triển Do thời gian, kinh nghiệm, hạn m oi chế ngôn ngữ nên khơng tránh khỏi sai sót, kính mong thông cảm z at nh Thầy Cô, Nhà khoa học Định hướng phát triển luận văn z Hướng nghiên cứu luận văn tập trung vào phần xây dựng mô @ gm hình mạng phân loại độ tuổi người với độ xác cao hơn, sử dụng mơ m co l hình áp dụng nhiều tầng tích chập theo kiến trúc mạng VGGNet để phân tích đặc trưng chi tiết Thử nghiệp áp dụng kỹ thuật over-sampling vào liệu an Lu với nhãn phân loại già ”Old”, để tăng thêm độ cân liệu Hà nội, tháng năm 2020 n va ac th si 64 DANH MỤC CÁC TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phùng Thị Thu Trang, Ma Thị Hồng Thu, (2019), Một mơ hình Deep learning nhẹ cho tốn nhận dạng tuổi giới tính sử dụng mạng CNN, Khoa ngoại ngũ – ĐH Thái Nguyên, ĐH Tân Trào Tiếng Anh [2] Adit Deshpande Engineering at Forward, A Beginner's Guide To Understanding lu Convolutional Neural Networks, UCLA CS '19.  an n va [3] Andrej Karpathy, CS231n Convolutional Neural Networks for Visual tn to Recognition - Image Classification http://cs231n.github.io/classification/ gh [4] N Ramanathan and R Chellappa, (2006), “Modeling age progression in young p ie faces”, in Computer Vision and Pattern Recognition, 2006 IEEE Computer Society nl w Conference on, vol.1 IEEE, pp 387–394 oa [5] Tales Lima Fonseca,( Nov 3, 2017 ), What’s happening inside the Convolutional d Neural Network? The answer is Convolution, https://buzzrobot.com/whats- lu ll u nf 2c22075dc68d va an happening-inside-the-convolutional-neural-network-the-answer-is-convolution- oi m [6] Shankar Setty, Moula Husain, Parisa Beham, Jyothi Gudavalli, Menaka Kandasamy, Radhesyam Vaddi, Vidyagouri Hemadri, J C Karure, Raja Raju, Rajan, z at nh Vijay Kumar and C V Jawahar. "Indian Movie Face Database: A Benchmark for z Face Recognition Under Wide Variations" @ gm [7] L.Zhu, K.Wang, L.Lin, and L.Zhang, (2016), “Learning a light weight deep l convolutional network for joint age and gender recognition”,Pattern Recognition m co (ICPR), 2016 23rd International Conference on IEEE, pp 3282–3287 an Lu n va ac th si 65 Trang web [8] https://dlapplications.github.io/2018-07-06-CNN/, truy cập ngày 23/04/2020 [9] https://www.analyticsvidhya.com/blog/2017/06/hands-on-with-deep-learningsolution-for-age-detection-practice-problem/?utm_source=practice-problem-agedetection&utm_medium=Datahack, FAIZAN SHAIKH, ( JUNE 27, 2017 ), Hands on with Deep Learning – Solution for Age Detection Practice Problem, truy cập ngày 25/04/2020 [10] https://towardsdatascience.com/a-comprehensive-guide-to-convolutional- lu neural-networks-the-eli5-way-3bd2b1164a53 , truy câjp ngày 29/06/2020 an n va [11] https://www.freecodecamp.org/news/an-intuitive-guide-to-convolutional- tn to neural-networks-260c2de0a050/ , truy câjp ngày 29/06/2020 ie gh [12] https://towardsdatascience.com/activation-functions-neural-networks- p 1cbd9f8d91d6 , truy câjp ngày 29/06/2020 oa nl w [13] https://techblog.vn/dropout-trong-neural-network , truy câjp ngày 30/06/2020 d [14] https://topdev.vn/blog/ung-dung-convolutional-neural-network-trong-bai-toan- lu va an phan-loai-anh/ , truy cập ngày 30/06/2020 ll u nf [15] http://cvit.iiit.ac.in/projects/IMFDB/ , truy cập ngày 30/06/2020 oi m [16] https://forum.machinelearningcoban.com/t/tong-hop-data-augmentation-trong- z at nh thi-giac-may-update-22-06-2019/5323 , truy cập ngày 30/06/2020 [17] https://quantrimang.com/su-khac-biet-giua-ai-hoc-may-va-hoc-sau-157948, z m co l gm @ truy cập ngày 30/06/2020 an Lu n va ac th si 66 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si

Ngày đăng: 12/07/2023, 17:27

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan