Phân loại voucher sử dụng mô hình học máy

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI TRƯỜNG ĐIỆN – ĐIỆN TỬ BÁO CÁO LUẬN VĂN THẠC SỸ Đề tài: PHÂN LOẠI VOUCHER SỬ DỤNG MƠ HÌNH HỌC MÁY Học viên thực hiện: GIÁP THỊ NGUYỆT Lớp 20BKTĐT MSHV: 20202445M Giảng viên hướng dẫn: PGS.TS NGUYỄN HỮU PHÁT Hà Nội, – 2023 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI TRƯỜNG ĐIỆN – ĐIỆN TỬ BÁO CÁO LUẬN VĂN THẠC SỸ Đề tài: PHÂN LOẠI VOUCHER SỬ DỤNG MƠ HÌNH HỌC MÁY Học viên thực hiện: GIÁP THỊ NGUYỆT Lớp 20BKTĐT MSHV: 20202445M Giảng viên hướng dẫn: PGS.TS NGUYỄN HỮU PHÁT Hà Nội, – 2023 LỜI CẢM ƠN Lời tơi xin gửi lời cảm ơn lịng biết ơn sâu sắc đến thầy giáo PGS.TS Nguyễn Hữu Phát, người giúp chọn đề tài, định hướng tận tình bảo, hướng dẫn tơi suốt q trình thực luận văn Tơi xin chân thành cảm ơn quý thầy, cô giáo Trường Điện Điện tử, Đại học Bách khoa Hà Nội Các thầy, cô giáo dạy bảo truyền đạt nhiều kiến thức, giúp tơi có tảng kiến thức vững trình học tập Đại học Bách khoa Hà Nội Một lần nữa, xin cảm ơn q thầy cơ, tơi kính chúc thầy ln có sức khỏe thật tốt để dìu dắt nhiều hệ sinh viên với kiến thức hay bổ ích Tơi xin chân thành cảm ơn! TĨM TẮT NỘI DUNG LUẬN VĂN Trí tuệ nhân tạo phát triển, ảnh hưởng thiết thực đến ngành công nghiệp lớn giới Trong nhiều lĩnh vực, phân loại ảnh toán ứng dụng rộng rãi, phần quan trọng việc xây dựng hệ thống truy vấn vấn ảnh dựa thông tin ảnh Với mục đích phân loại ảnh vào nhiều thể loại xác định Ứng dụng công nghệ phân loại phát triển mạnh nhiều lĩnh vực, bên cạnh đó, năm gần đây, ứng dụng học máy vào hoạt động kinh tế, kinh doanh đạt lợi ích chưa có Với ứng dụng thực tế đời sống việc phân loại ảnh, cụ thể phân loại voucher siêu thị lớn giúp siêu thị, nhà phân phối sản phẩm hiểu rõ sản phẩm, nhu cầu khách hàng cho sản phẩm thể Điều sở để phát triển chiến lược kinh doanh, tạo sản phẩm kế tiếp, cho phù hợp với cầu người tiêu dùng.Tuy nhiên với số lượng liệu voucher khổng lồ, để đưa phân loại voucher thuộc sản phẩm nào, nhà cung cấp nhanh xác cơng việc thực tay Thêm xuất thêm ảnh liệu chưa đào tạo phải giải khơng đào lại model Vì nhận thấy cần thiết việc đề xuất hệ thông tự động phân loại ảnh ứng dụng thị giác máy tính nhằm giải vấn đề cho việc phân loại Luận văn Thạc sĩ với đề tài “Phân loại voucher sử dụng mơ hình học máy “ tập trung vào vấn đề sau: Tìm hiểu, nghiên cứu chuyên sâu phương pháp phân loại ảnh có Các kỹ thuật thực toán phân loại ảnh, cách tạo thực tốn Tìm hiểu, so sánh đưa phương pháp đề xuất để xử lý tốn Cuối q trình thực hiện, đưa kết quả, đánh giá, phân tích đưa giải pháp tương lai Các vấn đề giải trình tìm hiều nghiên cứu cách khách quan, nghiêm túc Kết nghiên cứu tổng hợp đúc kết lại thành kiến thức, kỹ áp dụng trực tiếp vào sản phẩm thực tiễn Kết cuối mà luận văn hướng đến tổng hợp đúc kết lại kiến thức, hiểu biết trí tuệ nhân tạo, toán phân loại ảnh, bước thực hiện, từ việc chuẩn bị liệu, xử lý, đào tạo, đưa kết quả, đánh giá cải tiến model Đảm bảo kết đầu có kết xác nhất, đưa hiệu hệ thống đề xuất Luận văn mở nhiều hướng nghiên cứu lĩnh vực trí tuệ nhân tạo Cịn có nhiều đề mà gặp phải trị thực ứng dụng thực tế Kết xác, tốc độ thực hiện, hiệu suất, thêm liệu liệu sau thời gian sử dụng lâu dài Hà Nội, ngày tháng năm 2023 Học viên (Ký ghi rõ họ tên) MỤC LỤC DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT i DANH MỤC HÌNH VẼ ii DANH MỤC BẢNG BIỂU iii CHƯƠNG GIỚI THIỆU CHUNG 1.1 Giới thiệu chung 1.2 Bài toàn phân loại ảnh 1.2.1 Khái niệm 1.2.2 Các kỹ thuật phân loại ảnh 1.2.2.1 Phân loại có giám sát 1.2.2.2 Phân loại không giám sát (Unsupervised learning) 1.2.3 Một số thuật toán dùng toán phân loại 1.2.3.1 Support Vector Machine (SVM) 1.2.3.2 Decision Tree (Cây định) 1.2.3.3 Artificial Neural Network – ANNs (Mạng nơ-ron nhân tạo) 1.2.3.4 Convolutional Neural Networks – CNNs (Mạng nơ ron tích chập) 1.2.4 Những vấn đề đặt toán phân loại voucher 1.3 Ý tưởng xây dựng hệ thống kỹ thuật sử dụng 1.4 Các kỹ thuật đề xuất 11 1.4.1 Kỹ thuật trích lọc đặc trưng 11 1.4.2 Kỹ thuật phân loại 11 1.5 Kết luận 11 CHƯƠNG CƠ SỞ LÝ THUYẾT 12 2.1 Ảnh số số không gian màu biểu diễn ảnh số 12 2.1.1 Phân loại ảnh số 12 2.1.2 Các không gian màu biểu diễn ảnh số 13 2.1.2.1 Không gian màu RGB 14 2.1.2.2 Không gian màu HSV 14 2.2 Xử lý ảnh số 15 2.3 Tổng quan Convolution Neural Network 18 2.3.1 Giới thiệu tổng quan 18 2.3.2 Kiến trúc CNN 18 2.3.2.1 Convolution layer 19 2.3.2.2 Pooling layer – Lớp tổng hợp 21 2.3.2.3 Fully Connected layer 21 2.3.3 Các hàm kích hoạt (Activation Function) 22 2.4 Thuật toán tối ưu 26 2.4.1 Gradient Descent (GD) – Giảm dần độ dốc 26 2.4.2 Stochastic Gradient Descent (SDG) 27 2.4.3 Monentum 27 2.4.4 Nesterov accelerated gradient (NAG) 29 2.4.5 Adagrad 29 2.4.6 RMSprop 30 2.4.7 Adam 31 2.5 Auto-encoder 31 2.5.1 Tổng quan 31 2.5.2 Cấu trúc Auto-encoder 32 2.6 Siamese Neural Networks 33 2.7 Kết luận 34 CHƯƠNG THIẾT KẾ HỆ THỐNG, KIỂM THỬ VÀ ĐÁNH GIÁ KẾT QUẢ 35 3.1 Bài toán đặt 35 3.1.1 Mô tả tốn, quy trình khối thực 35 3.1.2 Tạo liệu 37 3.2 Quá trình thực 38 3.2.1 Tiền xử lý 38 3.2.2 Quá trình đào tạo 39 3.2.2.1 Khối trích xuất đặc trưng – AutoEncoder 39 3.2.2.2 Khối phân loại siamese neural network 41 3.2.3 Các số đánh giá (Metrixs) 43 3.2.4 Cấu hình sử dụng 43 3.3 Quá trình đánh giá tập test 44 3.3.1 Chuyển model sang dạng onnx 44 3.3.2 Tạo cở sở lưu trữ liệu chuẩn 44 3.3.3 Đánh giá 45 3.4 Kết 46 3.4.1 Kết trích xuất đặc trưng dùng AutoEnconder 46 3.4.2 Kết với model phân loại 47 3.5 Đánh giá kết 48 3.6 Kết luận 49 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50 TÀI LIỆU THAM KHẢO 51 DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT VIẾT TẮT TIẾNG ANH TIẾNG VIỆT AdaGrad Adaptive Gradient Algorithm Thuật tốn Gradient thích ứng AI Artificial Intelligent Trí tuệ nhân tạo ANN Artificial Neural Network Mạng nơ-ron nhân tạo CNN Convolution Neural Network Mạng nơ-ron tích chập DB Database Cơ sở liệu DenseNet Dense Convolutional Network Mạng Tích chập Kết nối Dày đặc GD Gradient Descent Suy giảm độ dốc NAG Nesterov Accelerated Gradient Nesterov tăng tốc độ dốc ReLU Rectified Linear Unit Đơn vị tuyến tính chỉnh lưu Resnet Residual networks Mạng phần dư RMSprop Root Mean Square Propagation Lan truyền bình phương trung bình gốc SDG Stochastic Gradient Descent Độ dốc ngẫu nhiên SNN Siamese Neural Network Mạng nơ-ron siamese SVM Support vector machine algorithm Máy vector hỗ trợ i khác RGB cách máy tính xử lý màu sắc HSV cố gắng nắm bắt thành phần theo cách người cảm nhận màu sắc Trong HSV “H” đại diện cho màu sắc, “S” biểu thị lượng màu tương ứng trộn vào với màu trắng ‘V’ biểu thị lượng mà màu tương ứng trộn vào màu đen (Mức xám) Trong RGB tách biệt thơng tin màu từ độ chói HSV sử dụng để tách độ chói hình ảnh khỏi thơng tin màu sắc Cho ví dụ, hai sắc thái màu đỏ có giá trị H giống nhau, giá trị RGB khác nhiều Trong thực tế, toán dựa theo dõi hay nhận dạng đối tượng theo màu sắc HSV tốt nhiều so với RGB 3.2.2 Quá trình đào tạo Trong trình đào tạo gồm hai khối chính: Là khối trích xuất đặc trưng ảnh khối phân loại Học viên vào chi tiết khối: 3.2.2.1 Khối trích xuất đặc trưng – AutoEncoder Trên thực tế mẫu liệu hình ảnh mang nhiều thuộc tính Mà thuộc tính đưa trực tiếp vào mơ hình đoán làm cho tốc độ training mơ hình bị giảm rõ rệt Trích xuất thơng tin đặc trưng tiến trình dùng đề giảm chiều liệu cho liệu ban đầu chuyển đổi sang dạng đơn giản nhỏ Trong nghiên cứu [22] học viên sử dụng auto-encoder để học đặc trưng ảnh cho việc chuyển đổi hỉnh ảnh phác thảo thơ sang hình ảnh khn mặt thật Trong nghiên cứu học viên đánh giá tập liệu gồm 556 ảnh khuôn mặt bạn học sinh có độ tuổi từ 15-18, kết đưa có kết tốt Dựa vào làm tiền đề để áp dụng phương pháp dùng auto-encoder học đặc trưng ảnh cho liệu khơng cần gán nhãn tốn cần giải luận văn Với khối trích xuất dặc trưng này, học viên dùng Autoencoder thuật toán machine learning học khơng giám sát, ta cần đưa ảnh vào mà không cần nhãn dán vào cho ảnh Trước đưa vào model ảnh chuyển qua hệ màu HSV resize kích thước (256,512) để tăng cường ảnh cho phần đào tạo này, việc thêm augmentation phù hợp Loss function 39 Sigmoid_focal_cossentropy Focal loss giới thiệu báo RetinaNet [23] Focal loss phù hợp liệu data class không cân Hàm loss khái quát hóa binaty cross-entropy việc thêm tham số 𝛾𝛾 (gamma), gọi tham số tập trung, cho phép ví dụ khó phân loại bị phạt nặng so với ví dụ dễ phân loại ∧ ^ ^ ^γ ^ L( y, p= ) α y (1 − p )γ log( p ) − (1 − y ) p log(1 − p ) (13) Trong đó: • 𝓅𝓅̂ ∈ [0,1] ước lượng xác suất positive class • 𝑦𝑦 ∈ {0,1} nhãn lớp nhị phân • 𝛾𝛾 tham số tập trung Hyperparameters Sau có liệu, lựa chọn hàm loss, tạo model Công việc tiến hành đào tạo Các tham số chọn batch_size = 512, với optimizer la Nadam với leanring_rate = 1e-4, loss SigmoidCrossEntropy() Chạy với epochs = 500 steps_per_epoch = 100 Kiến trúc model khối tốn Hình 3.4 Kiến trúc model Auto-encoder Học viên tạo model với lớp tích chập (Conv2D, Upsampling2D), pooling, hàm kích hoạt 40 3.2.2.2 Khối phân loại siamese neural network Tạo liệu cho khối phân loại Do khối phân loại dùng siamese neural network gồm hai mạng giống hệt Dữ liệu đưa vào model siamese cặp liệu kèm với label chúng Cặp ảnh có class có label 1, cặp khác class có label Trong thực tế đưa vào hệ thống phân loại hình ảnh, việc đưa ngẫu nhiên ảnh vào, máy không phân biệt ảnh ta đưa vào ngược xi, nên ta cần xử lý chúng để phần phân loại có kết xác Và để model phần biệt ảnh xuôi ảnh ngược cặp class hay khác class, liệu đề tài học viên tạo sau: Ta chia data thành hai dạng cặp • Positive pair: Là cặp có class dạng xuôi ngược gắn label Bảng 3.1:Cặp liệu positive pair Label Cặp ảnh Normal – Normal Rot – Rot • Negative pair: Là cặp có label Và cặp chia bảng Bảng 3.2: Cặp liệu negative pair Cặp ảnh Label Normal – Normal +1 Rot – Rot +1 Rot – Normal Normal +1 - Rot Trong đó: • Normal ảnh class dạng xi • Rot ảnh class dạng ngược 41 Khối thực sau khối trích xuất đặc trưng đào tạo xong Và lấy kết model khối trích xuất nhiên đóng băng phần giải mã hóa phần đầu vào hai mạng siamese Hình 3.5 Khối phân loại Hyperparameters Các hyperparameters chọn batch_size = 32, với optimizer Nadam với learning_rate = 1e-4, loss binary_crossentropy, với metrics: BinaryAccuracy, Precision, Recall Chạy với epochs = 500 steps_per_epoch = 10 42 3.2.3 Các số đánh giá (Metrixs) Bảng 3.3: Confusion matrix [24] Thực tế Positive Negative Positive True Positive (TP) False Positive (FP) Lỗi loại I Negative False Negative (FN) Lỗi loại II True Negative (TN) Recall= TP/ (TP+FN) False positive rate (FPR)=FP/(FP+TN) Precision= TP/(TP+FP) Dự đoán Từ Bảng 3.3 ta dễ dàng hình dung ý nghĩa số là: • Precision: Mức độ dự báo xác trường hợp dự báo Positive • Recall: Mức độ dự báo chuẩn xác trường hợp Positive trường hợp thực tế Positive 3.2.4 Cấu hình sử dụng Bảng 3.4: Thơng tin cấu hình máy sử dụng Processor Intel(R) Core (TM) i9-7920X CPU @ 2.90GHz Ram 64GB GPU1 NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] GPU2 NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] Cuda version 11.2 43 3.3 Quá trình đánh giá tập test 3.3.1 Chuyển model sang dạng onnx Ngày bên cạnh nghiên cứu mơ hình học sâu xác hơn, nhanh việc ứng dụng đưa mơ hình học sâu sản phẩm thực tế không phần quan trọng Đặc biệt việc chuyển mơ hình viết framework sang framework khác, thư viện có hàm kiểu liệu khác Để việc sử dụng model nhiều framework khác nhau, lúc ta cần dạng liệu chuẩn cho hàm dạng liệu để chuyển đổi Và ONNX chìa khóa để giải tất vấn đề ONNX viết tắt Open Neural Network Exchange [25], cơng cụ đóng vai trị trung gian hỗ trợ chuyển đổi mơ hình học máy từ framework khác ONNX cung cấp: • Cung cấp đồ thị biểu diễn chuẩn: Mỗi framework khác có đồ thị biểu diễn tính tốn khác ONNX cung cấp đồ thị chuẩn biểu diễn nhiều nút tính tốn biểu diễn đồ thị tất framework • Cung cấp kiểu liệu chuẩn: ONNX cung cấp kiểu liệu chuẩn bao gồm int8, int16, float16, • Cung cấp hàm chuẩn: ONNX cung cấp hàm chuyển đổi với hàm tương ứng framework mong muốn Ví dụ hàm softmax torch chuyển tương ứng thành hàm softmax ONNX Vì tốn sau q trình đào tạo hồn thiện cho hai khối trích xuất khối phân loại Học viên chuyển đổi hai model khối dạng ONNX để dễ dàng sữ dụng 3.3.2 Tạo cở sở lưu trữ liệu chuẩn Sau chuyển đổi model sang dạng onnx, học viên sử dụng model khối trích xuất đặc trưng để tạo liệu chuẩn cho việc đánh giá model Để đánh giá kết phân loại phần ta cần có ảnh chuẩn tạo database cho class Để đem phân loại ảnh đưa vào thuộc class Vì 44 dùng cho việc đánh giá, liệu học viên dùng tệp csv để lưu cột, thông số class Database có cấu trúc bảng Bảng 3.5: Cấu trúc tập liệu chuẩn ID Extract_up Extract_down Is_updown date Trong đó: • ID tên class • Extract_up: Là đặc trưng ảnh dạng bình thường • Extract_down: Là đặc trưng ảnh dạng xoay ngược • Is_updown: Để xác định ảnh đầu vào xi hay ngược • Date: Ngày thêm liệu vào database Sau tạo DB xong, ta tiến hành đưa ảnh vào phần extract để đưa vector đặc trưng (h2) ảnh Sẽ tính tốn |h2 - Extract_up| |h2Extract_down| đưa qua hàm sigmoid trả giá trị lấy kết cao Sau ta biết ảnh đưa vào thuộc class nào, ngược hay xuôi Với ảnh đưa vào ảnh ngược ta lấy flag ( is_updown) từ phản hồi ảnh xuôi 3.3.3 Đánh giá Sau tạo database từ liệu chuẩn mà model trích xuất Ta tiến hành trình đánh giá với tập test gồm 1631 ảnh phân bố không class Quá trình đánh Hình 3.6 bên 45 Hình 3.6 Khối đánh gía ảnh test Để đưa score cuối cùng, ta tính distance ảnh đầu vào so với tất đặc trưng có database đưa độ giống cặp ảnh đó, sau lấy giá trị độ giống lớn ảnh đầu vào ảnh có database kết cuối 3.4 Kết 3.4.1 Kết trích xuất đặc trưng dùng AutoEnconder Để đánh giá với trích xuất đặc trưng học viên minh họa số đầu vào đầu bảng 3.6 gồm tên class, đầu vào (input), đầu (output) sau được giải mã hóa lại từ feature trích xuất Bảng 3.6 Một số kết model AutoEncoder Class 46 Input Output food_beer_beercomm-A-23 shohinken_credit_jcbgiftcard20142018-1000 shohinken_depart-super_7i500 Jbcgiftcard-2019-2020-500 3.4.2 Kết với model phân loại Để đánh giá model học viên sử dụng tập test thực tế gồm 1631 ảnh, xoay chúng 180 để đánh giá độ xác với tập ảnh ngược xi Bảng 3.7: Kết độ xác tập real test Tập ảnh Xi Ngược Độ xác 99.57% 99,57% Bên cạnh học viên minh họa số kết đánh giá với tập ảnh Bảng đánh giá bao gồm cột gồm name (Tên class_số thứ tự ảnh class_a.jpg), id tên class ảnh dự đoán, score độ giống hai ảnh giá trị khoảng (0,1) giá trị gần độ giống cao, ảnh predict ảnh đầu vào, ảnh id ảnh chuẩn để tạo database chuẩn 47 Bảng 3.8: Một số kết phân loại 3.5 Đánh giá kết Nhìn vào Bảng 3.7 Bảng 3.8 ta đánh giá kết hệ thống có độ xác cao Tuy nhiên có trường hợp bị phân loại sai ảnh bị chi tiết nhiều qua trình scan bị lỗi, dự đốn đứng giá trị dự đốn thấp ví dụ Bảng 3.9 Và dựa vào để đưa phương pháp cải tiến tương lai Bảng 3.9: Một số trường hợp lỗi 48 name id score 1_0_384_r_a.jp g 0.0016973913 ảnh predict ảnh id 1_0_385_r_a.jp g 0.0004906058 Bảng 3.9 cho ta thấy ảnh dự đốn sai class có score thấp Ảnh predict đưa vào dự đốn có phần background màu trắng chứa nhiều, nguyên nhân trình scan ảnh đầu vào bị lỗi Đây nguyên nhân làm cho việc trích suất đặc trưng ảnh dự đoán bị lệch nhiều so với ảnh lưu trữ (ảnh id) sở liệu Vậy với trường hợp phân loại sai ta nên: • Đưa ảnh phân loại sai quay trở lại phân loại với phương pháp thủ công để đưa phân loaj • Kiểm tra lại q trình scan ảnh đầu vào hệ thống 3.6 Kết luận Chương trình bày kết thử nghiệm cho để pháp đề xuất Đánh giá phân tích lỗi gặp phải để đưa hướng phát triển để đạt kết tốt 49 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Sau tìm hiểu, nghiên cứu thử nghiệm, học viên hoàn thành luận với đề tài “Phân loại voucher sử dụng mơ hình học máy” Trong luận văn học học viên đưa nội dung sau: • Tìm hiểu sở lý thuyết o Các toán phân loại ảnh, số kỹ thuật giải toán o Tìm hiểu mạng nơ-ron nhân tạo, cấu trúc tạo nên mạng nơ-ron kỹ thuật cải thiện model o Mơ hình trích xuất đặc trưng ảnh, mơ hình phân loại ảnh dùng model siamese • Cách tìm tạo liệu cho việc đào tạo thử nghiệm • Đánh giá đưa kết model Bên cạnh đó, mơ hình nhận phân loại sai vài trường hợp ảnh đầu vào có đặc trưng bị nhiều so với ảnh gốc Với kiến thức kỹ có từ việc nghiên cứu thực luận văn, tương lai học viên tiếp tục thu nhập liệu nghiên cứu hướng cải thiện model để đưa để mang lại hiệu cao áp dụng vào thực tiễn Thêm để hoàn thiện hồn thiện hệ thơng hồn chỉnh cần phải khối nhỏ nhận diện ký tự quang học OCR, để đưa kỹ tự mã voucher từ biết voucher có giá trị giảm bảo nhiêu Vì tương lai mục tiêu học viên: • Cải thiện độ xác cho hệ thống • Thêm khối nhận diện ký tự quang học • Xây dựng sản phẩm hồn ứng dụng thực tế 50 TÀI LIỆU THAM KHẢO [1] "Learn How to Use Support Vector Machines (SVM) for Data Science," [Online] Available: https://www.analyticsvidhya.com/blog/2017/09/understaing-supportvector-machine-example-code/ [Accessed 20 Mar 2023] [2] "Decision Tree Algorithm, Explained," [Online] Available: https://www.kdnuggets.com/2020/01/decision-tree-algorithmexplained.html [Accessed 21 Mar 2023] [3] "CS231n Convolutional Neural Networks for Visual Recognition," [Online] Available: https://cs231n.github.io/neuralnetworks-1/ [Accessed 21 Mar 2023] [4] "[Cẩm nang AI] Artificial Neural Network gì? Cấu trúc, cách hoạt động ứng dụng mơ hình này," [Online] Available: https://viettelidc.com.vn/tin-tuc/cam-nang-ai-artificial-neuralnetwork-la-gi-cau-truc-cach-hoat-dong-va-ung-dung-cua-mo-hinhnay [Accessed 30 Mar 2023] [5] "Understanding Color Spaces and Color Space Conversion," [Online] Available: https://www.mathworks.com/help/images/understanding-colorspaces-and-color-space-conversion.html [Accessed 21 Mar 2023] [6] "Digital Image Processing Basics," [Online] Available: https://www.geeksforgeeks.org/digital-image-processing-basics/ [Accessed 22 Mar 2023] [7] "Tìm Hiểu Convolutional Neural Networks Cho Phân Loại Ảnh," [Online] Available: https://pbcquoc.github.io/cnn/ [Accessed 22 Mar 2023] [8] "Zero-Padding in Convolutional Neural Networks," [Online] Available: https://medium.com/@draj0718/zero-padding-inconvolutional-neural-networks-bf1410438e99 [Accessed 23 Mar 2023] [9] "Thuật tốn CNN gì? Cấu trúc mạng Convolutional Neural Network," [Online] Available: https://topdev.vn/blog/thuat-toancnn-convolutional-neural-network/ [Accessed 22 Mar 2023] [10] "CS231n Convolutional Neural Networks for Visual Recognition," [Online] Available: https://cs231n.github.io/neuralnetworks-1/ [Accessed 23 Mar 2023] 51 52 [11] "Sigmoid function," [Online] Available: https://en.wikipedia.org/wiki/Sigmoid_function [Accessed 23 Mar 2023] [12] "CS231n: Convolutional Neural Networks for Visual Recognition," [Online] Available: https://cs231n.github.io/neuralnetworks-1/ [Accessed 23 Mar 2023] [13] D Misra, "Mish: A Self Regularized Non-Monotonic Activation Function," in British Machine Vision Virtual Conference, UK, 2020 [14] "Optimizer- Hiểu sâu thuật toán tối ưu ( GD,SGD,Adam, )," [Online] Available: https://viblo.asia/p/optimizer-hieu-sau-ve-cac-thuat-toan-toi-uugdsgdadam-Qbq5QQ9E5D8 [Accessed 25 Mar 2023] [15] "Momentum Method and Nesterov Accelerated Gradient," [Online] Available: https://medium.com/konvergen/momentummethod-and-nesterov-accelerated-gradient-487ba776c987 [Accessed 25 Mar 2023] [16] "Intuition of Adam Optimizer," [Online] Available: https://www.geeksforgeeks.org/intuition-of-adam-optimizer/ [Accessed 25 Mar 2023] [17] D K N a R G Bank, "Autoencoders," ArXiv, 2020 [Online] Available: https://doi.org/10.48550/arXiv.2003.05991 [Accessed 25 Mar 2023] [18] Huu, P.N., Thi, N.G., Manh, H.T., Hai, T.L.T., Trong, H.N., Ngoc, P.P, "Proposing System for Classifying Voucher Images Using Siamese Model," in Intelligent Systems and Networks, Singapore, 2022 [19] "Tìm hiểu Siamese Neural Network," [Online] Available: https://tiensu.github.io/blog/55_siamese_network/ [Accessed 25 Mar 2023] [20] "Ticket shop/cheap tickets at Ticket Ranger," [Online] Available: https://www.ticketlife.jp/ [Accessed 25 Mar 2023] [21] C Poynton, "A Guided Tour of Color Space, New Foundations for Video Technology," in the SMTPE Advanced Television and Electronic Imaging Conference, 1995 [22] P N H a N G Thi, "Proposal of image generation model using cGANs for sketching faces," Jurnal Informatika (JIFO) Journal, vol 15, no 2, p 15 pages, 2021 [23] P G R G K H a P D T Lin, "Focal loss for dense object detection," in IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018 [24] "What is a Confusion Metrics in Machine Learning," [Online] Available: https://machinelearningmastery.com/confusion-matrixmachine-learning [Accessed 25 Mar 2023] [25] "Chuyển đổi mơ hình học sâu ONNX," [Online] Available: https://viblo.asia/p/chuyen-doi-mo-hinh-hoc-sau-ve-onnxbWrZnz4vZxw [Accessed 25 Mar 2023] 53

Định dạng
Số trang	65
Dung lượng	1,29 MB