Tìm hiểu về nhận dạng ảnh

30 27 0
Tìm hiểu về nhận dạng ảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM BÁO CÁO ĐỒ ÁN ĐỀ TÀI: Tìm hiểu nhận dạng ảnh Giảng viên hướng dẫn: Thầy Mai Trọng Khang Sinh viên thực hiện: Sơn Ngọc Minh 19521853 Phạm Hiểu Vy 19520358 Tp Hồ Chí Minh, tháng 12 năm 2021 LỜI CẢM ƠN Lời đầu tiên, em xin bày tỏ lòng biết ơn sâu sắc đến thầy Mai Trọng Khang – Giảng viên hướng dẫn chúng em thực Đồ án 1, thầy đồng hành tận tình hướng dẫn cho chúng em qua giai đoạn đồ án Nhờ có giúp đỡ nhiệt tình thầy mà chúng em hồn thành được đồ án cách tốt Vì kiến thức chúng em cịn hạn hẹp nên khơng thể tránh khỏi thiếu sót q trình thực đồ án Tuy nhiên, chúng em cố gắng hoàn thành hạn hạn chế lỗi nhiều Nhóm chúng em ln mong đợi nhận ý kiến đóng góp quý báu từ thầy qua rút kinh nghiệm, tự sửa chữa, hồn thiện thân tinh thần nghiêm túc, tự giác học hỏi Trong trình làm đề tài báo cáo, tránh khỏi thiếu sót, mong nhận phản hồi từ thầy bạn để góp phần làm cho báo cáo thêm hoàn thiện Chân thành cảm ơn thầy! NHẬN XÉT (Của giảng viên hướng dẫn) ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… Mở đầu I Lý chọn đề tài Mục tiêu nghiên cứu Phương pháp nghiên cứu II Machine learning Tổng quan Phân loại thuật toán ML 2.1 Phân loại dựa phương thức học a Học có giám sát b Học không giám sát c Học bán giám sát d Học củng cố 2.2 Phân loại dựa thuật toán 2.2.1 Regression Algorithms a Linear Regression b Logistic Regression c Stepwise Regression 2.2.2 Classification Algorithms a Linear Classifier b Support Vector Machine (SVM) 10 c Kernel SVM 10 2.2.3 Instance-based Algorithms 10 a K-Nearest Neighbor (KNN) 10 b Learning Vector Quantization (LVQ) 11 2.2.4 Clustering Algorithms 12 a K-Means clustering 12 b K-Medians 12 2.2.5 Artificial Neural Network Algorithms 13 a Perceptron 13 b Softmax Regression 13 c Multi-layer Perceptron 13 2.2.6 Dimensionality Reduction Algorithm 14 a Principal Component Analysis (PCA) 14 b Linear Discriminant Analysis (LDA) 15 III Bài toán nhận dạng tiền mặt 15 Keras 15 Convolutional Neutral Network (CNN) 16 VGG16 21 Transfer Learning 22 Các bước thực toán nhận diện tiền mặt 22 IV Kết luận hướng phát triển 29 Kết đạt 29 Hạn chế 29 Hướng phát triển 30 TÀI LIỆU THAM KHẢO 30 I Mở đầu Lý chọn đề tài Machine Learning thuật ngữ mà thường hay nghe đến lĩnh vực công nghệ thơng tin cụ thể trí tuệ nhân tạo Thực chất lĩnh vực trí tuệ nhân tạo, lĩnh vực quan trọng khoa học máy tính, ứng dụng rộng rãi khắp lĩnh vực đời sống cách mạng công nghiệp 4.0 Hiện nay, Machine Learning tỏ hiệu quả, hẳn người cụ thể lĩnh vực mà chúng áp dụng Trong số không kể đến nhận dạng ảnh, chẩn đốn y khoa, dự báo thời tiết, … Vì vậy, nhận thấy nhận dạng ảnh lĩnh vực ngày phổ biến, có tính ứng dụng cao rộng rãi với nhiều mặt sống Nhóm em định chọn đề tài tìm hiểu nhận dạng ảnh cụ thể nhận dạng tiền mặt sử dụng thư viện Keras mạng CNN (VGG16) Mục tiêu nghiên cứu Mục tiêu nghiên cứu đồ án tìm khái quát Machine Learning nhận dạng ảnh Qua xây dựng, huấn luyện mơ hình Machine Learning nhận dạng tiền mặt đơn giản Phương pháp nghiên cứu Qua việc tham khảo tài liệu Internet dẫn giảng viên, nhóm em xây dựng hệ thống nhận diện tiền mặt đơn giản dựa mạng VGG16 kĩ thuật Transfer Learning với hỗ trợ từ thư viện Keras II Machine learning Tổng quan Machine Learning tập AI (Artificial Intelligence – Trí tuệ nhân tạo) Nói đơn giản Machine Learning lĩnh vực nhỏ Khoa học máy tính, có khả tự học hỏi dựa liệu đưa vào mà khơng cần phải lập trình cụ thể Machine Learning làm cho máy tính có khả nhận thức người nghe, nhìn, hiểu ngơn ngữ, giải tốn, lập trình, … hỗ trợ người việc xử lý khối lượng lớn thông tin khổng lô mà phải đối mặt ngày, hay gọi Big Data Phân loại thuật toán ML 2.1 Phân loại dựa phương thức học a Học có giám sát Học có giám sát (Supervised Learning) mơ hình học sử dụng thuật toán dự đoán đầu (outcome) liệu (new input) dựa cặp (input, outcome) biết từ trước Cặp liệu cịn gọi (observation, label) : - Observation : kí hiệu x, input tốn Observation thường có dạng vector x = (x1, x2, …, xn), gọi feature vector Mỗi xi gọi feature Label : kí hiệu y, output tốn Mỗi observation có label tương ứng tạo thành cặp (observation, label) Các cặp liệu (input, outcome) biết trước gọi training data (dữ liệu huấn luyện) Học có giám sát mơ việc người học cách đưa dự đoán cho câu hỏi, sau đối chiếu với đáp án Sau rút phương pháp để trả lời khơng câu hỏi đó, mà cho câu hỏi có dạng tương tự Trong học có giám sát, observation bắt buộc phải dán nhãn trước Đây nhước điểm phương pháp này, khơng phải lúc việc dán nhãn xác cho observation dễ dàng Học có giám sát thường chia làm loại : - Phân loại (Classification): Một toán gọi classification label input data chia thành số hữu hạn nhóm Hồi quy (Hồi quy): Khi đầu mong muốn dải giá trị liên tục giá trị thực Chẳng hạn "tiền lương" hay "trọng lượng" Mơ hình hồi quy đơn giản hồi quy tuyến tính Học có giám sát mơ hình học phổ biến Machine Learning b Học không giám sát Học không giám sát lớp mơ hình học sử dụng thuật tốn để mơ tả trích xuất mối quan hệ tiềm ẩn liệu Khác với học có giám sát, học không giám sát thực thi liệu đầu vào khơng cần thuộc tính nhãn, mục tiêu việc học Mơ hình khơng cung cấp trước kiến thức trừ liệu Các liệu khơng "hướng dẫn" trước học có giám sát Các thuật toán cần học từ liệu mà khơng có hướng dẫn c Học bán giám sát Học bán giám sát mơ hình học kết hợp từ học có giám sát học không giám sát việc gán nhãn cho số liệu số liệu lại khơng gán nhãn số lượng liệu không gán nhãn thường lớn nhiều so với liệu gán nhãn Các liệu kết hợp với để tận dụng hiệu liệu có Thơng thường, điều làm tăng tính xác mơ hình xây dựng d Học củng cố Học tăng cường (Reinforcement Learning) mơ hình học thuật tốn tự động sử dụng phản hồi từ môi trường để điều chỉnh hoạt động cho tối đa hiệu đạt Thuật toán reinforcement learning đo phản hồi từ môi trường sử dụng hàm đánh giá để tìm phương án hành động nhằm tăng cường phản hồi tích cực từ mơi trường Trong mơ hình này, khơng có tập huấn luyện cố định, thuật toán cần mục tiêu nhóm mục tiêu cần đạt, tập hành vi thực hiện, liệu phản hồi hiệu thực thi hành động so với mục tiêu đề 2.2 Phân loại dựa thuật toán 2.2.1 Regression Algorithms a Linear Regression Hồi quy tuyến tính (Linear Regression) thuật tốn tìm phương trình tuyến tính dựa tập liệu quan hệ X (dữ liệu đầu vào) Y (dữ liệu đầu ra) X biến giải thích Y biến phụ thuộc Ví dụ, tạo mơ hình quan hệ chiều cao cân nặng mơ hình hồi quy tuyến tính Trước thử tạo mơ hình quan hệ, nên xác định liệu mối quan hệ có liên quan với hay khơng Khơng thiết phải có tương tác biến, cần phải có liên quan Để mối quan hệ biến dùng biểu đồ phân tán công cụ việc xác định mức độ liên quan Nếu khơng có mối quan hệ biến đưa vào mô hình, mơ hình hồi quy tuyến tính khơng giúp ích trường hợp Hình Linear Regression b Logistic Regression Hồi quy logistic (Logistic Regression) thuật toán phân loại dùng để gán đối tượng cho tập hợp giá trị rời rạc (như 0, 1, 2, ) Một ví dụ điển hình phân loại Email, gồm có email cơng việc, email gia đình, email spam, Giao dịch trực tuyến có an tồn hay khơng an tồn, khối u lành tính hay ác tình Thuật tốn dùng hàm sigmoid logistic để đưa đánh giá theo xác suất Ví dụ : Khối u 80% lành tính, giao dịch 90% gian lận, Ứng dụng: + Dự đốn email có phải spam hay khơng + Dự đoán giao dịch ngân hàng gian lận hay khơng + Dự đốn khối u lành hay ác tính + Dự đốn khoản vay có trả khơng + Dự đốn khoản đầu tư vào start-up có sinh lãi hay không c Stepwise Regression Hồi quy bước (stepwise regression) dạng phân tích hồi quy bội biến độc lập bổ sung (từng biến một) vào phương trình hồi quy ảnh hưởng chúng tính mức bổ sung khả giải thích phương trình hồi quy ghi lại Nhược điểm lớn phương pháp quy hồi bước cho phép biến khơng có liên quan vào mơ hình, vậy, hồi quy Stepwise tạo mối quan hệ ảo hay tác động giả lên biến phụ thuộc mơ hình Phương pháp quy hồi bước khuyến khích sử dụng biến đưa vào mơ hình sử hỗ trợ vững lý thuyết liên quan đến vấn đề nghiên cứu Trong trường hợp này, để đánh giá cải thiện độ phù hợp mơ hình thơng qua số R – bình phương số thơng tin AIC, BIC bước sử dụng câu lệnh nestreg để ghi nhận thay đổi số Câu lệnh nestreg cho biết nhiều thông tin độ phù hợp mô thống kê Wald, Chi – bình phương, R – bình phương, thay đổi R – bình phương số thông tin AIC, BIC cho mơ hình trung gian 2.2.2 Classification Algorithms a Linear Classifier Trong lĩnh vực machine learning, mục tiêu phân loại thống kê sử dụng đặc điểm đối tượng để xác định thuộc lớp Một phân loại tuyến tính đạt điều cách đưa định phân loại dựa giá trị kết hợp tuyến tính đặc tính Đặc điểm đối tượng cịn gọi giá trị đặc trưng thường trình bày cho máy vectơ gọi vectơ đặc trưng Các phân loại hoạt động tốt cho vấn đề thực tế phân loại tài liệu nói chung cho vấn đề có nhiều biến (tính năng), đạt đến mức độ xác tương đương với phân loại phi tuyến tính thời gian để đào tạo sử dụng Hình Linear Classifier b Support Vector Machine (SVM) Trong machine learning, support-vector machines (SVMs, support-vector networks) mơ hình học có giám sát với thuật tốn học liên quan phân tích liệu để phân loại phân tích hồi quy Ngồi việc thực phân loại tuyến tính, SVM thực phân loại phi tuyến tính cách hiệu cách sử dụng gọi thủ thuật hạt nhân, ánh xạ ngầm đầu vào chúng vào không gian đặc trưng chiều cao Khi liệu khơng gắn nhãn, việc học có giám sát khơng thể thực cần có phương pháp học tập khơng có giám sát nhằm tìm cách phân cụm liệu tự nhiên thành nhóm, sau ánh xạ liệu tới nhóm hình thành c Kernel SVM Ý tưởng Kernel SVM phương pháp kernel nói chung tìm phép biến đổi cho liệu ban đầu khơng phân biệt tuyến tính biến sang không gian Ở không gian này, liệu trở nên phân biệt tuyến tính Nếu liệu hai lớp khơng phân biệt tuyến tính, tìm cách biến đổi liệu sang không gian cho không gian ấy, liệu hai lớp phân biệt tuyến tính gần phân biệt tuyến tính Có loại kernel thơng dụng: linear, poly, rbf, sigmoid Trong đó, rbf sử dụng nhiều lựa chọn mặc định thư viện SVM Với liệu gần phân biệt tuyến tính, linear poly kernels cho kết tốt 2.2.3 Instance-based Algorithms a K-Nearest Neighbor (KNN) 10 Hình Deep Learning Framwork Power Scores 2018 Convolutional Neutral Network (CNN) Convolutional Neural Network (CNN ConvNet) hay cịn gọi mạng nơ rơn tích chập Đây mơ hình tiên tiến Deep Learning CNN thường áp dụng phổ biến phân tích xử lý hình ảnh trực quan CNN đưa vào tảng Facebook, Google, … để xử lý hình ảnh nhận diện khn mặt người dùng, nhận dạng hình ảnh, xe tự lái hay drone giao hàng tự động, … CNN phù hợp tối ưu cho xử lý phân loại hình ảnh nhóm em định sử dụng CNN cho đồ án Cấu trúc CNN 16 Hình Cấu trúc CNN - Convolution Layer (Conv Layer) lớp để trích xuất đặc trưng từ hình ảnh đầu vào Nó trì mối quan hệ pixel cách tìm hiểu đặc trưng hình ảnh với vng nhỏ liệu đầu vào Convolution Layer có nhiệm vụ thực tính tốn Những yếu tố quan trọng Convolution Layer : filter map, stride, padding feature map CNN sử dụng filter để áp dụng vào vùng hình ảnh gọi filter map Những filter map ma trận chiều với số bên gọi parameter + Stride : dịch chuyển filter map theo pixel dựa vào giá trị từ trái sang phải dịch chuyển gọi stride Hình Convolve with 3x3 filter and stride is + Padding: giá trị thêm vào lớp input Khi muốn pixel viền ảnh tiếp xúc tương tác nhiều với lọc thêm pixel có giá trị vào viền hình ảnh mà không ảnh hưởng đến đầu vào lọc áp dụng 17 Hình Input 32x32x3 với padding=2 + Feature map : Thể kết lần filter map quét qua input Hình 10 Minh họa feature map - ReLU Layer: áp dụng hàm kích hoạt g thường max (0, x) lên đầu Conv Layer Mục đích tăng tính phi tuyến tính cho mạng ReLu Layer khơng làm thay đổi kích thước ảnh khơng thêm tham số 18 Hình 11 Hàm ReLu biến thể - Pooling Layer : đầu vào lớn pooling layer xếp vào conv layer để làm giảm số chiều không gian đầu vào giảm độ phức tạp tính tốn Có hai loại pooling chủ yếu max pooling average pooling Trong max pooling sử dụng phổ biến với ý tưởng: Giữ lại chi tiết quan trọng giữ lại pixel có giá trị lớn Hình 12 Max pooling Average pooling Tại Pooling Layer, sử dụng lớp Max Pooling số lượng Parameter giảm Vì vậy, Convolutional Neural Network xuất nhiều lớp Filter Map, Filter Map cho Max Pooling khác 19 - Fully Connected Layer lớp kết nối đầy đủ mạng NN thông thường Sau ảnh đưa qua lớp Conv Layer Pooling Layer model học tương đối đặc điểm ảnh, output layer cuối dàn phẳng (Flattening) thành vector đưa vào Fully Connected Layer Cuối sử dụng hàm softmax hàm sigmoid để phân loại đầu Với toán phân loại (classification) có output hàm activation output layer hàm sigmoid, có nhiều output hàm activation output layer hàm softmax Hình 13 Minh họa Fully Connected Layer 20 Hình 14 Minh họa hàm Softmax VGG16 VGG16 mạng convolutional neural network đề xuất K Simonyan and A Zisserman, University of Oxford Model sau train mạng VGG16 đạt độ xác 92.7% top-5 test liệu ImageNet gồm 14 triệu hình ảnh thuộc 1000 lớp khác Hình 15 Cấu trúc mạng VGG16 - Convolutional layer: kích thước 3*3, padding=1, stride=1 Pool/2: max pooling layer với size 2*2 Càng sau kích thước input giảm trọng số ngày tăng (64 -> 128 -> 256->512 ->4096) 21 - Sau nhiều Conv Layer Pooling Layer liệu dàn phẳng (flattening) đưa vào Fully Connected Layer Transfer Learning Transfer Learning kỹ thuật mà pretrained model train source tasks cụ thể đó, phần hay tồn pretrained model tái sử dụng phụ thuộc vào nhiệm vụ layer model Một model sử dụng phần hay tồn pretrained model để học target tasks tùy vào nhiệm vụ layer mà model thêm layer khác dựa pretrained model sẵn có Các bước thực tốn nhận diện tiền mặt - Tạo liệu cách đọc ảnh tờ tiền từ camera Thiết kế mạng NN với đầu vào ảnh (128,128,3), đưa vào mạng VGG16 đầu VGG16 dùng để đưa vào mạng NN nhỏ kết thúc lớp Dense hàm softmax Đầu vector softmax chứa probality p(i) ứng với class i, in giá trị max vector chọn làm class dự đốn Đầu tiên trước bước vào trình huấn luyện (training) liệu cần phải có liệu cho tốn Về tiền Việt Nam khơng có sẵn liệu mạng nên phải tự tạo liệu cách đọc liên tục từ camera lưu lại vào thư mục tương ứng với mệnh giá tiền Ở nhóm em sử dụng tờ tiền 10000, 20000 50000 VNĐ nhãn 00000 dành cho ảnh khơng có xuất tiền Lần lượt chạy đoạn code sau với tên thư mục tương ứng với mệnh giá tờ tiền chọn làm liệu : 22 Hình 16 Tạo liệu Sau chạy xong cho loại tiền liệu hình ảnh đầu vào loại tiền lưu vào thư mục data với thư mục có tên tương ứng với mệnh giá tiền Hình 17 Dữ liệu để training 23 Hình 18 Ảnh minh họa liệu Đọc hình ảnh thư mục tạo resize hình ảnh liệu thành kích thước (128,128) Sau convert nhãn (00000,10000,20000,50000) thành one-hot sử dụng class LabelBinarizer thư viên sklearn lưu vào file pix.data để load liệu cho lần sau Tiếp theo training model Chúng em tận dụng phần trích xuất đặc trưng VGG16 24 Hình 19 Cấu trúc VGG16 Bỏ phần Classifier mạng VGG16 dùng phần lại làm input cho lớp Fully Connected Đầu tiên chia liệu thành tập train tập test với tỉ lệ tập train 80% cịn tập test 20% Hình 20 Chia train:test tỉ lệ 8:2 Lượt bỏ phần Classifier mạng VGG16 Ở đây, chúng em điều chỉnh phần weights phần Fully Connected thêm vào nên chúng em đóng băng layer VGG VGG train tốt Phần Fully connected bao gồm lớp dàn phẳng input (flattening), lớp Dense với hàm kích hoạt reLu, sử dụng Dropout để bỏ qua nút mạng cách ngẫu nhiên nhầm giảm thiểu over-fitting Cuối lớp Dense (4) với hàm kích hoạt softmax để phân loại liệu thành output 25 Hình 21 Cấu trúc mạng với phần xanh lớp FC Để model train xác tranh overfitting áp dụng thêm kỹ thuật augmentation cho liệu cách sử dụng phép quay, thu phóng, thay đổi tỉ lệ, dịch sang trái sang phải, lật ngang dọc,… để mở rộng liệu training Hình 22 Augmentaiton cho liệu Cuối training model với hàm fit_generator để tăng cường liệu làm cho mơ hình tổng qt hóa tốt Chúng em cho mơ hình train với 50 epochs Hình 23 Training liệu với 50 epochs Kết Sau training model với tỉ lệ train :test 8:2 thu kết với weight có accuracy cao thu 98.4% 26 Hình 24 Weight với Accuracy 98.4% Demo Hình 25 Nhận diện tiền mệnh giá 10000 Hình 26 Nhận diện tiền mệnh giá 10000 27 Hình 27 Nhận diện tiền mệnh giá 20000 Hình 28 Nhận diện tiền mệnh giá 20000 28 Hình 29 Nhận diện tiền mệnh giá 50000 Hình 30 Nhận diện tiền mệnh giá 50000 Source code: https://github.com/sonngocminh99/Money_Classify IV Kết luận hướng phát triển Kết đạt Trong trinh thực đồ án 1, nhóm học kiến thức Machine Learning, Deep Learning, tìm hiểu số thuật toán, mạng CNN, VGG16 học cách vận dụng thư viện Keras vào toán xử lý ảnh hết vận dụng kiến thức biết để training hiểu cách hoạt động tốn nhận dạng tiền mặt để áp dụng vào tốn xử lý ảnh khác Ngồi ra, nhóm cịn học kỹ thuật để pre-trained model cụ thể transfer learning Hạn chế 29 Model tạo với liệu đơn giản hạn chế Đơi cịn nhận diện chưa xác hồn tồn, chưa nhận diện xác điều kiện thiếu sáng, … Hướng phát triển - Khắc phục hạn chế nêu - Tăng độ xác mơ hình - Mở rộng liệu nhận diện nhiều loại tiền mặt - Hoàn thiện đưa hệ thống áp dụng vào thực tiễn - Có thể áp dụng để giải toán xử lý ảnh khác TÀI LIỆU THAM KHẢO Chuỗi viết DeepLearning https://nttuan8.com/bai-1-linear-regression-va-gradientdescent/#Python_code Mạng neural tích chập cheatsheet https://stanford.edu/~shervine/l/vi/teaching/cs-230/cheatsheetconvolutional-neural-networks Transfer Learning tốn Face Recognition https://viblo.asia/p/transfer-learning-va-bai-toanface-recognition-3Q75w7xD5Wb Vgg16 Là Gì – Kiến Trúc Các Mạng Cnn Nổi Tiếng https://in4tintuc.com/vgg16-la-gi/ Những Thơng Tin Về Cấu Trúc Mạng CNN Là Gì? https://itnavi.com.vn/blog/cnn-la-gi/ Convolutional Neural Network gì? Cách chọn tham số cho Convolutional Neural Network chuẩn chỉnh https://wiki.tino.org/convolutional-neural-network-la-gi/ Phân Loại Hình Ảnh Sử Dụng Keras (Image Classification) https://tek4.vn/phan-loai-hinh-anhvoi-keras-image-classification Chuỗi viết giới thiệu Machine Learning https://machinelearningcoban.com/2016/12/26/introduce/ Fully Connected vs Convolutional Neural Networks https://medium.com/swlh/fully-connectedvs-convolutional-neural-networks-813ca7bc6ee5 30 ... đến nhận dạng ảnh, chẩn đoán y khoa, dự báo thời tiết, … Vì vậy, nhận thấy nhận dạng ảnh lĩnh vực ngày phổ biến, có tính ứng dụng cao rộng rãi với nhiều mặt sống Nhóm em định chọn đề tài tìm hiểu. .. tài tìm hiểu nhận dạng ảnh cụ thể nhận dạng tiền mặt sử dụng thư viện Keras mạng CNN (VGG16) Mục tiêu nghiên cứu Mục tiêu nghiên cứu đồ án tìm khái quát Machine Learning nhận dạng ảnh Qua xây... áp dụng phổ biến phân tích xử lý hình ảnh trực quan CNN đưa vào tảng Facebook, Google, … để xử lý hình ảnh nhận diện khuôn mặt người dùng, nhận dạng hình ảnh, xe tự lái hay drone giao hàng tự

Ngày đăng: 15/01/2022, 21:44

Hình ảnh liên quan

Học tăng cường (Reinforcement Learning) là mô hình học trong đó thuật toán tự động sử dụng các phản hồi từ môi trường để điều chỉnh hoạt động của chính mình sao cho tối đa nhất hiệu  quả đạt được - Tìm hiểu về nhận dạng ảnh

c.

tăng cường (Reinforcement Learning) là mô hình học trong đó thuật toán tự động sử dụng các phản hồi từ môi trường để điều chỉnh hoạt động của chính mình sao cho tối đa nhất hiệu quả đạt được Xem tại trang 8 của tài liệu.
Trong machine learning, support-vector machines (SVMs, cũng là support-vector networks) là mô hình học có giám sát với các thuật toán học liên quan phân tích dữ liệu để phân loại và phân tích hồi quy - Tìm hiểu về nhận dạng ảnh

rong.

machine learning, support-vector machines (SVMs, cũng là support-vector networks) là mô hình học có giám sát với các thuật toán học liên quan phân tích dữ liệu để phân loại và phân tích hồi quy Xem tại trang 10 của tài liệu.
Hình 3 KNN trong Classification với K=1 - Tìm hiểu về nhận dạng ảnh

Hình 3.

KNN trong Classification với K=1 Xem tại trang 11 của tài liệu.
Hình 4 Softmax Regression dưới dạng mạng nơ ron - Tìm hiểu về nhận dạng ảnh

Hình 4.

Softmax Regression dưới dạng mạng nơ ron Xem tại trang 13 của tài liệu.
Hình 5 Multi-layer Perceptron    - Tìm hiểu về nhận dạng ảnh

Hình 5.

Multi-layer Perceptron Xem tại trang 14 của tài liệu.
Hình 6 DeepLearning Framwork Power Scores 2018 - Tìm hiểu về nhận dạng ảnh

Hình 6.

DeepLearning Framwork Power Scores 2018 Xem tại trang 16 của tài liệu.
Hình 7 Cấu trúc CNN - Tìm hiểu về nhận dạng ảnh

Hình 7.

Cấu trúc CNN Xem tại trang 17 của tài liệu.
-Convolution Layer (Conv Layer) là lớp đầu tiên để trích xuất các đặc trưng từ hình ảnh đầu vào - Tìm hiểu về nhận dạng ảnh

onvolution.

Layer (Conv Layer) là lớp đầu tiên để trích xuất các đặc trưng từ hình ảnh đầu vào Xem tại trang 17 của tài liệu.
Hình 10 Minh họa feature map - Tìm hiểu về nhận dạng ảnh

Hình 10.

Minh họa feature map Xem tại trang 18 của tài liệu.
Hình 11 Hàm ReLu và các biến thể - Tìm hiểu về nhận dạng ảnh

Hình 11.

Hàm ReLu và các biến thể Xem tại trang 19 của tài liệu.
Hình 12 Max pooling và Average pooling - Tìm hiểu về nhận dạng ảnh

Hình 12.

Max pooling và Average pooling Xem tại trang 19 của tài liệu.
Hình 13 Minh họa Fully Connected Layer - Tìm hiểu về nhận dạng ảnh

Hình 13.

Minh họa Fully Connected Layer Xem tại trang 20 của tài liệu.
Hình 15 Cấu trúc mạng VGG16 - Tìm hiểu về nhận dạng ảnh

Hình 15.

Cấu trúc mạng VGG16 Xem tại trang 21 của tài liệu.
Hình 14 Minh họa hàm Softmax - Tìm hiểu về nhận dạng ảnh

Hình 14.

Minh họa hàm Softmax Xem tại trang 21 của tài liệu.
Hình 16 Tạo dữ liệu - Tìm hiểu về nhận dạng ảnh

Hình 16.

Tạo dữ liệu Xem tại trang 23 của tài liệu.
Hình 18 Ảnh minh họa dữ liệu - Tìm hiểu về nhận dạng ảnh

Hình 18.

Ảnh minh họa dữ liệu Xem tại trang 24 của tài liệu.
Đọc cái hình ảnh trong các thư mục đã tạo và resize các hình ảnh trong bộ dữ liệu thành kích thước (128,128)  - Tìm hiểu về nhận dạng ảnh

c.

cái hình ảnh trong các thư mục đã tạo và resize các hình ảnh trong bộ dữ liệu thành kích thước (128,128) Xem tại trang 24 của tài liệu.
Hình 19 Cấu trúc VGG16 - Tìm hiểu về nhận dạng ảnh

Hình 19.

Cấu trúc VGG16 Xem tại trang 25 của tài liệu.
Hình 21 Cấu trúc mạng mới với phần xanh lá là lớp FC mới - Tìm hiểu về nhận dạng ảnh

Hình 21.

Cấu trúc mạng mới với phần xanh lá là lớp FC mới Xem tại trang 26 của tài liệu.
Hình 22 Augmentaiton cho dữ liệu - Tìm hiểu về nhận dạng ảnh

Hình 22.

Augmentaiton cho dữ liệu Xem tại trang 26 của tài liệu.
Hình 24 Weight với Accuracy 98.4% - Tìm hiểu về nhận dạng ảnh

Hình 24.

Weight với Accuracy 98.4% Xem tại trang 27 của tài liệu.
Hình 27 Nhận diện tiền mệnh giá 20000 - Tìm hiểu về nhận dạng ảnh

Hình 27.

Nhận diện tiền mệnh giá 20000 Xem tại trang 28 của tài liệu.
Hình 29 Nhận diện tiền mệnh giá 50000 - Tìm hiểu về nhận dạng ảnh

Hình 29.

Nhận diện tiền mệnh giá 50000 Xem tại trang 29 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan