1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận Văn Thạc Sĩ) Phân Lớp Ngữ Nghĩa Hình Ảnh Dựa Trên Mạng Nơ-Ron Tích Chập.pdf

85 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 85
Dung lượng 2,55 MB

Nội dung

Untitled BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÀ RỊA VŨNG TÀU  TRƯƠNG HỮU CHIẾN PHÂN LỚP NGỮ NGHĨA HÌNH ẢNH DỰA TRÊN MẠNG NƠ RON TÍCH CHẬP LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN BÀ RỊA VŨNG TÀU 202[.]

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÀ RỊA-VŨNG TÀU  TRƯƠNG HỮU CHIẾN PHÂN LỚP NGỮ NGHĨA HÌNH ẢNH DỰA TRÊN MẠNG NƠ-RON TÍCH CHẬP LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN BÀ RỊA VŨNG TÀU - 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÀ RỊA-VŨNG TÀU  TRƯƠNG HỮU CHIẾN PHÂN LỚP NGỮ NGHĨA HÌNH ẢNH DỰA TRÊN MẠNG NƠ-RON TÍCH CHẬP Chuyên ngành: Công nghệ thông tin Mã ngành: 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS VĂN THẾ THÀNH BÀ RỊA VŨNG TÀU - 2020 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Phân lớp ngữ nghĩa hình ảnh dựa mạng nơ-ron tích chập” cơng trình nghiên cứu tơi hướng dẫn giảng viên hướng dẫn, không trùng lắp người khác Tơi trích dẫn đầy đủ tài liệu tham khảo, cơng trình nghiên cứu liên quan nước quốc tế Các tài liệu luận văn tham khảo, kế thừa trích dẫn liệt kê danh mục tài liệu tham khảo Tơi xin chịu hồn tồn trách nhiệm lời cam đoan Bà rịa - Vũng tàu, ngày 12 tháng 12 năm 2020 Học viên Trương Hữu Chiến i LỜI CẢM ƠN Trước tiên, xin gửi lời cảm ơn và bày tỏ biết ơn chân thành tới TS.Văn Thế Thành – Giáo viên hướng dẫn khoa học trực tiếp hướng dẫn tơi, hết lịng hỗ trợ giúp đỡ tơi q trình nghiên cứu hồn thiện luận văn Tơi xin gửi lời cảm ơn chân thành tới thầy, cô giảng viên Trường Đại học Bà Rịa Vũng Tàu tạo điều kiện thuận lợi cho học tập nghiên cứu suốt trình học tập trường Và tơi muốn gửi lời cảm tới các anh, chị, em lớp MIT18K1 khóa Thạc sĩ ngành công nghệ thông tin, bên cạnh và động viên suốt thời gian học tập và trình thực luận văn tốt nghiệp Cuối cùng, xin gửi lời cảm ơn tới cha, vợ và các con, người thân gia đình tơi, chăm lo, động viên tơi tích cực học tập và hồn thành thật tốt khóa học thạc sĩ này Vì thời gian có hạn, cố gắng hoàn thành luận văn chắn khơng tránh khỏi thiếu sót Rất mong nhận cảm thông, chia sẻ, đóng góp ý kiến tận tình q thầy bạn để luận văn hồn thiện Tơi xin chân thành cảm ơn! ii MỤC LỤC LỜI CAM ĐOAN i MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT vi DANH MỤC HÌNH VẼ i DANH MỤC BẢNG BIỂU iv LỜI MỞ ĐẦU CHƯƠNG TỔNG QUAN PHÂN TÍCH NGỮ NGHĨA HÌNH ẢNH 1.1 Đặc trưng văn kèm ảnh 1.2 Đặc trưng nội dung ảnh 1.3 Hướng tiếp cận theo ngữ nghĩa hình ảnh 10 1.4 Trích xuất đặc trưng 13 1.4.1 Ý nghĩa trích xuất đặc trưng 14 1.4.2 Các đặc trưng phổ biến 14 1.5 Các nghiên cứu liên quan 15 1.6 Kết luận 17 CHƯƠNG 18 TỔNG QUAN VỀ MẠNG NƠ-RON TÍCH CHẬP 18 2.1 Giới thiệu 18 2.2 Một số khái niệm 20 2.3 Kiến trúc mạng nơ-ron tích chập 21 iii 2.3.1 Lớp tích chập (Convolutional) 23 2.3.2 Hàm kích hoạt ReLU 27 2.3.3 Lớp lấy mẫu (Pooling) 28 2.3.4 Lớp kết nối đầy đủ 29 2.4 Kỹ thuật tối ưu mạng 31 2.5 Một số Kiến trúc mạng CNN phổ biến 32 2.5 Kiến trúc LeNet-5 33 2.5 Kiến trúc AlexNet 34 2.5 Kiến trúc VGG-16 36 2.5.4 Kiến trúc Inception (GoogleLeNet) 38 2.6 Kết luận 40 CHƯƠNG 41 ĐỀ XUẤT MƠ HÌNH PHÂN LOẠI ẢNH VÀ KẾT HỢP 41 TÌM KIẾM THEO NGỮ NGHĨA 41 3.1 Kiến trúc hệ thống 41 3.2 Mơ hình phân lớp hình ảnh CNN 42 3.3 Mơ hình tìm kiếm theo ngữ nghĩa 46 3.3.1 Các thích cho hình ảnh 47 3.3.2 Phát triển Ontology 49 3.3.3 Ontology hình ảnh 50 3.3.4 Truy xuất hình ảnh ngữ nghĩa (SIR-Semantic Image Retrieval) 53 3.4 Kết luận 55 iv CHƯƠNG 56 KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ 56 4.1 Môi trường và các công cụ sử dụng cho thực nghiệm 56 4.2 Tập liệu thực nghiệm 56 4.3 Xây dựng mơ hình phân loại ảnh cho hệ thống tìm kiếm 58 4.3.1 Vai trò Dropout 60 4.3.2 Ảnh hưởng Batch size đến kết phân lớp dữ liệu 61 4.4 Kết tìm kiếm ảnh theo ngữ nghĩa 62 4.5 Kết luận 69 TÀI LIỆU THAM KHẢO 70 Tiếng Việt 70 Tiếng Anh 70 v DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt 01 AI 02 Tiếng anh Giải thích Artificial Intelligence Trí tuệ nhân tạo ANN Artificial Neural Network Mạng nơ-ron nhân tạo 03 CBIR Content-Based Images Retrieval Tìm kiếm ảnh theo nội dung 04 CNN Convolutional Neural Network Mạng nơ-ron tích tập 05 CSDL Database Cơ sở liệu 06 DL Deep Learning Học sâu 07 DNN Deep Neural Network Mạng nơ-ron sâu 08 DT Decision Tree Cây định 09 FNN Feedforward Neural Network Mạng nơ-ron truyền thẳng 10 GPU Graphic Proccessing Unit Bộ vi xử lý liệu hình ảnh 11 HOG Histograms of Oriented Gradients Biểu đồ độ dốc định hướng 12 k-NN k-Nearest Neighbors K-láng giềng gần nhất ImageNet Large Scale Visual Recognition Challenge Cuộc thi thử thách nhận biết hình ảnh quy mơ lớn ImageNet Internet of Things Internet vạn vật 13 ILSVRC 14 IoT 15 OWL Ontology Web language Ngôn ngữ ontology web 16 QBIC Query Based Image Content Truy vấn ảnh theo nội dung 17 SBIR Semantic Based Image Retrieval Truy vấn ảnh theo ngữ nghĩa vi 18 SIFT Scale Invariant Feature Transform Biến đổi đặc trưng cục bất biến SIFT 19 SURF Speeded Up Robust Features Trích chọn đặc trưng SURF 20 SVM Support Vector Machine Máy vec-tơ hỗ trợ 21 ReLU Rectified Linear Unit Điều chỉnh đơn vị tuyến tính 22 RGB Red Green Blue Hệ màu 23 RDF Resource Description Framework Khung mô tả tài nguyên 24 SIR Semantic Image Retrieval Truy vấn ảnh nghữ nghĩa 25 SPARQL SPARQL Protocol And RDF Query Language Ngôn ngữ truy vấn cho CSDL ngữ nghĩa 26 TBIR Text-Based Image Retrieval Truy xuất hình ảnh dựa văn vii DANH MỤC HÌNH VẼ Hình 1.1: Ví dụ hiển thị ảnh……………………………………………….…………… Hình 1.2: Ví dụ truy vấn “d-80” Google……………………………….……………… Hình 1.3: Ví dụ truy vấn “Apple” Google……………………………….…………… Hình 1.4: Ví dụ số lọai kết cấu………………………………………….….………….9 Hình 1.5: Minh họa tầng ngơn ngữ dùng ontology……… …….…………….13 Hình 2.1: Mơ hình não người…………………………………………………………… 18 Hình 2.2: Mạng nơ-ron tích chập hay Convolutional Neural Networks (CNN)……… 19 Hình 2.3: Kiến trúc CNN………………………………………………………………….22 Hình 2.4: Mạng nơ-ron thơng thường……………………………………………………….22 Hình 2.5: Mạng nơ-ron tích chập………………………………………….… ….…………22 Hình 2.6: Minh họa ảnh dữ liệu đầu vào và lọc……………………………………… 23 Hình 2.7: Minh họa tích chập ảnh đầu vào kết quả Bảng đồ đặc trưng…………….24 Hình 2.8: Minh họa trình tích chập nhiều lớp…………………….………………… 26 Hình 2.9: Minh họa bảng đồ đặc trưng xếp chồng lên nhau………………….…………27 Hình 2.10: Các hàm kích hoạt…………………………………………….………………….28 Hình 2.11: Minh họa việc lấy mẫu con………………………………….……………… 29 Hình 2.12: Một ví dụ mô hình học sâu dựa mạng nơ-ron tích chập…….….….31 Hình 2.13: Mạng nơ-ron trước sau trình Dropout…………………………… 32 i 4.3 Xây dựng mơ hình phân loại ảnh cho hệ thớng tìm kiếm Mơ hình giải tốn phân lớp ảnh vào lớp 15 chủ đề khác (Cat, Dog, Peacok, … ) Đầu mơ hình vector có 1.000 phần tử Phần tử thứ i vector đại diện cho xác suất ảnh thuộc lớp thứ i Do đó, tổng phần tử vector Phân loại hình ảnh mạng AlexNet với hỗ trợ thư viện nguồn mở TensorFlow tảng mã nguồn mở end-to-end dành cho học máy giúp đào tạo mơ hình ML [27] Để xây dựng mơ hình phân loại ảnh cho hệ thống tìm kiếm, tập liệu thực nghiệm chia thành tập liệu tập huấn luyện (training set) gồm 7.110 ảnh (60%), tập kiểm thử (test set) gồm 2.370 ảnh (20%) tập giám sát (validation set) gồm 2.370 ảnh (20%) Tập liệu giám sát dùng để giám sát trình học xem mạng có trạng thái bị học chậm (underfitting) khớp (overfitting) không? Dữ liệu huấn luyện chia thành batch, với batch size 500 ảnh để đưa vào huấn luyện nhằm tránh tắt nghẽn mạng giảm dung lượng nhớ cần thiết để huấn luyện Phương pháp tính độ lỗi mạng Momentum với tham số base learning 0,05 lr_decay 0,96 Khi mạng học qua tồn ảnh tập h́n luyện lần xem mạng học chu kỳ (epoch) số epoch 400 nên phải lặp tối đa là 5.688 lần theo công thức sau: (4.1) Qua q trình h́n luyện kiểm tra mơ hình mạng nơ-ron tích chập thu số kết qua bảng thống kê thời gian huấn luyện mơ hình Bảng 58 Bảng 4.1: Kết h́n luyện mơ hình Thời gian (giờ:phút:giây) 00:15:39 00:45:39 01:15:26 01:45:52 02:15:36 02:45:36 03:15:25 03:45:19 04:15:58 04:45:38 05:15:29 06:09:30 Bước lặp 270 790 1,268 1,778 2,289 2,829 3,352 3,868 4,232 4,639 5,129 5,688 Độ xác 36.80% 52.39% 63.52% 69.27% 72.36% 73.38% 75.79% 77.26% 80.37% 82.52% 83.26% 85.39% Để học mơ hình đạt độ xác 85% tập train cần huấn luyện Để kiểm tra độ xác mơ hình phân lớp tập test chúng đánh giá theo độ đo là Confusion matrix Hình 4.2 Precision Hình 4.3 Hình 4.2: Biểu đồ Confusion matrix đánh giá theo chủ đề ảnh 59 Hình 4.3: Biểu đồ Precision đánh giá mơ hình phân loại theo chủ đề ảnh Hình 4.2 hình 4.3 cho thấy mơ hình phân lớp chủ đề ảnh ngựa vằn (zebras) có độ xác khá cao, đạt 97,89% Ngun nhân là các đặc trưng ngựa vằn bật so với chủ đề ảnh lại có các vệt vằn đen lưng Ngược lại mô hình phân lớp chủ đề ảnh mèo (cat) có độ xác chưa cao, đạt 68,79% Ngun nhân có thể là các đặc trưng mèo khó nhận dạng các chủ đề ảnh khác có nhiều đặc trưng tương đồng với số chủ đề ảnh khác chó và khỉ chúng động vật chân, hình dáng nhỏ nhắn khác biệt rõ nhất gương mặt 4.3.1 Vai trò Dropout Như đề cập phần trên, lớp Dropout loại bỏ số ngẫu nhiên nơron, từ đó giúp cho quá trình huấn luyện khơng bị overfitting Để đánh giá vai trị lớp Dropout việc phân loại liệu hình ảnh thơng qua việc sử dụng tỉ lệ dropout khác nhau: 0% (tức không sử dụng lớp dropout), 30%, 50%, 70% 90% Chú ý tỉ lệ dropout thể tỉ lệ nơ-ron loại bỏ Kết đưa thể xu học mơ hình và mô tả Bảng Bảng 4.2: Tỉ lệ lỗi thay đổi giá trị Dropout hệ thống 60 Thơng qua kết nhận được, ta thấy mơ hình khơng có lớp Dropout cho tỉ lệ lỗi h́n luyện thấp nhất (9,31%) Nhưng độ chênh lệch tỉ lệ lỗi trình huấn luyện kiểm tra lại cao so với các trường hợp khác Mối quan hệ tỉ lệ dropout, tỉ lệ lỗi huấn luyện kiểm tra cho thấy tượng overfitting rõ ràng trường hợp khơng có lớp Dropout Hiện tượng giảm dần tăng tỉ lệ dropout Tuy nhiên, tỉ lệ dropout lớn, ví dụ 90%, tỉ lệ lỗi nhận dạng huấn luyện kiểm tra tăng vọt (thể trình underfitting) Nguyên nhân gây tượng thông tin bị mất nhiều trình xử lý dẫn đến phân loại khơng xác Thực tế, để có tỉ lệ phân loại tối ưu nhất, yêu cầu phải thực thử nghiệm nhiều tỉ lệ khác riêng lẻ cho mơ hình 4.3.2 Ảnh hưởng Batch size đến kết phân lớp liệu Batch size định số lượng ảnh dùng cho lần cập nhật trọng số, với kích thước tập huấn luyện tập liệu thu thập 11.850 ảnh Một chu kỳ học tương ứng với xử lý 11.850 ảnh Nếu chọn batch size = 20, có nghĩa là liệu chia thành 592 gói để xử lý Tương tự, batch size = 200, số gói liệu 59 gói Bảng kết có thay đổi kích thước gói liệu batch Với kích thước Batch size nhỏ, tỉ lệ lỗi cao (47,41%) Khi kích thước tăng dần, kết thu có thay đổi khả quan Nhìn chung, batch size lớn, trọng số cập nhật cách ổn định Nhưng lưu ý rằng, batch size lớn yêu cầu nhiều nhớ Bảng 4.3: Kết phân lớp sử dụng liệu với batch size khác 61 Kích thước tập huấn luyện ảnh hưởng đến độ xác tăng lên số lượng liệu tăng lên Càng nhiều liệu tập huấn luyện, tác động lỗi huấn luyện lỗi thử nghiệm nhỏ cuối là độ xác có thể cải thiện Bằng quá trình này, mơ hình đào tạo sử dụng để phân loại hình ảnh có liệu thử nghiệm minh họa Hình 4.4 Hình 4.4: Minh họa phân lớp dữ liệu hình ảnh 4.4 Kết tìm kiếm ảnh theo ngữ nghĩa Truy xuất hình ảnh dựa Ontology tập trung nhiều vào việc nắm bắt nội dung ngữ nghĩa (tức ánh xạ các tính hình ảnh với khái niệm), điều có thể giúp đáp ứng yêu cầu người dùng theo cách tốt nhiều Người dùng có thể đưa khái niệm / từ khóa làm đầu vào văn có thể nhập hình ảnh Kết thực nghiệm cho thấy hiệu và độ xác hệ thống đề xuất 62 Bằng cách đưa hình ảnh dạng truy vấn Hình 4.5, cơng cụ tìm kiếm, so sánh với tập hợp hình ảnh lưu trữ sở liệu gắn nhãn có (hình ảnh đào tạo) để tìm điểm tương đồng Hình ảnh truy vấn phải đặt số danh mục ảnh có Nếu có bất kỳ hình ảnh khơng rõ ràng nào, chúng đặt vào danh mục hình ảnh gần nhất, theo mức độ phù hợp với ảnh truy vấn người dùng Mơ hình thể học ngữ nghĩa với liệu cá thể hình ảnh có thể sử dụng để tìm mối quan hệ hình ảnh chọn hình ảnh khác sở liệu lưu trữ Những hình ảnh này giới thiệu cho người dùng, tập kết xếp theo thứ tự giảm dần theo giá trị phù hợp Chúng không nhất thiết phải phù hợp với truy vấn lọc có khả quan tâm Hình 4.5: Minh họa biểu đồ truy vấn khớp hình ảnh 63 - Trường hợp thực nghiệm 1, người dùng sử dụng hình ảnh ngựa vằn làm đầu vào Công cụ truy vấn tạo truy vấn cho truy vấn thực thi nó sở kiến thức ontology Kết hình ảnh tìm thấy sở liệu ảnh phù hợp nhất Hình 4.6 Hình 4.6: Trường hợp thực nghiệm với hình ảnh ngựa vằn 64 Hình 4.7 tương tự trường hợp thực nghiệm Hình 4.6 đó người dùng nhập hình ảnh hình ảnh liên quan phù hợp nhất trả người dùng Hình 4.7: Trường hợp thực nghiệm với hình ảnh chú chó 65 - Trường hợp thực nghiệm 2, người dùng sử dụng tính nhập văn hệ thống SIR cung cấp đầu vào dạng văn Ở đưa vào từ khóa “Dog” để truy vấn ảnh, ta thấy kết trả hình ảnh liên quan đến dog Hình 4.8 Hình 4.8: Trường hợp thực nghiệm với từ khóa truy vấn “Dog” 66 Tương tự Hình 4.9 với từ khóa truy vấn “Monkey” hệ thống SIR tạo truy vấn tương ứng cho truy vấn thực thi nó sở liệu ảnh để đưa hình ảnh liên quan hiển thị cho người dùng Hình 4.9: Trường hợp thực nghiệm với từ khóa truy vấn “Monkey” 67 - Trường hợp thực nghiệm với từ khóa “animal” Do khơng có hình ảnh hệ thống có chủ đề “animal” nên tìm với ngữ nghĩa trả hình số loại động vật monkey, zebra, dog, tất các loài này là động vật Hình 4.10: Tìm kiếm với từ khóa “Animal” 68 4.5 Kết luận Trong nghiên cứu này, tơi đề x́t mơ hình phân lớp liệu hình ảnh dựa mạng tích chập CNN với mơ hình kiến trúc AleNet kết hợp với domain ontology để hỗ trợ tìm kiếm theo ngữ nghĩa Tác giả phân tích tác động tốc độ học đến việc rút ngắn thời gian huấn luyện, cho thấy vai trò lớp dropout việc giảm overfitting, kích thước gói batch size ảnh hưởng đến kết phân lớp đối tượng Trong đó, kết thực nghiệm cho thấy mơ hình kiến trúc AlexNet với kỹ thuật học sâu sử dụng để trích x́t thơng tin đặc trưng ảnh cho phân lớp hiệu với độ xác cao 85% Nghiên cứu xây dựng domain ontology cụ thể giúp cho việc biểu diễn mối quan hệ ngữ nghĩa chủ đề ảnh rõ ràng hơn, việc tạo thể luận (ontology) cho sưu tập hình ảnh thiết lập mối quan hệ chúng, giúp cho việc chuẩn hóa từ khóa tìm kiếm, bổ sung thơng tin cho hình ảnh để việc truy xuất hình ảnh có liên quan đến truy vấn người dùng Truy vấn SPARQL sử dụng cho trình truy xuất hiệu hình ảnh và văn dựa chủ đề, vị từ và đối tượng cách sử dụng domain ontology Hệ thống đề xuất thử nghiệm liệu hình ảnh thu thập liên quan đến miền này, kết thực nghiệm cho thấy kiểu truy xuất hình ảnh này, truy xuất hiệu hình ảnh rất gần với hình ảnh truy vấn từ sở liệu thể học So với các phương pháp truy xuất hình ảnh dựa văn / từ khóa nội dung, truy x́t hình ảnh dựa Ontology tập trung nhiều vào việc nắm bắt nội dung ngữ nghĩa (tức ánh xạ tính hình ảnh với khái niệm), điều này giúp tăng tính truy x́t hình ảnh với tốc độ nhanh so với truy xuất thông thường, đáp ứng yêu cầu người dùng cách tốt Tuy nhiên, hướng phát triển dự kiến mở rộng tập liệu ảnh với số lượng lớn để cải thiện độ xác phân lớp liệu ảnh 85% Hiệu việc tìm kiếm hình ảnh có thể cải thiện cách tích hợp thể học SPARQL để truy x́t hình ảnh có liên quan cách xác hơn./ 69 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Đắc Thành, (2017) Nhận dạng và phân loại hoa ảnh màu [2] Vũ Hữu Tiệp, (2017) Machine Learning http://machinelearningcoban.com/general/2017/02/06/featureengineering/ Tiếng Anh [3] P Muneesawang, N Zhang, L Guan, Multimedia Database Retrieval: Technology and Applications, Springer, New York, 2014 [4] Yushi Chen, Hanlu Jiang, Chunyang Li, Xiuping Jia, and Pedram Ghamisi, “Deep Feature Extraction and Classification of Hyperspectral Images Based on Convolutional Neural Networks” IEEE Trans Geosci Remote Sens., vol 54, no 10, Oct 2016 [5] https://towardsdatascience.com/applied-deep-learning-part-4-convolutional-neuralnetworks-584bc134c1e2#5777 [6] Li, Man, Xiao-Yong Du, and Shan Wang 2005 “Learning Ontology from Relational Database.” In Machine Learning and Cybernetics, 2005 Proceedings of 2005 International Conference On, 6:3410–3415 IEEE [7] Arivazhagan, S., Shebiah, R N., Nidhyanandhan, S S., & Ganesan, L (2010) Fruit Recognition using Color and Texture Features Information Sciences, 1(2), 90–94 [8] Sergey Sosnovsky, D., Dicheva, “Ontological technologies for user modeling”, Int J Metadata, Semantics and Ontologies, Vol 5, No 1, 2010 [9] Website: www.w3.org/rdf-sparql-query “SPARQL Query Language for RDF”; Website:http://www.w3.org.- "Resource Description Framework (RDF)” 70 [10] Y Kim, “Convolutional neural networks for sentence classification”, 2016 [11] Tee Cheng Siew (2008) Feature selection for content-based image retrieval using statistical discriminant analysis PhD thesis Faculty of Computer Science and Information System Universiti Teknologi Malaysia [12] Hyvönen, Eero, Samppa Saarela, Avril Styrman, and Kim Viljanen 2003 “Ontology-Based Image Retrieval.” In WWW (Posters) [13] Magesh, N., and P Thangaraj 2011 “Semantic Image Retrieval Based on Ontology and SPARQL Query.” In International Conference on Advanced Computer Technology (ICACT) [14] Van T T , Le M T (2017), “Mot so cai tien cho he truy van anh dua tren cay STree”, proceeding o f Publishing House for Science and Technology [15] Patel, Shabaz Basheer, and Anand Sampat 2017 “Semantic Image Search Using Queries.” Accessed September [16] Tim Morris: Computer Vision and Image Processing Palgrave Macmillan (2004) [17] AbdAlmageed, W., Wu, Y., Rawls, S., Harel, S., Hassne, T., Masi, I., Choi, J., Lekust, J., Kim, J., Natarajana, P., Nevatia, R., Medioni, G Face recognition using deep multi-pose representations In: IEEE Winter Conference on Applications of Computer Vision (WACV) (2016) [18] Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning, The MIT Press, 2016 [19] Andrej Karpathy CS231n Convolutional Neural Networks for Visual RecognitionImage Classification http://cs231n.github.io/classification/ 71 [20] N Srivastava, G E Hinton, A Krizhevsky, I Sutskever, R Salakhutdinov, Dropout: a simple way to prevent neural networks from overfitting, Journal of machine learning research 15, 2014, pp 1929-1958 [21] Lecun, Y.; Bottou, L.; Bengio, Y.; Haffner, P (1998) "Gradient-based learning applied to document recognition" Proceedings of the IEEE 86 (11): 2278–2324 [22] Krizhevsky, A., Sutskever, I., & Geoffrey E., H (2012) ImageNet Classification with Deep Convolutional Neural Networks Advances in Neural Information Processing Systems 25 (NIPS2012), 1–9 [23] Source: Illustrated: 10 CNN Architectures - Raimi Karim https://towardsdatascience.com/illustrated-10-cnn-architectures-95d78ace614d [24] A Gauthami Latha, Ch Satyanarayana, Y Srinivas Semantic Image Annotation using Ontology And SPARQL International Journal of Innovative Technology and Exploring Engineering (IJITEE) ISSN: 2278-3075, Volume-9 Issue-3, January 2020 [25] Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Fei-Fei, L (2015) ImageNet Large Scale Visual Recognition Challenge International Journal of Computer Vision, 115(3), 211–252 [26] http://www.image-net.org/challenges/LSVRC/ [27] https://www.tensorflow.org/api_docs/python/tf/keras/applications/alexnet 72

Ngày đăng: 19/05/2023, 21:56

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w