1. Trang chủ
  2. » Tất cả

Luận văn thạc sĩ khoa học máy tính tra cứu ảnh dựa trên khoảng cách và bài toán tối ưu pareto

20 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THU HẰNG TRA CỨU ẢNH DỰA TRÊN KHOẢNG CÁCH VÀ BÀI TOÁN TỐI ƯU PARETO LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2020 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THU HẰNG TRA CỨU ẢNH DỰA TRÊN KHOẢNG CÁCH VÀ BÀI TOÁN TỐI ƯU PARETO Chuyên ngành: Khoa học máy tính Mã số: 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS NGƠ QUỐC TẠO THÁI NGUYÊN - 2020 i LỜI CAM ĐOAN Tên tơi là: Nguyễn Thu Hằng Lớp: CK17B Khóa học: 2018-2020 Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 48 01 01 Cơ sở đào tạo: Trường Đại học Công nghệ thông tin Truyền Thông Đại học Thái Nguyên Người hướng dẫn khoa học: PGS.TS Ngô Quốc Tạo Tơi xin cam đoan tồn nội dung trình bày luận văn kết tìm hiểu nghiên cứu thân Các số liệu, kết trình bày luận văn hồn tồn trung thực Những tư liệu sử dụng luận văn tuân thủ theo luật sở hữu trí tuệ, có liệt kê rõ ràng tài liệu tham khảo Tơi xin chịu hồn tồn trách nhiệm với nội dung viết luận văn này! Thái Nguyên, ngày 10 tháng 09 năm 2020 Tác giả luận văn Nguyễn Thu Hằng ii LỜI CẢM ƠN Trong trình học tập thực luận văn, nhận hướng dẫn tận tình Thầy hướng dẫn khoa học PGS.TS Ngô Quốc Tạo - Viện Hàn Lâm Khoa học Công nghệ Việt Nam, người thầy mà muốn bày tỏ lòng biết ơn sâu sắc Luận văn khơng thể hồn thành khơng có Thầy cô trường Đại học Công nghệ thông tin Truyền Thông - Đại học Thái Nguyên tạo điều kiện thuận lợi giúp đỡ Tôi xin bày tỏ cảm ơn chân thành với hỗ trợ giúp đỡ Xin cảm ơn đề tài VAST01.07/19-20 NVCC02.01/20-20 Xin chân thành cảm ơn Chủ tịch HĐQT, Ban giám hiệu tập thể Trường THPT Lương Thế Vinh - Cẩm Phả - Quảng Ninh tạo điều kiện thuận lợi mặt thời gian tài để tơi hồn thành luận văn Cuối cảm ơn tất giúp đỡ gia đình, đồng nghiệp, bạn bè động viên, đóng góp ý kiến, để tơi hồn thành luận văn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CHỮ VIẾT TẮT v KÍ HIỆU TỐN HỌC vi DANH MỤC HÌNH VẼ vii DANH MỤC BẢNG BIỂU viii MỞ ĐẦU Chương TỔNG QUAN VỀ TRA CỨU ẢNH 1.1 Giới thiệu hệ thống tra cứu ảnh 1.1.1 Các thành phần hệ thống CBIR 1.1.2 Tra cứu ảnh theo nội dung sử dụng kỹ thuật máy học 1.2 Các đặc trưng ảnh 13 1.2.1 Đặc trưng màu 13 1.2.2 Đặc trưng hình dạng 14 1.2.3 Đặc trưng kết cấu 15 1.2.4 Liên hệ không gian 15 1.3 Ứng dụng tra cứu ảnh 16 Chương TRA CỨU ẢNH DỰA TRÊN TỐI ƯU ĐA MỤC TIÊU VỚI KHOẢNG CÁCH 19 2.1 Giới thiệu toán 19 2.1.1 Bài toán tra cứu ảnh theo nội dung 19 2.1.2 Bài toán tra cứu ảnh theo nội dung sử dụng tối ưu Pareto 20 2.2 Khoảng cách 20 2.2.1 Khoảng cách Minkowski 20 2.2.2 Khoảng cách lược đồ giao 21 2.2.3 Khoảng cách Canberra 21 iv 2.3 Đa mục tiêu theo khoảng cách 22 2.4 Tiếp cận giải toán tối ưu đa mục tiêu Pareto 22 2.4.1 Tối ưu đa mục tiêu Pareto 22 2.4.2 Rút gọn khơng gian tìm kiếm dựa vào tập Pareto 23 2.4.3 Nâng hiệu phân lớp ảnh 29 Chương ỨNG DỤNG VÀ CHƯƠNG TRÌNH THỬ NGHIỆM 37 3.1 Sơ đồ chương trình 37 3.2 Cơ sở liệu ảnh thử nghiệm 38 3.3 Phân tích thiết kế chương trình thử nghiệm 40 3.3.1 Giao diện chương trình 40 3.3.2 Các bước thực truy vấn 40 3.4 Đánh giá kết đạt so sánh với phương pháp khác 45 3.4.1 Các phương pháp sở 45 3.4.2 Phương pháp đánh giá 45 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO 58 v DANH MỤC CHỮ VIẾT TẮT Từ viết tắt Dạng đầy đủ Diễn giải CBIR Content-Based Image Retrieval Tra cứu ảnh dựa vào nội dung HSV Hue, saturation, value Màu sắc, độ bão hòa, độ sáng MARS Multimedia Analysis and Các hệ thống phân tích đa Retrieval Systems phương tiện tra cứu QBIC Query By Image Content Truy vấn ảnh nội dung RF Relevance feedback Phản hồi liên quan SVM Support vector machine Máy vector hỗ trợ vi KÍ HIỆU TỐN HỌC M Độ dài vector đặc trưng N Kích thước sở liệu T Số đặc trưng t Chỉ số đặc trưng Q, Ii Ảnh truy vấn ảnh thứ I sở liệu I°i Vector đặc trưng chuẩn hóa ảnh thứ i I°it Vector đặc trưng chuẩn hóa t ảnh thứ i Qt, It đặc trưng t tương ứng ảnh truy vấn Q ảnh I ±t Đặc trưng chuẩn hóa t ảnh truy vấn Q i DQt (Ii ), D (Qt , Iit ) Khoảng cách theo đặc trưng t ảnh Ii so với ảnh truy vấn Q DQ (Ii ), D (Q, Ii ) Khoảng cách ảnh Ii so với ảnh truy vấn Q toàn đặc trưng top-k Tập gồm k ảnh có thứ hạng tương tự cao ảnh truy vấn NB Tập ảnh có độ tương tự cao theo đặc trưng toàn cục tra cứu NB- Tập ảnh xác nhận không liên quan phản hồi người dùng NB+ Tập ảnh xác nhận liên quan phản hồi người dùng NBt Tập ảnh có độ tương tự cao theo đặc trưng t tra cứu NB: Tập ảnh có thứ hạng độ tương tự cao thuộc tập NB- tra cứu NB* Tập ảnh chưa tra cứu vii DANH MỤC HÌNH VẼ Hình 3.1 Sơ đồ chương trình 37 Hình 3.2 Các ảnh minh họa cho 10 thể loại tập ảnh Wang 38 Hình 3.3 Hình ảnh giao diện chương trình thực nghiệm 40 Hình 3.4 Đưa ảnh truy vấn vào hệ thống tra cứu đề xuất 41 Hình 3.5 Kết tra cứu khởi tạo top-20 42 Hình Kết tra cứu khởi tạo top-20 vịng phản hồi thứ 43 Hình 3.7 Kết tra cứu khởi tạo top-20 vòng phản hồi thứ hai 43 Hình 3.8 Kết tra cứu khởi tạo top-20 vòng phản hồi thứ ba 44 Hình 3.9 Kết tra cứu khởi tạo top-20 vòng phản hồi thứ tư 44 Hình 3.10 Trung bình độ xác kết top-k đề xuất ParetoAdaBoost ba tập liệu Wang, Oxford Buiding, Caltech theo năm vòng phản hồi liên quan 49 Hình 3.11 Trung bình độ xác kết top-k đề xuất ParetoSVM ba tập liệu Wang, Oxford Building, Caltech theo năm vòng phản hồi liên quan 51 Hình 3.12 So sánh độ xác kết top-k kỹ thuật đề xuất Pareto-AdaBoost với kỹ thuật sở tren ba tập liệu Wang, Oxford Building, Caltech 53 Hình 3.13 So sánh độ xác kết top-k kỹ thuật đề xuất Pareto-SVM với kỹ thuật sở ba tập liệu Wang, Oxford Building, Caltech 54 Hình 3.14 Đồ thị độ xác phương pháp Pareto-AdaBoost, SVM, AdaBoost MARS tập liệu Wang, Oxford Building, Caltech 54 Hình 3.15 Đồ thị độ xác phương pháp Pareto-SVM, SVM, AdaBoost MARS tập liệu Wang, Oxford Building Caltech 55 viii DANH MỤC BẢNG BIỂU Bảng 3.1 Các miêu tả ảnh hàm khoảng cách sử dụng thực nghiệm 39 Bảng 3.2 Các tham số sử dụng thực nghiệm 46 Bảng 3.3 Số ứng viên Pareto thep top – k Wang (gồm 1000 ảnh) 47 Bảng 3.4 Số ứng viên Pareto theo top – k Oxford Buiding (gồm 2560 ảnh) 48 Bảng 3.5 Số ứng viên Pareto theo top – k Caltech (gồm 590 ảnh) 48 Bảng 3.6 Trung bình độ xác top - k kết đề xuất ParetoAdaBoost năm vòng phản hồi liên quan tập liệu Wang 50 Bảng 3.7 Trung bình độ xác top-k kết đề xuất ParetoAdaBoost năm vòng phản hồi liên quan tập liệu Oxford Buiding 50 Bảng 3.8 Trung bình độ xác top-k kết đề xuất ParetoAdaBoost năm vòng phản hồi liên quan tập liệu Caltech 51 Bảng Trung bình độ xác top-k kết đề xuất Pareto-SVM năm vòng phản hồi liên quan tập liệu Wang 52 Bảng 3.10 Trung bình độ xác top-k kết đề xuất Pareto-SVM năm vòng phản hồi liên quan tập liệu Oxford Building 52 Bảng 3.11 Trung bình độ xác top-k kết đề xuất Pareto-SVM năm vòng phản hồi liên quan tập liệu Caltech 53 MỞ ĐẦU Những năm gần đây, với xuất Internet thay đổi hoàn toàn cách thức tìm kiếm thơng tin Ví dụ cần tìm kiếm, đơn giản cần gõ vài từ khóa vào máy tìm kiếm Google hay Bing, lập lức có danh sách tương đối xác trang web có liên quan đến thơng tin cần tìm Đối với hình ảnh, có hệ thống tương tự Tra cứu ảnh thực dựa vào mô tả ngắn ảnh Các ảnh mơ tả tập thuộc tính độc lập nội dung (tên file,khn dạng, loại, kích cỡ, tên tác giả, thiết bị thu nhận, ngày tạo vị trí ổ đĩa) mà quản lý thông qua hệ quản trị sở liệu truyền thống Hạn chế cách tiếp cận truy vấn bị giới hạn vào thuộc tính có tệp ảnh Một cách tiếp cận thay sử dụng từ khóa thích ảnh Trong cách tiếp cận này, trước tiên ảnh thích thủ cơng từ khóa Sau đó, ảnh tra cứu thích tương ứng chúng Cách tiếp cận giới hạn cách tiếp cận trước Tuy nhiên, có ba khó khăn với cách tiếp cận này, yêu cầu số lượng lớn nhân công việc phát triển thích, khác biệt giải thích nội dung ảnh, khơng qn cách gán từ khóa người thực thích khác Cách tiếp cận thích từ khóa trở nên khơng khả thi cỡ tập ảnh gia tăng nhanh chóng Để khắc phục khó khăn cách tiếp cận dựa vào thích, cách tiếp cận thay tra cứu ảnh dựa vào nội dung đề xuất từ đầu năm 1990 Với hệ thống này, cách lấy ảnh đầu vào từ người dùng, hệ thống cố gắng tìm kiếm ảnh giống sở liệu trả lại cho người sử dụng Về bản, hệ thống hoạt động theo cách thức sau: Đầu tiên ảnh đưa vào để tìm kiếm (hay gọi ảnh truy vấn) toàn ảnh CSDL hệ thống sử dung kĩ thuật trích rút nội dung ảnh sang vector (đặc trưng ảnh) cách sử dụng đặc trưng mức thấp (màu sắc, hình dạng, kết cấu, vv) Hệ thống tính tốn đo khoảng cách ảnh truy vấn với ảnh CSDL Cuối cùng, ảnh có khoảng cách gần với ảnh truy vấn hệ thống trả Điều làm giảm đáng kể khó khăn cách tiếp cận túy dựa thích, q trình trích rút đặc trưng thực tự động Kể từ đời, tra cứu ảnh dựa vào nội dung thu hút quan tâm nghiên cứu lớn, phạm vi từ nghiên cứu tới thương mại Cho đến nay, số hệ thống nguyên mẫu thực nghiệm sản phẩm thương mại đề xuất xây dựng QBIC, MARS Tuy CBIR có nhiều tiến song người dùng gặp khó khăn việc tìm kiếm thơng tin liên quan từ tập liệu ảnh lớn không đồng mặt nội dung ngữ nghĩa Điều dẫn đến kết tìm kiếm chưa mong muốn Thơng tin mà máy tính hiểu nội dung ảnh thường là giá trị điểm ảnh,vector đặc trưng trích rút theo thủ tục, cịn người hiểu nội dung ảnh thường khái niệm ngữ nghĩa Do khơng có tương quan cách xác nội dung mà máy tính có thơng qua đặc trưng trực quan mức thấp dung mà người hiểu thông qua khái niệm ngữ nghĩa mức cao dẫn đến khoảng trống ngữ nghĩa Khoảng trống ngữ nghĩa định nghĩa theo Smeulders cộng sau: “Khoảng trống ngữ nghĩa không tương đồng thơng tin ảnh, trích rút từ liệu trực quan so với diễn giải liệu ảnh người dùng tình cụ thể ” Khoảng trống ngữ nghĩa nằm đặc trưng trực quan mức thấp ảnh ngữ nghĩa mức cao mong muốn dự định suy từ đặc trưng trực quan mức thấp Các thực nghiệm hệ thống CBIR nội dung mức thấp thường thất bại mô tả khái niệm ngữ nghĩa mức cao ảnh Do đó, hiệu tra cứu ảnh dựa vào nội dung xa so với kỳ vọng người dùng Để khắc phục hạn chế trên, năm gần hướng nghiên cứu tập trung tìm phương pháp giảm khoảng trống ngữ nghĩa đặc trưng mức thấp khái niệm mức cao Để thu hẹp khoảng trống ngữ nghĩa, nâng cao hiệu tra cứu ảnh theo nội dung cần sử dụng kết hợp đa đặc trưng để so sánh độ tương tự, đánh số tra cứu Việc sử dụng kết hợp đa đặc trưng để so sánh độ tương tự dẫn đến đa khoảng cách cần độ đo toàn cục kết hợp tối ưu tuyến tính hàm khoảng cách thành phần Trong luận văn xin đề cập đến phương pháp “Tra cứu ảnh dựa khoảng cách toán tối ưu pareto”, nghiên cứu sử dụng cách tiếp cận tối ưu Pareto toán tiền xử lý liệu (rút gọn tập mẫu) Qua đó, khơng gian tìm kiếm tập độ đo khoảng cách với truy vấn thu gọn tập Pareto Tập thu gọn sử dụng liệu đầu vào giúp cho máy phân lớp hoạt động hiệu Nội dung luận văn gồm chương Chương 1: TỔNG QUAN VỀ TRA CỨU ẢNH Chương trình bày khái quát lý thuyết tra cứu ảnh dựatrên nội dung, tìm hiểu số đặc trưng ảnh, tìm hiểu số ứng dụng hệ thống tra cứu ảnh sẵn có Chương 2: TRA CỨU ẢNH DỰA TRÊN TỐI ƯU ĐA MỤC TIÊU VỚI KHOẢNG CÁCH Chương giới thiệu toán tra cứu ảnh theo nội dung khoảng cách thường dùng tra cứu ảnh, đa mục tiêu theo khoảng cách, đề xuất rút gọn tập ứng viên nhằm giảm khơng gian tìm kiếm dựa vào tiếp cận tối ưu đa mục tiêu Pareto Chương 3: ỨNG DỤNG VÀ CHƯƠNG TRÌNH THỬ NGHIỆM Chương đưa thiết kế hệ thống đề xuất, sở liệu lựa chọn thử nghiệm đánh giá kết đạt so sánh với phương pháp khác 5 Chương TỔNG QUAN VỀ TRA CỨU ẢNH 1.1 Giới thiệu hệ thống tra cứu ảnh Từ hai thập kỉ qua, xuất Internet thay đổi hồn tồn cách thức tìm kiếm thơng tin Ví dụ, làm việc với văn bản, ta cần đơn giản gõ vài từ khóa vào máy tìm kiếm Google hay Bing để lập lức có danh sách tương đối xác trang web có liên quan Ta có hệ thống tương tự với ảnh Với hệ thống này, cách lấy ảnh đầu vào từ người sử dụng, hệ thống cố gắng tìm kiếm ảnh giống liệu, trả lại cho người sử dụng Một cách lý tưởng, giống định nghĩa dựa giống khái niệm thể ảnh Đây hệ thống Tra cứu ảnh theo nội dung hay đơn giản tra cứu ảnh (“content-based image retrieval” viết tắt CBIR) Các hệ thống thường trích rút biểu diễn trực quan ảnh định nghĩa hàm tìm kiếm, đối sánh mối liên quan tra cứu dáp ứng yêu cầu người dùng Lĩnh vực cộng đồng nhiên cứu quan tâm năm qua 1.1.1 Các thành phần hệ thống CBIR Một hệ thống CBIR gồm thành phần mơ tả sơ đồ Hình 1.1 Hình 1.1 Hệ thống tra cứu ảnh theo mội dung Một hệ thống tra cứu ảnh thực qua nhiều công đoạn: nhập ảnh truy vấn, nhập liệu ảnh cho csdl, chuẩn hóa ảnh, trích chọn đặc trưng ảnh truy vấn ảnh sở liệu, tính tốn độ tương tự cách hiển thị kết lên hình… Tuy nhiên có miêu tả khái quát hệ thống tra cứu ảnh thông qua cơng đoạn sau: Hình 1.2 Cấu trúc hệ thống tra cứu ảnh theo nội dung - Trích chọn đặc trưng: Các đặc trưng hình ảnh bao gồm đặc trưng nguyên thủy đặc trưng ngữ nghĩa đặc trưng logic Các đặc trưng là: màu sắc (color), kết cấu (texture), hình dạng (shape), vị trí khơng gian (spatial location),… định lượng tự nhiên, chúng trích xuất tự động bán tự động Đặc trưng logic cung cấp mơ tả trừu tượng liệu hình ảnh cấp độ khác Thông thường, nhiều đặc trưng sử dụng ứng dụng cụ thể thực tế + Trích chọn đặc trưng cho ảnh truy vấn: Ở công đoạn ảnh truy vấn ảnh nhập vào hệ thống xử lý để trích chọn đặc trưng theo đặc trưng định phục vụ tính tốn độ tương đồng sau đưa kết quả, nói cơng đoạn tính tốn online 7 + Trích chọn đặc trưng ảnh sở liệu: Đây cơng đoạn tính tốn đặc trưng cho ảnh sở liệu sinh sở liệu lưu trữ đặc trưng, cơng đoạn thường tính tốn từ nhập ảnh vào cở sở liệu, tiến hành người dùng cho phép thực hay nói cách khác tiến hành offline - Đo độ tương tự ảnh: Hệ thống CBIR dựa đặc điểm nguyên thủy để so sánh độ tương tự ảnh truy vấn tất ảnh CSDL Mặc dù tương tự khác ảnh không xác định theo cách Số lượng ảnh tương tự thay đổi yêu cầu truy vấn thay đổi Chẳng hạn trường hợp hai hình ảnh, biển xanh mặt trời mọc trường hợp khác núi xanh với mặt trời mọc Hình 1.3 Hình ảnh minh họa độ tương tự hình ảnh Khi mặt trời xem xét độ tương tự hai ảnh cao đối tượng quan tâm biển xanh độ tương tự hai ảnh thấp Như khó khăn để tìm phương pháp đo độ tương tự hai hình ảnh cách xác tất kiểu yêu cầu truy vấn Hay nói cách khác phương pháp tra cứu có giới hạn Ví dụ khó cho cơng nghệ tra cứu dựa màu sắc để tìm điểm khác ảnh bầu trời màu xanh với ảnh mặt biển xanh Vì đánh giá phương pháp tra cứu ảnh dựa nội dung cần phải biết hiệu công nghệ phụ thuộc vào kiểu yêu cầu tra cứu mà người dùng sử dụng - Đánh số: Đánh số công việc quan trọng tra cứu ảnh dựa nội dung, giúp tìm kiếm nhanh ảnh dựa đặc trưng trực quan, vector đặc trưng ảnh có xu hướng, có số chiều cao khơng thích hợp cho cấu trúc đánh số truyền thống Do trước lên kế hoạch đánh số ta phải tìm cách làm giảm số chiều vector đặc trưng Khi giảm số chiều liệu đa chiều đánh số - Tra cứu hiển thị kết quả: Hiển thị kết vừa thu cho người dùng theo giá trị ngưỡng tương tự - Phản hồi liên quan: Kĩ thuật phản hồi liên quan sử dụng nhằm thu hẹp “khoảng trống ngữ nghĩa” CBIR, cải thiện kết tra cứu thông qua tương tác người dùng máy Một kịch thông thường cho phản hồi liên quan CBIR sau: Bước 1: Máy tính đưa kết tra cứu khởi tạp (top-k)thôngqua ảnh truy vấn Bước 2: Người dùng cung cấp đánh giá kết top-k, đánh giá theo kiểu “liên quan” “không liên quan” với nhận thức người dùng Bước 3: Máy học thử lại Lặp lại bước Các thành phần hệ thống CBIR: - Cơ sở liệu ảnh: Là sở liệu phục vụ lưu trữ ảnh Có thể ổ cứng thường, hệ quản trị sở liệu - Cơ sở liệu đặc trưng: Các đặc trưng trích chọn offline lưu trữ sở liệu tệp tin matlab, bảng tính excel,… Quá trình thực thi hệ thống tra cứu ảnh: + Người dùng đưa truy vấn ảnh có sẵn + Hệ thống đón nhận truy vấn ảnh, sau trích chọn đặc trưng + Hệ thống so sánh truy vấn ảnh với sở liệu đặc trưng có + Hệ thống trả kết tra cứu Một hệ thống tra cứu ảnh cần đáp ứng được: + Nhu cầu sử dụng hình ảnh người dùng thông tin kèm ảnh + Cách mơ tả nội dung ảnh + Trích chọn đặc trưng từ ảnh + Lưu trữ sở liệu ảnh + Truy vấn lưu trữ hình ảnh tương tự + Truy xuất hình ảnh sở liệu hiệu + Giao diện thân thiện, phù hợp 1.1.2 Tra cứu ảnh theo nội dung sử dụng kỹ thuật máy học Các kỹ thuật học máy có hiệu tăng đáng kể hệ thống CBIR kỹ thuật máy vector hỗ trợ (SVM), học tăng cường (AdaBoost),… Một hạn chế khơng có liệu huấn luyện từ trước với truy vấn cụ thể, liệu huấn luyện có sau người dùng phản hồi với ảnh truy vấn đưa vào người dùng Bên cạnh liệu huấn luyện tương đối liệu kiểm tra bị nhiễu vấn đề khoảng trống ngữ nghĩa Kỹ thuật AdaBoost 10 Kỹ thuật AdaBoost áp dụng số hệ thống CBIR nhằm mục đích tăng cường thuật tốn học yếu, địi hỏi liệu đánh trọng số trước thực thuật toán học lần lặp Tuy nhiên, kỹ thuật dựa vào AdaBoost thường phân lớp chậm cần nhiều lần lặp phản hồi Boosting phương pháp cho phép cải thiện độ xác thuật toán học Đây loại phương pháp tổ hợp, cho phép kết hợp phương pháp phân lớp yếu thành phân lớp mạnh 𝐿 𝐹(𝑥) = ∑ 𝛼𝑖 𝑓𝑖 (𝑥) 𝑙=1 𝛼𝑖 xác định trọng số học yếu thứ l Kỹ thuật Boosting thực lặp lặp lại, cho lần lặp l, phân lớp yếu đưa vào tổ hợp đạt tiêu chuẩn dừng AdaBoost dẫn đến biến thể boosting phổ biến trở thành thuật toán học mạnh Trong trình học, giữ phân bố trọng số 𝐷𝑙 (𝑖)trên mẫu huấn luyện Theo phân bố này, lần lặp Boosting lựa chọn học yếu đưa them vào mơ hình Sau lần lặp l, mẫu đánh lại trọng số, dựa vào hàm lỗi (loss function) Nhằm tập trung vào mẫu khó, bỏ qua mẫu dễ Giải thuật AdaBoost thuật toán học hiệu phổ biến, dễ dàng cài đặt, không cần thiết tới tham số hiệu chỉnh Trên thực tế có tham số số tối đa L lần lặp Việc thiết lập tham số quan trọng thuật tốn có xu hướng overfit (quá khớp) thiết lập L lớn Kỹ thuật máy vector hỗ trợ (SVM) Các kĩ thuật học máy phản hồi liên quan đề xuất nhằm hỗ trợ hiệu chỉnh truy vấn Hầu hết kĩ thuật truyền thống đòi hỏi lượng lớn ... thống tra cứu ảnh sẵn có Chương 2: TRA CỨU ẢNH DỰA TRÊN TỐI ƯU ĐA MỤC TIÊU VỚI KHOẢNG CÁCH Chương giới thiệu toán tra cứu ảnh theo nội dung khoảng cách thường dùng tra cứu ảnh, đa mục tiêu theo khoảng. .. HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THU HẰNG TRA CỨU ẢNH DỰA TRÊN KHOẢNG CÁCH VÀ BÀI TOÁN TỐI ƯU PARETO Chuyên ngành: Khoa học máy tính Mã số: 48 01 01 LUẬN... đến đa khoảng cách cần độ đo tồn cục kết hợp tối ưu tuyến tính hàm khoảng cách thành phần Trong luận văn xin đề cập đến phương pháp ? ?Tra cứu ảnh dựa khoảng cách toán tối ưu pareto? ??, nghiên cứu sử

Ngày đăng: 28/02/2023, 20:12

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w