TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG VÀ ỨNG DỤNG CHO TRA CỨU ẢNH THEO NỘI DUNG. ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

20 3 0
TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG VÀ ỨNG DỤNG CHO TRA CỨU ẢNH THEO NỘI DUNG. ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG VÀ ỨNG DỤNG CHO TRA CỨU ẢNH THEO NỘI DUNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thơng tin Hải Phịng - 2011 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHỊNG -o0o - TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG VÀ ỨNG DỤNG CHO TRA CỨU ẢNH THEO NỘI DUNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY NGÀNH CƠNG NGHỆ THÔNG TIN Sinh viên : Bùi Thị Thúy Nga Giáo viên hướng dẫn : PGS TS Ngô Quốc Tạo Mã sinh viên : 111217 Hải Phòng, 7/2011 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG CỘNG HÒA XÃ HỘI CHỦ NGĨA VIỆT NAM Độc lập – Tự – Hạnh Phúc -o0o NHIỆM VỤ THIẾT KẾ TỐT NGHIỆP Sinh viên: Bùi Thị Thúy Nga Mã số: 111217 Lớp: CT1101 Ngành : Công nghệ thông tin Tên đề tài: Tìm hiểu số phương pháp trích chọn đặc trưng ứng dụng cho tra cứu ảnh theo nội dung 3 NHIỆM VỤ CỦA ĐỀ TÀI Nội dung yêu cầu cần giải nhiệm vụ đề tài tốt nghiệp a Nội dung - Nghiên cứu đánh giá kỹ thuật tra cứu ảnh theo nội dung - Đề xuất sử dụng số kỹ thuật khác đưa so sánh với hệ thống ảnh trước - Từ đưa phương pháp cải tiến khắc phục hạn chế - Thử nghiệm chương trình tra cứu ảnh theo nội dung b Các yêu cầu cần giải - Tìm hiểu kiến thức xử lý ảnh - Tham khảo mã nguồn mở xử lý ảnh - Nghiên cứu tra cứu ảnh theo nội dung phương pháp trích chọn đặc trưng dựa tài liệu nghiên cứu trước Từ triển khai cài đặt thuật tốn tra cứu ngơn ngữ lập trình C# - Thực nghiệm dựa xây dựng đánh giá kết nghiên cứu Các số liệu cần để thiết kế, tính tốn Các phương pháp trích chọn đặc trưng sau áp dụng vào toán tra cứu ảnh theo nội dung Địa điểm thực tập LỜI CẢM ƠN Em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo, PGS.TS Ngô Quốc Tạo, Viện Công Nghệ Thông tin thuộc Viện Khoa học công nghệ Việt Nam người trực tiếp hướng dẫn, tận tình bảo em suốt trình làm đồ án Em xin chân thành cảm ơn thầy cô giáo khoa Công nghệ thông tin Trường Đại học Dân Lập Hải Phịng ,những người nhiệt tình giảng dạy truyền đạt kiến thức cần thiết suốt thời gian em học tập trường, để em hoàn thành tốt trình tốt nghiệp Cuối em xin gửi lời cảm ơn đến gia đình, bạn bè, người thân ủng hộ động viên tinh thần đề đồ án hoàn thành Em xin chân thành cảm ơn! Hải Phòng, ngày tháng năm 2011 Sinh viên Bùi Thị Thúy Nga MỤC LỤC MỤC LỤC DANH MỤC CÁC HÌNH DANH MỤC CÁC CHỮ VIẾT TẮT LỜI NÓI ĐẦU 10 CHƢƠNG 1: TỔNG QUAN 12 1.1 Tổng quan tra cứu ảnh theo nội dung 12 1.2 Các chức hệ thống tra cứu ảnh dựa vào nội dung tiêu biểu 12 1.2.1 Truy vấn người sử dụng 14 1.2.1.1 Truy vấn ảnh mẫu (QBE – Query By Example) 14 1.2.1.2 Truy vấn đặc trưng (QBF – Query By Feature) 14 1.2.1.3 Các truy vấn dựa vào thuộc tính (Attribute – Based queries) 14 1.2.2 Đánh số nhiều chiều 15 1.3 Đánh giá hiệu tra cứu 15 1.4 Những hệ thống tra cứu ảnh theo nội dung 16 1.4.1 Hệ thống QBIC (Query By Image Content) IBM 17 1.4.2 Hệ thống Virage công ty Virage 17 1.4.3 Hệ thống RetrievalWare tập đồn cơng nghệ Excalibur 17 1.4.4 Hệ thống VisualSeek WebSeek đại học Columbia 18 1.4.5 Hệ thống Photobook phịng thí nghiệm truyền thơng MIT 18 1.4.6 Hệ thống Netra Đại học California, Thư viện ảnh Alexandria 18 1.5 Kết luận 18 CHƢƠNG 2: CÁC KHÁI NIỆM CƠ BẢN 20 2.1 Màu sắc 20 2.1.1 Các không gian màu 20 2.1.1.1 Không gian màu RGB 21 2.1.1.2 Không gian màu CMY 21 2.1.1.3 Không gian màu L*a*b 22 2.1.1.4 Không màu HSV 22 2.1.2 Các đặc trưng màu sắc 23 2.1.2.1 Lược đồ màu (Histogram) 23 2.1.2.2 Vector liên kết màu (Color Coherence Vector) 24 2.1.2.3 Tương quan màu 24 2.1.2.4 Các màu trội 25 2.1.2.5 Các mômen màu 25 2.2 Kết cấu 26 2.2.1 Ma trận đồng (Co-occurence Matrix) 27 2.2.2 Các đặc trưng Tamura 27 2.2.2.1 Thô (Coarseness) 27 2.2.2.2 Độ tương phản 28 2.2.2.3 Hướng 28 2.2.3 Các đặc trưng Wold 29 2.2.4 Mô hình tự hồi qui đồng thời SAR 30 2.2.5 Các đặc trưng lọc Gabor 31 2.2.6 Các đặc trưng biến đổi sóng 32 2.3 Hình dạng 33 2.3.1 Các bất biến mômen 33 2.3.2 Các góc uốn 34 2.3.3 Các ký hiệu mô tả Fourier 35 2.3.4 Hình trịn, độ lệch tâm, hướng trục 36 2.4 Thông tin không gian 36 2.5 Phân đoạn 37 2.6 Độ đo 37 2.6.1 Khái niệm 38 2.6.2 Một số độ đo thông dụng 38 2.6.2.1 Khoảng cách Minkowsky: 38 2.6.2.2 Khoảng cách toàn phương 38 2.6.2.3 Khoảng cách Euclid: 38 2.6.2.4 Độ đo khoảng cách min-max 39 CHƢƠNG 3: KỸ THUẬT TRA CỨU ẢNH DỰA THEO NỘI DUNG 40 3.1 Màu sắc 40 3.1.1 Lược đồ màu 40 3.1.2 Vector liên kết màu (Color Coherence Vector) 40 3.1.3 Đặc trưng tự tương quan màu (AutoCorrelogram) 41 3.2 Độ đo khoảng cách lƣợc đồ màu 41 3.2.1 Khoảng cách dạng Minkowsky 41 3.2.2 Khoảng cách toàn phương 42 3.2.3 Độ đo khoảng cách min-max 43 3.3 Kỹ thuật dựa vào đặc trƣng màu 43 3.3.1 Lược đồ màu toàn cục 44 3.3.2 Lược đồ màu cục 45 CHƢƠNG 4: TRIỂN KHAI & THỰC NGHIỆM 46 4.1 Quy trình xây dựng phần mềm tra cứu ảnh tổng hợp 46 4.2 Lựa chọn tập mẫu 47 4.3 Lựa chọn phƣơng pháp truy vấn ảnh 47 4.4 Xây dựng ứng dụng 48 4.5 Kết 49 KẾT LUẬN 52 TÀI LIỆU THAM KHẢO 53 DANH MỤC CÁC HÌNH Hình 1.1 Mơ hình hệ thống tra cứu ảnh theo nội dung Hình 2.1 Khơng gian màu RGB Hình 2.2 Khơng gian màu CMY Hình 2.3 Khơng gian màu HSV Hình 3.1 Khoảng cách dạng Minkowsky Hình 3.2 Khoảng cách dạng tồn phương Hình 3.3 Ba ảnh biểu đồ màu tương ứng Hình 4.1: Quy trình huấn luyện tập liệu ảnh ban đầu Hình 4.2 Mơ hình ứng dụng Hình 4.3: Tập ảnh sở liệu Hình 4.4: Kiến trúc ứng dụng Hình 4.5: Giao diện ứng dụng Hình 4.6: Tiến trình tra cứu Hình 4.7: Kết tra cứu Hình 4.8: So sánh hai kỹ thuật sử dụng DANH MỤC CÁC CHỮ VIẾT TẮT KÝ HIỆU DIỄN GIẢI VIR Visual Information Retrieval (Tra cứu thông tin) CBIR Content Based Image Retrieval (Tra cứu ảnh dựa theo nội dung) RGB Red Green Blue (Đỏ, Xanh lục, Xanh lơ) HSV Hue Saturation Value ( Màu, sắc nét, cường độ) CMY Cyan Magenta Yellow ( màu lục lam, màu đỏ tươi, màu vàng ) QBE Query By Example (Truy vấn ảnh mẫu) QBF Query By Feature (Truy vấn đặc trưng) CCV Color Coherence Vectors (Véc tơ gắn kết màu) SDF Spectral Distribution Functions (Hàm phân bố phổ) MLE Maximum Likelihood Estimation (Ước lượng khả nhất) MRSAR multi-resolution simultaneous auto-regressive model (Mơ hình tự hồi quy đồng thời đa phân giải) SAR Simultaneous Auto-Regressive (Tự hồi quy đồng thời) MRF Markov random field (Trường ngẫu nhiên Markov) PWT Pyramid-Structured Wavelet Transform (Biến đổi song cấu trúc hình chóp) TWT Tree-Structured Wavelet Transform (Biến đổi song cấu trúc cây) RISAR Rotation-Invariant SAR model(Mơ hình SAR bất biến quay) 10 LỜI NÓI ĐẦU Cùng với mở rộng multimedia, với khối lượng hình ảnh phim lưu trữ ngày lớn, với phát triển thiết bị Điện tử, Tin học Viễn thông thu hút ngày nhiều chuyên gia sâu vào nghiên cứu công cụ cung cấp cho việc lấy thông tin liệu ảnh từ nội dung chúng Trong thực tế, toán tra cứu ảnh có nhiều ứng dụng quan trọng Các ứng dụng phức tạp so sánh mẫu vân tay, tìm kiếm ảnh tội phạm áp dụng ngành khoa học hình sự, sở liệu ảnh địa lý, y học làm cho lĩnh vực nghiên cứu phát triển nhanh công nghệ thông tin Tuy nhiên số lượng ảnh lưu trữ trở nên lớn vấn đề phải có phương pháp tổ chức sở liệu ảnh tốt với kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ xác cao có hiệu tốt Việc tìm kiếm ảnh mong muốn hàng triệu ảnh thuộc đủ loại chủ đề khác khó khăn Khi số lượng ảnh sưu tập cịn ít, việc nhận diện ảnh hay việc so sánh giống khác nhiều ảnh thực mắt thường, nhiên có số lượng lớn ảnh việc so sánh mắt thường khó khăn, địi hỏi phải có phương pháp hiệu xác Tìm kiếm theo cách thông thường dựa văn bổ sung truy vấn dựa theo nội dung, tìm vào khía cạnh nhân thức thơng tin ảnh Thực truy vấn mức nhận thức đòi hỏi phương thức mới, cho phép định đến thuộc tính liên quan đến thị giác cần tìm Giao diện đồ họa phải hỗ trợ đặc tả ví dụ mẫu có sẵn Khi người dùng vịng lặp, mơ hình giao diện cho người dừng truy cập vào giống đối tượng Trước năm 1990, người ta thường sử dụng phương pháp tra cứu ảnh theo văn (Text Based Image Retrieval) Theo cách người ta gán cho ảnh lời thích phù hợp với nội dung đặc điểm ảnh, sau việc tra cứu ảnh thực dựa lời thích Phương pháp đơn giản, nhiên lại áp dụng để tra cứu sở liệu ảnh có số lượng ảnh lớn kết tra cứu mang tính chủ quan cảm ngữ cảnh [8] Một phương pháp nhiều người quan tâm nghiên cứu phương pháp “Tra cứu ảnh dựa theo nội dung” (Content-Based Image Retrieval) Ý 11 tưởng phương pháp trích chọn đặc điểm dựa vào nội dung trực quan ảnh màu sắc, kết cấu, hình dạng bố cục khơng gian ảnh để làm sở cho việc tra cứu, xếp, tổ chức sở liệu ảnh [8] Nội dung đề tài giới thiệu sở lý thuyết ứng dụng số phương pháp tra cứu ảnh, sâu vào giới thiệu phương pháp “tra cứu ảnh theo nội dung” Trên sở tiến hành thử nghiệm phương pháp cụ thể để xây dựng chương trình phần mềm tra cứu ảnh cho phép đọc vào ảnh mẫu tìm kiếm ảnh tương tự với ảnh mẫu tập hợp ảnh cho trước theo đặc trưng màu sắc Nội dung đề tài gồm phần sau: Chương 1: Tổng quan tra cứu ảnh theo nội dung Chương 2: Các khái niệm Chương 3: Kỹ thuật tra cứu ảnh theo nội dung Chương 4: Triển khai thực nghiệm 12 Chƣơng 1: TỔNG QUAN 1.1 Tổng quan tra cứu ảnh theo nội dung Tra cứu ảnh dựa theo nội dung (CBIR) có nguồn gốc từ năm 1992 Tra cứu ảnh theo nội dung tra cứu thông tin trực quan (VIR - Visual Information Retrieval) Tra cứu thông tin trực quan chủ đề nghiên cứu lĩnh vực công nghệ thông tin Tương tác với nội dung trực quan cách thiết yếu để tra cứu thông tin trực quan Các yếu tố trực quan màu sắc, kết cấu, hình dạng bố cục khơng gian trực tiếp liên quan đến khía cạnh cảm nhận nội dung ảnh, với khái niệm mức cao ý nghĩa đối tượng, khung cảnh ảnh, dùng manh mối cho tìm kiếm hình ảnh với nội dung tương tự từ sở liệu Tra cứu thơng tin, mơ hình hóa thể liệu trực quan, phân tích xử lý phim ảnh, nhận dạng thị giác máy tính (computer vision), tổ chức sở liệu đa phương tiện (multimedia), lập mục đa chiều, mơ hình hóa tâm lí hành vi người dùng, hệ thống tương tác người - máy trực quan hóa liệu, lĩnh vực nghiên cứu quan trọng đóng góp cho tra cứu thơng tin trực quan Các yếu tố mơ tả nội dung có liên quan đến đặc trưng cảm nhận màu sắc, kết cấu, hình dạng, mối liên hệ không gian chuyển động Các yếu tố sở nguồn gốc màu sắc đối tượng, vai trị, kiên, hay thơng tin có liên hệ với màu sắc cảm giác, cảm tưởng hay ý nghĩa hình ảnh Do vậy, phân tích ảnh, nhận dạng thị giác máy tính đóng vai trò hệ thống tra cứu thơng tin trực quan Nó cho phép tự động trích chọn hầu hết thông tin trực quan, thông qua việc phân tích phân bố điểm ảnh rút độ đo nội dung trực quan Trong đồ án này, em tập trung vào đặc trưng màu cho ứng dụng tra cứu ảnh dựa theo nội dung 1.2 Các chức hệ thống tra cứu ảnh dựa vào nội dung tiêu biểu Một hệ thống tra cứu ảnh dựa theo nội dung (Content-Based Image Retrieval) tiêu biểu không xử lý nguồn thông tin khác mà khuôn dạng khác (như văn bản, hình ảnh video) mà cịn giải nhu cầu người sử dụng Về hệ thống phân tích nội dung nguồn thông tin truy vấn sử dụng, đem so sánh nội dung để tra cứu mục tin liên quan Các chức chỉnh hệ thống tra cứu ảnh bao gồm nội dung sau: 13 Phân tích nội dung nguồn thông tin, biểu diễn nội dung nguồn phân tích theo cách thích hợp cho so sánh truy vấn sử dụng Bước thông thuờng cần nhiều thời gian phải xử lý thông tin nguồn (các ảnh) sở liệu Tuy nhiên, bước thực lần Phân tích truy vấn người sử dụng biểu diễn chúng dạng thích hợp cho so sánh với sở liệu nguồn Bước tương tự bước trước, áp dụng với ảnh truy vấn Định nghĩa chiến lược để so sánh truy vấn tìm kiếm với thơng tin sở liệu lưu trữ Tra cứu thông tin liên quan theo cách hiệu Bước thực hiên trực tuyến yêu cầu nhanh Các kỹ thuật đánh số đại sử dụng để tổ chức lại khơng gian đặc trưng để tăng tốc q trình đối sánh Thực điều chỉnh cần thiết hệ thống dựa phản hồi từ người sử dụng ảnh tra cứu Người sử dụng Tạo truy vấn Phản hồi liên quan Trích chọn đặc trưng Véc tơ đặc trưng Cơ sở liệu nh Cơ sở liệu đặc trưng Đánh số So sánh độ tương tự Các kết tra cứu Ảnh Hình 1.1: Mơ hình hệ thống tra cứu ảnh dựa theo nội dung 14 1.2.1 Truy vấn ngƣời sử dụng Có nhiều cách gửi truy vấn trực quan Một phương pháp truy vấn tốt phương pháp tự nhiên người sử dụng thu đủ thông tin từ người sử dụng để trích rút kết có ý nghĩa Các phương pháp truy vấn sử dụng phổ biến nghiên cứu tra cứu ảnh dựa theo nội dung: 1.2.1.1 Truy vấn ảnh mẫu (QBE – Query By Example) Trong kiểu truy vấn này, người sử dụng hệ thống rõ ảnh truy vấn đích dựa vào sở liệu tìm kiếm ảnh tương tự Ảnh truy vấn ảnh thường, ảnh quét có độ phân giải thấp, phác thảo sử dụng công cụ mô tả giao diên đồ họa Ưu điểm hệ thống cách tự nhiên cho người sử dụng chung để tra cứu ảnh sở liệu 1.2.1.2 Truy vấn đặc trƣng (QBF – Query By Feature) Trong hệ thống QBF tiêu biểu, người sử dụng rõ truy vấn việc rõ đặc trưng quan tâm tìm kiếm Như người dùng truy vấn sở liệu ảnh cách đưa lệnh để tra cứu tất ảnh có góc phần tử trái chứa 25% pixel màu vàng Truy vấn rõ việc sử dụng công cụ giao diện đồ họa chuyên dụng Những người sử dụng hệ thống tra cứu ảnh chuyên nghiệp thấy loại truy vấn bình thường, người sử dụng chung khơng thể QBIC [3] ví dụ hệ thống tra cứu ảnh dựa theo nội dung sử dụng loại phương pháp truy vấn 1.2.1.3 Các truy vấn dựa vào thuộc tính (Attribute – Based queries) Các truy vấn dựa vào thuộc tính sử dụng thích văn bản, trích rút nỗ lực người, khố tra cứu Loại biểu diễn địi hỏi độ trừu tượng cao khó để thu phương pháp tự động hoàn toàn ảnh chứa số lượng lớn thơng tin mà khó tóm tắt sử dụng số từ khố Phương pháp nhìn chung nhanh dễ để thực hiện, có độ chủ quan nhập nhằng cao xuất đề cập Hầu hết nỗ lực nghiên cứu thương mại tập trung vào xây dựng hệ thống thực tốt với phương pháp QBE 15 1.2.2 Đánh số nhiều chiều Để thực tra cứu ảnh dựa vào nội dung sở liệu ảnh lớn, kỹ thuật đánh số nhiều chiều cần sử dụng Có ba cộng đồng nghiên cứu đóng góp vào lĩnh vực này: hình học tính tốn, quản trị sở liệu, nhận dạng mẫu Các kỹ thuật đánh số nhiều chiều phổ biến có gồm thuật tốn bucketing, k-d, k-d ưu tiên, tứ phân, K-D-B, hB, R-tree biến thể R+ R* Lịch sử kỹ thuật đánh số nhiều chiều quay lại năm 1970, phương pháp khối, tứ phân, k d giới thiệu lần Tuy nhiên, hiệu cịn xa so với mong muốn Bị thúc đẩy nhu cầu cấp bách đánh số không gian từ hệ thống GIS CAD, Guttman đề xuất cấu trúc đánh số R-tree [2] Dựa nghiên cứu ông, nhiều biến thể khác Rtree phát triển [1] Năm 1990, Beckmann Kriegel đề xuất biến thể R-tree động, R* tree [5] Tuy nhiên, R* tree không thực tốt với số chiều lớn 20 1.3 Đánh giá hiệu tra cứu Để đánh giá hiệu hệ thống tra cứu, người ta đưa hai số đo độ thu hồi (recall) độ xác (precision) Các số đo lấy từ hệ thống tra cứu thông tin truyền thống Đối với truy vấn q , tập hợp ảnh sở liệu thích hợp với truy vấn q ký hiệu R q kết tra cứu truy vấn q ký hiệu Q q Độ xác việc tra cứu định nghĩa tỉ lệ kết thu thích hợp với truy vấn precision Q( q ) R ( q ) Q( q ) 1.1 Độ thu hồi tỉ lệ kết thích hợp truy vấn trả lại: recall Q( q ) R ( q ) R( q ) 1.2 Việc lựa chọn R q lại không ổn định đa đạng cách hiểu ảnh Hơn nữa, số lượng ảnh thích hợp lại lớn số lượng ảnh hệ thống tìm 16 lúc khái niệm độ thu hồi trở thành vơ nghĩa Do đó, độ xác độ thu hồi mô tả dạng thô hiệu hệ thống tra cứu Gần MPEG7 có đề nghị cách đánh giá hiệu hệ thống tra cứu gọi ANMRR(average normalized modified retrieval rank) Theo cách độ xác độ thu hồi kết hợp thành số đo Ký hiệu số lượng ảnh hoàn toàn với truy vấn q N(q) số lượng lớn ảnh hoàn toàn với tất Q truy vấn tức max N q1 , N q , , N q M Sau truy vấn q ảnh hoàn toàn k gán giá trị xếp hạng rank(k) giá trị thứ hạng số ảnh hồn tồn ảnh nằm k kết truy vấn ( k N q ,2M ) có giá trị k ảnh khơng nằm k kết truy vấn Thứ hạng trung bình AVR q truy vấn q tính: N q AVR (q ) k rank q N q 1.3 Thứ hạng tra cứu sửa đổi MRR q tính là: MRR q AVG q 0.5 0.5 * N q 1.4 MRR q nhận giá trị tất ảnh hoàn toàn nằm k kết truy vấn Thứ hạng tra cứu sửa đổi chuẩn hoá NMRR q ) nhận giá trị từ đến tính: NMRR (q) MRR (q) k 0.5 0.5 * N (q) 1.5 Thứ hạng tra cứu sửa đổi chuẩn hoá trung bình ANMRR xét tất truy vấn Q là: ANMRR Q Q NMRR q 1.6 q 1.4 Những hệ thống tra cứu ảnh theo nội dung Những năm gần đây, có nhiều hệ thống tra cứu ảnh, hệ thống nghiên cứu hệ thống thương mại xây dựng Dưới đây, số hệ thống CBIR phát triển 17 1.4.1 Hệ thống QBIC (Query By Image Content) IBM QBIC chuẩn cho truy vấn nội dung ảnh, hệ thống tra cứu ảnh dựa vào nội dung thương mại QBIC hỗ trợ truy vấn dựa vào ảnh mẫu, phác thảo vẽ người sử dụng xây dựng, mẫu kết cấu màu lựa chọn QBIC kỹ thuật flood-fill tăng cường Một công cụ phác thảo để trợ giúp người sử dụng theo dõi điểm biên đối tượng dựa khái niệm “snakes” phát triển nghiên cứu thị giác máy tính Cơng cụ nhận đường cong phác thảo người sử dụng lề tự động với điểm biên ảnh gần cạnh Nó tìm đường cong cực đại hoá độ lớn gradient ảnh dọc đường cong Sau nhận biết đối tượng, QBIC tính tốn đặc trưng đối tượng ảnh Các đặc trưng sau:Màu, Kết cấu, Hình, Phác thảo Ngay đặc trưng mô tả, độ đo tương tự sử dụng để nhận ảnh tương tự Trong bước tìm kiếm, QBIC phân biệt “các ảnh” “các đối tượng” Một ảnh ảnh màu đầy đủ frame đơn video đối tượng phần ảnh QBIC tính tốn đặc trưng sau: Các đối tượng, ảnh QBIC số hệ thống nhận vào miêu tả đánh số đặc trưng nhiều chiều 1.4.2 Hệ thống Virage công ty Virage Virage máy tìm kiếm ảnh dựa vào nội dung phát triển liên hợp Virage Tương tự với QBIC, Virage hỗ trợ truy vấn trực quan dựa màu, thành phần cấu tạo (bố cục màu), kết cấu cấu trúc (thông tin đường bao đối tượng) Nhưng Virage tiến bước xa QBIC Nó hỗ trợ kết hợp tùy ý truy vấn Người sử dụng điều chỉnh trọng số kết hợp với đặc trưng theo nhấn mạnh riêng họ Jeffrey cộng đề xuất tiếp khuôn khổ mở cho quản lý ảnh Họ phân loại đặc trưng trực quan thành tổng quát (như màu, hình, kết cấu) lĩnh vực cụ thể (nhận dạng mặt người, phát khối u, v.v ) 1.4.3 Hệ thống RetrievalWare tập đoàn công nghệ Excalibur RetrievalWare máy tra cứu ảnh dựa vào nội dung phát triển tập đoàn cơng nghệ Excalibur Máy tìm kiếm gần họ sử dụng màu, hình, kết cấu, độ sáng, bố cục màu, hướng tỷ lệ ảnh, đặc trưng truy vấn Người sử 18 dụng điều chỉnh trọng số kết hợp với đặc trưng trình tìm kiếm 1.4.4 Hệ thống VisualSeek WebSeek đại học Columbia VisualSEEk máy tìm kiếm đặc trưng trực quan WebSEEk máy tìm kiếm văn bản/ảnh web, hai sản phẩm phát triển đại học Columbia VisualSEEK hỗ trợ truy vấn dựa vào đặc trưng trực quan quan hệ không gian chúng WebSEEK máy tìm kiếm hướng Web Nó gồm ba module module tập hợp ảnh/video, module phân loại chủ đề đánh số, module tìm kiếm, duyệt, tra cứu hỗ trợ tra cứu dựa từ khóa nội dung trực quan 1.4.5 Hệ thống Photobook phịng thí nghiệm truyền thông MIT Photobook tập công cụ tương tác để duyệt tìm kiếm ảnh phát triển phịng thí nghiệm MIT Media Hệ thống cho phép người sử dụng tra cứu ảnh dựa màu sắc, hình dạng kết cấu Hệ thống cơng cụ bán tự động sinh mẫu truy vấn dựa vào ảnh mẫu cung cấp người sử dụng Cho phép người sử dụng trực tiếp đưa yêu cầu truy vấn họ với lĩnh vực khác nhau, lĩnh vực họ thu mẫu truy vấn tối ưu Trong phiên Photobook gần nó, Picard cộng đề xuất gồm người sử dụng lặp thích tra cứu ảnh 1.4.6 Hệ thống Netra Đại học California, Thƣ viện ảnh Alexandria Netra hệ thống tra cứu ảnh nguyên mẫu phát triển dự án ADL Netra sử dụng thông tin màu, kết cấu, hình, vị trí khơng gian vùng ảnh phân đoạn để tìm kiếm tra cứu vùng tương tự từ sở liệu Các đặc trưng nghiên cứu hệ thống Netra phân tích kết cấu dựa lọc Gabor, xây dựng từ điển ảnh dựa mạng neural phân đoạn vùng dựa vào luồng biên 1.5 Kết luận Trong chương này, em giới thiệu kỹ thuật tra cứu ảnh dựa vào nội dung, bao gồm: tra cứu thông tin thị giác, chức tiêu biểu hệ thống tra cứu ảnh dựa vào nội dung, đánh giá hiệu tra cứu trình bày số hệ thống tra cứu ảnh theo nội dung Đặc biệt em nhấn mạnh vào đặc trưng thị giác Trong đồ án 19 em tập trung vào vấn đề nâng cao hiệu hệ thống tra cứu ảnh dựa vào nội dung thị giác thông qua sử dụng đặc trưng màu sắc

Ngày đăng: 05/08/2022, 06:56

Tài liệu cùng người dùng

Tài liệu liên quan