Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 56 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
56
Dung lượng
1,49 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TRẦN DOÃN HIỂN NGHIÊN CỨU PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH SỬ DỤNG PHÂN CỤM VÀ ỨNG DỤNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, năm 2013 LỜI MỞ ĐẦU Xử lý ảnh lĩnh vực nghiên cứu phát triển không ngừng tính trực quan sinh động khả áp dụng vào thực tế lớn Hiện xử lý ảnh giành nhiều quan tâm nhà nghiên cứu nước Trong xử lý ảnh, tra cứu ảnh nói lĩnh vực đòi hỏi nghiên cứu tổng hợp: nghiên cứu xử lý ảnh để rút trích đặc trưng, áp dụng tính toán toán học cao cấp để xác định mức độ tương đồng hai ảnh Hơn nữa, với phát triển phần mềm phần cứng, khối lượng ảnh phát triển không ngừng ngày lớn Một số lượng lớn ảnh sử dụng thư viện ảnh số web Vì nhu cầu tìm kiếm ảnh nhu cầu tất yếu Hiện tại, tra cứu ảnh ứng dụng nhiều lĩnh vực như: quản lý biểu trưng(logo), truy tìm tội phạm, ứng dụng y khoa, quân sự… Hệ thống tra cứu ảnh dựa nội dung (CBIR-Content-Based Image Retrieval) hệ thống truy vấn ảnh dựa việc tự động rút trích số thông tin đặc trưng ảnh như: màu sắc, kết cấu, vị trí, hình dạng Phương pháp nhiều người nghiên cứu với nhiều cách tiếp cận khác nhau; nhiều hệ thống tra cứu ảnh dựa nội dung đời như: QBIC, VisualSeek, WebSeek BlobWorld Phân cụm toán nhiều người nghiên cứu trước đây, nayvẫn có vai tròquan trọng cần thiết nghiên cứu khai phá liệu nhiều lĩnh vực đời sống: thương mại, sinh học, phân tích liệu không gian Đề tài nghiên cứu kỹ thuật phân cụm ảnh thành vùng trích chọn đặc trưng vùng, dựa vào ta tra cứu ảnh cách nhanh chóng xác từ sở liệu ảnh cho trước Có nhiềuphương pháp phân cụm khác K-Means, HAC Mỗi phương pháp có ưu điểm, mạnh riêng có yêu cầu riêng cách biểu diễn liệu, độ đo So sánh thuật toán khác phạm vi khác khôngđơn giản, việc đánh giá thường dựa vào chất lượng kết phân cụm.Phân cụm tích lũy phân cấp (Hierarchical Agglomerative Clustering HAC) thuật toán phân cụm phâncấp có tính gia tăng cao tạo phân cấp pixel dựa theo yếu tố đó, theo hướng tiếp cận khóa luận áp dụng phương pháp phâncụm HAC để phân cụm liệu trước đưa vào tra cứu ảnh Nội dung luận văn giới thiệu tổng quan tra cứu ảnh dựa vào nội dung sâu vào đề tài “Nghiên cứu phương pháp phân đoạn ảnh sử dụng phân cụm ứng dụng tra cứu ảnh dựa vào nội dung” Trên sở phương pháp tra cứu ảnh dựa vào phân cụm, tiến hành xây dựng chương trình thử nghiệm cho phép đọc vào ảnh mẫu tìm kiếm ảnh tương tự với ảnh mẫu tập hợp ảnh cho trước Nội dung khoá luận gồm có chương: CHƯƠNG 1: TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG, giới thiệuphương pháp tra cứu ảnh dựa vào nội dung số hệ thống tra cứu ảnh tiêu biểu CHƯƠNG 2: TRA CỨU ẢNH DỰA VÀO NỘI DUNG SỬ DỤNG PHÂN CỤM THEO MÀU, giới thiệu chi tiết thuật toán phương pháp tra cứu ảnh sử dụng phân cụm CHƯƠNG 3: XÂY DỰNG HỆ THỐNG VÀ KẾT QUẢ ĐẠT ĐƯỢC, xây dựng phân tích thiết kế hệ thống giới thiệu số kết đạt xây dựng chương trình LỜI CẢM ƠN Trong trình thực luận văn này, em nhận hướng dẫn, bảo tận tình TS Nguyễn Hữu Quỳnh, Khoa Công nghệ Thông tin thuộc trường Đại học Điện lực cán trực tiếp hướng dẫn khoa học cho em Thầy giành nhiều thời gian việc hướng dẫn cách nghiên cứu, đọc tài liệu, cài đặt thuật toán giúp đỡ xây dựng hệ thống thực nghiệm Em xin chân thành cảm ơn Thầy, Cô giáo trường Đại học Công nghệ Thông tin Truyền Thông, Đại học Thái Nguyên nhiệt tình giúp đỡ tạo điều kiện tốt cho em suốt trình học tập trường Xin chân thành cảm ơn anh, chị bạn học viên lớp Cao học - trường Đại học Công nghệ Thông tin Truyền Thông thuộc Đại học Thái Nguyên động viên, giúp đỡ nhiệt tình chia sẻ với kinh nghiệm học tập, công tác suốt khoá học Và lời cuối cùng, xin bày tỏ lòng chân thành biết ơn tới cha mẹ, anh chị, người gia đình bạn bè bên cạnh lúc khó khăn nhất, giúp vượt qua khó khăn học tập sống Thái Nguyên, ngày 25 tháng năm 2013 MỤC LỤC Lời mở đầu Trang DANH MỤC CÁC BẢNG, SƠ ĐỒ, HÌNH KÍ HIỆU CÁC CỤM TỪ VIẾT TẮT CBIR Content Base Image Retrieval Tra cứu ảnh dựa vào nội dung QBIC Query By Image Content Truy vấn theo nội dung ảnh CIE Commission internationale de l'éclairage Uỷ ban quốc tế màu sắc HAC Hierarchical Agglomerative Clustering Phân cụm tích luỹ phân cấp CBC Color Base Clustering Phân cụm dựa vào màu MST Minimum Spainning Tree Cây mở rộng tối thiểu IRM Integrated Region Matching Đối sánh vùng tích hợp CSDL Cơ Sở Dữ Liệu Chương 1: TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG 1.1 Giới thiệu Thông thường để lưu trữ thông tin, liệu nội dung, vật, việc người ta thường chọn sử dụng dạng lưu trữ kiểu văn Nhưng lưu trữ liệu văn nhiều phản ánh đầy đủ, chân thực đối tượng miêu tả nhiều cảm nhận chủ quan củangười viết Vì kết hợp với lưu trữ liệu dạng văn người ta sử dụng lưu trữ liệu dạng ảnh Khối lượng liệu dạng ảnh ngày trở nên khổng lồ thiết bị thu nhận ảnh số ngày trở nên phổ biến với giá phù hợp Khi ta có nhu cầu tìm kiếm vài ảnh kho liệu ảnh lên tới vài trăm nghìn ảnh để minh họa cho đề tài tuyệt đối chuyện đơn giản tìm kiếm cách thủ công tức xem ảnh ta tìm thấy ảnh có nội dung cần tìm Song song với phát triển phương tiện kỹ thuật số tương lai, số lượng ảnh tăng nhiều Do nhu cầu thật đòi hỏi phải có công cụ hỗ trợ tìm kiếm ảnh xác hiệu Vì tra cứu ảnh dựa vào nội dung đời để góp phần đáp ứng nhu cầu “Tra cứu ảnh dựa vào nội dung” - Đây chủ đề nghiên cứu lĩnh vực công nghệ thông tin Mục đích lấy ảnh từ sở liệu phù hợp với tiêu chí truy vấn Các yếu tố mô tả nội dung ảnh có liên quan đến cảm nhận màu sắc, kết cấu, hình dạng, cấu trúc, mối liên hệ không gian chuyển động Do vậy, phân tích ảnh, nhận dạng ảnh thị giác máy tính đóng vai trò hệ thống tra cứu ảnh.Nó cho phép tự động trích chọn hầu hết thông tin cảm nhận, thông qua việc phân tích phân bố điểm ảnh rút độ đo nội dung trực quan Các hệ thống truy vấn ảnh dựa vào nội dung đa dạng nhìn chung phân biệt bởi: đặc trưng mà hệ thống rút trích từ ảnh để làm sở truy vấn, phương pháp trích rút đặc trưng ảnh sử dụng hệ thống truy vấn, độ đo tương tự hai ảnh, phương pháp đánh số nhiều chiều để tối ưu việc tìm kiếm Một hệ thống tra cứu ảnh dựa nội dung tiêu biểu không liên quan tới nguồn thông tin dạng khác (ví dụ văn bản, ảnh video) mà liên quan đến nhu cầu người sử dụng Về phân tích nội dung nguồn thông tin truy vấn người sử dụng sau đối sánh chúng để tìm tiêu chí có liên quan Những chức hệ thống tra cứu ảnh dựa vào nội dung bao gồm: Phân tích nội dung nguồn thông tin biểu diễn nội dung nguồn thông tin phân tích phù hợp với đối sánh truy vấn người sử dụng (không gian thông tin nguồn chuyển đổi thành không gian đặc điểm với mục đích đối sánh nhanh bước tiếp theo) Bước thường nhiều thời gian cho việc xử lý thông tin nguồn (ảnh) sở liệu Nó phải làm lần làm độc lập Phân tích truy vấn người dùng biểu diễn chúng thành dạng phù hợp với việc đối sánh với sở liệu nguồn Nhiệm vụ bước giống với bước trước áp dụng với ảnh truy vấn Xác định chiến lược để đối sánh tìm kiếm truy vấn với thông tin lưu trữ sở liệu Bước thực trực tuyến thực nhanh Công nghệ đánh số sử dụng để nhận dạng không gian đặc điểm để tăng tốc độ xử lý đối sánh Tạo điều chỉnh cần thiết hệ thống (thường cách đối chiếu tham số công nghệ đối sánh) dựa phản hồi từ người sử dụng hình ảnh tra cứu Thực ngoại tuyến So sánh độ tương Các kết tra c Phản hồi liên qu Người sử dụng Tạo truy ỉ số Cơ sở l Các hệ thống tra cứu ảnh dựa vào nội dung thường tuân theomô hình sau: Hình 1.1: Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung Chúng ta nhận thấy mặt hệ thống tra cứu ảnh dựa vào nội dung, có nguồn thông tin trực quan khuôn dạng khác mặt có truy vấn người sử dụng Hai mặt liên kết thông qua chuỗi tác vụ minh họa Hình 1.1 Hai tác vụ phân tích truy vấn người sử dụng đánh số nhiều chiều tóm lược hai tác vụ quan trọng nhất: “Phân tích nội dung thông tin nguồn” (trích rút đặc trưng) “Định nghĩa chiến lược để đối sánh truy vấn tìm kiếm với thông tin sở liệu lưu trữ” (độ đo tương tự), mô tả chi tiết phần (mục 2.3.3 mục 2.4) 1.2 Đặc trưng ảnh 1.2.1 Màu sắc Mắt người nhạy cảm với màu sắc đặc điểm màu thành phần quan trọng giúp người nhận biết hình ảnh Vì vậy, đặc điểm màu sắc đặc điểm nội dung ảnh Đặc điểm màu sắccó thể cung cấp thông tin hữu hiệu cho việc phân loại ảnh chúng hữu ích cho việc tra cứu ảnh Cũng mà tra cứu ảnh dựa màu sắc sử dụng rộng rãi hệ thống tra cứu ảnh dựa nội dung Biểu đồ màu thường sử dụng để thể đặc điểm màu ảnh Mặc dù trước sử dụng biểu đồ màu cần phải lựa chọn xác định kiểu không gian màu lựa chọn độ đo tương tự 1.2.1.1 Không gian màu Không gian màu biểu diễn tập màu, số không gian màu sử dụng rộng rãi đồ họa máy tính Màu sắc thường xác định không gian màu chiều Không gian màu RGB Không gian màu RGB không gian màu sử dụng nhiều cho đồ hoạ máy tính Lưu ý R,G B viết tắt từ đỏ (Red), xanh lục (Green) xanh lơ (Blue) Đây không gian màu cộng: đỏ, xanh lục xanh lơ kết hợp lại để tạo màu khác Không gian không đồng nhận thức Không gian màu RGB trực quan hoá hình khối, minh hoạ hình 1.2 10 Hình 1.2: Không gian màu RGB trực quan hoá hình khối Mỗi trục màu (R, G, B) có độ quan trọng Do đó, trục nên lượng hoá với độ xác Khi không gian màu RGB lượng hoá, số bin luôn hình khối Thông thường, (2 3), 64 (43), 216 (63), 512 (83) bin sử dụng lượng hoá không gian màu RGB Chuyển đổi từ ảnh RGB sang ảnh cấp xám nhận tổng R, G B chia kết cho ba Không gian màu HSx Không gian màu HSI, HSV, HSB HLS thường gọi HSx có mối liên quan gần gũi với nhận thức màu sắc người không gian màu RGB Những trục từ không gian màu HSx mô tả đặc tính màu sắc độ, độ bão hoà độ sáng Sự khác không gian màu HSx biến đổi chúng từ không gian màu RGB, chúng thường mô tả hình dạng khác (như hình nón, hình trụ) Trong hình 1.3 không gian màu HSV mô tả hình nón 42 • Thực phân chia ảnh thành vùng dựa theo Phân cụm ảnh Lưu ảnh vào csdl khoảng cách euclide pixel màu • Trích rút đặc trưng vùng, cụ thể đặc trưng màu sắc, kích cỡ vị trí không gian vùng • Lưu thông tin ảnh véc tơ đặc trưng sau trích rút ảnh Xóa ảnh khỏi csdl • Xoá ảnh đặc trưng khỏi csdl Biểu đồ trình tự Hình 3.4: Biểu đồ trình tự tra cứu ảnh 43 Hình 3.5:Biểu đồ trình tự lưu vào sở liệu Hình3.6:Biểu đồ trình tự xoá ảnh khỏi sở liệu 44 3.3.2 Thiết kế sở liệu Tên trường Kiểu liệu Khóa Mô tả Image_ID Int X ID ảnh ImageName Nvarchar(500) Tên ảnh ImageClus Image Dữ liệu ảnh sau phân cụm Width Int Chiều rộng ảnh Height Int Chiều cao ảnh Threshold Int Ngưỡng màu Bảng 3.1 : Bảng sở liệu Image Tên trường Kiểu liệu Khóa Mô tả Cluster_ID Int X ID Cụm ảnh ID_Image Int TotalPixel Float Tổng số pixel cụm hay cỡ cụm Centroid_X Float Trọng tâm cụm theo hướng X Centroid_Y Float Trọng tâm cụm theo hướng Y RMean Float Giá trị đặc trưng kênh màu Red GMean Float Giá trị đặc trưng kênh màu Green BMean Float Giá trị đặc trưng kênh màu Blue ID ảnh Bảng 3.2 : Bảng sở liệu Cluster Mối quan hệ bảng: 45 Hình 3.7: Mối quan hệ bảng 3.4 Mô tả chương trình Chương trình xây dựng với mục đích tra cứu ảnh dựa đặc trưng màu, cỡ vị trí không gian Sử dụng hai ảnh có tập ảnh sở liệu hai ảnh tập ảnh sở liệu để so sánh, đánh giá hiệu hệ thống Không gian màu sử dụng chương trình không gian màu RGB, khuôn dạng không gian màu RGB định dạng phổ biến ảnh số Tập ảnh thử nghiệm CSDL gồm 1000 ảnh jpeg CSDL ảnh tập tập ảnh GS Wang [15] tập hợp từ Internet sử dụng để đánh giá hiệu tra cứu Các ảnh CSDL có kích cỡ 128× 85 điểm ảnh 85×128 điểm ảnh Các ảnh gồm 256 màu CSDL gồm loại ảnh chính: ngựa, cảnh hoàng hôn, vườn hoa, rừng, phong cảnh, nhà cửa loại ảnh khác Bảng 3.3 số liệu cụ thể loại ảnh sở liệu: STT Loại ảnh Ngựa Cảnh hoàng hôn Vườn hoa Rừng Bầu trời, phong cảnh Nhà cửa Các loại ảnh khác Số lượng 71 85 121 130 356 115 122 Bảng 3.3:Số liệu loại ảnh sở liệu 46 3.5 Kết đạt Qua trình tìm hiểu phân tích thiết kế hệ thống trình bày trên, thời gian nghiên cứu tìm hiểu thuật toán em xây dựng hệ thống tra cứu ảnh thử nghiệmvới tập ảnh sở liệu thử nghiệm trình bày phần trê Hệ thống thử nghiệm cho số kết tốt Giao diện tra cứu ảnh: Người sử dụng lựa chọn ảnh truy vấnvà nhấn nút tra cứu Hình 3.8: Giao diện hệ thốngtra cứu ảnh Giao diện hiển thị ảnh kết quả: Hệ thống tiến hành tìm kiếm ảnh hiển thị kết hình Hình 3.9: Giao diện hiển thị kết truy vấn 47 Các vùng ảnh sau phân cụm Hình 3.10:Các vùng ảnh sau phân cụm Giao diện thao tác sở liệu Hình 3.11: Giao diện tab sở liệu 48 Thêm ảnh vào sở liệu: Hình3.12: Giao diện thêm ảnh vào sở liệu Xoá ảnh khỏi sở liệu: Hình 3.13: Giao diện xoá ảnh khỏi sở liệu 49 Đánh giá hiệu hệ thống Trong luận văn này, sử dụnghai ảnh tập sở liệu hai ảnh tập sở liệu để làm ảnh mẫu truy vấnđể xem hiệu chương trình đạt Hệ thống đưa bẩy ảnh kết gần với ảnh mẫu truy vấn Sử dụng hai ảnh sở liệu làm ảnh truy vấn: + Ảnh truy vấn thứ : Hình 3.14: Ảnh mẫu truy vấn thứ + Ảnh kết thu lần thứ nhất: Hình 3.15: Kết truy vấn lần thứ 50 + Ảnh truy vấn thứ hai : Hình 3.16: Ảnh mẫu truy vấn thứ hai + Ảnh kết thu lần thứ hai: Hình 3.17: Kết truy vấnlần thứ hai 51 Sử dụng hai ảnh tập sở liệu ảnh làm ảnh truy vấn: + Ảnh truy vấn lần thứ : Hình 3.18: Ảnh mẫu truy vấn thứ ba + Ảnh kết thu lần thứ ba: Hình 3.19: Kết truy vấn lần thứba 52 + Ảnh truy vấn lần thứ : Hình 3.20: Ảnh mẫu truy vấn thứ ba + Ảnh kết thu lần thứ 4: Hình 3.21: Kết truy vấn lần thứ4 53 Ở thấy hiệu hệ thống truy vấn ảnh mẫu CSDL có CSDL Tiếp theo đánh giá hệ thống theo chủ đề với tham số ngưỡng khác cách thay đổi ngưỡng đầu vào ảnh mẫu truy vấn thuộc số chủ đề định Ngưỡng màu Ngưỡng cỡ Số cụm Kết 0,1 45 50% 10 0,1 31 65% 11 0,1 26 50% 12 0,1 16 55% 13 0,05 12 65% 13 0,1 13 70% 13 0,15 13 65% Bảng 3.4 : Bảng kết tra cứu với chủ đề Ngựa Ngưỡng màu Ngưỡng cỡ Số cụm Kết 10 0,1 19 70% 11 0,05 23 60% 11 0,1 23 90% 11 0,15 24 65% 12 0,1 21 70% 13 0,1 22 90% Bảng 3.5 : Bảng kết tra cứu với chủ đề Hoa Kết hai bảng cho ta thấy với ngưỡng màu hay ngưỡng cỡ khác cho kết tra cứu khác Kết tra cứu tốt hay không phụ thuộc nhiều vào cách chọn ngưỡng màu ngưỡng cỡ cho phù hợp 3.6 Kết đạt Trong chương cuối này, trình bày phân tích thiết kế hệ thống tra cứu ảnh dựa vào phân cụm số kết thử nghiệm đạt Qua kết thu ta nhận thấy rằngphương pháp tra cứu dựa vào đặc trưng màu cho kết tốt so với mong muốn tra cứu người dùng 54 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Tra cứu ảnh dựa theo nội dung lĩnh vực nghiên cứu mở Những công nghệ non trẻ nhiều vấn đề cần phải tiếp tục nghiên cứu Trong giới hạn luận văn, trình bày tổng quan công nghệ tra cứu ảnh dựa theo nội dung với phương pháp thường sử dụng Đặc biệt xây dựng thử nghiệm chương trình tra cứu ảnh với sở liệu ảnh tự nhiên dựa vào đặc trưng vùngđã thu kết định Qua ta thấy hiệu phương pháp đãcho kết hiệu quảmặt khác thời gian tìm kiếm cũngnhanh Nhưng tra cứu ảnh theo nội dung dựa đặc trưng vùnggồmmàu sắc, vị trí không gian cỡ nên phản ánh khía cạnh ảnh phản ánh hếtngữ nghĩa ảnh Mặc dù hệ thống đáp ứng phần lớn yêu cầu người sử dụng Ở Việt Nam, công việc quản lý, tìm kiếm ảnh, biểu trưng(logo) chủ yếu thủ công làm nhiều thời gian công sức Nếu đầu tư xây dựng hệ thống tra cứu ảnh tốt thu lợi ích to lớn lĩnh vực hình sự, giáo dục, văn hóa…Đặc biệt có lợi hệ thống tìm kiếm ảnh Internet kho liệu vô lớnvà phong phú Luận văn thực công việc sau: - Tìm hiểu tổng quan tra cứu ảnh dựa vào nội dung - Nghiên cứu phương pháp tra cứu ảnh dựa vào phân cụm pixel ảnh - Tìm hiểu sưu tầm tập ảnh thử nghiệm - Xây dựng hệ thống thực nghiệm tra cứu cho kết tốt 55 TÀI LIỆU THAM KHẢO Tiếng Việt: Nguyễn Đức Nghĩa – Nguyễn Tô Thành, Toán rời rạc, NXB Đại học Quốc gia Hà nội, 2003 Nguyễn Thị Thu Chung, Xây dựng danh bạ web tiếng việt với phân cụm phân cấp văn bản, khoá luận tốt nghiệp đại học quy, Trường đại học công nghệ- Đại học quốc gia Hà Nội, 2009 Tiếng Anh: Beckmann, N., Kriegel, H.-P., Schneider, R., and Seeger, B (1990), The R*Tree: An efficient and robust access method for points and rectangles In Proc of ACM SIGMOD David M Blei, Hierarchical clustering, COS424 Princeton University, February 28, 2008 Flickner.M, Sawhney.H, Niblack.W, Ashley.J, Huang.Q, Dom.B, Gorkani.D, Hafner.J, Lee D, Petkovic D, Steele.D, Yanker.D, Query by Image and Video Content: The QBIC System IEEE Computer 1995, september, pp 2332 H Tamura, S Mori, and T Yamawaki Texture features corresponding to visual perception IEEE Transactionson Systems,Man, and Cybernetics, SMC-8(6):460–473, 1978 J.Z Wang, J Li, and G Wiederhold Simplicity: Semantics-sensitive integrated matching for picture libraries IEEE Trans on Pattern Analysis and Machine Intelligence, 23(9):947–963, 2001 R Haralick, K Shanmugam, and I Dinstein Texture feature for image classification IEEE Transactions on Systems, Man, and Cybernetics, SMC-3(6):610–621, 1973 R.C Gonzalez and R.E Woods, Digital Image Processing.AddisonWesley, third edition, 1992 10 R.O Stehling, M.A Nascimento, and A.X Falc˜ao An adaptive and efficient clustering-based approach for content based image retrieval in image databases In Proc of the Intl Data Engineering and Application Symposium, pages 356–365, 2001 11 T Kanungo, D M Mount, N Netanyahu, C Piatko, R Silverman, & A Y.Wu (2002) An efficient k-means clustering algorithm: Analysis and implementation Proc IEEE Conf Computer Vision and Pattern Recognition, pp.881-892 12 Veena Sridhar (2002), Region-based Image Retrieval Using Multiple Features, Technical Report Technical Report TR 02-10, University of Alberta, Edmonton, Alberta, Canada 13 Geusebroek, J M., van den Boomgaard, R., Smeulders, A W M., and Geerts, H (2001) Color invariance IEEE Trans on Pattern Analysis and Machine Intelligence, 23(12):1338–1350 Các tài liệu khác: 14 http://www.ics.uci.edu/~eppstein/280/tree.html 56 15 http://vi.wikipedia.org/wiki/Không_gian_Euclide 16 Wang’s research group (2004), http://wang.ist.psu.edu/docs/related.shtml [...]... về tra cứu ảnh dựa vào nội dung, bao gồm: tra cứu ảnh, trình bày một số ứng dụng củahệ thống CBIR, các 21 chức năng tiêu biểu của hệ thống tra cứu ảnh dựa vào nội dung, một số nghiên cứu liên quan về màu và thông tin không gian, đặc trưng hình và kết cấu Đặc biệt tôi nhấn mạnh vào các đặc trưng màu vàthông tin không gian 22 Chương 2 : TRA CỨU ẢNH DỰA VÀO NỘI DUNG SỬ DỤNG PHÂN CỤM 2.1 Giới thiệu về phân. .. R*-Tree[3] và là hệ thống đầu tiên có cách tiếp cận tra cứu ảnh dựa trên nội dung được ứng dụng trong thực tiễn Các kỹ thuật trong hệ thống này là cơ sở nghiên cứu cho sự xây dựng và phát triểncủa các hệ thống tra cứu ảnh sau này QBIC cung cấp một số phương pháp: đơn đặc trưng, đa đặc trưng [12] và Multi-pass: • Phương pháp truy vấn đơn đặc trưngchỉ sử dụng một đặc điểm cụ thể để tra cứu ảnh • Truy... đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thời gian đầu, các phương pháp phân cụm ảnh được đưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiện thu thập và lưu trữ Ngày nay, cùng với sự phát triển về các phương tiện thu nhận và biểu diễn ảnh, các ảnh màu đã hầu như thay thế hoàn toàn các ảnh mức xám trong việc biểu diễn và lưu trữ thông... theo chúng ta so sánh ảnh mẫu truy vấn với các ảnh trong cơ sở dữ liệu, muốn so sánh các ảnh thì phải dựa vào độ đo khoảng cách giữa các đặc trưng đã trích rút của ảnh mẫu với tập ảnh cơ sở dữ liệu.Độ đo khoảng cách là một trong những mục chính trong quá trình tra cứu ảnh mà quyết định độ chính xác và tốc độ của kỹ thuật tra cứu ảnh Trong trường hợp tra cứu sử dụng các vùng của ảnh, quan trọng là để... đồ màu và véctơ gắn kết màu, không gian màu HSV cung cấp các kết quả tra cứu tốt hơn không gian CIE L*u*v* và CIE L*a*b* 2.3 Kỹ thuật phân đoạn ảnh sử dụng phân cụm theo màu 2.3.1 Khoảng cách Euclid Trong đó là các thuộc tính 2.3.2 Kỹ thuật phân cụm ảnh Phân cụm ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng... thuật toán phân cụm và xác lập các điều kiện khởi tạo, xây dựng các thủ tục biểu diễn và đánh giá kết quả phân cụm Hiện nay chưa có một phương phápphân cụm tổng quát nào có thể giải quyết trọn vẹn cho tất cả các dạng cấu trúc dữ liệu Với những dữ liệu hỗn hợp thì việc phân cụm càng khó khăn hơn và đây đang là một thách thức trong ngành khai phá dữ liệu 2.1.3 Phân cụm phân cấp Phương pháp phân cụm phân cấp(hierachical... đoạn thích hợpđể chia ảnh thành các vùng Các kỹ thuật phân đoạn có thểđược phân lớp thành ba loại: dựa vào vùng, dựa vào ường biên và dựa vào pixel.Sau khi ảnh ược phân đoạn và thu đượccác vùng, các đặc trưng thuộc về các vùng thu được sẽ được ghi lại Các mã xích[9] sử dụng 4 hoặc 8 liên thông để biểu diễn cácđoạn thẳng tạo thành đường biên của vùng Các dấu hiệu, số các hình và a giác là các lượcđồ... vùng thuần nhất từ ảnh trong một thời gian ngắn Luận văn nghiên cứu hai thuật toánphân đoạn khác nhau có tên là K-means[11] và kỹ thuật phân cụm được đề xuất bởi Stehling [10] K-means là một trong những phương pháp phân cụm phổ biến nhất và dễ dàng thực hiện Phương pháp khởi tạo ngẫu nhiên giá trị trung bình của K cụm và tính toán sự khác nhau giữa mỗi pixel và trung bình của mỗi cụm Tính toán này quyết... agglomerativeclusteringHAC) Trong thực tế phân cụm phân cấp bottom-up được sử dụng rộng rãi hơn là topdowndo các tiêu chí để ghép cụm trong bottom-up đơn giản và dễ thực hiện hơn việcđánh giá tách cụm trong top-down Trong báo cáo này tôi tập trung vào phươngpháp bottom-uptức là HAC Phương pháp HAC 26 HAC dựa theo đặc thù của thuật toán phân cụm đệ quy và coi mỗi đối tượng nhưmột điểm dữ liệu trong không gian Euclide Việc... Các hệ thống tra cứu ảnh dựa vào nội dung 1.4.1 Hệ thống QBIC (Query By Image Content) Hệ thống QBIC[5] là hệ thống tra cứu ảnh dựa trên sự phác thảo cho phép người sử dụng xây dựng một phác thảo, vẽ ra và lựa chọn màu sắc cùng các mẫu kết cấu Các đặc trưng màu sử dụng trong QBIC là giá trị màu trung bình của không gian RGB QBIC là một trong các hệ thống dùng cấu trúcđánh chỉ số nhiều chiều dựa trên cấu ... áp dụng phương pháp phâncụm HAC để phân cụm liệu trước đưa vào tra cứu ảnh Nội dung luận văn giới thiệu tổng quan tra cứu ảnh dựa vào nội dung sâu vào đề tài Nghiên cứu phương pháp phân đoạn ảnh. .. ảnh sử dụng phân cụm ứng dụng tra cứu ảnh dựa vào nội dung Trên sở phương pháp tra cứu ảnh dựa vào phân cụm, tiến hành xây dựng chương trình thử nghiệm cho phép đọc vào ảnh mẫu tìm kiếm ảnh. .. với ảnh mẫu tập hợp ảnh cho trước 3 Nội dung khoá luận gồm có chương: CHƯƠNG 1: TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG, giới thiệuphương pháp tra cứu ảnh dựa vào nội dung số hệ thống tra cứu