Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 38 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
38
Dung lượng
1,34 MB
Nội dung
Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 1 MỤC LỤC LỜI CẢM ƠN . 3 PHẦN MỞ ĐẦU . 4 CHƢƠNG I : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN VỀĐỘĐOKHOẢNGCÁCH . 5 1.1. Khái quát về xử lý ảnh. 5 1.1.1. Xử lý ảnh là gì? . 5 1.1.2.Một số vấn đề cơ bản trong xử lý ảnh: . 5 1.2. Bài toán vềđộđokhoảngcách 6 1.2.1. Bài toán 6 1.2.2. Một số ứng dụng của độđokhoảngcách 6 CHƢƠNG 2: MỘT SỐ ĐỘĐOKHOẢNGCÁCH 7 2.1.Các độđokhoảngcáchgiữacácđốitượng 7 2.1.1. Phân phối chuẩn 8 2.1.2. Độđo Divergence (độ phân kỳ) 9 2.1.3. Phân phối xác suất rời rạc . 14 2.1.4. Khoảngcách Euclid . 15 2.2. Độđokhoảngcáchgiữacác dãy . 15 2.2.1. Khoảngcách Hamming . 15 2.2.2. Khoảngcách Hamming mờ . 16 2.2.3. Khoảngcách Levenshtein(chỉnh sửa) . 16 2.2.4. Khoảngcách liên quan khác 17 2.2.5. Khoảngcách thông tin và xấp xỉ thông tin 17 2.3. Độđo theo lý thuyết thông tin . 18 2.4. Độđokhoảngcáchgiữacác tập hợp . 19 2.4.1. Khoảngcách Hausdorff . 19 2.4.2. Các biến thể của khoảngcách Hausdorff 22 2.4.3. Cácđộđotrên tập mờ . 23 2.5. Độđokhoảngcách trong các ứng dụng 24 2.5.1. Bất biến 24 Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 2 2.5.2. Ví dụ vềđộđo . 24 CHƢƠNG III. CHƢƠNG TRÌNH THỬ NGHIỆM . 34 3.1. Bài toán: . 34 3.2. Phương pháp thực hiện 34 3.3. Kết quả . 34 KẾT LUẬN . 37 TÀI LIỆU THAM KHẢO: 38 Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 3 LỜI CẢM ƠN Em xin chân thành cảm ơn PGS TS Ngô Quốc Tạo, Trưởng phòng Nhân dạng và Công nghệ tri thức, Viện Công nghệ thông tin, Viện Hàn Lâm Khoa học và Công nghệ Việt Nam đã định hướng và giúp đỡ em tận tình trong suốt quá trình làm đồ án. Em xin chân thành cảm ơn các thầy, cô giáo bộ môn khoa Công Nghệ Thông Tin đã truyền dạy những kiến thức thiết thực trong suốt quá trình học, đồng thời em xin cảm ơn nhà trường đã tạo điều kiện tốt nhất cho em hoàn thành đồ án này. Trong phạm vi hạn chế của một đồ án tốt nghiệp, những kết quả thu được còn là rất ít và quá trình làm việc khó tránh khỏi những thiếu sót, em rất mong nhận được sự góp ý của các thầy cô giáo và các bạn. Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 4 PHẦN MỞ ĐẦU Trong khoa học vật lý giai đoạn cần thiết đầu tiên theo hướng chủ đề học tập nào là tìm nguyên tắc số cách tính toán và phương pháp thực hành để đánh giá chất lượng một số kết nối với nó. Tôi thường nói rằng, khi bạn có thể đánh giá những gì bạn đang nói đến, và biểu diễn nó bằng các con số, bạn biết gì về nó, trong khi bạn không thể đo lường nó, khi bạn không thể biểu diễn nó với số, tri thức của bạn là sơ sài và không thỏa đáng, nó có thể là sự khởi đầu của tri thức, nhưng hầu như trong suy nghĩ của bạn luôn tiến đến trạng thái của khoa học, bất cứ vấn đề gì có thể được. “POPULAR LECTURES AND ADDRESSES”, LORD KELVIN Sự giống nhau tươngđối có thể được định nghĩa là mối quan hệ giữa hai thực thể có cùng tính chất hoặc có cácđặc điểm giống nhau, nhưng khác nhau vềđộđo hoặc mức độ. Lớn hơn giá trị tương đồng, lớn hơn sự tương đồng giữacácđối tượng. Mặt khác, sự không giống nhau tươngđối tập trung vào sự khác biệt; nhỏ hơn sự khác nhau, giống nhau hơn cácđối tượng. Cả giá trị giống nhau và giá trị không giống nhau thể hiện khái niệm về chân dung giữacácđối tượng, nhưng sự nhấn mạnh là khác nhau. Đó là phù hợp hơn để xác định phụ thuộc vào loại dữ liệu và các vấn đề ở bàn tay. Nói chung, sự lân cận là một chức năng của các biến quan sát hoặc các thông số thu thập. Chúng ta sẽ đề cập đến nó như là một độ đo, mặc dù nó có thể không được như vậy theo nghĩa toán học nghiêm ngặt. Nội dung đồ án sẽ trình bày tổng quan vềcácđộđo không giống nhau đối với các loại dữ liệu khác nhau, cùng với đặc điểm của nó. Một số trong số đó đã được biết đến, trong khi những độđo khác còn tươngđối mới. Nội dung đồ án bao gồm 3 chương: Chương 1: Trình bày cácđộđokhoảngcách không giống nhau. Chương 2: Cácđộđođặc biệt được sử dụng trong lĩnh vực học tập mô hình và ứng dụng của cácđộ đo. Chương 3: Chương trình thực nghiệm và kết quả. Cuối cùng là phần kết luận. Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 5 CHƢƠNG I : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN VỀĐỘĐOKHOẢNGCÁCH 1.1. Khái quát về xử lý ảnh. 1.1.1. Xử lý ảnh là gì? Xử lý ảnh là một khoa học còn tươngđối mới mẻ so với nhiều ngành khoa học khác, nhất là trên qui mô công nghiệp. Xử lý ảnh là quá trình thực hiện các thao tác trên ảnh đầu vào cho ra kết quả như mong muốn. Ảnh kết quả có thể khác so với ảnh ban đầu tốt hơn hoặc xấu hơn so với ảnh đầu vào. 1.1.2.Một số vấn đề cơ bản trong xử lý ảnh: a) Một số khái niệm cơ bản: Ảnh: là một tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thường được biểu diễn bằng một ma trận 2 chiều, mỗi phần tử của ma trận tương ứng với một điểm ảnh. Điểm ảnh: được xem như là đặctrưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đốitượng trong không gian. Mức xám: là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với 1 giá trị số - kết quả của quá trình lượng hóa. Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường dùng các phần tử đặctrưng của ảnh là pixel. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Một số mô hình được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê. b) Tăng cường ảnh – khôi phục ảnh: Tăng cường ảnh là bước quan trọng tạo tiền đề cho xử lý ảnh. Nó gồm các kỹ thuật: lọc độtương phản, khử nhiễu, nổi màu…. Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh. c) Biến đổi ảnh: Thuật ngữ biến đổi ảnh thường được dùng để nói tới một lớp các ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh. Có nhiều loại biến dạng được dùng như: biến đổi Fourier, sin,cosin …. Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 6 d) Nhận dạng ảnh: Nhận dạng ảnh là quá trình liên quan đến các mô tả đốitượng mà người ta muốn đặc tả nó. Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đốitượng khác nhau như: nhận dạng vân tay, nhận dạng chữ viết… Có bốn cách tiếp cận khác nhau: +/ Đối sánh mẫu dựatrêncácđặctrưng được trích chọn. +/ Phân loại thống kê. +/ Đối sánh cấu trúc. +/ Phân loại dựatrên mạng nơron nhân tạo. e) Nén ảnh: Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Dođó cần phải giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết. Nén ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. 1.2. Bài toán vềđộđokhoảngcách 1.2.1. Bài toán Độđotương tự là một trong những phương pháp tốt để máy tính phân biệt được các hình ảnh qua nội dung của chúng. Thông thường hệ thống tra cứu ảnh sẽ truy vấn hình ảnh bằng phương pháp đotương tự dựatrêncác chức năng, việc xác định nó có thể dưới nhiều hình thức như phát hiện biên, màu sắc, vị trí điểm ảnh . các phương pháp như histogram, màu sắc và phân tích histogram dòng cột sử dụng biểu đồ để xác định độtương tự. Áp dụng cho bài toán độđokhoảng cách: cho một ảnh đầu vào và một danh sách ảnh, sau đó sử dụng một trong số cácđộđo khảng cách để xác định độtương tự của ảnh trong danh sách ảnh với ảnh đầu vào. Ảnh nào trong danh sách ảnh có độđokhoảngcách gần với ảnh đầu vào nhất thì sẽ được sắp xếp theo thứ tự. 1.2.2. Một số ứng dụng của độđokhoảngcáchĐộđokhoảngcách được ứng trong rất nhiều lĩnh vực như xử lý ảnh và nhận dạng mẫu, nhận dạng chữ viết tay, trong y học giúp bác sĩ phát hiện các mô bệnh để tìm ra các tế bào ung thư (sử dụng công cụ tự phát huỳnh quang),…Như vậy, ta có thể thấy tầm quan trọng của độđokhoảngcách trong thực tiễn là rất lớn. Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 7 CHƢƠNG 2: MỘT SỐ ĐỘĐOKHOẢNGCÁCH 2.1.Các độđokhoảngcáchgiữacácđối tƣợng Để phân tích sự khác biệt giữacácđốitượng được mô tả bởi các vectơ trong một không gian đặc trưng, một số độđo khác nhau có thể được xem xét. Nếu các vectơ trung bình được sử dụng để làm đại diện cho toàn bộ cácđối tượng, chúng có thể được sử dụng để tính toán khoảngcáchgiữacác nhóm theo các công thức từ bảng 2.1. Bảng 2.1 Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 8 Một khả năng khác là đặctrưng cho một đốitượng bằng một hàm phân bố xác suất nhiều biến (pdf) F(x). Sau đó, sự khác biệt giữa hai quần thể được đo bằng sự khác nhau giữa hai hàm phân bố xác suất pdf F 1 và F 2 . Độđo Kolmogorov thường được sử dụng [Gibbs và Su, 2002]. Cho hai hàm phân phối F 1 và F 2 nó được định nghĩa như sau: (2.1) Như một phần mở rộng, việc đánh giá sự khác nhau giữacácđốitượng cũng có thể dựa vào mô tả từng phân phối như là một điểm trong một không gian Riemann với các tọa độ xác định bởi các thông số đối tượng. Ví dụ: một đốitượngđặctrưng bởi một hàm mật độ bình thường được xác định bởi các tọa độ (μ, Σ) trong m + m (m + 1) / 2 không gian chiều. Đốitượng được mô tả bởi các thông số tương tự sẽ được ánh xạ thành các điểm lân cận trong không gian này. Với điều kiện một độđo metric phù hợp có thể được xác định, sự khác nhau giữacác nhóm là chiều dài trắc địa (kết nối con đường ngắn nhất hai điểm trên một đa tạp) giữacác điểm biểu diễn cho đối tượng. 2.1.1. Phân phối chuẩn Giả định của dữ liệu được rút ra từ một phân bố chuẩn thường được thực hiện trong thực tế. Do đó, cần có cácđộđo không giống nhau thích hợp. Một độđo cổ điển giữa hai phân phối chuẩn N (μ 1 , Σ) và N (μ 2 , Σ) với ma trận hiệp phương sai bằng Σ là khoảngcách Mahalanobis vuông D M giữacác phương thức: (2.2) Vì các tham số phân phối hầu như không được biết đến nên trong thực tế chúng được thay thế bằng cách ước lượng mẫu: , i = 1,2 và C = , trong đó n i biểu thị kích cỡ và C i , i = 1,2, biểu diễn cho mẫu có nghĩa là vectơ và ma trận hiệp phương sai mẫu tương ứng. Khoảngcách Mahalanobis ước tính sau đó trở thành: . Nếu C = I hoặc C = diag ( i ), thì các D 2 M trở thành Euclide hay khoảngcách Euclide trọng lượng giữacác vectơ tâm tương ứng. Lưu ý, nếu khoảngcách Mahalanobis được xét đối với một không gian X = N (μ, Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 9 Σ), sau đó không gian (X, d M ) là tiền metric. Khoảngcách Mahalanobis là dựatrên giả định của ma trận hiệp phương sai bằng nhau. Cho ma trận hiệp phương sai không đồng nhất, tổng quát của nó dẫn đến bán kính thông tin chuẩn [Jardine và Sibson, 1971]. Cho hai phân phối chuẩn N 1 ≡ N(µ 1 , Σ 1 ) và N 2 ≡ N(µ 2 , Σ 2 ), ta có: (2.3) Một thước đokhoảngcáchgiữacác phân phối chuẩn, phù hợp với ma trận hiệp biến không đồng nhất, được đề xuất trong [Anderson và Bahadur, 1962]. Cho b α = (α Σ 1 +(1 - α) Σ 2 ) -1 (µ 1 - µ 2 ) với α . Sau đó, (2.4) Như trước đây, các thông số phân phối được thay thế bằng ước lượng mẫu. Cácđộđo khác đối với phân phối chuẩn được thể hiện trong phần tiếp theo. 2.1.2. Độđo Divergence (độ phân kỳ) Nhiều độđo cổ điển thể hiện sự khác biệt giữa hai phân phối xác suất F 1 và F 2 với các hàm mật độ f 1 và f 2 là trường hợp đặc biệt của -phân kỳ được đề xuất bởi Csiszar [Csiszar, 1967], dựatrên tỷ lệ khả năng (2.5) trong đó (λ) là một số thực, hàm lồi được xác định trên R + sao cho (1) = 0, và μ là một thước đotrên miền D. Lưu ý rằng bằng cách đảo ngược cácđối số F 1 và F 2 của d Φ (F 1 , F 2 ), thu được -phân kỳ khác, tức là d Φ (F 2 , F 1 ) trở thành d λΦ (1/λ) (F 1 , F 2 ). Hơn Đồ án tốt nghiệp Ngành: Công nghệ thông tin Phạm Thị Kim Tuyến Page 10 nữa, sự phân kỳ đối xứng, d Φ (F 1 ,F 2 ) + d Φ (F 2 ,F 1 ), có thể được xem xét như [Esposito và cộng sự, 2000.]. Một số độđo phân kỳ nổi tiếng với biểu đồ phân bố liên tục một biến được đưa ra dưới đây, cùng với các công thức tương đương cho hai phân phối chuẩn. Công thức cho phân phối rời rạc bị bỏ qua vì chúng là những khái quát đơn giản của những giá trị liên tục, bằng cách sử dụng tổng thay vì tích phân. Các nghiên cứu về mối quan hệ giữacácđộđo phân kỳ được trình bày cũng như tổng quát hóa của chúng có thể được tìm thấy ví dụ trong [Taneja, 1989, 1995] hoặc trong các cuốn sách trực tuyến [Taneja]. Cho ngắn gọn, chúng ta hãy biểu thị , cho i = 1,2, và Σ = Σ 1 = Σ 2 , cho ma trận hiệp phương sai bằng nhau và bình phương khoảngcách Mahalanobis D 2 M . Các biểu đồ phân bố giống như f 1 và f 2 là liên tục trênkhoảng thời gian phân chia và , tương ứng như vậy , i = 1,2, trong đó là trọng lượng dương. là viết tắt của giao giữa hai khoảng thời gian và và μ(J st ) là độ dài (độ đo Lebesgue) của J st . +/ Độ khác nhau Kullback-Leibler: Độđo này, còn được gọi là khoảngcách thông tin hoặc dữ liệu ngẫu nhiên tươngđối [Esposito và cộng sự., 2000], ta thu được (2.6) Quy ước thông thường là log(0/b) = 0 cho tất cả các b và log(a/0) = cho tất cả a khác không. Do đó, d KL là giá trị lợi tức trong [0, ]. Cácđộđo Kullback-Leibler dựatrên khái niệm trọng lượng thông tin. Nếu hai đốitượng được mô tả bởi các phân bố xác suất, d KL thể hiện các thông tin trung bình cho việc loại bỏ đốitượng đầu tiên để nghiêng vềđốitượng thứ hai, khi x thuộc vềđối