Nghiên cứu phương pháp nhận dạng hình dạng

Trang 1

- - - - - - - - - - - - -

LuËn v¨n th¹c sÜ khoa häc

Nghiªn cøu ph−¬ng ph¸p nhËn d¹ng h×nh d¹ng

Ngµnh: xö lý th«ng tin vµ truyÒn th«ng M∙ sè:421

®inh thÞ kim ph−îng

Ng−êi h−í g dÉn kh a häc: T.S.NguyÔn kim anh

Trang 2

Lêi cam ®oan

T«i xin cam ®oan b¶n luËn v¨n nµy lµ kÕt qu¶ nghiªn cøu cña b¶n th©n d−íi sù h−íng dÉn cña TS NguyÔn Kim Anh NÕu cã g× sai ph¹m, t«i xin hoµn toµn chÞu tr¸ch nhiÖm

Ng−êi lµm cam ®oan

§inh ThÞ Kim Ph−îng

Trang 3

Lời nói đầu 9

Chương 1:Tổng quan về tìm kiếm ảnh dựa trên hình dạng Error! Bookmark not defined 1.1 Giới thiệu 12

1.2 Trích chọn đặc trưng 13

1.2.1.Biến đổi Fourier 12

1.2.1.1.Chuỗi Fourier 13

1.2.1.2 Sự hội tụ của chuỗi Fourier 14

1.2.1.3 Biến đổi Fourier 14

1.2.1.4 Biến đổi Fourier rời rạc 15

1.2.1.5 Biến đổi Fourier hai chiều 16

1.2.1.6 Phạm vi của biến đổi Fourier 16

1.2.2 Không gian độ chia (Scale space) 17

1.2.2.1 Cơ sở 17

1.2.2.2 Không gian độ chia Gaussian 19

1.2.2.3 Phạm vi của sự không tạo các đặc trưng mới 19

1.2.2.4 Không gian độ chia mâu thuẫn với việc đa quyết định 20

1.2.3.Thảo luận 22

1.3 Phép đo tương đương và thực hiện phép đo 22

1.3.1 Phép đo sự giống nhau 23

1.3.1.1 Không gian phép đo khoảng cách (Distance Metric Spaces) 24

1.3.1.2 Khoảng cách dạng Minkowski 24

1.3.1.3 Khoảng cách Cosin 24

1.3.1.4 Thông tin thống kê χ2 25

Trang 4

1.3.1.6 Khoảng cách bậc hai 26

1.3.1.7 Khoảng cách Mahalanobis 27

1.3.2.Thực hiện phép đo 27

1.3.2.1 Độ nhạy và độ chính xác(RPP) 28

1.3.2.2 Tỷ lệ trọng số thành công (PWH- Percentage of Weighted Hits) 28

1.3.2.3 Phần trăm của thứ bậc giống nhau (PSR-Percentage of Similarity Ranking ) 29

2.3.3.2 Trường hợp biến đổi mối quan hệ 50

2.3.4 Cluster có ý nghĩa của biến đổi 52

2.3.4.1 Phép đo sự không tương đương giữa các biến đổi 52

Trang 5

3.1.4 Luật ra quyết định Contrario 61

3.4.Chuẩn hóa nhân tố hình dạng từ ảnh cho đặc trưng độc lập 68

3.4.1 Biểu diễn hình dạng bằng các mức đường 68

3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ 70

3.4.2.1 Mã hóa / Tiêu chuẩn hóa trị không đổi tương đương 71

3.4.2.2 Mã hóa / Chuẩn hóa quan hệ bất biến 73

Trang 6

Danh Môc C¸c tõ viÕt t¾t

10 Pro Proposition

Trang 7

Danh mục hình vẽ

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phổ 13

Hình 1.2: ảnh và các biến đổi khác 13

Hình 1.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu 20

Hình 1.4: (a) Khoảng cách Ocolit, 25

(b) khoảng cách Cosin, (c) khoảng cách L1 25

Hình 1:a) ảnh ký tự,b) mức đường tương ứng, c) Đoạn mức đường 31

Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng 37

Hình 2.5: Vấn đề quan trọng của phân bố phương thức nền 43

Hình 2.6: Phân đoạn ảnh đã scan và 71 đường mức có mức ý nghĩa cực đại 44

Hình 2.7: Nhóm với mối quan hệ tới hướng 45

Hình 2.8: Nhóm trong không gian(toạ độ x, hướng) 46

Hình 2.9: Thử nghiệm Guernica 48

Hình 2.10: Thử nghiệm “ Guernica “ quan hệ tương ứng ý nghĩa không đổi 49

Hình 2.11: Hai đoạn mức đường và khung tương ứng 50

Hình 2.12: Thử nghiệm “ Guernica “ 51

Hình 3.1: Trích chọn mức đường có ý nghĩa 70

Hình 3.3: Mã hoá sự không đổi tương đương bán cục bộ 73

Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi 74

Trang 8

Hình 3.6: Mã hoá sự tương đồng không đổi 76

Hình 4.1: ảnh và mức đường có ý nghĩa 80

Hình 4.2: Thử nghiệm hitchcook 82

Hình 4.3: Phương pháp nhận dạng bán cục bộ quan hệ không đổi 83

Hình 4.4: Phương pháp nhận dạng quan hệ bán cục bộ không đổi 83

Trang 9

Lời nói đầu

Ngày nay thông tin nói chung sử dụng trong ảnh là phổ biến Rất nhiều lĩnh vực sử dụng ảnh như một công cụ để thực hiện công việc

Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng như trạm vệ tinh, khó khăn trong lưu trữ, chi phí cao cho xử lý và internet Sự đa dạng các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số Các ứng dụng của ảnh bao gồm: giải trí số, thư viện số, giáo dục và World Wide Web (www) Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc Lợi ích trước mắt của ảnh số gồm cả mặt xã hội và thương mại Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiền bạc Tuy nhiên, độ lớn của kho lưu trữ ảnh số trên toàn thế giới có giới hạn, sự tận dụng ảnh số từ CSDL hiện tại khó hơn Điều này là vì thiếu cách đánh chỉ mục và quản lý ảnh số chuẩn

thông tin thuộc tính Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể cung cấp cho người sử dụng từ khoá tìm kiếm lướt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ như ngôn ngữ truy vấn cấu trúc (SQL) Tuy nhiên, nhìn từ bên ngoài có hạn chế; một trong những hạn chế đó là thời gian tính toán khi CSDL lớn, nó dường như không thể chú giải thủ công tất cả các ảnh Mặt khác các đặc trưng thị giác của ảnh rất khó mô tả bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đó là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động hoá Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR) CBIR được giới thiệu như phần bổ xung cho việc tiến tới đánh chỉ mục

Trang 10

tiềm năng ứng dụng rộng rãi của nó, CBIR đã thu hút được số lượng lớn các chú ý trong những năm gần đây (KAT 92, NIB 93, YOS 99)

Trong CBIR, ảnh trong CSDL là dữ liệu không cấu trúc, ảnh số hoàn toàn chỉ bao gồm mảng các pixel độ chói, không có ý nghĩ vốn có Một trong những chìa khoá bắt nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, để phản ánh ngữ nghĩa ảnh Vì vậy việc trích chọn hiệu quả các đặc trưng ngữ nghĩa đó là điều cốt yếu sự thành công của CBIR Nghiên cứu trên những yêu cầu của người sử dụng đối với ảnh từ bộ sưu tập ảnh biểu thị những đặc trưng nguyên thuỷ đó như màu sắc, kết cấu, hình dạng hoặc hỗn hợp của chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (EAK 99) Những đặc trưng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài Vì vậy đặc trưng nguyên thuỷ của ảnh ở mức thấp có thể được bắt nguồn và khai thác để khuyến khích việc CBIR tự động hoá

*Đối tượng nghiên cứu

Từ các thông tin cơ bản trên đây các ảnh trong CSDL có thể được đánh chỉ mục bằng cách sử dụng thông tin thuộc tính hoặc thông tin ngữ nghĩa Ngữ nghĩa của ảnh có thể được mô tả sử dụng các đặc trưng nguyên thuỷ; ví dụ: màu sắc, cấu trúc, hình dạng hoặc tổ hợp của chúng Kết quả nghiên cứu này chấp nhận tiến tới CBIR, đó là việc đánh chỉ mục và tìm kiếm ảnh bằng ngữ nghĩa của ảnh Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình dạng Mục đích chủ yếu của cách tìm kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng Điều tra các công nghệ và phát triển trong nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ tìm kiếm nhãn mác, nhận dạng đối tượng… hoặc có thể hợp nhất trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc trưng hỗn hợp của ảnh

Trang 11

Nhận dạng nói chung hội tụ các vấn đề của nhận dạng trực quan dựa trên thông tin hình dạng hình học Phương pháp nhận dạng hình dạng thường bao gồm 3 tiến trình: trích chọn đặc trưng, đối sánh (cốt lõi của tiến trình này là định nghĩa 1 khoảng cách hoặc phép đo sự tương đồng giữa các đặc trưng hình dạng được mô tả) và ra quyết định Phần này chủ yếu nghiên cứu vấn đề ra quyết định cho đối sánh hình dạng, đặc biệt trong khung chung giữa hai hình dạng giống nhau để đối sánh, nó có thể đi tới quyết định như thế nào? Mục đích để định nghĩa tiêu chuẩn thống kê dẫn tới quyết định 2 hình dạng là giống hay không

Nghiên cứu các tiến trình thực hiệnnhận dạng hình dạng theo trình tự các công đoạn: từ công đoạn sơ khai biểu diễn ảnh, trích chọn đặc trưng, tách nhóm nhân tố hình dạng thành 1 hình dạng và chủ yếu là phương pháp ra quyết định Contrario cho nhận dạng hình dạng

*Cấu trúc luận văn

Chương 1 : Tổng quan về tìm kiếm ảnh dựa trên hình dạng Chương 2: Tách nhóm

Chương 3: Phương pháp Contrario cho nhận dạng hình dạng Chương 4: Thử nghiệm

Do thời gian và khả năng có hạn nên luận văn này sẽ còn nhiều thiếu sót Rất mong được sự góp ý và thông cảm của các thầy giáo, cô giáo

Hà nội, ngày 6 tháng 11 năm 2006

Học viên

Trang 12

Chương 1

Tổng quan tìm kiếm ảnh dựa trên hình dạng

1.1 Giới thiệu

Vấn đề cơ bản của tìm kiếm ảnh dựa trên hình dạng là phép đo sự tương đồng giữa các các hình dạng được mô tả bởi các đặc trưng của chúng Vì vậy, hai bước cần thiết trong tìm kiếm và nhận dạng ảnh dựa trên hình dạng đó là trích chọn đặc trưng và phép đo tương đương giữa các đặc trưng đã được trích chọn

Hai công cụ cơ bản cần thiết được sử dụng trong trích chọn đặc trưng hình dạng là biến đổi Fourier và không gian độ chia Mặc dù trích chọn đặc trưng là mấu chốt để tìm kiếm ảnh dựa trên hình dạng và nhận dạng hình dạng, phép đo sự tương đồng giữa các đặc trưng được trích chọn cũng rất quan trọng yêu cầu hiệu quả tìm kiếm ảnh đó là nhận biết nhanh các hình dạng tương đồng - sự tương đồng trong giới hạn của các đặc trưng được trích chọn

1.2 Công cụ trích chọn đặc trưng

Biến đổi Fourie là một công cụ kinh điển Nó đã được sử dụng từ nhiều năm nay trong mọi hệ thống xử lý tín hiệu và hệ thống máy tính Còn không gian độ chia là một công cụ mới đang được chú ý gần đây

1.2.1.Biến đổi Fourier

Biến đổi Fourie là mấu chốt trong xử lý ảnh nó được ứng dụng rộng rãi trong lý thuyết cũng như trong thực tế Nguyên tắc cơ bản của biến đổi Fourie đó là một đối tượng được coi như một tín hiệu và như vậy có thể biểu diễn đối tượng thành các thành phần cơ bản của tín hiệu Biến đổi Fourie rất hữu ích cho phân tích các đối tượng khác nhau: có thể đối tượng bị làm nhiễu bởi biến đổi phổ

Trang 13

(Hình 1.1), trong khi các đối tượng tương đương khác sẽ có biến đổi phổ tương tự thậm chí cả khi chúng bị ảnh hưởng bởi nhiễu và các biến đổi khác(hình 1.2)

Hình 1.1: Đối tượng bị làm nhiễu bởi biến đổi phổ

Trang 14

Với chu kỳ T:

1.2.1.2 Sự hội tụ của chuỗi Fourier

Nếu một hàm f(x) là tuần hoàn và nguyên trong chu kỳ của nó thì sẽ tồn tại chuỗi Fourie nh−ng không đảm bảo chắc chắn rằng chuỗi Fourie sẽ hội tụ tới f(x) Tuy nhiên theo điều kiện Fourie Dirichcle phần lớn hoặc các lớp chung của hàm có thể biểu diễn bằng chuỗi Fourie Điều kiện chuỗi Fourie Dicrichcle nếu là một đoạn hàm f(x) liên tục :

1 Giới hạn số các điểm không liên tục 2 Giới hạn các điểm cực trị

Hàm này có thể mở rộng thành chuỗi Fourie hội tụ tại các điểm liên tục và ý nghĩa của điểm giới hạn thực và giới hạn ảo của hàm tại điểm giới hạn:

Đối với tín hiệu số hoặc đối t−ợng số điều kiện Dirichcle đ−ợc chứng minh vì vậy nó có thể đ−ợc biểu diễn bởi chuỗi Fourie:

1.2.1.3 Biến đổi Fourier

(1.3)

(1.4) (1.5) (1.6)

Trang 15

Nếu hàm f(x) có thể biểu diễn bằng chuỗi Fourie của nó Sau đó f(x) được

Tương ứng công thức:

1.2.1.4 Biến đổi Fourier rời rạc

Biến đổi Fourie đặc biệt hữu ích đối với phân tích đối tượng số vì đối tượng số tồn tại ở dạng rời rạc Để biến đổi công thức 1.7 và 1.8 thành dạng rời rạc, f(x) được lấy N mẫu trong chu kỳ [0, T]

Trang 16

Mối quan hệ này dễ thay đổi chỉ rõ sự chính xác của biểu diễn đối tượng trong miền không gian và trong miền tần số là ngược với nhau Chú ý, khi bố trí một tập dữ liệu khác thì chúng không thể biến đổi độc lập với nhau Điều này cần lưu ý khi trích chọn đặc trưng trong miền không gian lấy mẫu đối tượng

1.2.1.5 Biến đổi Fourier hai chiều

Đối với hàm hai biến f(x,y) xác định 0 ≤ x, y ≤ N Cặp biến đổi Fourie là:

Mặc dù, số lượng F(u,v) từ biến đổi Fourie của biểu thức là rất lớn nhưng số lượng F(u,v) có ích là rất bé Đây là lý do biểu diễn đối tượng trong miền tần số tốt hơn (Hệ số có nghĩa ít) Điều này thực sự hữu ích trong nhiều ứng dụng đặc biệt trong việc phân tích hình dạng vì nó có thể xấp xỉ ý nghĩa của đối tượng gốc f(x,y) hoặc f(x) có thể xây dung từ F(u,v) nhỏ Đây là vấn đề cơ bản của xử lý tín hiệu Fourie và phân tích đối tượng Fourie

1.2.1.6 Phạm vi của biến đổi Fourier

Biến đổi Fourie tuân theo phạm vi hữu ích của việc phân tích đối tượng • Sự riêng rẽ: Biến đổi Fourie rời rạc (1.11) có thể mô tả riêng rẽ như

sau:

• Lợi ích của việc riêng rẽ này đó là F(u,v) có thể thu được trong 2 bước bằng cách sử dụng liên tiếp biến đổi Fourie 1 chiều FT 1 chiều có thể được tính toán sử dụng biến đổi Fourie nhanh FFT

• Biến đổi: Biến đổi phạm vi của FT

(1.14)

Trang 17

• Điều này chỉ ra: 1 sự thayđổi trong miền không gian sẽ dẫn đến sự thay đổi trong miền tần số

Sau đó thay thế vào biểu thức có :

tương ứng việc quay F(u,v) một góc tương tự trong miền tần số

sau:

Điều này chỉ ra rằng: độ chia của f(x,y) với a và b theo x,y trong miền không gian tỷ lệ nghịch với biên độ F(U,V) trong miền tần số Điều này cũng giảm bớt hệ số F(u,v) bởi 1/a và 1/b theo u, v trong miền tần số Tổng quát, phóng to một đối tượng ảnh trong miền tần số sẽ làm nổi mức tần số thấp trong miền không gian trong khi việc thu nhỏ đối tượng trong ảnh sẽ làm tăng vùng tần số cao trong miền không gian

1.2.2 Không gian độ chia (Scale space)

Đối với FT thì không gian độ chia là công cụ khá mới trong phân tích đối tượng Nó đã được phát triển trong các hệ thống tính toán Phần này sẽ giới thiệu không gian độ chia tuyến tính và phạm vi quan trọng của nó

1.2.2.1 Cơ sở

Lý thuyết không gian độ chia giúp ta quan sát các đối tượng trong các độ chia khác nhau và các đối tượng chỉ có ý nghĩa duy nhất theo độ chia chính Một ví dụ đơn giản nếu là ảnh một sự vật thì dù có là độ chia 1m hay 1cm thì ý nghĩa

(1.15)

(1.16)

Trang 18

chia Các dụng cụ quan sát như camera các dụng cụ này có thể quan sát cũng là một sự sắp xếp độ chia Để mở rộng các độ chia tương ứng với sự phóng to hay thu nhỏ nhờ các dụng cụ quan sát Độ chia của một dụng cụ luôn có hai giới hạn: độ chia giúp phân biệt chi tiết ảnh tốt nhất và kém nhất và khi quan sát sự vật thì độ chia nằm trong khoảng giới hạn hai phía này

Để tính toán bất kỳ dạng biểu diễn nào từ dữ liệu ảnh, thông tin cần được trích chọn bằng cách sử dụng toán tử nào đó với dữ liệu Các toán tử tương tự như ống kính máy quay sử dụng để mô tả thế giới thực Một vài vấn đề đặt ra khi đề cập tới các toán tử đó được sử dụng như thế nào, thực hiện ở đâu và thực hiện công việc ra sao, độ lớn như thế nào Như vậy thông tin thu được xác định rất phong phú thông qua mối quan hệ của các cấu trúc thực tế trong dữ liệu và kích cỡ của toán tử

Độ chia gần đúng khi phân tích đối tượng có thể biết trước Tuy nhiên trong phần lớn các vấn đề thì điều này không quan trọng Lý do chính để xây dựng không gian độ chia đó là nếu có kiến thức biết trước về không gian độ chia thích hợp lấy từ tập CSDL có nhiều độ chia thì không gian độ chia sẽ được áp dụng để thu gọn công thức tính toán thích hợp

Việc sử dụng các hàm làm trơn nhiễu Gauss tại các độ chia khác nhau đã được áp dụng trong phân tích ảnh cho thấy mối liên hệ giữa các độ chia khác nhau với cấu trúc ảnh và không gian độ chia là có giới hạn Tuy nhiên độ chia kích thước hoàn toàn có thể thêm vào trong không gian miêu tả đối tượng vì các cấu trúc có thể được nghiên cứu thông qua độ chia Đặc biệt khi gắn vào tín hiệu f(x): RN →R và 1 tập liên tục {L( )x,t /t〉0} làm mịn dần dần (có nghĩa là việc nhân chập tín hiệu f(x) với một hàm liên tục g(x,t))

( )x,tg( ) ( )x,tfx (1.17)

ở đây g(x,t) là hàm làm mịn hoặc hàm mặt nạ, l(x,t) là tín hiệu được làm mịn, * là phép nhân chập Với tín hiệu liên tục thì f(x)được khai triển như sau:

Trang 19

1.2.2.2 Không gian độ chia Gaussian

Hàm Gausss là hàm mặt nạ hữu ích nhất cho không gian độ chia tổng quát

định nghĩa như một mô tả tại độ chia 0 đối với tín hiệu gốc L( )x,0= f( )x 1.19

Và sự miêu tả độ chia kém hơn mang lại bằng phép nhân chập với mặt nạ Gauss khi đó kích thước ảnh tăng lên:

1.2.2.3 Phạm vi của sự không tạo các đặc trưng mới

Phạm vi quan trọng nhất trong không gian độ chia đó là sự không tạo các đặc trưng mới Có nghĩa là sự biến đổi từ một độ chia tốt sang một độ chia xấu hơn sẽ thiết lập một tín hiệu đơn giản hơn, vì thế đặc trưng trong không gian độ chia mất tính đơn điệu khi độ chia gia tăng Nó là nguyên nhân làm ảnh hưởng tới tín hiệu và làm mờ ảnh hưởng đối với tín hiệu hai chiều

(1.20)

(1.22)

Trang 20

Hình 1.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu

Các đặc trưng hữu ích đặc biệt tại điểm qua 0 của đạo hàm bậc thứ n Thực tế đạo hàm bậc hai của tín hiệu được sử dụng trong phân tích đối tượng, bởi đạo hàm bậc hai phản ánh điểm uốn cong của tín hiệu Điểm cong (một đặc trưng hữu ích đối với phân tích đối tượng) Điểm qua 0 của đạo hàm bậc hai là điểm uốn cong đó là đặc trưng cho góc lồi ra của đối tượng Với tín hiệu một chiều, điều đó được áp dụng với không gian độ chia Gauss Điểm qua 0 của tín hiệu tại tất cả các độ chia gọi là lấy dấu hoặc cây khoảng cách (hình 1.3 b) Bởi phạm vi không sáng tạo của đặc trưng mới, việc làm mịn cuối cùng của tín hiệu được bảo đảm Vì vậy chiều cao của cây khoảng cách là có giới hạn Witkin(Wit 83) giải thích cây khoảng cách này với kinh nghiệm quan sát, cành cây trong cây khoảng cách tương ứng với vị trí lồi ra của đối tượng ASA 84: đầu tiên trích chọn đỉnh từ

cây khoảng cách thu được và giải thích chúng như các đặc trưng vật lý( như góc, điểm nối, điểm kết thúc, điểm đặc biệt…) Mok96 cũng trích chọn đỉnh từ cây khoảng cách thu được và đề nghị việc sử dụng các đặc trưng đỉnh thông thường cho tìm kiếm hình dạng Hoàn toàn có thể áp dụng không gian độ chia để biểu diễn hình dạng

1.2.2.4 Không gian độ chia mâu thuẫn với việc đa quyết định

Trong phân tích đối tượng hai phương pháp phân tích có thứ bậc thường được sử dụng: một là phương pháp không gian độ chia, phương pháp khác cây quyết định, ví dụ như phương pháp hình chóp và phương pháp sóng Hai phương pháp này khác nhau: điểm khác biệt chính của hai công cụ thể hiện ở 3 khía cạnh:

+Lấy mẫu không nhất quán, chống lại việc lấy mẫu các không gian khác Biểu diễn không gian độ chia được định nghĩa bằng việc làm mịn và lưu giữ các mẫu không gian giống nhau tại tất cả các độ chia Trong khi lấy mẫu không gian đa quyết định tại các độ chia khác nhau là khác nhau Đối tượng

Trang 21

chính của đa quyết định là giảm bớt lấy mẫu từ một độ chia tới các độ chia cao hơn, vì thế quá trình xử lý tín hiệu có thể hiệu quả hơn

+Tương quan độ chia đối nghịch với sự phân ly độ chia, phương pháp đa quyết định không khai thác điểm khác biệt của cấu trúc thông qua độ chia Các kết quả tính toán tại mỗi một độ chia được sử dụng duy nhất để hướng dẫn tính toán tại độ chia tiếp theo nhỏ hơn và được loại bỏ một khi điều này được hoàn thành Chỉ thực hiện thuật toán tại một độ chia và tại một thời điểm Phương pháp không gian độ chia chính là việc phân tích độ chia như một phần cần thiết của quá trình phân tích sự quan sát và nhận dạng Phạm vi các phép đo tại các độ chia khác nhau có thể có cơ sở vững chắc phụ thuộc nhiệm vụ chứa trong nó Bằng định nghĩa, giới thiệu không gian độ chia mang đến một giải pháp cho việc phổ biến lượng bù sai, điều đó có nghĩa các đặc trưng ở các độ chia khác nhau có thể liên quan tới những đặc trưng khác một cách rõ ràng

+Lấy mẫu độ chia liên tục chống lại việc lấy mẫu độ chia cố định Giữa các phương pháp không gian độ chia và phương pháp đa quyết định đó là sự miêu tả đa quyết định chấp nhận một bước lấy mẫu cố định trong độ chia hoặc quyết định đó không bị suy giảm, trong khi phương pháp độ chia phân tích tín hiệu tại độ chia liên tục Vì vậy nhiệm vụ của việc tìm đặc trưng qua độ chia dễ dàng hơn trong không gian độ chia so với việc miêu tả đa quyết định Sự tinh xảo của lấy mẫu độ chia có thể thực hiện khi có yêu cầu

Sự khác biệt các đặc trưng của hai loại phương pháp xác định ở cách ứng dụng của chúng Phương pháp không gian độ chia thường được sử dụng cho phân tích và tìm hiểu tín hiệu, trong khi phương pháp đa quyết định thường được sử dụng cho mã hoá Nó cũng cần thiết để kết hợp phương pháp không gian độ chia với phương pháp đa độ chia Phương pháp đa độ chia được chú ý hơn đa quyết định trong điều kiện phân tích hoặc miêu tả tín hiệu tại một độ chia tại một thời

Trang 22

tục Mối tương quan tác động cấu trúc tín hiệu thông qua độ chia làm mất ý nghĩa của phương pháp đa độ chia

1.2.3.Thảo luận

ở phần trên, hai công cụ phân tích: Biến đổi Fourier và không gian độ chia đã được mô tả và thảo luận Phạm vi quan trọng của hai công cụ này đã được phân tích và chọn lọc Biến đổi Fourier miêu tả một đối tượng sử dụng các thành phần cơ bản của các tính chất khác nhau Không gian độ chia quan sát một đối tượng với vector cơ bản có chiều khác nhau (các số chiều của vector khác nhau)

Thông tin phổ thu được từ biến đổi Fourier có thể được sử dụng trực tiếp cho việc mô tả hoặc miêu tả đối tượng Trong khi thông tin trong không gian đo đạc thu được từ không gian độ chia cần thiết sự giải thích sâu xa hơn trước khi sử dụng mô tả đối tượng Sự giải thích thông tin không gian độ chia vẫn còn là thách thức Điều đó rất quan trọng để làm lẫn lộn giữa giải thích đối tượng và mô tả đối tượng tại đa độ chia với giải thích đối tượng và mô tả đối tượng trong không gian độ chia, đây là một vấn đề rất khó

Trong các dạng của thông tin thu được, biến đổi Fourier thu được thông tin đối tượng với hệ số tần số thấp, trong khi miêu tả thông tin đối tượng thu được với hệ số rất cao Đối với không gian độ chia, thông tin đối tượng chung có thể được giải thích từ độ chia cao hơn, trong khi thông tin mô tả đối tượng có thể được giải thích từ độ chia thấp hơn

Sức mạnh của hai công cụ cho phân tích đối tượng là rất rõ ràng Nó được biết đến đó là phân tích đối tượng hoặc trích chọn đặc trưng trong miền không gian là rất khó vì vấn đề nhiễu và các đối tượng thay đổi Những vấn đề này có thể dễ dàng vượt qua bởi việc phân tích đối tượng trong miền phổ hoặc trong miền không gian độ chia Cả hai phương pháp chấp nhận việc phân tích đối tượng tăng dần tính chi tiết Bằng việc loại trừ hoặc bỏ qua những chi tiết tinh tế nhất trong một đối tượng Đối tượng có thể được biểu diễn và thể hiện hiệu quả hơn

Trang 23

Từ cách nhìn nhận này, không gian độ chia xử lý tương tự với biến đổi Fourier Tuy nhiên trong không gian độ chia, những chi tiết của đối tượng được dịch chuyển trong miền tần số

1.3 Phép đo tương đồng và thực hiện các phép đo

Đối với việc tìm kiếm ảnh dựa trên hình dạng và các đặc trưng ảnh được trích chọn thường là vector đặc trưng N chiều, nó có thể được đề cập tới như một điểm trong không gian N chiều Một bức ảnh được đánh chỉ mục trong cơ sở dữ liệu sử dụng các vector đặc trưng được trích chọn Việc tìm kiếm ảnh thực chất là việc xác định sự giống nhau giữa ảnh truy vấn và các ảnh mục tiêu trong cơ sở dữ liệu mà thực chất là sự xác định khoảng cách giữa các vector đặc trưng miêu tả hình ảnh Sự đo đạc khoảng cách mong muốn cần phải tham chiếu với nhận thức của người Vì vậy, đối với một đặc trưng hình dạng dẫn tới sự chính xác của việc tìm kiếm ảnh cao hơn, phép đo khoảng cách tốt hơn Đối với việc tìm kiếm ảnh trực tuyến thì hiệu quả cần phải được xem xét khi lựa chọn một phép đo khoảng cách Nhiều phép đo khoảng cách khác đã được khai thác trong việc tìm kiếm ảnh, chúng bao gồm khoảng cách các khối trung tâm (SWA91);(STR95); khoảng cách Ơcơlit (VOO88); khoảng cách Cosin(VOO 88), khoảng cách giao nhau của biểu đồ histoogram, hai khoảng cách thống kê(RUB99), khoảng cách bậc hai (NiB93, DEN99, WOL96, SEI97) và khoảng cách Mahalanobis…(TRE71, SMI97) Trong mục này, một vài phép đo khoảng cách sẽ được mô tả và ước lượng Mục đích của việc ước lượng này để tìm ra một phép đo tương đồng sự mong đợi cho các bộ mô tả ước lượng hình dạng khác nhau Để biết tìm kiếm ảnh tốt như thế nào, cần phải có một phép đo khả thi Nói chung, thực hiện các phép đo đo được sự chính xác của việc tìm kiếm ảnh Tuy nhiên, phụ thuộc vào sự xác định độ chính xác khác nhau, có các phép đo sự thực hiện khác nhau

1.3.1 Phép đo sự giống nhau

Trang 24

Một phép đo tương đồng thường được định nghĩa như một phép đo khoảng cách Trong phần này mô tả chi tiết các phép đo sự giống nhau khác nhau

1.3.1.1 Không gian phép đo khoảng cách

X và Y của nó, ở đó tồn tại một số thực d(x,y) gọi là khoảng cách thoả mãn các thuộc tính sau:

(,)() 2 (1.26)1

L∞ (Q,T) = max {(Qi - Ti)} ; 0 ≤ i ≤ N (1.27)

1.3.1.3 Khoảng cách Cosin

Trang 25

Khoảng cách Cosin tính toán sự khác nhau về phương hướng mà không để ý tới chiều dài vector Khoảng cách này thu được từ việc đo góc giữa hai vector Bằng qui tắc tích vô hướng: Q.T =Qt.T = Q.T.cosθ

Hình 1.4: (a) khoảng cách Ocolit,

Như có thể thấy: khoảng cách Ơcơlit có được tính đến cả góc lẫn chiều dài vector để tính toán Trong khi khoảng cách Cosin chỉ tính đến góc đó khi tính

ư= N

TQ

Trang 26

Đường giao biểu đồ được đề xuất bởi Swain và Ballard {Swa 91} Tìm thấy những đối tượng bên trong các bức ảnh một cách khách quan bằng việc sử dụng biểu đồ màu sắc Nó cũng có thể vận dụng đối sánh cục bộ Khi kích thước đối tượng( với đặc trưng Q) nhỏ hơn kích thước ảnh( với đặc trưng trong T) Định nghĩa gốc của khoảng cách biểu đồ cho bởi công thức:

1.3.1.6 Khoảng cách bậc hai

Những khoảng cách được tính toán từ phép đo khoảng cách được mô tả ở trên chỉ tính toán sự tương ứng giữa mỗi kích thước và không làm cho thông tin sử dụng thông qua các kích thước Vấn đề này nhận ra trong sự thích ứng của biểu đồ Khoảng cách bậc hai được đề xuất để tính toán đến sự giống nhau thông qua kích thước (NIB93, SMI97) Nó cung cấp nhỉều kết quả hơn là sự đối sánh duy nhất giữa các biểu đồ mẫu Khoảng cách mẫu bậc hai giữa hai vector đặc trưng Q và T được tính:

( , ) ( [ ) () ]2(1.32)

aij =ư ij ; trong đó dij =[Qi ưTi]

Để tính toán, khoảng cách mẫu bậc hai được viết lại (DEN 99)

Trang 27

( , ) (1.33)

khoảng cách Mahalanobis, vector đặc trưng được coi như không gian biến

bằng nhau, Σ là ma trân đường chéo:

kích thước thay đổi ít hơn với sự thay đổi nhỏ hơn và trọng số ít hơn với kích thước biến đổi nhiều hơn

1.3.2.Thực hiện phép đo

Trang 28

Để định lượng các giải thuật khác nhau cho tìm kiếm ảnh, một phép đo hiệu quả thực hiện là cần thiết Các phép đo hiệu quả thực hiện đã được đề xướng

[LU98 BMI,99], phép đo sự thực hiện thường dựa trên việc thống kê các bước thử chủ quan Các phép đo sự thực hiện khác thường sử dụng các phép thử chủ quan khác, dẫn đến các định nghĩa khác nhau về sự chính xác trong tìm kiếm ảnh Các phép đo sự thực hiện khác nhau được thảo luận trong phần này

1.3.2.1 Độ nhạy và độ chính xác(RPP)

RPP là phép đo sự thực hiện tìm kiếm ảnh được sử dụng rộng rãi nhất trong các bài giảng Về cơ bản nó dựa trên sự đối sánh tuyệt đối Trong phương pháp này, CSDL được chuyển thành tập nhị phân theo sự phù hợp hoặc không hợp với truy vấn dựa trên phép thử chủ quan Trong các phép thử chủ quan, mỗi một đối tượng lựa chọn một tin tức tương ứng với dạng truy vấn từ CSDL Các mục đích được lựa chọn cho mỗi truy vấn sát với các đối tượng có sẵn được xem xét thích hợp tới truy vấn Ngược lại, chúng được coi là không thích hợp Độ chính xác và độ nhạy được định nghĩa như sau:

n1 : Số lượng ảnh được tìm kiếm )

Độ chính xác đo bằng tìm kiếm ảnh chính xác trong khi độ nhạy đo bằng khả năng tìm kiếm mục đích thích hợp từ CSDL Độ chính xác và độ nhạy có mối hệ ngược nhau Sự chính xác thông thường giảm tương ứng sự gia tăng độ nhạy (cái này tăng thì cái kia giảm)

1.3.2.2 Tỷ lệ trọng số thành công (PWH- Percentage of Weighted Hits)

Trang 29

PWH tương đương như phép đo độ nhạy ở RPP Phép thử chủ quan giống như độ chính xác, đó là mỗi đối tượng lựa chọn một vài mục phù hợp với truy vấn từ CSDL Tuy nhiên thay vì việc đo độ nhạy dựa trên giá trị nhị phân phù hợp

Vì vậy PWH được định nghĩa như sau:

1.3.2.3 Phần trăm của thứ bậc giống nhau (PSR-Percentage of Similarity Ranking )

PSR được đề xuất bởi Bimbo và Pala[bim 97], trong phép đo này mỗi đối tượng gán một dãy giống nhau cho mỗi iterm trong CSDL dựa trên sự tương đồng của iterm với truy vấn Điều này hơn hẳn việc gán sự thích hợp / không thích hợp

cho truy vấn j và phép đo được thoả thuận trong một thứ bậc khép kín tương ứng

(1.37)

Trang 30

Đồ thị của Sj(i) như hàm của Pj(i) chỉ ra hiệu quả tìm kiếm của thuật toán

1.3.2.4 Thảo luận

Ba phép đo sự thực hiện được giới thiệu, PWH chỉ ra trong tính toán số lượng các chủ đề khác nhau lựa chọn cho iterm tương ứng Nó đáp ứng sự sắp xếp của con người nhiều hơn trong recall ở RPP Tuy nhiên PWH không đo khả năng loại bỏ các iterm không phù hợp trong danh sách hoàn lại Sự bất lợi của PWH là nó lại giả thiết một số iterm cố định được hoàn trả, điều này là không thực tế vì số iterm hoàn trả có thể khác nhau Đối với PSR mang lại trong tính toán số lượng và thoả thuận của việc con người sắp xếp thứ bậc Tuy nhiên với một truy vấn PSR mang lại một iterm chi tiết tại một thứ tự chi tiết là cao khi đó mâu thuẫn đối với truy vấn là nhỏ Điều này dẫn đến kết quả PSR thấp nếu sự sắp xếp của thuật toán tìm kiếm khác với sự sắp xếp của con người Mặt khác nếu mâu thuẫn lớn thì PSR có thể là cao thậm chí khi sự sắp xếp bằng thuật toán khác hẳn sắp xếp của chủ đề Phép đo RPP có khả năng khôi phục iterm phù hợp và cả khả năng loại bỏ iterm không phù hợp Sự bất lợi duy nhất của RPP là bỏ qua sự phù hợp của với truy vấn Sự bất lợi này là không quan trọng nếu tập dữ liệu là một phân lớp RPP là phép đo sự thực hiện ưu việt hơn PWH và PSR Đặc biệt thích hợp để đo sự thực hiện khôi phục dữ liệu trên tập dữ liệu lớn và được phân lớp

1.3.3 Trích chọn đặc trưng hình dạng

Trích chọn thông tin hình dạng từ dữ liệu ảnh tập trung ở đường viền và nhận thức về hình dạng là không thay đổi đối với thay đổi độ tương phản( thay đổi trong độ chia màu sắc và độ chói) Hình dạng hình học có được mô hình như

(1.38)

Trang 31

đường cong khép kín Tuy nhiên trong một vài quan sát gần đây một phần đối tượng khi quan sát bị ẩn bởi các đối tượng khác, mặc dù vẫn còn giới hạn trong nhận thức của con người khi nhận dạng hình dạng trong ảnh.Vì vậy nhân tố hình dạng thực sự không trọn vẹn các cung tương ứng của đường viền đối tượng, chỉ là một đoạn đối tượng Trong luận văn này chấp nhận biểu diễn nhân tố hình dạng với bất kỳ đoạn cung nào Thông tin về việc trích chọn nhân tố hình dạng từ ảnh như thế nào là không cần thiết cho moment, ta sẽ tính toán tập các nhân tố hình dạng được trích chọn từ một ảnh được giới thiệu phù hợp với biểu diễn ngữ nghĩa hình dạng của chúng

Khi hình dạng là đối tượng bị ảnh hưởng của méo dạng xa gần, bằng nhận thức của mình con người vẫn có thể nhận dạng dạng đúng đối tượng Để so sánh, biểu diễn hình dạng là không đổi với các phép biến đổi này và không đề cập tới các phép biến đổi trong đối sánh hình dạng, vì chúng cho phép vạch ra một lớp lớn các cung thành một đường tròn và vì thế vạch ra các cung tuỳ ý tạo thành cung tròn Phép biến đổi trục đo có thể xấp xỉ cục bộ bằng phép biến đổi quan hệ

Hình 1:a ảnh ký tự,b) mức đường tương ứng, c) Đoạn mức đường

Từ nhân tố hình dạng khá cục bộ yêu cầu biểu diễn nhân tố hình dạng dạng hình học không thay đổi Phần lớn các ứng dụng chỉ cần tương đương không đổi là đủ Vì vậy, Có thể biểu diễn mỗi nhân tố hình dạng S bằng danh sách của K bộ mô tả quan hệ hoặc sự tương đồng không đổi, gọi là Code(mã) Hình 1

1.4 Thảo luận

Trang 32

Trong chương này một vài công cụ cơ bản sẽ được sử dụng trong việc tìm kiếm, nhận dạng ảnh dựa vào hình dạng và trích chọn các đặc trưng đã được nhắc lại Những lý thuyết và thuộc tính quan trọng của hai công cụ trích chọn đặc trưng tức là biến đổi Fourier và không gian độ chia đã được mô tả và bàn luận Hai công cụ mà những đặc trưng hình dạng có được từ những miền khác nhau Với biến đổi Fourier có được các đặc tính từ miền phổ và không gian độ chia có được các đặc trưng từ miền không gian Cả hai công cụ đều hữu ích cho phân tích hình dạng bởi chúng có khả năng thu được đặc trưng tín hiệu của một hình dạng khi loại trừ bớt nhưng chi tiết hình dạng tinh tế nhất

Các phép đo sự giống nhau khác và phép đo sự thực hiện cũng dược thảo luận Phép đo sự giống nhau khác được ước lượng sử dụng các đặc trưng ảnh tổng quát và tập CSDL hình dạng tiêu chuẩn Các kết quả thí nghiệm chỉ ra phép đo khoảng cách khối trung tâm là phù hợp cho khôi phục ảnh dựa trên hình dạng Tuy nhiên nó sẽ được sử dụng như phép đo tương đương trong thí nghiệm khôi phục ảnh trong suốt luận văn Một khi những tập CSDL sử dụng cho thí nghiệm trong luận văn được phân lớp thành tất cả các nhóm giống nhau và không giống nhau, RPP sẽ được sử dụng cho phép đo sự thực hiện

Trang 33

Chương 2

Phương pháp tách contrario

Phương pháp tách contrario nhằm giải quyết 3 vấn đề cơ bản trong phân tích nhóm: đầu tiên là ước lượng giá trị của nhóm, thứ hai là vấn đề nhóm có ý nghĩa này lại thường chứa trong các nhóm có ý nghĩa khác, cần thiết phải định rõ nhóm có ý nghĩa nhất trong số các nhóm đó, thứ 3 là định rõ qui tắc kết hợp giữa các nhóm có ý nghĩa cho phép quyết định có sự riêng biệt giữa các nhóm hay chúng chỉ là một, nhằm mục đích nhận dạng hình dạng Thuật toán đối sánh được tính toán tương ứng của các nhân tố hình dạng giữa hai ảnh đem so sánh và thiết lập mối quan hệ không gian giữa các đối sánh nhân tố hình dạng đưa vào ảnh

Mỗi cặp đối sánh hình dạng dẫn tới 1 biến đổi xác định Chương này giới thiệu lý thuyết lựa chọn nhóm đúng để nhóm các nhân tố hình dạng thành một hình dạng dựa vào việc tách nhóm trong không gian biến đổi

Thực hiện nhóm nhằm mục đích phát hiện ra các cấu trúc bằng cách phân chia điểm trong tập dữ liệu điểm thành các nhóm tự nhiên Phương pháp này sử dụng cho vấn đề nhận dạng, đưa vào hai ảnh, trả lời câu hỏi: hai ảnh có hình dạng nào chung Thay vì phải phân tích nhiều nhân tố hình dạng và định rõ chúng trong mỗi cặp ảnh được đề cập mỗi nhân tố hình dạng được định nghĩa theo nhiều cách: nhân tố hình dạng tương ứng như các đoạn mức đường đã được mã hóa trong mối quan hệ xác định Bước nhận dạng tiếp theo là đối sánh sự tương đồng của các nhân tố hình dạng Khi các nhân tố hình dạng là một đoạn của mức đường, mỗi thủ tục đối sánh với 1 phân tích tách biên được mô tả chi tiết Kết quả của thủ tục là một tập các cặp đối sánh nhân tố hình dạng Do đối sánh cục bộ không tách hai nhân tố hình dạng của cùng 1 hình dạng đơn vì vậy

Trang 34

dạng được biến đổi từ ảnh đầu tiên đến ảnh thứ hai bằng cùng phép biến đổi Chính điều này dẫn tới việc tìm nhóm các nhân tố hình dạng có thể tính toán như tách nhóm thông thường

Vấn đề của việc tìm ra nhóm trong tập cơ sở dữ liệu là một nghiên cứu thực sự Nó bao gồm việc nhận dạng, phân lớp đối tượng trong CSDL Tất cả các phương pháp phải đối mặt với ba vấn đề tổng quan đã nêu trên Dubes và Miligan và Cooper đã giới thiệu giải pháp để lựa chọn số nhóm, mỗi nhóm chú ý đến qui tắc dừng trong phương thức thứ bậc Phương pháp Contrario định nghĩa một phương pháp cơ sở cho các phép đo sự tập trung của các điểm Trong phương pháp này, phân lớp sắp xếp tập các đoạn được đề cập và nhóm có ý nghĩa được tách Sự thuận lợi của các thủ tục chính là tính hệ thống, và có thể tổng quát chung cho bất cứ chiều nào (mặc dù gánh nặng tính toán trở nên quá nặng) Tuy nhiên không giải quyết được vấn đề ra quyết định, Grimson và Hutterloche giới thiệu một nghiên cứu trên Likelihood của điểm sai trong không gian tham số Hough Công việc này làm cơ sở cho phương pháp tách được giới thiệu Các phương pháp nhận dạng trước đó kết hợp một ngưỡng đơn với mỗi ảnh mục tiêu, độc lập với các cảnh phức tạp Ngược lại với các phương pháp trên, theo phương

2.1 Cluster có thứ bậc và đánh giá giá trị 2.1.1.Giá trị nhóm Contrario

Định nghĩa một phép đo định lượng giá trị nhóm các điểm Một nhóm sẽ được đề cập như một vùng có ý nghĩa khi nó hàm chứa trong vùng có một vài điểm mong đợi nếu như dữ liệu được xác định tại một không gian Từ đó, một phương thức xác suất phải được định nghĩa chính xác, thậm chí nó sẽ được yêu cầu

2.1.1.1 Cơ sở:

Trang 35

Trong tất cả các công thức sau, E lấy từ tập phụ RD, để lại với một phép đo xác suất π (nó sẽ được gọi là luật cơ sở) Định nghĩa π(R) là xác suất tại một không gian điểm phụ thuộc R

Định nghĩa của π là một vấn đề cụ thể tổng quan đưa ra một xác suất biết trước hoặc có thể ước lượng theo kinh nghiệm trên tập dữ liệu

Định nghĩa 2.1: Một xử lý nền là một xử lý các điểm có hạn (Xi) i= 1 M trong E từ các biến độc lập với nhau, định dạng phân bố theo luật π

tập dữ liệu sẽ là nhóm có nghĩa nếu các điểm quan trọng thuộc vào một vùng rất nhỏ, ở đó xác suất của những điểm này rất nhỏ Vì vậy, cơ sở của phương thức Contrario là trái với giả thiết dưới đây:

bao hàm trong mọi tập dữ liệu điểm Trong thực tế, định nghĩa một nhóm có nghĩa sẽ bao hàm tổng có hạn các vùng phụ

2.1.1.2 Nhóm có ý nghĩa

kỳ và có hình dạng bất kỳ Fix cứng xác suất cho trước, vùng R sẽ phải thuộc vào tập vùng gốc R có giới hạn, nó sẽ được mô tả kỹ hơn Giả thiết đơn giản hơn R giới hạn các dự tuyển #R và với mọi R∈R, O∈ R k ≤ M ∈ N và 0 ≤ p ≤ 1

Trang 36

Dạng luật nhị phân xử lý nền X1 X M và vùng R ∈ E với xác suất π (R), 1 có thể giải thích như xác suất tại điểm cuối k ngoài các điểm M của việc xử lý vào trong tập R Mặc dù nghiên cứu dạng nhị thức và chúng sử dụng trong tách cấu trúc hình học có thể tìm thấy

j ∈ (1, ,M) và R' ∈ R Gọi số cách báo sai của R = Xj + R'

Gọi R = Xj + R' là một vùng ε có nghĩa nếu NFAg(X, j, R') ≤ ε

ta là giới thiệu mở rộng số lượng vùng có ý nghĩa ε là nhỏ hơn ε

Proposition 2.1

Để tính toán số các cảnh báo lỗi là phép đo sự giống nhau giữa các nhóm chứa trong vùng R như thế nào trong một tập dữ liệu điểm này ẩn chứa trong k điểm dữ liệu khác Mức NFAg(R) thấp hơn, (Prop 2.1) thông số điều khiển tách là ε

Mệnh đề dưới đây chỉ ra ảnh hưởng của tham số #R và của thông số quyết định ε trong kết quả tách biên là rất ít

Mệnh đề 2.2: Đặt R là một vùng của R

(2.1)

Trang 37

Chú ý: k*(ε) là giá trị nhỏ nhất của điểm trong nhóm có nghĩa ε Bằng kết quả dự đoán, quyết định ng−ỡng này chỉ có loga phụ thuộc #R và ε

Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng

Hình 2.2 chỉ ra một ví dụ của nhóm dữ liệu bao gồm 950 điểm đồng dạng phân bố trong một đơn vị vuông và 50 điểm thêm vào xung quanh (0,4;0,4) và (0,7;0,7) xung quanh 950 điểm; phân bố đồng đều trong một đơn vị vuông Trong ví dụ này #R= 2500 (50 kích cỡ khác cho mỗi chiều) Chính xác hai nhóm lớn nhất

2.1.2 Tiêu chuẩn kết hợp tốt nhất

Trong mục 2.2.1.2 đã giới thiệu hạn chế không gian của việc kiểm tra vùng từ

Độ d− thừa cao khi mỗi vùng có nghĩa lại liên quan tới tập mô tả

Trang 38

Hai vùng R ⊂ R', câu hỏi này dễ dàng trả lời bằng việc so sánh NFAg(R) và

hỏi khác khi 3 hoặc nhiều vùng liên kết với nhau, vì vậy phải yêu cầu một tiêu chuẩn hỗn hợp Đầu tiên sẽ định nghĩa số cảnh báo sai cho một cặp vùng Giá trị mới này đ−ợc so sánh với NFA của vùng hỗn hợp Giới thiệu 3 hệ số danh nghĩa

và π1= π (R1), π2 =π (R2) xác suất của chúng à(M, k1 , k2, π1 , π2) là xác suất tại giá

Đặt 1<i ≠ j <M và R’, R”∈ R Bây giờ 2 vùng thử Xi + R' và Xj + R'' có thể giao nhau và phải thực sự với xác suất này Chú ý: đ−ợc mô tả bằng sự thay đổi hoàn toàn vai trò i và j:

R', Xj + R'')

(2.4)

Trang 39

Cặp vùng bất kỳ(Ri,Rj) là có ý nghĩa ε nếu NFAgg(X,i,j,R',R'') < ε, NFAgg (X,i,j,R',R'') cũ sẽ được chứa trong NFAgg (Ri,Rj)

Mệnh đề 2.3: Số cặp vùng lý tưởng nhỏ hơn ε

Mệnh đề này dẫn tới 2 phép đo kém ý nghĩa: NFA của vùng và NFA của cặp vùng Từ số lượng vùng có ý nghĩa ε trong phương thức nền ở trên đề cập tới biên độ tương tự nhau được so sánh để định nghĩa một tiêu chuẩn hỗn hợp

Định nghĩa 2.4 (Vùng riêng biệt): Đặt R1 và R2 là hai vùng riêng biệt và R là

quan hệ với R1 và R2 nếu:

Tập R là vùng thử và R là một nhân tố của R R là riêng biệt trong R nếu nó

vùng Cluster Nếu công thức 2.5 không xảy ra vùng thử được coi như vùng không có giá trị, có nghĩa vùng thử có thể chia thành nhiều cặp vùng có nghĩa khác trong Cluster Lenma tiếp theo sẽ cung cấp sự hữu ích trong việc gia tăng quyết định hỗn hợp

Lenma 2.1: Mỗi giá trị k1 và k2 trong (0,…., M) Mỗi k1, k2 ≤ M và mỗi π1 và π2 [0,1] sao cho π1 + π2 ≤ 1

Mệnh đề 2.4: Nếu R là riêng biệt với chú ý tới R1 và R2

Từ mệnh đề (2.4) và định nghĩa (2.4)

(2.6)

Trang 40

Bằng Lenma 2.1, với β(M ư1,k,p)≤β(M,k,p) cho mọi M, k, p công thức biểu diễn như sau:

Mệnh đề 2.4 là hữu ích cho tính toán tổng quan, có thể tránh việc phải tính toán chi tiết 3 phân bố bằng bộ lọc các cluster đó

2.1.3 Vấn đề tính toán 2.1.3.1 Lựa chọn vùng thử

Tập đúng của các vùng thử R như thế nào? Một vài lý do a > 0, r > 0 và n

,

giản lựa chọn vùng thử có hình chữ nhật thích hợp với xác suất phân bố p được định

Định nghĩa 2.2: thừa nhận tính toán NFA của bất cứ vùng thử nào tại dữ liệu

tại sao phép thử không thể thực hiện theo cách này Tốt hơn nên giải quyết cây cấu trúc của tập dữ liệu điểm mô tả bằng thuật toán tập trung thứ bậc Tổ chức thứ bậc dữ liệu được sử dụng để giới hạn các vùng thử, bằng thủ tục như sau:

Bước 1: Bằng việc áp dụng phương pháp tập trung thứ bậc, phương pháp này

cung cấp 1 tập hợp các tập con ẩn trong tập hợp điểm Cấu trúc cây mà trong đó mỗi nút là một phần của tập dữ liệu và là một ứng viên Cluster Cây này gọi là dendgrogram

Phần lớn các thủ tục được thực hiện bởi việc lặp lại thủ tục nhị phân hỗn hợp Vì vậy trực tiếp thiết lập cây nhị phân trong mỗi phương pháp, bước khởi đầu: thiết

Tiêu đề	Nghiên Cứu Phương Pháp Nhận Dạng Hình Dạng
Tác giả	Đinh Thị Kim Phượng
Người hướng dẫn	T.S. Nguyễn Kim Anh
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Xử Lý Thông Tin Và Truyền Thông
Thể loại	Luận Văn Thạc Sĩ Khoa Học
Năm xuất bản	2006
Thành phố	Hà Nội

Định dạng
Số trang	90
Dung lượng	1,64 MB

Nghiên cứu phương pháp nhận dạng hình dạng

Ph−ơng thức quyết định Contrario