20 Phân loại 20 1 Giới thiệu Trong nhiều ứng dụng xử lí ảnh, kích cỡ và hình dạng của các phần tử như bong bong, trạng thái mù, giọt, chất màu, nhân tế bào phải được phân tích Trong những trường hợp này, các tham số cần quan tâm được định nghĩa rõ ràng và có thể được đo trực tiếp từ các ảnh chụp được Chúng ta xác định vùng và hình dạng của mỗi phân tử mà chúng được phát hiện bằng các phương pháp trong phần 19 5 1 và 19 3 Biết được các tham số này sẽ cho phép tất cả các câu hỏi cần quan tâm có th.
20 P h â n l o i 20.1 Giới thiệu Trong nhiều ứng dụng xử lí ảnh, kích cỡ hình dạng phần tử bong bong, trạng thái mù, giọt, chất màu, nhân tế bào phải phân tích Trong trường hợp này, tham số cần quan tâm định nghĩa rõ ràng đo trực tiếp từ ảnh chụp Chúng ta xác định vùng hình dạng phân tử mà chúng phát phương pháp phần 19.5.1 19.3 Biết tham số cho phép tất câu hỏi cần quan tâm trả lời Từ liệu thu thập được, tính tốn ví dụ histogram vùng phần tử (hình 20.1.c) Ví dụ điển hình lớp rộng ứng dụng khoa học Các tham số đối tượng đánh giá cách trực tiếp rõ ràng từ liệu hình ảnh giúp trả lời câu hỏi khoa học đưa đưa Các ứng dụng khác phức tạp yêu cầu phân biệt lớp đối tượng khác ảnh Trường hợp dễ điển hình đưa nhiệm vụ kiểm tra cơng nghiệp Kích cỡ đối tượng kiểm tra có phạm vi dung sai cho phép khơng? Có phần bị bỏ sót? Có sai hỏng ví dụ vết xước khơng? Dựa kết phân tích kiểm tra, đối tượng xác nhận đạt coi bị lỗi Việc gán đối tượng ảnh tới lớp định (giống khía cạnh khác phân tích xử lí ảnh) vấn đề học thuật thực mà khơng chun biệt cho phân tích ảnh kĩ thuật thông dụng Về điều này, viêc phân tích ảnh phần lĩnh vực nghiên cứu nhận dạng mẫu Một ứng dụng cổ điển nhận dạng mẫu mà người biết nhận dạng tiếng nói Các từ nói chứa tín hiệu ấm 1D (một chiều) Ở việc phân loại để nhận âm vị, từ cấu ngồn ngữ nói Nhiệm vụ tương ứng xử lí ảnh nhận dạng văn (text recognition), nhận dạng chữ từ đoạn văn bản, việc nhận dạng chữ từ đoạn văn biết nhận dạng kí tự quang học (optical character recognition - OCR) a b Hình 20.1: Các bước phân tích phân bố kích cỡ phần tử (hạt đậu): a- Ảnh gốc,b- ảnh nhị phân, c- Phân bố vùng Một khó khăn chung phân loại liên quan đến thực tế quan hệ tham số quan tâm liệu ảnh không hiển nhiên, rõ ràng Các đối tượng phân loại không liên quan trực tiếp đến dải định giá trị đặc điểm phải xác định đặc trưng quang học ảnh Cho ví dụ phân biệt hạt đậu, hạt tiêu khô hạt hoa hướng dương hình 20.2? Mối liên quan đặc trưng quang học lớp đối tượng cần nghiên cứu cẩn thận Chúng ta minh họa mối quan hệ phức tạp đặc điểm đối tượng đặc trưng quang học với hai ví dụ Hình 20.2:Nhiệm vụ phân loại: Hạt hạt tiêu, hạt đậu hạt hướng dương hay không hạt ba loại hạt A- ảnh gốc B ảnh nhị phân sau phân đoạn Tình trạng cối bị tàn lụi môi trường (Waldsterben Sự hủy hoại rừng diện rộng mưa axit ô nhiễm môi trường) nhiều vấn đề lớn mà nhà khoa học phải đối măt Trong hệ thống cảm ứng từ xa, nhiệm vụ chúng xếp phân lớp khu vực bị phá hủy rừng từ hình ảnh vệ tinh khơng gian Trong ví dụ này, mối quan hệ lớp khác đặc điểm hủy hoại ảnh rõ ràng Các nghiên cứu chi tiết cần thiết để khám phá mối quan hệ phức tạp Các ảnh không gian phải so sánh với nghiên cứu mặt đất Chúng ta cần nhiều đặc tính để nhận biết lớp định việc hủy họai rừng Có nhiều ứng dụng tương tự y tế sinh học Một câu hỏi tiêu chuẩn y học phân biệt khỏe mạnh bệnh tật Lại lần nữa, rõ ràng trông mong quan hệ đơn giản hai lớp đối tượng đặc tính của đối tượng theo dõi ảnh Một ví dụ hình 20.3 Chúng ta khơng có vấn đề việc nhận đối tượng đèn Làm hệ thống máy móc hình ảnh thực nhiệm vụ Các đặc tính rút từ ảnh giúp nhận đèn Trong khơng gặp vấn đề việc nhận đèn hình 20.3, cảm thấy với câu hỏi làm thực điều dùng máy tính Rõ ràng nhiệm vụ phức tạp Chúng ta nhận đèn nhìn thấy nhiều đèn khác trước ghi nhớ trải nghiệm Nhưng làm kinh nghiệm lưu lại việc so sánh thực hiên Rõ ràng không sở sở liệu hình dạng hình học đèn mà cịn biết hồn cảnh hay mơi trường có đèn chúng sử dụng làm Nghiên cứu vấn đề thuộc loại phần lĩnh vực nghiên cứu trí tuệ nhân tạo (viết tắt AI- Artificial intellidence) Liên quan đến ứng dụng khoa học, kĩ thuật hình ảnh phần động lực phát triển khoa học tự nhiên thực nghiệm ngày phát triển, thường xuyên xảy trường hợp đối tượng xuất mà khơng có chế phân lớp sẵn sàng cho đối tượng Mục tiêu xử lí hình ảnh tìm lớp cho đối tượng Vì vậy, cần kĩ thuật phân loại mà chúng không yêu cầu kiến thức trước Tổng kết lại, kết luận việc phân loại bao gồm hai chức sau: Mối liên hệ đặc điểm ảnh (các đặc trưng quang học) lớp đối tượng tìm kiếm phải nghiên cứu chi tiết Chủ đề phần lĩnh vực khoa học tương ứng việc cấu thành ảnh ví dụ quang học tranh luận chương 6-8 Từ vô số đặc điểm ảnh, phải lựa chọn tập tối ưu phép lớp đối tượng khác phân biệt cách rõ ràng với công việc phải làm tối thiểu lỗi kĩ thuạt phân lớp hợp lí Nhiệm vụ gọi phân loại chủ đề chương Chúng ta đề cập đến vài vấn đề lựa chọn loại xác, số lượng đặc tính (phần 20.2) vài kĩ thuật phân loại đơn giản (phần 20.3) H ì n h 20.3: Làm nhận tất đối tượng đèn 20.2 Không gian đặc tính 20.2.1 Phân loại dựa đối tượng ngược với dựa pixel Có thể phân biệt hai loại thủ tục phân lớp bao gồm phân lớp dựa pixel phân lớp dựa đối tượng Trong số trường hợp phức tạp, phân đoạn đối tượng dùng đặc điểm Khi yêu cầu sử dụng nhiều đặc điểm tiến trình phân loại để định pixel thuộc loại đối tượng Sự phân loại dựa đối tượng đơn giản nhiều sử dụng đối tượng khác tách từ không chạm hay đè lên Việc phân loại dựa đối tượng nên sử dụng số lượng liệu cần xử lí nhiều Tồn đặc điểm dựa pixel tranh luận chương 11-15 giá trị xám trung bình, định hướng cục bộ, số sóng cục bộ, biến thể giá trị xám, tính trung bình tồn vùng đối tượng sử dụng đặc trưng miêu tả đặc tính đối tượng Thêm nữa, dùng tồn tham số miêu tả hình dạng đối tượng nói đến chương 19 Thỉnh thoảng, việc áp dụng hai trình phân loại yêu cầu Đầu tiên, phân loại dựa pixel để tách đối tượng khỏi đối tượng khác sau sử dụng phân loại dựa đối tượng cách ứng dụng đặc tính hình học đối tượng 20.2.2 Cluster Một tập P đặc điểm tạo không gian M kích cỡ P kí hiệu khơng gian đặc tính hay khơng gian đo đạc Mỗi pixel hay đối tượng biểu diễn vector đặc tính khơng gian Nếu đặc tính biểu diễn lớp đối tượng tốt, tât vector đặc tính đối tượng từ lớp nằm gần khơng gian đặc tính Chúng ta coi việc phân lớp trình thống kê gán hàm mật độ xác suất kích cỡ P tới lớp đối tượng Chúng ta ước lượng hàm xác suất cách lấy mẫu từ lớp đối tượng cho, tính tốn vector đặc tính gia tăng điểm tương ứng khơng gian đặc tính rời rạc Thủ tục histogram kích cỡ P khái quát hóa (phần 3.2.1) Khi lớp đối tượng biểu diễn phân bố xác suất hẹp khơng gian đặc tính, nói đến cluster Nó phân tách đối tượng vào lớp đối tượng cho cluster lớp đối tượng tách rời khỏi Với đặc điểm thích hợp hơn, cluster chồng lên chí tệ khơng cluster tồn Trong trường hợp việc phân loại mà khơng có lỗi khơng thể 20.2.3 Lựa chọn đặc tính Chúng ta bắt đầu ví dụ, phân loại hạt khác (trong hình 20.2) thành lớp: lớp hạt tiêu, lớp hạt đậu, lớp hạt hướng dương Hình 20.4a, b thể biểu đồ hai đặc tính vùng độ lệch tâm Trong biểu đồ vùng thể hai đỉnh, đồ thị độ lệch tâm có đỉnh quan sát Trong trường hợp nào, khơng đặc tính hai đặc tính phân biệt lớp hạt Nếu lấy hai thông số nhau, phân biệt hai vùng (trong hình 20.4c) Hai lớp nhận diện lớp hạt tiêu lớp hạt đậu Cả hai loại hạt hình trịn thể lệch tâm thấp (từ đến 0.2) Do vậy, hai loại hạt kết hợp lại thành đỉnh đồ thị độ lệch tâm hình 20.4b Hạt hướng dương khơng tạo nên vùng dày chúng biến đổi lớn hình dạng kích thước Nhưng rõ ràng chúng có kích cỡ tương đương với hạt đậu, chúng khơng đủ dùng để nhận dạng dùng đặc tính vùng Trong hình 20.4c, nhận diện nhiều đối tượng rìa ngồi Thứ nhất, có nhiều đối tượng nhỏ với độ lệch tâm lớn Đó đối tượng thấy phần hạt mép ảnh 20.2 Ngồi cịn có đối tượng lớn ảnh mà hạt đậu chạm vào tạo thành đối tượng ảnh lớn Độ lệch tâm đối tượng lớn lớn khơng phân biệt chúng với hạt hướng dương dùng hai tam số đơn giản vùng độ lệch tâm Chất lượng đặc tính quan trọng cho phân loại tốt Điều nghĩa gì? Góc độ đầu tiên, nghĩ nhiều đặc tính lựa chọn tốt Nói chung, khơng phải điều đáng kể Trong hình 20.5a, thể khơng gian đặc tính chiều lớp Đặc tính thứ hai khơng cần thiết để cải thiện phân chia hình 20.5b Vùng thứ thứ chồng lấn Một khảo sát phân bổ khơng gian đặc tính kết luận giải thích điều này: Đặc tính thứ khơng nói cho biết nhiều mới, biến đổi tương quan mạnh với đặc tính Do đó, hai đặc tính tương quan mạnh Hai việc sở đáng lưu tâm, người ta thường bỏ qua nhiều lớp phân biệt với số tham số Chúng ta cho rằng, đặc tính tách biệt hai lớp Vậy, 10 đặc tính tách biệt 10 = 1024 lớp đối tượng Ví dụ đơn giản minh họa khả tách biệt lớn với số thơng số Vấn đề cốt lõi phân bố ngang vùng khơng gian đặc tính Từ đó, điều quan trọng để tìm đặc tính, ví dụ nghiên cứu mối quan hệ đặc tính đối tượng đặc tính hình ảnh cách cẩn thận 20.2.4 Sự khác biệt lớp khơng gian đặc tính Ngay có tính tốt có có lớp học tách Trong trường hợp vậy, ln ln giá trị nhắc nhở tách đối tượng lớp học xác định mơ hình thực tế Thông thường, việc chuyển từ lớp sang lớp khác khơng phải đột ngột mà phải Ví dụ, bất thường phần tử xuất biến đổi với mức độ khác nhau, khơng hai lớp riêng biệt, "bình thường" "không hợp lý", mà chuyển tiếp liên tục hai lớp Vì vậy, khơng thể mong đợi để có phân tách lớp tốt khơng gian đặc tính trường hợp Chúng ta rút hai kết luận Đầu tiên, khơng bảo đảm có phân tách tốt lớp khơng gian đặc tính, đặc tính tối ưu lựa chọn Thứ hai, tình trạng buộc phải xem xét lại phân loại đối tượng Hai lớp đối tượng thực tế lớp kỹ thuật trực quan để phân biệt chúng khơng đầy đủ Trong ứng dụng quan trọng khác, nhận dạng ký tự quang học hay OCR, có lớp riêng biệt Mỗi ký tự lớp xác định tốt Trong dễ dàng để phân biệt hầu hết chữ cái, số, ví dụ 'O' hoa số "0", chữ 'I' 'l' số '1 ', giống nhau,nghĩa là, nằm gần khơng gian đặc tính (hình 20.6) Một phân lớp tốt mà khơng phân biệt tính đặc tính, đặt vấn đề nghiêm túc cho nhiệm vụ phân loại lớp Làm phân biệt chữ lớn 'O' từ số "0" 'l' 'I' hoa? Chúng ta đưa hai câu trả lời cho câu hỏi Đầu tiên, phơng chữ thiết kế lại để làm cho chữ phân biệt tốt chúng Thật ra, phông chữ đặc biệt thiết kế cho nhận dạng ký tự tự động Thứ hai, thông tin bổ sung đưa vào phân loại q trình Tuy nhiên, điều địi hỏi việc phân loại khơng lại cấp độ cá nhân chữ cái, mà phải cải tiến mức từ Sau đó, dễ dàng để thiết lập quy tắc tốt nhận dạng Một quy tắc đơn giản giúp phân biệt chữ 'O' từ số "0" chữ số không trộn lẫn từ Như ví dụ đếm cho quy tắc này, mã bưu điện Anh hay Canada có chứa pha trộn chữ số Bất người không đào tạo để đọc hỗn hợp pha trộn khơng bình thường có vấn đề nghiêm trọng việc đọc ghi nhớ chúng Như ví dụ khác, chữ viết hoa phân biệt chữ thường 'l' quy tắc chữ in hoa đầu từ từ đoạn văn Chúng ta khép lại phần với bình luận yêu cầu xem phân loại có vấn đề định chất loại đặc tính quan trọng nhất, khơng, tốt lựa chọn thích hợp phương pháp phân loại 20.2.5 Biến đổi trục sở Các thảo luận phần trước đề xuất phải chọn tính đối tượng cẩn thận Mỗi tính mang lại thông tin trực giao với biết lớp đối tượng Nghĩa là, lớp đối tượng với phân bố tương tự đặc tính nên khơng có ltuowng quan với tính khác Nói cách khác, đặc tính nên khơng có tương quan Mối tương quan đặc tính nghiên cứu với phương pháp thống kê thảo luận phần 3.3 giả sử phân phối đặc tính lớp khác biết (có giám sát phân loại) Một số quan trọng hiệp phương sai chéo (crosscovariance) của hai tính mp mq từ vector đặc tính P-chiều cho lớp đối tượng, định nghĩa là: Cpq = Nếu Cpq = khẳng định khơng có hiệp phương sai chéo, trực quan Biến số: Cpp = phương pháp biến số cửa đặc tính Một đặc tính tốt cho số lớp đối tượng hiển thị phương sai nhỏ cho thấy phần mở rộng nhỏ vùng phương hướng tương ứng khơng gian tính Với đặc tính P, hình thành ma trận đối xứng với hệ số Cpq, ma trận hiệp phương sai Các phần tử đường chéo ma trận hiệp phương sai có chứa hiệp phương sai đặc tính P, yếu tố không thuộc đường chéo tạo thành hiệp phương sai chéo Giống tất ma trận đối xứng, làm chéo hóa ma trận hiệp phương sai Thủ tục gọi biến đổi trục sở Các ma trận hiệp phương sai tọa độ trục sở: Chéo hóa cho thấy tìm thấy hệ thống tọa độ tất tính khơng tương quan Những tính kết hợp tuyến tính tính cũ đặc tính ma trận hiệp phương sai đặc tính Các giá trị riêng tương ứng phương sai chuyển đổi tính Các tính tốt cho thấy gia trị phương sai thấp nhất; giá trị phương sai lớn khơng có tác dụng nhiều chúng phân tán rộng khơng gian đặc tính, đó, khơng đóng góp nhiều để tách lớp đối tượng khác Vì vậy, chúng bỏ qua mà không làm cho phân loại Một ví dụ minh họa đơn giản trường hợp hai tính gần giống hệt nhau, minh họa hình 20,7 Trong ví dụ này, tính m1 and m2 cho lớp đối tượng gần giống hệt nhau, tất điểm khơng gian đặc tính gần với đường chéo hai tính hiển thị phương sai lớn Trong trục m’ = m2 - m1 lại đặc tính tốt cho thấy phân bố hẹp, m’1 vơ dụng m1 m2 riêng Vì làm giảm chiều khơng gian đặc tính hai chiều mà khơng có bất lợi Bằng cách này, sử dụng biến đổi trục sở để giảm kích thước khơng gian tính tìm thấy tập hợp nhỏ tính tốt Điều địi hỏi phân tích ma trận hiệp phương sai lớp đối tượng Chỉ có tính bỏ qua phân tích cho tất lớp cho kết qủa tương tự Để tránh hiểu lầm, biến đổi trục sở cải thiện chất lượng phân biệt lớp Nếu tập hợp đặc tính khơng thể tách rời hai lớp, đặc tính thiết lập chuyển đổi hệ trục sở không làm Vậy, với tập hợp tính năng, chuyển đổi để tìm tập hợp tối ưu, làm giảm chi phí tính tốn phân loại 20.2.6 Phân loại ảnh có giám sát khơng có giám sát Chúng ta coi vấn đề phân loại ảnh phân tích cấu trúc khơng gian đặc tính Một đối tượng xem mẫu khơng gian đặc tính Thơng thường phân biệt phương pháp phân loại có giám sát phân loại khơng có giám sát Giám sát: Trong phương pháp phân loại có giám sát nghĩa xác định nhóm khơng gian đặc tính với đối tượng biết trước sử dụng cách cho học xác định nhóm Sau biết số loại vị trí chúng kích thước khơng gian đặc tính Với phân loại khơng giám sát coi khơng biết đối tượng phân loại Chúng ta tính tốn mẫu khơng gian đặc tính từ đối tượng muốn phân loại sau thực phân tích cluster khơng gian đặc tính Trong trường hợp chí khơng biết trước số lớp Kết có số cluster tách biệt khơng gian đặc tính Rõ ràng phương pháp có tính khách quan kết thuận lợi cho phân tách Cuối nói phương pháp tự học khơng gian đặc tính cập nhật đối tượng khác phân loại Phương pháp học bù đắp dần vào tính đối tượng Phải cập nhật đối tượng lý đơn giản thay đổi chiếu sáng mà điều thường xuyên xẩy môi trường công nghiệp ánh sáng ban ngày, bám bẩn hệ thống chiếu sáng 20.3 Kỹ thuật phân loại đơn giản Trong phần thảo luận kỹ thuật phân loại ảnh khác Chúng ta sử dụng phân loại có giám sát không giám sát Các kỹ thuật khác phương pháp sử dụng để kết hợp lớp với cluster khơng gian đặc tính (trong phần 20.2.6) Một cluster thuộc tính xác định phương pháp, việc xử lý phân loại thêm giống với phương pháp Một đối tượng mang đặc tính vector liên quan với loại bị từ chối loại Các kỹ thuật phân loại ảnh khác cách thức cluster làm mẫu không gian đặc tính Phổ biến cho tất phân loại ánh xạ lên khơng gian đặc tính M không gian định D Không gian định D chứa phần tử Q tương ứng với loại bao gồm từ chối với loại cho đối tượng không xác định Trong trường hợp xác định định không gian định số nhị phân, lúc phần tử chọn tất lại phải khơng Nếu phân loại theo xác suất tham số không gian định số thực sau tổng tất phần tử không gian định phải 20.3.1 Phân loại theo tra cứu Đây kỹ thuật phân loại đơn giản vài trường hợp tốt, khơng thực mơ hình với cluster phân loại đối tượng, nên khơng hồn hảo Phương pháp phân loại theo kiểu tra cứu đơn giản khơng gian đặc tính đánh dấu tế bào mà nằm nhóm, thơng thường với số lượng tế bào đáng kể không thuộc nhóm đánh Trong trường hợp có từ cluster bị chồng lấn, chọn cluster Đầu tiên vào phân loại theo xác suât tế bào Thứ rõ phân loại lỗi không giống không gian vector đánh dấu Sau khởi tạo khơng gian đặc tính, hoạt động phân loại đơn giản theo tra cứu (phần 10.2.2) Vector đặc tính M đối chiếu với bảng tra cứu xem thuộc lớp Khơng nghi ngờ gì, kỹ thuật phân loại nhanh chóng với u cầu số lượng tính tốn nhỏ Nhược điểm phương pháp đòi hỏi dung lượng nhớ lớn cho bảng tra cứu Ví dụ : xác định không gian chiều với 64 điểm, yêu cầu 64x64x64 = ¼ MB nhớ, nhiều 255 loại yêu cầu byte để đủ lưu bảng tra cứu kết luận nhìn từ bảng kỹ thuật khả thi cho khơng gian chiều Điều cho thấy có giá trị để giảm số lượng tính Ngồi tính với phân bố hẹp có giá trị đặc tính cho tất phân loại sử dụng, từ phù hợp với phạm vi nhỏ, số đặc tính nhỏ để giảm yêu cầu nhớ 20.3.2 Phân loại theo khung ô vuông Phân loại kiểu khung ô vuông mô hình đơn giản với nhóm khơng gian thuộc tính Một cluster lớp mơ hình khung vng xung quanh cluster (hình 20.8 ) Rõ ràng phương pháp khung vng mơ hình đơn giản Nếu giả sử nhóm phân bố đa chiều bình thường nhóm có dạng hình elip Khi elip nằm ô vuông trục elip song song với trục khơng gian thuộc tính Trong chiều khơng gian đặc tính ví dụ elip với nửa trục a b có diện tích khơng tốt , chu vi vng 4ab Điều Khi đặc tính tương quan với nhóm đối tượng trở nên dài hẹp dọc theo đường chéo khơng gian đặc tính, ô vuông bao gồm nhiều khoảng trống chúng dễ dàng chồng lấn lên nhau, làm cho phân loại vùng chồng lấn nhiên tính tương quan tránh biến đổi trục ( phần 20.2.5) Tính tốn u cầu phân loại theo ô vuông yêu cầu vừa phải Với khác nhóm kích thước khơng gian đặc tính So sánh đưa định xem có hay khơng vector đặc tính có thuộc nhóm khơng Qua tìm số nhỏ so sánh nhóm Q kích thước P khơng gian đặc tính 2PQ Ngược lại với phân loại theo đối chiếu tính tốn địa P, số thao tác khơng phụ thuộc vào số nhóm Để kết thúc phần ,chúng ta thảo luận vấn đề phân loại thực tế Hình 20.2 trình bày ảnh hạt khác hạt hướng dương, hạt đậu lăng hạt tiêu Trong ví dụ đơn giản trình bày số thuộc tính chúng vấn đề phân loại Mặc dù loại hạt xác định rõ, đảm bảo xem xét thuộc tính cần thiết cho q trình phân loại ,hiển nhiên tham số để phân biệt thành cơng loại hạt Hơn hình dạng hạt giống, đặc biệt hạt hướng dương có khác biệt hình dạng đáng kể, việc lựa chọn thuộc tính trình bày phần 20.2.3 Hình 20.8 minh họa phân loại theo vng hạt giống từ hình 20.2 hạt đậu hướng dương sử dụng vùng đặc tính khác Diện tích Độ lệch tâm Số Tổng … … 122 Hạt tiêu 100-300 0.0-0.22 21 Đậu lăng 320-700 0.0-0.18 67 0.25-0.65 15 Hạt dướng 530-850 dương 19 Từ chối Bảng 20.1: Tham số kết ví dụ phân loại với hạt hình 20.2 tương ứng với khơng gian đặc tính hình 20.8 Hình 20.8 minh họa phân loại theo ô vuông sử dụng diện tích độ lệch tâm Hình chữ nhật đánh dấu cho khác loại Điều kiện cho vng tóm tắt bảng 20.1 kết phân loại cuối hình 20.9 trình bày ảnh Trong hình ảnh có đối tượng thuộc tổng số phụ từ bảng 20.1 mặt đánh dấu Từ tổng 122 đối tượng, 103 đối tượng công nhận Qua đối tượng bị loại trừ chúng khơng thuộc loại lý sau đây: Hai nhiều đối tượng nằm gần xác định diện tích độ lệch tâm cao Hình 20.9 : đánh dấu loại đối tượng từ hình 20.2 trình bày loại hạt tiêu a, b hạt đậu lăng, c hạt hướng dương d đối tượng loại trừ Đối tượng bên rài ảnh qua phần nhìn thấy.điều dẫn đến đối tượng có diện tích nhỏ độ lệch tâm cao Ba hạt hướng dương bị loại chúng diện tích lớn tăng diện tích loại hạt hướng dương hạt đậu lăng coi hạt hướng dương Qua điều cho thấy lỗi phân loại loại bỏ loại bỏ tiếp xúc đối tượng với kỹ thuật phân tách cao Hình 20.10: minh họa khoảng cách nhỏ cho việc phân loại hạt từ hình 20.2 hạt tiêu , đâu lăng, hướng dương sử dụng thuộc tính diện tích độ lệch tâm Vector thuộc tính thuộc nhóm mà có khoảng cách tối thiểu với tâm nhóm 20.3.3 Phân loại theo khoảng cách tối thiểu Phân loại theo khoảng cách tối thiểu cách đơn giản khác để mơ hình cluster Mỗi cluster biểu diễn tâm chúng mq Cơ mơ hình chia đơn giản khơng gian thuộc tính cách tìm kiếm khoảng cách nhỏ từ vector thuộc tính tới cluster khác Để thực điều này, tính tốn đơn giản khoảng cách vector m tới trung tâm nhóm khác mq: Thuộc tính gán cho loại mà khoảng cách tính ngắn Về mặt hình học, cách phân chia khơng gian thuộc tính minh họa hình 20.10 Ranh giới mặt phẳng trực giao từ vector kết nối với trung tâm nhóm điểm khoảng cách chúng Phân loại theo khoảng cách tối thiểu tốt phân loại theo khung vng số lượng tính tốn tỉ lệ thuận với kích thước khơng gian thuộc tính số nhóm Nó kỹ thuật linh hoạt thay đổi theo cách khác Kích cỡ nhóm thêm vào phương trình (20.5), cách thuộc tính gần với nhóm mà kết nối với Thứ xác định khoảng cách lớn giữ nhóm Nếu khoảng cách thuộc tính khoảng cách lớn với tất nhóm cụm đối tượng bị loại bỏ khơng thuộc loại định nghĩa 20.3.4 Phân loại theo độ hợp lệ lớn Mơ hình phân loại theo mức độ hợp lệ cho nhóm cụm thống kê hàm mật độ Trong trường hợp đơn giản thuộc tính chiều phân bố P thực Với mơ hình này, tính tốn cho thuộc tính vector xác suất thuộc nhóm P kết hợp vector thuộc tính với lớp mà có tối đa tính hợp lệ khía cạnh kỹ thuật sác xuất khả thi Nó khơng u cầu mà định đặt đối tượng vào loại biết Chúng đơn giản cung cấp xác suất đối tượng nhóm khác 20.4 Bài tập 20.1 Phương pháp phân loại Chứng minh tính tương hỗ phương pháp phân loại 20.2 Loại thuộc tính Dưới vài nhiệm vụ phân loại So sánh chúng trả lời câu hỏi sau: Làm để phân loại loại khác nhau? Các loại có khả tách rời chúng chồng chéo ? Có phân cấp loại theo cấu trúc? Các thuộc tính để phân biệt nhóm khác ? phân loại theo nhiệm vụ: A Hình ảnh lấy từ bong bóng, ngập nước cách tạo sóng Mục đích đo phân bố kích thước bong bóng B Nhiệm vụ phân biệt tế bào khôi u với tế bào khoe mạch từ ảnh thu từ kính hiển vi C Phân biệt đối tượng điểm nhỏ sao, thiên hà, tiểu hành tinh cách sử dụng ảnh chụp từ kính thiên văn Các hình ảnh thực 10 đến 12 kênh quang phổ dải hồng ngoại nhìn thấy D Nhận dạng ký tự (OCR): hệ thống tự động đọc số từ đến 9, dấu thập phân, dấu cộng dấu trừ E Nhiệm vụ tạo dẫn hướng sử dụng đồ phân biệt khu vực nhà, đường, rừng, … Vấn đề 20.3 : yêu cầu lưu trữ tính tốn So sánh u cầu lưu trữ tính tốn cho nhiệm vụ phân loại giả sử bạn có thuộc tính có độ phân giải bít Bốn loại bạn biết kỹ thuật phân loại là: 1) 2) 3) 4) Phương pháp tra cứu Phương pháp khung ô vuông Phương pháp khoảng cách tối thiểu Phương pháp độ hợp lệ lớn ... phân bố kích cỡ phần tử (hạt đậu): a- Ảnh gốc,b- ảnh nhị phân, c- Phân bố vùng Một khó khăn chung phân loại liên quan đến thực tế quan hệ tham số quan tâm liệu ảnh không hiển nhiên, rõ ràng Các đối... hủy rừng từ hình ảnh vệ tinh khơng gian Trong ví dụ này, mối quan hệ lớp khác đặc điểm hủy hoại ảnh rõ ràng Các nghiên cứu chi tiết cần thiết để khám phá mối quan hệ phức tạp Các ảnh không gian... tính của đối tượng theo dõi ảnh Một ví dụ hình 20.3 Chúng ta khơng có vấn đề việc nhận đối tượng đèn Làm hệ thống máy móc hình ảnh thực nhiệm vụ Các đặc tính rút từ ảnh giúp nhận đèn Trong khơng