Một số ứng dụng thực tế của bài toán phân chia vùng ảnh là: Truy xuấthình ảnh dựa trên nội dung; Hình ảnh y khoa: xác định vị trí khối u và bệnh lýkhác, đo khối lượng mô chẩn đoán, nghiê
Trang 1CHƯƠNG I TỔNG QUAN VỀ PHÂN CHIA VÙNG ẢNH 3
1.1 Tổng quan về phân chia vùng ảnh 3
1.2 Các hướng tiếp cận phân chia vùng ảnh 4
1.2.1 Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng .4 1.2.2 Các kỹ thuật dựa trên không gian ảnh 5
1.2.3 Các kỹ thuật dựa trên các mô hình vật lý 5
CHƯƠNG II MỘT SỐ PHƯƠNG PHÁP PHÂN CHIA VÙNG ẢNH CƠ BẢN……… …….7
2.1 Các phương pháp phân chia vùng ảnh tiêu biểu 7
2.1.1 Phân vùng dựa vào ngưỡng biên độ 7
2.1.2 Phân vùng dựa trên cơ sở vùng 8
2.1.3 Phân vùng theo miền đồng nhất 12
2.1.4 Phân vùng theo đồ thị 18
2.2 Phân vùng dựa trên thuật toán phân cụm 24
2.2.1 Thuật toán phân cụm K-means 24
2.2.2 Thuật toán phân cụm Fuzzy C-means 25
2.2.3 Thuật toán DBSCAN 26
2.2.4 Đánh giá các thuật toán phân cụm 32
CHƯƠNG III ỨNG DỤNG CHO BÀI TOÁN PHÂN CHIA VÙNG ẢNH Y KHOA 33
3.1 Giới thiệu bài toán 33
Trang 23.2.2 Tìm hiểu chung về chuẩn DICOM 35
3.2.3 Kiến thức cơ bản về chẩn đoán ảnh y học 36
3.3 Các bước cài đặt thử nghiệm chương trình 40
3.4 Các chức năng của chương trình 42
3.5 Kết quả thử nghiệm 43
TÀI LIỆU THAM KHẢO 46
PHỤ LỤC 48
A Cấu trúc file DICOM 48
B Một số loại chấn thương cơ bản 51
Trang 31 DICOM Digital Imaging and Communicationsin Medicine Số hóa và truyền ảnh y tế
2 DBSCAN Density Based Spatial Clustering of Applications with Noise
Phân cụm dữ liệu
và xác định nhiễu dựa trên mật độ
3 CT Computed Tomography Scanner Chụp cắt lớp điện toán
Trang 4Khoá học: 2012 - 2014
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên
Giáo viên hướng dẫn: TS Vũ Việt Vũ
Tôi xin cam đoan luận văn “Nghiên cứu phương pháp phân chia vùng ảnh
và ứng dụng” này là công trình nghiên cứu của riêng tôi Các số liệu sử dụng
trong luận văn là trung thực Các kết quả nghiên cứu được trình bày trongluận văn chưa từng được công bố tại bất kỳ công trình nào khác
Thái Nguyên, ngày 10 tháng 06 năm 2014
HỌC VIÊN
Nguyễn Thị Bích Điệp
Trang 5học Kỹ thuật Công nghiệp – Đại học Thái Nguyên, người đã tận tình hướngdẫn giúp học viên hoàn thành luận văn tốt nghiệp.
Học viên cũng xin gửi lời cảm ơn sâu sắc đến các thầy cô giáo củaTrường Đại học Công nghệ Thông tin và Truyền thông - Đại học TháiNguyên, cùng các thầy cô giáo của Viện Công nghệ thông tin - Viện khoa họcViệt Nam đã nhiệt tình giảng dạy, truyền đạt kiến thức cho học viên trongsuốt 2 năm học
Học viên xin cảm ơn sự giúp đỡ của lãnh đạo khoa Chẩn đoán hình ảnh,bệnh viên Đa khoa Trung ương Thái Nguyên đã hỗ trợ và cung cấp hình ảnhcho luận văn của học viên Cảm ơn bác sĩ Lê Thị Lan – bệnh viên Đa khoaTrung ương Thái Nguyên đã giúp đỡ, bổ trợ cho học viên những kiến thứccăn bản về chẩn đoán hình ảnh y khoa để học viên có thể hoàn thành đượcluận văn của mình
Nguyễn Thị Bích Điệp
Trang 6MỞ ĐẦU
Xử lý ảnh là một lĩnh vực khoa học công nghệ khá mới so với nhiều ngànhkhoa học khác Tuy vậy, tốc độ phát triển của nó rất nhanh với nhiều ứngdụng thiết thực trong các ngành: vật lý, hóa học, sinh học, y học…
Phân chia vùng ảnh là một bài toán cơ bản trong toàn bộ quá trình xử lýảnh Quá trình này thực hiện việc phân ảnh thành các vùng rời rạc và đồngnhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó.Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từngphần của các đối tượng thật sự bên trong ảnh
Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máytính, phân chia vùng ảnh luôn đóng một vai trò cơ bản và thường là bước tiền
xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ởmức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trênđối tượng, hay truy vấn ảnh dựa vào nội dung
Một số ứng dụng thực tế của bài toán phân chia vùng ảnh là: Truy xuấthình ảnh dựa trên nội dung; Hình ảnh y khoa: xác định vị trí khối u và bệnh lýkhác, đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu; Pháthiện và nhận dạng: Nhận dạng vân tay, nhận dạng khuôn mặt…
Hiện nay, có nhiều công trình nghiên cứu khoa học về phân tích ảnh y học.Các ứng dụng hiện nay đều hướng đến mục tiêu hỗ trợ các bác sĩ trong việcchẩn đoán bệnh lý, tổn thương dựa trên định tính
Ảnh y học là kỹ thuật và quá trình được sử dụng để tái tạo ra hình ảnh cơthể con người hoặc bộ phận cơ thể Ảnh y học thường chụp các bộ phận bêntrong cơ thể người bằng các thiết bị chuyên dụng như máy X-Quang chụphộp sọ, máy chụp cắt lớp vi tính, máy chụp cộng hưởng từ, máy chụp mạch
Trang 7não nên ảnh thường không rõ, không sắc nét, gây khó khăn cho các chuyêngia y học trong việc chẩn đoán bệnh Mặc dù các thiết bị y tế với công nghệngày càng nâng cao để hỗ trợ cho các chuyên gia y tế phân tích và xử lýthông tin từ ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việcnâng cao chất lượng ảnh - đây là một khâu quan trọng được coi là bước tiền
xử lý cho bước tiếp theo là phân chia vùng ảnh y học Nếu phân chia vùngảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi vậyngười ta xem công đoạn phân chia vùng ảnh là quá trình then chốt trong quátrình xử lý ảnh nói chung
Nội dung chính của luận văn tập trung tìm hiểu về một số phương phápphân chia vùng ảnh và ứng dụng vào việc phân tách các vùng trong ảnh chụp
CT não người Luận văn được chia thành 3 nội dung chính:
Chương 1: Tổng quan về phân chia vùng ảnh
Chương 2: Tìm hiểu một số phương pháp phân chia vùng ảnh tiêu biểu và tập trung tìm hiểu phương pháp phân chia vùng ảnh dựa trên các thuật toán phân cụm
Chương 3: Ứng dụng cho bài toán phân chia vùng ảnh y khoa
Khi viết báo cáo này học viên đã cố gắng để đạt được những mục tiêu vàđịnh hướng nghiên cứu đề ra ban đầu, song điều kiện thời gian và năng lực cònhạn chế nên không tránh khỏi thiếu sót Học viên mong nhận được sự góp ýcủa thầy giáo hướng dẫn, thầy cô giáo để học viên có được những kinh nghiệmthực tế và bổ ích để sau này có thể xây dựng được một chương trình hoàn thiệnhơn
Trang 8CHƯƠNG I
TỔNG QUAN VỀ PHÂN CHIA VÙNG ẢNH
Chương này tìm hiểu những vấn đề tổng quan của phân chia vùng ảnh Để có được những kiến thức ban đầu về phân chia vùng ảnh, qua quá trình đọc tài liệu, học viên đã tìm hiểu những khái niệm cơ bản về phân chia vùng ảnh, nền tảng các giải thuật phân chia vùng ảnh và các hướng tiếp cận phân chia vùng ảnh.
I.1 Tổng quan về phân chia vùng ảnh
Phân chia vùng ảnh [1] là một thao tác ở mức thấp trong toàn bộ quátrình xử lý ảnh Quá trình này thực hiện việc phân chia vùng ảnh thành cácvùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên củacác vùng ảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứngvới tòan bộ hay từng phần của các đối tượng thật sự bên trong ảnh Vì thế,trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh (image processing), thịgiác máy tính, phân chia vùng ảnh luôn đóng một vai trò cơ bản và thường
là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thaotác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nénảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thờigian đầu, các phương pháp phân chia vùng ảnh được đưa ra chủ yếu làm việctrên các ảnh mức xám do các hạn chế về phương tiện thu thập và lưu trữ
Ngày nay, cùng với sự phát triển về các phương tiện thu nhận và biểudiễn ảnh, các ảnh màu đã hầu như thay thế hoàn toàn các ảnh mức xám trongviệc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn so với ảnhmức xám Do đó, các kỹ thuật, thuật giải mới thực hiện việc phân chia vùngảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhu cầu
Trang 9mới Các thuật giải, kỹ thuật này thường được phát triển dựa trên nền tảng các
thuật giải phân chia vùng ảnh mức xám đã có sẵn.
I.2 Các hướng tiếp cận phân chia vùng ảnh
Phân chia vùng ảnh [1] là chia ảnh thành các vùng không trùng lặp.Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào
đó Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân vùng Ví dụ nhưđồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer… Sau khi phânvùng mỗi pixel chỉ thuộc về một vùng duy nhất Để đánh giá chất lượng củaquá trình phân vùng là rất khó Vì vậy trước khi phân chia vùng ảnh cần xácđịnh rõ mục tiêu của quá trình phân vùng là gì Xét một cách tổng quát, ta cóthể chia các hướng tiếp cận phân chia vùng ảnh thành ba nhóm chính như sau:
Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng
Các kỹ thuật dựa trên không gian ảnh
Các kỹ thuật dựa trên các mô hình vật lý
I.2.1 Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng
Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh làmột thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gianmàu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trong
ảnh như là một cụm (cluster) các điểm trong không gian màu đó Mức độ
phân tán của các điểm trong trong một cụm được xác định chủ yếu bởi sựkhác biệt về màu sắc Một cách khác, thay vì ánh xạ các pixel trong ảnh vào
một không gian màu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu dạng ad-hoc cho ảnh đó (ví dụ như Hue), và thông thường, các đối
tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh trong histogram đó Do đó,việc phân vùng các đối tượng trong ảnh tương ứng với việc xác định các cụm– đối với cách biểu diễn thứ nhất; hoặc xác định các vùng cực trị của
Trang 10histogram – đối với cách biểu diễn thứ hai Các phương pháp tiếp cận này chỉlàm việc trên một không gian màu.
I.2.2 Các kỹ thuật dựa trên không gian ảnh.
Kỹ thuật được đề cập trong phần trên hoạt động dựa trên các khônggian đặc trưng của ảnh (thông thường là màu sắc) Do đó, các vùng ảnh kếtquả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian.Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự côđọng (compactness) về nội dung xét theo ý nghĩa không gian ảnh (ý nghĩa cácvùng theo sự cảm nhận của hệ thần kinh con người) Mà đặc tính này là quantrọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh Do các phươngpháp gom cụm cũng như xác định ngưỡng histogram đã nêu đều bỏ qua thôngtin về vị trí của các pixel trong ảnh
Trong các báo cáo khoa học về phân chia vùng ảnh mức xám, có khánhiều kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tínhđồng nhất trong không gian đặc trưng của ảnh và tính cô đọng về nội dungảnh Tuỳ theo các kỹ thuật mà các thuật giải này áp dụng, chúng được phânthành các nhóm sau:
Các thuật giải áp dụng kỹ thuật chia và trộn vùng
Các thuật giải áp dụng kỹ thuật tăng trưởng vùng
Các thuật giải áp dụng lý thuyết đồ thị
Các giải thuật áp dụng mạng neural
Các giải thuật dựa trên cạnh
I.2.3 Các kỹ thuật dựa trên các mô hình vật lý
Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đóđều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếu
Trang 11như các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sánghoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thayđổi nhiều hoặc ít một cách đột ngột Và kết quả là các thuật giải này tạo ra cáckết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượngtrong ảnh bằng mắt thường Để giải quyết vấn đề này, các giải thuật phân chiavùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng vớiánh sáng đã được đề xuất Các công cụ toán học mà các phương pháp này sửdụng thì không khác mấy so với các phương pháp ở trên, điểm khác biệtchính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tính phảnchiếu ánh sáng trên bề mặt màu sắc của các đối tượng.
Trang 12CHƯƠNG II
MỘT SỐ PHƯƠNG PHÁP PHÂN CHIA VÙNG ẢNH CƠ BẢN
Ở chương 1 học viên đã tìm hiểu sơ lược về các hướng tiếp cận phân chia vùng ảnh Có rất nhiều kỹ thuật phân chia vùng ảnh được sử dụng tùy vào tính chất của bài toán Trong quá trình tìm hiểu và đọc tài liệu tham khảo, học viên nhận thấy rất nhiều công trình nghiên cứu hay các luận văn
đã đi sâu tìm hiểu một số kỹ thuật phân vùng tiêu biểu như: Phân vùng dựa vào ngưỡng biên độ, phân vùng dựa trên cơ sở vùng, phân vùng theo miền đồng nhất, phân vùng theo đồ thị Vì vậy trong luận văn của mình, học viên đi sâu vào nghiên cứu phương pháp phân chia vùng ảnh dựa trên các thuật toán phân cụm vì một số ưu điểm của nó sẽ được trình bày dưới đây.
II.1.1.Phân vùng dựa vào ngưỡng biên độ
Biên độ của các tính chất vật lý của ảnh (như là độ phản xạ, độtruyền sáng, màu sắc …) là một đặc tính đơn giản và rất hữu ích Nếu biên
độ đủ lớn đặc trưng cho ảnh thì chúng ta có thể dùng ngưỡng biên độ đểphân chia vùng ảnh Thí dụ, biên độ trong bộ cảm biến hồng ngoại có thểphản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Đặc biệt, kỹthuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như vănbản in, đồ họa, ảnh màu hay ảnh X-quang
Việc chọn ngưỡng trong kỹ thuật này là một bước vô cùng quan trọng,thông thường người ta tiến hành theo các bước chung như sau:
- Xem xét lược đồ xám của ảnh để xác định đỉnh và khe Nếu ảnh cónhiều đỉnh và khe thì các khe có thể sử dụng để chọn ngưỡng
Trang 13- Chọn ngưỡng T sao cho một phần xác định trước η của toàn bộ sốmẫu
- Điều chỉnh ngưỡng dựa trên xét lược đồ xám của các điểm lân cận
- Chọn ngưỡng bằng cách xem xét lược đồ xám của những điểm thoảtiêu chuẩn đã chọn
Một thuật toán đơn giản trong kỹ thuật này là: giả sử rằng chúng ta đang quan tâm đến các đối tượng sáng (object) trên nền tối (background), mộttham số T gọi là ngưỡng độ sáng, sẽ được chọn cho một ảnh f[x,y] theo cách:
If f[x,y] ≥ T f[x,y] = object = 1 Else f[x,y] = Background = 0
Ngược lại, đối với các đối tượng tối trên nền sáng ta có thuật toán sau:
If f[x,y] < T f[x,y] = object = 1 Else f[x,y] = Background = 0
Ta cần chọn ngưỡng T để việc phân vùng đạt được kết quả cao nhất Córất nhiều thuật toán chọn ngưỡng: ngưỡng cố định, dựa trên lược đồ, sử dụngEntropy, sử dụng tập mờ, chọn ngưỡng thông qua sự không ổn định của lớp
Trang 14phải thỏa mãn một vài thuộc tính đã được xác định trước; ví dụ P(Ri )=TRUE nếu tất cả pixel trong Ri có mức xám giống nhau Cuối cùng điều kiện (e) nghĩa
là chân trị của P theo các vùng Ri và Rj khác nhau nếu j khác i
Trang 15Kết quả xử lý của những cụm điểm những pixel sẽ được xem là “hạt” (seeds)nếu thuộc tính của chúng gần với tâm thuộc tính của cụm pixel đó
Việc chọn tiêu chuẩn phụ thuộc vào từng loại ảnh Ví dụ phân tích ảnhchụp vệ tinh trái đất phụ thuộc vào màu sắc Với ảnh trắng đen, phân tích vùngphải giải thích được một tập mô tả dựa trên giá trị mức xám và đặc trưng khônggian Việc mô tả các thuộc tính một cách rời rạc có thể đưa ra nhữngkết quả sai lạc khi thông tin liên thông hoặc lân cận không được dùng trongquá trình phát triển vùng Ví dụ, hiển thị một khoảng bất kỳ những pixel với
ba giá trị mức xám tách biệt Những pixel phát triển thì có giá trị mức xámgiống nhau để có dạng một “vùng” mà không chú ý đến vấn đề liên thông sẽđưa ra một kết quả phân vùng vô nghĩa
Một vấn đề khác trong phát triển vùng là dạng của điều kiện dừng Cơbản phát triển vùng sẽ dừng khi không có pixel nào thỏa mãn tiêu chuẩn đểnằm trong vùng đó Tiêu chuẩn chẳng hạn như mức xám, cấu trúc, màu lànhững bản chất cục bộ, không xét đến lịch sử của quá trình phát triển vùng.Thêm tiêu chuẩn sẽ làm tăng thêm sức mạnh của định luật phát triển vùngdùng khái niệm của kích thước, sự giống nhau của một pixel ứng cử và nhữngpixel đã được phát triển, và hình của những vùng đã được phát triển Sử dụngnhững loại tiêu chuẩn đã được miêu tả, dựa trên giả thuyết kiểu của kết quảđược mong đợi có giá trị từng phần bé nhất
Chia và chọn vùng
Đặt R biểu diễn toàn bộ vùng ảnh và chọn tính chất P cho trước Mộtphương pháp phân vùng R là chia nó ra thành những vùng nhỏ hơn và nhữngvùng tứ phân nhỏ hơn, đối với bất kì vùng Ri nào, P(Ri)=TRUE Bắt đầu vớitoàn bộ vùng Nếu P(Ri)=FALSE thì ta chia ảnh thành 4 phần Nếu P làFALSE cho bất kì vùng tứ phân nào, chúng ta chia vùng tứ phân đó thành 4
Trang 16phần nhỏ hơn, và cứ tiếp tục như thế Kỹ thuật phân chia đặc biệt này có sựthuận lợi trong biểu diễn được gọi là cây tứ phân (Quadtree) Chú ý rằng gốccủa cây tứ phân tương ứng với toàn bộ ảnh và mỗi node tương ứng với phầnchia nhỏ hơn Trong trường hợp này, chỉ R4 được chia nhỏ hơn nữa
Nếu chỉ phân chia thì phần cuối cùng sẽ chứa những vùng gần nhau
có cùng thuộc tính Trở ngại này có thể được khắc phục bằng cách hợp lại.Những vùng gần nhau mà có những pixel tổng hợp thỏa tính chất P nghĩa là 2vùng lân cận Ri và Rj được hợp lại nếu P(Ri U Rk)=TRUE
a Hình được chia cắt b Cây quan hệ tương ứng
Hình 2.1
Tóm lại ta có thủ tục sau:
- Chia thành 4 vùng bằng nhau bất kì vùng nào có P(Rj)= FALSE
- Hợp những vùng kề nhau Ri và Rj với P(Ri U Rj)=TRUE
- Dừng nếu không thể phân chia hoặc không thể hợp được nữa
Ta định nghĩa P(Ri) = TRUE nếu có ít nhất 80% các pixel trong Rj cóthuộc tính |zj-mi|≤2σi với zj là mức xám của pixel thứ j trong vùng Ri, mi làmức xám của vùng đó, và σi là độ lệch chuẩn của mức xám trong Ri NếuP(Ri)=TRUE trong điều kiện này, giá trị của tất cả các pixel được đặt bằngvới mi Phân chia và hợp được thực hiện sử dụng thuật toán trên
Trang 17a.Hình ban đầu b.Kết quả sau khi tách và trộn
c Kết quả sau khi phân ngưỡng Hình 2.2 Minh họa phân ngưỡng
Kết quả của việc áp dụng kĩ thuật này vào ảnh trong hình 2.2a đượchiển thị trong hình 2.2b Chú ý rằng ảnh đã được phân vùng hoàn toàn Ảnhhiển thị trong hình 2.2c nhận được bởi phân ngưỡng hình 2.2a, với mộtngưỡng đặt tại điểm chính giữa của 2 đỉnh chính của Histogram
II.1.3.Phân vùng theo miền đồng nhất
Giới thiệu
Kỹ thuật phân chia vùng ảnh thành các miền đồng nhất dựa vào cácthuộc tính quan trọng nào đó của miền Mỗi một thuộc tính khi sử dụng thì cómột tiêu chuẩn phân vùng tương ứng Một số thuộc tính tiêu biểu như: mứcxám, màu sắc ( đối với ảnh màu), kết cấu sợi v.v…
Giả sử ảnh X phải được phân thành N vùng khác nhau R1, R2, … RN vànguyên tắc phân vùng là một vị từ của công thức P(R)
Trang 18Việc phân chia vùng ảnh chia tập X thành các tập con Ri , i = 1 Nphải thỏa mãn:
Các vùng Ri, i=1 N phải lấp kín hoàn toàn ảnh:
P(R): f(k,l) < T Trong trường hợp các ảnh màu, vectơ đặc trưng X có thể là ba thành phần ảnh RGB [fR(k,l), fG(k,l), fB(k,l)]T Lúc đó luật phân ngưỡng có dạng:
P(R,x,t): ((fR(k,l)<TR)&& (fG(k,l)<TR)&&(fB(k,l)<TR))
Trang 19 Phương pháp tách cây tứ phân
Phương pháp tách cây tứ phân dựa trên nguyên tắc kiểm tra tính hợpthức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn Nếu tiêu chuẩnđược thoả việc phân vùng coi như kết thúc Trong trường hợp ngược lại, chiamiền đang xét thành 4 miền nhỏ hơn, áp dụng đệ quy bằng phương pháp trêncho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thoả mãn tiêu chuẩnđồng nhất
Thuật toán được mô tả như sau:
Procedure PhanDoan(Mien) Begin
If (miền đang xét không thoả) Then Begin
Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4 For i=1 to 4 Do PhanDoan(Zi)
End Else Exit End;
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọimức, trừ mức ngoài cùng Vì thế cây này có tên là cây tứ phân Gốc của cây làảnh ban đầu, một vùng thoả tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạonên một nút nhánh
Giả sử chọn tiêu chuẩn phân vùng là màu sắc và quy ước mọi điểm củavùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút láđen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia
Trang 20a Ảnh gốc b Phân mức 1
c Phân mức 2 d Phân mức 3
Hình 2.3 Minh họa kỹ thuật tách cây tứ phân
Hình 2.3 - minh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chiathành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với các phầnnhỏ, ta được phân mức 2, 3
Phương pháp phân vùng hợp
Phương pháp phân vùng bởi hợp thao tác ngược lại với phương pháptách cây tứ phân, nghĩa là xuất phát từ các miền nhỏ nhất - các điểm ảnh rồihợp chúng lại nếu thoả mãn tiêu chuẩn đề ra để được miền đồng nhất lớn hơn
Trang 21Tiếp tục với các miền thu được cho đến khi ta không thể hợp nhất chúng vớinhau nữa, lúc này số miền còn lại chính là các phân vùng của ảnh
Việc hợp nhất hai miền phải thoả mãn hai nguyên tắc sau:
Sau khi hợp nhất (k,l) vào vùng R thì ta phải cập nhật lại giá trị trungbình và độ lệch tiêu chuẩn: m i= n+11 (I (k , l)+n∗m i) (2.3)
Trang 22Nếu có nhiều hơn một vùng lân cận thỏa mãn thì hợp điểm (k,l) vớivùng Ri sao cho sự khác biệt |(k,l)-mi| nhỏ nhất
Cũng trong phương pháp pháp phân vùng bởi hợp, có một cách tiếpcận khác với kỹ thuật trên, đó là phương pháp phân vùng dựa vào đồ thị Phânvùng dựa trên đồ thị tìm cách hợp nhất hai miền Ri và Rj theo tính chất sosánh giữa hai cặp miền
Phương pháp tách hợp (Split- Merge)
Hai phương pháp vừa xét ở trên có một số nhược điểm Phương pháptách tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng Tuynhiên nó thực hiện việc chia quá chi tiết Phương pháp hợp cho phép giảm sốvùng liên thông xuống mức tối thiểu nhưng cấu trúc hàng ngang dàn trải,không cho ta thấy mối liên hệ giữa các vùng Chính vì nhược điểm này ta nghĩđến việc phối hợp cả 2 phương pháp Trước tiên dùng phương pháp tách để tạonên cấy tứ phân, phân vùngtheo hướng từ gốc lên lá Tiếp theo tiến hành duyệtcây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương phápnày ta thu được miêu tả cấu trúc của ảnh với các miền liên thông có kích thướctối đa
Giải thuật trên gồm một số bước sau:
B1: Kiểm tra tiêu chuẩn đồng nhất
Nếu không thỏa và số điểm trong vùng lớn hơn một điểm, tách làm 4vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy Nếu kết quả táchxong và không tách được nữa thì chuyển sang B2
Nếu tiêu chuẩn đồng nhất là thỏa thì tiến hành hợp vùng và cập nhậtgiá trị trung bình cho vùng
B2: Hợp vùng: Cần kiểm tra 4 lân cận đã nêu trên Có thể có nhiềuvùng thỏa mãn khi đó ta chọn vùng tối ưu rồi tiến hành hợp
Trang 23Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháptách và ảnh được làm trơn.
II.1.4.Phân vùng theo đồ thị
Phân chia vùng ảnh dựa vào đồ thị là một phương pháp tiếp cận kháhiện đại dựa trên thuộc tính non-local của ảnh đầu vào Phương pháp này pháthiện ra biên giữa hai vùng của ảnh bằng cách so sánh sự khác nhau giữa nộivùng (intercomponent) với sự khác nhau với các vùng khác Thuật toán phânvùng dựa vào đồ thị tuân theo chiến lược tham lam, có thời gian chạy gần nhưtuyến tính, nhưng vẫn đảm bảo được việc phân vùng chính xác và hiệu quả
Giới thiệu
Các phương pháp phân chia vùng ảnh cổ điển đều có chung một nhượcđiểm là chạy rất chậm trong các ứng dụng xử lý ảnh và hầu như không nắmbắt được các thuộc tính non-local quan trọng của ảnh Vì vậy, hầu hết cácnghiên cứu của những năm gần đây đều có xu hướng tìm kiếm một kỹ thuậtphân vùng có khả năng xử lý trong cơ sở dữ liệu ảnh lớn một cách nhanhchóng, chính xác và hiệu quả Kỹ thuật phân vùng dựa vào đồ thị được mô tả
ở đây không những vừa nắm bắt được các đặc tính non-local mà độ phức tạp
tính toán chỉ là O(nlogn) đối với bức ảnh có n điểm ảnh (pixel)
Giống như các phương pháp phân cụm cổ điển, phương pháp này cũngdựa trên việc chọn các cạnh từ một đồ thị Đồ thị này được xây dựng bằngcách coi mỗi điểm ảnh là một đỉnh, hai điểm ảnh kề nhau thì được nối bởi mộtcạnh vô hướng, trọng số trên một cạnh thể hiện sự khác nhau giữa hai điểmảnh Tuy nhiên, phương pháp này thực hiện việc điều chỉnh sự phân vùng dựavào mức độ thay đổi giữa các miền lân cận của ảnh
Ví dụ: Ảnh phía trên bên trái của hình: hầu hết đều thấy rằng bức ảnhnày có ba miền phân biệt: một hình chữ nhật ở nữa bên trái, một hình chữ
Trang 24nhật đặc ở giữa nửa bên phải và phần bao quanh hình chữ nhật đặc này Đó làthuộc tính quan trọng của sự tri giác (perceptually) và các đặc trưng này cũng
sẽ được nắm bắt bởi thụật toán phân vùng
Hình 2.4 Nhận dạng các vùng ảnh
Phương pháp phân vùng dựa vào đồ thị sẽ tìm dấu hiệu đường biêngiữa hai vùng bằng cách so sánh hai đại lượng: một là dựa vào cường độ khácnhau dọc theo đường biên và hai là dựa vào cường độ khác nhau giữa cácđiểm ảnh với mỗi vùng
Phương pháp
Cho G = (V,E) là một đồ thị vô hướng với các đỉnh vi ∈V, là tập hợpcác phần tử cần được phân vùng và các cạnh (vi ,vj) ∈ E, tương ứng với cáccặp đỉnh lân cận nhau Mỗi cạnh (vi ,vj) ∈ E có một trọng số tương ứng, trọng
số là một số không âm đo sự khác nhau giữa hai phần tử lân cận vi và vj, kýhiệu w(vi, vj) Ở đây trọng số của cách cạnh đo sự khác nhau giữa hai điểmnối bởi cạnh đó (có nhiều mức độ khác nhau: màu sắc, vị trí, sự vận độnghoặc các thuộc tính khác)
Trang 25Như vậy phân vùng một bức ảnh là việc phân chia V thành các thànhphần, mà mỗi thành phần (hoặc miền) C ∈ V tương đương với một thànhphần liên thông trong đồ thị G‟ = <V,E‟>, E‟ E
Trước hết, ta định nghĩa độ khác nội vùng (internal difference) và độkhác giữa hai vùng (difference between two components)
Độ khác nội vùng (internal difference) của một thành phần C V làtrọng số lớn nhất trong cây tỏa nhánh tối thiểu của thành phần đó, kí hiệuInt(C) Khi đó:
Độ khác giữa hai vùng (difference between two components) C1, C2
V, là trọng số nhỏ nhất giữa hai vùng, kí hiệu là Dif(C1,C2) Khi đó:
Dif(C1,C2) = min w(Vi,Vj) (2.6)
Vi∈C1,Vj∈C2,(Vi,Vj)∈E Nếu không có cạnh nối nào giữa C1 và C2 thì đặt Dif(C1,C2) = ∞ Độ đo
sự khác nhau này là về nguyên lý thì vẫn có vẻ mơ hồ, vì nó chỉ phản ánhđược cạnh có trọng số nhỏ nhất nối giữa hai thành phần
Trang 26Một khái niệm có liên quan trong định nghĩa về tính chất D là giá trịkhác nội vùng nhỏ nhất, kí hiệu MInt Giá trị Mint được định nghĩa như sau:MInt (C1, C2) = min( Int (C1 ) + τ (C1 ), Int (C1 ) + τ (C 2 )) (2.7)
Hàm ngưỡng τ điều khiển mức độ khác nhau giữa hai thành phần, saocho giá trị này phải lớn hơn các giá trị khác nội vùng của các thành phần để
nhằm mục đích nhận ra đường biên giữa chúng Đối với các thành phần nhỏ
Int(C) là không đủ tốt để ước lượng các đặc tính của dữ liệu Trong một sốtrường hợp khi |C| = 1 thì Int(C) = 0 với |C| là kích thước của thành phần C.Khi đó chúng ta sử dụng một hàm ngưỡng dựa trên kích thước của thành phần:
Định nghĩa 1
Một phân vùng được xem là quá mịn nếu tồn tại một số cặp miền C1,C2
∈ S mà giữa hai miền này không có dấu hiệu của đường biên
Để định nghĩa được những khái niệm bổ sung cho phân vùng quá thô,chúng ta đưa ra khái niệm tinh chỉnh (refinement) của một phân vùng
Trang 27Cho hai phân vùng S và T của cùng một tập cơ sở, ta nói rằng T là mộttinh chỉnh (refinement) của S khi mỗi thành phần của T được chứa trong(hoặc bằng) một số thành phần của S Và ta cũng nói rằng T là một tinh chỉnhđúng (proper refinement) của S khi T ≠ S
Chú ý rằng nếu T là tinh chỉnh đúng của S thì T có thể được chứa bởimột hoặc một số các miền trong S và S được gọi là thô hơn T
Định nghĩa 2
Một phân vùng được xem là quá thô khi tồn tại một tinh chỉnh đúngcủa S mà phân vùng đó vẫn chưa là quá mịn Vấn đề đặt ra là liệu có phảiluôn luôn tồn tại phân vùng không quá thô cũng không quá mịn hay không?
Và nếu tồn tại thì phân vùng đó có là duy nhất không?
Thực tế cho thấy là nói chung luôn có thể có nhiều hơn một phân vùngkhông quá thô cũng không quá mịn, do đó phân vùng này là không duy nhất
Trở lại với thuật toán phân vùng dựa trên đồ thị, thuật toán này gần vớithuật toán Kruskal xây dựng cây tỏa nhánh tối thiểu của một đồ thị Độ phức
tạp của thuật toán là O(m log m), trong đó m là số cạnh của đồ thị
Trang 28Bước 3: Lặp lại bước 4 với q = 1,…,m
Bước 4: Xây dựng Sq từ Sq-1 như sau: Cho vi và vj là hai đỉnh nối vớinhau bởi cạnh thứ q, tức là oq = (vi,vj) Nếu vi và vj nằm trong hai thànhphần tách rời nhau của Sq-1 và ω(oq) nhỏ hơn sự khác nhau nội vùng của cảhai thành phần thì trộn hai thành phần này với nhau, ngược lại không làm gì
cả Cụ thể hơn gọi Ciq-1 là thành phần của Sq-1 chứa vi và Cjq-1 là thành phầncủa Sq-1 chứa vj Nếu Ciq-1 ≠ Cjq-1 và ω(oq) ≤ Mint(Ciq-1,Cjq-1) thì Sq thu được từ
Sq-1 bằng cách trộn Ciq-1 với Cjq-1 Ngược lại Sq =Sq-1
Bước 5: Trả về kết quả S = Sm
Chứng minh được rằng phân vùng S được xây dựng trong thuật toántrên là tuân theo các thuộc tính toàn cục khi sử dụng tính chất so sánh cặpmiền đã định nghĩa trong phần trước Nghĩa là mặc dù thuật toán chỉ dựa vàocác quyết định tham lam nhưng phân vùng được xây dựng vẫn thỏa mãn cácthuộc tính toàn cục
Trang 29II.2 Phân vùng dựa trên thuật toán phân cụm
II.2.1.Thuật toán phân cụm K-means
K-Means là thuật toán rất quan trọng và được sử dụng phổ biến trong
kỹ thuật phân cụm Tư tưởng chính của thuật toán K-Means là tìm cách phânnhóm các đối tượng (objects) đã cho vào k cụm (k là số các cụm được xácđịnh trước, k nguyên dương) sao cho tổng bình phương khoảng cách giữa cácđối tượng đến tâm nhóm (centroid) là nhỏ nhất
Thuật toán K-Means thực hiện qua các bước chính sau:
1 Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụmđược đại diện bằng các tâm của cụm
2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thườngdùng khoảng cách Euclidean)
3 Nhóm các đối tượng vào nhóm gần nhất
4 Xác định lại tâm mới cho các nhóm
5 Thực hiện lại bước 2 cho đến khi không có sự thay đổi nhóm nàocủa các đối tượng
Nhóm các đối tượng vào nhóm gần nhất
Không có đối tượng nào thay đổi nhóm?
Đúng Sai
Trang 30II.2.2.Thuật toán phân cụm Fuzzy C-means
Thuật toán K-means phân hoạch tập dữ liệu thành các cụm là các tập rõ.Phân hoạch mờ xem các cụm là các tập mờ và 2 điểm dữ liệu sẽ cómức đội thuộc về một cụm với giá trị trong [0,1]
Thuật toán Fuzzy C-means cực tiểu hàm mục tiêu:
– μij là phần tử hàng i cột j của ma trận thành viên U, biểu diễn độthuộc của xj vào cụm j (có Cj là trọng tâm)
– m>1 là tham số mờ hóa (m điều chỉnh độ thuộc về của 1 điểmvào cụm tương ứng, thông thường chọn m=2)
Không gian dữ liệu gồm n điểm xi i=1,n Cần phân hoạch thành c cụm(2<= c <n) Thuật toán Fuzzy C-means gồm các bước:
1 Chon tham số mờ hóa m>1
2 Khởi tạo ma trận thành viên Unxc với 0<= μij<=1 sao cho