LÀM NỔI VÀ TÁCH ĐƯỜNG BIÊN ẢNH - Lọc trung bình kh- 123docz.net

a. Lọc trung bình không gian

I.5. LÀM NỔI VÀ TÁCH ĐƯỜNG BIÊN ẢNH

I.5.1. Làm nổi đường biên ảnh qua bộ lọc FIR

Vì đường biên ảnh chiếm ở dải tần số cao trong phổ của ảnh, nên ta có thể làm nổi hoặc tách đường biên ảnh qua bộ lọc thông cao. Dùng cho chức năng này, ta có thể dùng bộ lọc tương phản pha có điểm cắt tần số đủ cao để làm nổi đường biên ảnh và làm mờ các chi tiết khác của ảnh có tần số thấp.

Một phương pháp khác hay dùng để làm nổi đường biên ảnh là dùng bộ lọc Laplace, định nghĩa như sau:

(1.17)

ở đây f(x,y) là hàm cường độ của ảnh. Đặc tính tần số của Laplace được định nghĩa như sau:

2 2 2 1 2 1, ) (ω ω =ω +ω H (1.18)

Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đường biên, xem sơ đồ ví dụ hình 1.14. Chúng là sự đơn giản hoá sườn âm và sườn dương đường biên.

Hình 1.13. (a) Kết quả sử dụng bộ lọc PCF với ωc =1.7. (b) Kết quả sử dụng lọc PCF với ωc =2.0.

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải 33 y y x f x y x f y x f 2 2 2 2 2 ( , ) ( , ) ) , ( ∂ ∂ + ∂ ∂ = ∇

Hình 1.14. Đạo hàm bậc nhất và bậc hai của đường biên.

Rõ ràng là đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh. Thông thường, các điểm cắt zero của đạo hàm bậc hai là nơi có đường biên ảnh. Cần phải nhớ rằng đạo hàm của một hàm hai biến tại bất kỳ điểm nào cũng phụ thuộc vào hướng lấy đạo hàm.

Các bộ lọc FIR có thể dùng xấp xỉ một Laplace.

I.5.2. Tách đường biên ảnh qua cách tiếp cận khoảng cách I.5.2.1. Toán tử Robert I.5.2.1. Toán tử Robert

Nó bao gồm hai mặt nạ sau đây :

Chiều dài đường biên ảnh có thể rút ra bằng cách dùng bất kỳ phép xử lý không tuyến tính nào sau đây.

y i j( , )= y i j1( , )2 +y i j( , ) 2 2 (1.19) { } y i j( , ) =max y i j1( , ) , y i j2( , ) (1.20) { } y i j( , )= y i j1( , ) + y i j2( , ) (1.21) W1 0-110 W2 -1001 f(x) a x fx ∂ ∂ b x fx 2 2 ∂ ∂ c

Trong đó y1(i,j) và y2(i,j) là đáp ứng rút ra từ mẫu W1 và W2. Hai biểu thức cuối cùng được dùng thường xuyên nhất. Hướng của đường biên θ(i,j), tính

theo phương nằm ngang, có thể rút ra bởi:

) , ( ) , ( tan 4 ) , ( 1 2 1 j i y j i y j i =π − θ (1.22) Các phần tử trong mặt nạ gọi là các trọng số.

I.5.2.2. Toán tử Sobel

Phương pháp Sobel được thiết kế để xấp xỉ hàm gradient rời rạc. Mặt nạ xử lý Sobel có dạng sau:

Và ảnh chiều dài đường biên tính ra từ tính toán dùng biểu thức (1.19), (1.20) hoặc (1.21). Hướng của đường biên tính từ:

θ( . ) tan ( , ) ( , ) i j y i j y i j = −1 2 1 (1.23)

Chú ý rằng W1dùng để tách lấy đường biên dọc ảnh, còn W2 dùng để tách lấy đường biên ngang của ảnh.

I.5.2.3. Các mặt nạ gradient khép kín

Chúng được phát triển dựa trên sự đánh giá tất cả các hướng có thể của một đường biên ảnh trong một ảnh rời rạc. Bởi vậy thay vì chỉ áp dụng hai mặt nạ như hai phương pháp trước, tám mặt nạ đã được dùng, mỗi cái cung cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng (xem

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải 35 10-120-210-1 W1 -1-2-1000121 W2

hình 5.4). Bốn kiểu khác nhau của các mặt nạ của phương pháp này cho ở phía dưới. Chúng là sự phát triển dựa trên mô hình dữ liệu cơ sở cho đường biên trong ảnh.

Hình 1.15. Các hướng xử lý.

I.6. NHẬN DẠNG ẢNHI.6.1. Mô hình tham số I.6.1. Mô hình tham số

Sử dụng một véctơ để đặc tả đối tượng. Mỗi phần tử của véctơ mô tả một đặc tính của đối tượng.

Giả sử tiếp : x0 = 1 1 N i N = ∑ xi y0 = 1 1 N i N = ∑ yi

là toạ độ tâm điểm. Như vậy, moment trung tâm bậc p, q của đường bao là: µpq = 1 1 N i N = ∑ (xi-x0)p(yi-y0)q (1.24) 1 2 0 7 6 5 4 3 E NE N NW W SW S SE

Véctơ tham số trong trường hợp này chính là các moment µij với i=1, 2,...,p và j=1, 2,...,q. Còn trọng số các đặc trưng hình học, người ta hay sử dụng chu tuyến, đường bao, diện tích và tỉ lệ T = 4πS/p2, với S là diện tích, p là chu tuyến.

Việc lựa chọn phương pháp biểu diễn sẽ làm đơn giản cách xây dựng. Tuy nhiên, việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng.

I.6.2. Mô hình cấu trúc:

Cách tiếp cận của mô hình này dựa vào việc mô tả đối tượng nhờ một số khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự nhiên. Để mô tả đối tượng, người ta dùng một số dạng nguyên thuỷ như đoạn thẳng, cung, v,...,v. Chẳng hạn một hình chữ nhật được định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một.

I.7. NÉN DỮ LIỆU ẢNH

Nén dữ liệu là quá trình làm giảm lượng thông tin "dư thừa" trong dữ liệu gốc và do vậy, lượng thông tin thu được sau nén thường nhỏ hơn dữ liệu gốc rất nhiều. Với dữ liệu ảnh, kết quả thường là 10 : 1. Một số phương pháp còn cho kết quả cao hơn.

Ngoài thuật ngữ "nén dữ liệu”, do bản chất của kỹ thuật này nó còn có một số tên gọi khác như: giảm độ dư thừa, mã hoá ảnh gốc.

I.7.1. Các loại dư thừa dữ liệuI.7.1.1. Sự phân bố ký tự I.7.1.1. Sự phân bố ký tự

Trong một dãy ký tự, có một số ký tự có tần suất xuất hiện nhiều hơn một số dãy khác. Do vậy, ta có thể mã hoá dữ liệu một cách cô đọng hơn. Các dãy ký tự có tần xuất cao được thay bởi một từ mã nhị phân với số bít nhỏ;

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải

ngược lại các dãy có tần xuất thấp sẽ được mã hoá bởi từ mã có nhiều bít hơn. Đây chính là bản chất của phương pháp mã hoá Huffman.

• Sự lặp lại của các ký tự

Trong một số tình huống như trong ảnh, 1 ký hiệu (bít "0" hay bít "1") được lặp đi lặp lại một số lần. Kỹ thuật nén dùng trong trường hợp này là thay dãy lặp đó bởi dãy mới gồm 2 thành phần: số lần lặp và kí hiệu dùng để mã. Phương pháp mã hoá kiểu này có tên là mã hoá loạt dài RLC (Run Length Coding).

I.7.1.2. Những mẫu sử dụng tần suất

Có thể có dãy ký hiệu nào đó xuất hiện với tần suất tương đối cao. Do vậy, có thể mã hoá bởi ít bít hơn. Đây là cơ sở của phương pháp mã hoá kiểu từ điển do Lempel-Ziv đưa ra và có cải tiến vào năm 1977, 1978 và do đó có tên gọi là phương pháp nén LZ77, LZ78. Năm 1984, Terry Welch đã cải tiến hiệu quả hơn và đặt tên là LZW (Lempel-Ziv- Welch).

I.7.1.3. Độ dư thừa vị trí

Do sự phụ thuộc lẫn nhau của dữ liệu, đôi khi biết được ký hiệu (giá trị) xuất hiện tại một vị trí, đồng thời có thể đoán trước sự xuất hiện của các giá trị ở các vị trí khác nhau một cách phù hợp. Chẳng hạn, ảnh biểu diễn trong một lưới hai chiều, một số điểm ở hàng dọc trong một khối dữ lệu lại xuất hiện trong cùng vị trí ở các hàng khác nhau. Do vậy, thay vì lưu trữ dữ liệu, ta chỉ cần lưu trữ vị trí hàng và cột. Phương pháp nén dựa trên sự dư thừa này gọi là phương pháp mã hoá dự đoán.

Cách đánh giá độ dư thừa như trên hoàn toàn mang tính trực quan nhằm biểu thị một cái gì đó xuất hiện nhiều lần. Đối với dữ liệu ảnh, ngoài đặc thù chung đó, nó còn có những đặc thù riêng. Thí dụ như có ứng dụng không cần toàn bộ dữ liệu thô của ảnh mà chỉ cần các thông tin đặc trưng biểu

diễn ảnh như biên ảnh hay vùng đồng nhất. Do vậy, có những phương pháp nén riêng cho ảnh dựa vào biến đổi ảnh hay dựa vào biểu diễn ảnh.

I.7.2. Phân loại các phương pháp nén

Có nhiều cách phân loại các phương pháp nén khác nhau. Cách thứ nhất dựa vào nguyên lý nén. Cách này phân các phương pháp nén thành 2 họ lớn:

• Nén chính xác hay nén không mất thông tin (Lossless): họ này bao

gồm các phương pháp nén mà sau khi giải nén ta thu được chính xác dữ liệu gốc.

• Nén có mất mát thông tin (Lossy): họ này bao gồm các phương pháp

mà sau khi giải nén ta không thu được dữ liệu như bản gốc. Trong nén ảnh, người ta gọi là các phương pháp "tâm lý thị giác". Các phương pháp này lợi dụng tính chất của mắt người, chấp nhận một số vặn xoắn trong ảnh khi khôi phục lại. Tất nhiên, các phương pháp này chỉ có hiệu quả khi mà độ vặn xoắn là chấp nhận được bằng mắt thường hay với dung sai nào đó.

Cách phân loại thứ hai dựa vào cách thức thực hiện nén. Theo cách này, người ta cũng phân thành hai họ:

• Phương pháp không gian (Spatial Data Compression): các phương

pháp thuộc họ này thực hiện nén bằng cách tác động trực tiếp lên việc lấy mẫu của ảnh trong miền không gian.

• Phương pháp sử dụng biến đổi (Transform Coding): Gồm các phương

pháp tác động lên sự biến đổi của ảnh gốc mà không tác động trực tiếp như họ trên [6].

Có một cách phân loại khác nữa, cách phân loại thứ ba, dựa vào triết lý của sự mã hoá. Cách này cũng phân các phương pháp nén thành 2 họ:

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải

• Các phương pháp nén thế hệ thứ nhất: Gồm các phương pháp mà mức

độ tính toán là đơn giản, thí dụ như việc lấy mẫu, gán từ mã, v.. v...

• Các phương pháp nén thế hệ thứ hai: Dựa vào mức độ bão hoà của tỷ

lệ nén.

Trong các phần trình bày dưới đây, ta sẽ theo cách phân loại này.

Cũng còn phải kể thêm một cách phân loại thứ tự do Anil.K.Jain nêu ra. Theo cách của Jain, các phương pháp nén gồm 4 họ chính:

• Phương pháp điểm. • Phương pháp dự đoán.

• Phương pháp dựa vào biến đổi. • Các phương pháp tổ hợp (Hybrid).

Thực ra cách phân loại này là chia nhỏ của cách phân loại thứ ba và dựa vào cơ chế thực hiện nén. Xét một cách kỹ lưỡng nó cũng tương đương cách phân loại thứ ba.

Nhìn chung, quá trình nén và giải nén dữ liệu có thể mô tả một cách tóm tắt theo sơ đồ dưới đây:

Quá trình nén

Dữ liệu gốc Dữ liệu nén

Quá trình giải nén

CHƯƠNG II. KHẢO SÁT HỆ THỐNG THỰC

II.1. Các chức năng hỗ trợ của máy tính trong quá trình dạy học II.1.1. Chức năng lưu trữ và xử lí thông tin

Máy tính có thể quản lí, xử lí cung cấp thông tin khác nhau như văn bản, dữ liệu thống kê, suy luận logic, các công thức, các phép toán và các dạng khác nhau của tri thức. Máy tính sẽ phát huy được sức mạnh của nó khi thông tin cần cung cấp được trích từ ngân hàng dữ liệu. Ở khía cạnh này, máy tính phục vụ xuất sắc nếu nhiệm vụ của người học có một trong các yêu cầu sau:

• Tìm kiếm thông tin. • Chọn lọc thông tin.

Kiểm tra một khái niệm có nội dung xác định thông qua liên kết trong ngân hàng dữ liệu.

II.1.2. Chức năng điều chỉnh hoạt động học tập

Nếu được lập trình thích hợp, máy tính có thể điều chỉnh hoàn thiện và phát triển hoạt động học tập của học sinh. Máy tính làm cho các môn học trở nên hứng thú hơn đối với học sinh, kích thích học sinh tìm tòi, khám phá kiến thức mới. Máy tính giúp cho học sinh phát triển khả năng diễn đạt, khả năng tư duy logic (đặc biệt tư duy thuật toán).

Dựa vào mục đích dạy học và kết quả học tập của từng học sinh, máy tính cung cấp thông tin phản hồi (thông tin ngược) cho học sinh nhằm giúp đỡ họ có thể điều chỉnh hoạt động học tập của mình.

II.1.3. Chức năng luyện tập và thực hành

Các chương trình để luyện tập và thực hành trên máy tính giúp học sinh có cơ hội tốt để tiếp xúc với những vấn đề thực tiễn đã được đơn giản hoá sao

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải

cho phù hợp với khả năng và trình độ học sinh. Học sinh có thể luyện tập hoặc thực hành trên máy tính trước khi bắt tay vào làm việc với đối tượng thực.

II.1.4. Chức năng minh hoạ và trực quan

Máy tính cung cấp một khả năng lớn về lưu trữ, thể hiện các hình ảnh, âm thanh. Chính vì vậy, nhờ máy tính, các hình ảnh trực quan trong quá trình dạy học có thể được thể hiện một cách sinh động, đa dạng và phong phú.

II.1.5. Chức năng hỗ trợ thiết kế

Chức năng này thể hiện ở việc đưa vào quá trình dạy học các chương trình đồ hoạ hay các chương trình tương tự.

II.1.6. Chức năng mô hình hoá và mô phỏng

Mô hình hoá và mô phỏng là những phương pháp gần tương tự nhau dùng để phản ánh tiến trình nghiên cứu khoa học và sau đó để dạy về cơ sở của các tiến trình đó. Trong khoa học, mô hình hoá các quá trình lý thuyết được coi là con đường tốt nhất để huấn luyện tư duy khoa học và phương pháp giải quyết vấn để, ở mô hình hoá, ta có thể tìm thấy hầu như ở tất cả các khâu của quá trình nhận thức và khám phá điển hình đối với một người nghiên cứu.

II.1.7. Chức năng liên lạc

Chức năng liên lạc của máy tính được sử dụng nhiều trong những trường hợp mà mối liên lạc giữa người học và người dạy một cách trực tiếp gặp khó khăn (ví dụ đào tạo từ xa). Trong những trường hợp đó máy tính đóng vai trò là phương tiện truyền thông giữa người dạy và người học.

II.1.8. Chức năng đánh giá

Máy tính, qua các phần mềm dạy học, đóng vai trò là một thiết bị phân tích và đánh giá các bài kiểm tra, chuẩn đoán đưa ra các hướng giải quyết (các thông tin phản hồi).

II.2. Các quan điểm thiết kế phần mềm theo hướng dạy học với sự giúp đỡ của máy tính

II.2.1. Các quan điểm có tính cổ điển

Các quan điểm cổ điển nhất trong việc thiết kế các phần mềm dạy học được tìm thấy trong các dạng ứng dụng được phân cấp theo mức độ chủ động điều khiển các phần mềm. Có thể chỉ ra các dạng thiết kế phần mềm sau:

• Thiết kế các phần mềm luyện tập và thực hành. • Thiết kế các phần mềm mô phỏng.

• Thiết kế các phần mềm gia sư.

• Thiết kế các phần mềm hỗ trợ cho việc mô hình hoá.

• Thiết kế các hệ tương tác (giữa người học và máy) trên cơ sở tri thức. • Thiết kế các hệ tìm kiếm thông tin.

• Thiết kế các phần mềm tính toán.

• Thiết kế các phần mềm dùng trong thí nghiệm.

II.2.2. Xây dựng các vi thế giới

Sự xuất hiện của máy tính trong dạy học có thể giúp ích cho việc giải quyết các xung đột về nhận thức giữa cái mới và cái đã biết cũng như các vấn đề tương tự bằng cách tạo ra các thế giới chỉ tồn tại trên máy tính và tuân theo các quy luật mà lý thuyết của thế giới thực đã khẳng định.

Sinh viên: Nguyễn Thị Khuyên Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải

II.2.3. Xây dựng hệ tác giả

Các ngôn ngữ tác giả hoặc hệ tác giả cho phép người giáo viên với một kiến thức tối thiểu về tin học cũng có thể tạo ra các sản phẩm là các chương trình dạy học. Hệ tác giả cho phép giáo viên phát huy tính tích cực năng lực sáng tạo của mình trong việc xây dựng các bài học dưới sự hỗ trợ của máy tính. Đồng thời nó cũng giúp cho học sinh nâng cao hiểu biết, khả năng tư duy, phán đoán và rèn luyện trong quá trình tự học, tự nghiên cứu.

II.2.4. Xây dựng hệ chuyên gia