Tài liệu tham khảo công nghệ thông tin Xây dựng chương trình hỗ trợ giảng dạy môn học xử lý ảnh
Trang 1MỤC LỤC
MỞ ĐẦU 6
CHƯƠNG I CƠ SỞ LÍ THUYẾT 8
I.1 GIỚI THIỆU VỀ XỬ LÝ ẢNH 8
I.1.1 Tổng quan về một hệ thống xử lý ảnh 8
I.1.2 Một số khái niệm 10
I.2 BIỂU DIỄN ẢNH 12
I.2.1 Biểu diễn màu 12
I.2.1.1 Mô hình màu RGB 12
I.2.1.2 Mô hình màu CMY 13
I.2.1.3 Mô hình màu HSV 13
I.2.1.4 Mô hình ánh sáng 13
I.2.2 Số hóa ảnh 14
I.2.3 Các định dạng ảnh cơ bản trong xử lý ảnh 15
I.2.3.1 Định dạng ảnh IMG 15
I.2.3.2 File ảnh PCX 15
I.2.3.3 File ảnh BMP 16
I.2.3.4 Định dạng ảnh TIFF 16
I.2.4 Một số phương pháp biểu diễn ảnh 17
I.2.4.1 Mã loạt dài 17
I.2.4.2 Mã xích 18
I.2.4.3 Mã tứ phân 19
I.3 NÂNG CAO CHẤT LƯỢNG ẢNH 19
I.3.1 Cải thiện ảnh dùng toán tử điểm 19
I.3.1.1 Tăng độ tương phản 20
Trang 2I.3.1.2 Tách nhiễu và phân ngưỡng 21
I.3.1.3 Biến đổi âm bản 22
I.3.1.4 Cắt theo mức 22
I.3.1.5 Trích chọn bít 24
I.3.1.6 Trừ ảnh 25
I.3.1.7 Nén dải độ sáng 25
I.3.2 Cải thiện ảnh dùng toán tử không gian 26
I.3.2.1 Làm trơn nhiễu bằng lọc tuyến tính 26
I.3.2.2 Làm trơn nhiễu bằng lọc phi tuyến: 28
I.4 BIẾN ĐỔI ẢNH 29
I.4.1 Biến đổi Fourrier-TF: khái niệm và công thức 29
I.4.1.1 Không gian một chiều 30
I.4.1.2 Không gian hai chiều 30
I.4.2 Biến đổi Fourrier rời rạc – DFT 30
I.4.2.1 DFT cho tín hiệu một chiều 31
I.4.2.2 DFT cho tín hiệu hai chiều (ảnh số) 31
I.4.3 Biến đổi KL 31
I.5 LÀM NỔI VÀ TÁCH ĐƯỜNG BIÊN ẢNH 34
I.5.1 Làm nổi đường biên ảnh qua bộ lọc FIR 34
I.5.2 Tách đường biên ảnh qua cách tiếp cận khoảng cách 35
I.5.2.1 Toán tử Robert 35
I.5.2.2 Toán tử Sobel 36
I.5.2.3 Các mặt nạ gradient khép kín 36
I.6 NHẬN DẠNG ẢNH 37
I.6.1 Mô hình tham số 37
I.6.2 Mô hình cấu trúc: 38
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
2
Trang 3I.7 NÉN DỮ LIỆU ẢNH 38
I.7.1 Các loại dư thừa dữ liệu 38
I.7.1.1 Sự phân bố ký tự 38
I.7.1.2 Những mẫu sử dụng tần suất 39
I.7.1.3 Độ dư thừa vị trí 39
I.7.2 Phân loại các phương pháp nén 40
CHƯƠNG II KHẢO SÁT HỆ THỐNG THỰC 42
II.1 Các chức năng hỗ trợ của máy tính trong quá trình dạy học 42
II.1.1 Chức năng lưu trữ và xử lí thông tin 42
II.1.2 Chức năng điều chỉnh hoạt động học tập 42
II.1.3 Chức năng luyện tập và thực hành 42
II.1.4 Chức năng minh hoạ và trực quan 43
II.1.5 Chức năng hỗ trợ thiết kế 43
II.1.6 Chức năng mô hình hoá và mô phỏng 43
II.1.7 Chức năng liên lạc 43
II.1.8 Chức năng đánh giá 44
II.2 Các quan điểm thiết kế phần mềm theo hướng dạy học với sự giúp đỡ của máy tính 44
II.2.1 Các quan điểm có tính cổ điển 44
II.2.2 Xây dựng các vi thế giới 44
II.2.3 Xây dựng hệ tác giả 45
II.2.4 Xây dựng hệ chuyên gia 45
II.3 Các dạng ứng dụng cụ thể của máy tính trong dạy học tin học 45
II.4 Một số tiêu chuẩn để xây dựng phần mềm hỗ trợ dạy học 46
Trang 4II.4.1 Những tiêu chuẩn về phần cứng 46
II.4.2 Những yêu cầu về mặt sư phạm 46
II.4.3 Yêu cầu về cách thể hiện 46
II.5 Thực trạng về vấn đề giảng dạy ở các trường ĐH, CĐ hiện nay 47
II.6 Những hạn chế của phương thức giảng dạy thông thường 47
II.7 Những ưu điểm của việc sử dụng chương trình hỗ trợ giảng dạy 48
II.8 So sánh chương trình hỗ trợ giảng dạy với giáo trình điện tử và các tài liệu PowerPoint 49
II.9 Tiềm năng của việc sử dụng chương trình hỗ trợ giảng dạy 50
CHƯƠNG III PHÂN TÍCH HỆ THỐNG 52
III.1 Sơ đồ môi trường 52
III.2 Sơ đồ chức năng 53
III.3 Mục đích yêu cầu của chương trình 56
III.3.1 Mục đích chương trình 56
III.3.2 Yêu cầu chương trình 56
CHƯƠNG IV THIẾT KẾ VÀ XÂY DỰNG CHƯƠNG TRÌNH 58
IV.1 Thiết kế nội dung 58
IV.2 Thiết kế dữ liệu 59
IV.3 Thiết kế các màn hình giao diện của phần mềm 60
IV.3.1 Giao diện chính: 61
IV.3.2 Giao diện Lý Thuyết: 63
IV.3.3 Giao diện Bài tập: 64
IV.3.4 Giao diện Ví dụ: 65
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
4
Trang 5IV.3.5 Giao diện cập nhật, thay đổi nội dung bài giảng 66
IV.4 Hướng dẫn sử dụng 68
IV.5 Yêu cầu đối với chương trình 70
KẾT LUẬN 72
TÀI LIỆU THAM KHẢO 74
Trang 6dàng? Liệu con người có thể thích nghi được với thế giới thông tin bao quanh,
và nếu được thì nhờ những công cụ và phương tiện nào?
Để trả lời cho câu hỏi này, không gì khác chúng ta thấy rõ ràng cầnphải có một cuộc cách mạng trong giáo dục và đào tạo Phát triển đồng bộ các
cơ quan và tổ chức trường học cùng với các chương trình và trước hết làphương pháp đào tạo Bởi vì chức năng của nhà trường bao giờ cũng là chuẩn
bị con người cho việc đáp ứng những thay đổi của văn minh nhân loại
Trong bối cảnh phát triển như hiện nay, nếu muốn nền giáo dục đápứng được đòi hỏi cấp thiết của công cuộc công nghiệp hóa, hiện đại hóa đấtnước, nếu muốn việc dạy học theo kịp cuộc sống, chúng ta nhất thiết phải cảicách phương pháp dạy học theo hướng vận dụng CNTT và các thiết bị dạyhọc hiện đại phát huy mạnh mẽ tư duy sáng tạo, kỹ năng thực hành và hứngthú học tập của học sinh để nâng cao chất lượng đào tạo
Qua quá trình học tập tại Đại học Hàng Hải, em đã được các thầy giáotrong Khoa công nghệ thông tin tận tình chỉ bảo, cung cấp rất nhiều thông tin,những ý tưởng quan trọng trong việc làm đồ án tốt nghiệp Được sự địnhhướng, tạo điều kiện của Khoa công nghệ thông tin và sự hướng dẫn trực tiếp
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
6
Trang 7của thầy giáo KS Nguyễn Văn Giang - Khoa Công nghệ thông tin – Học
Viện Kỹ Thuật Quân Sự, em đã lựa chọn đề tài “Xây dựng chương trình hỗ
trợ giảng dạy môn học xử lý ảnh” làm đồ án tốt nghiệp cho mình.
Xuất phát từ ý tưởng dạy học bằng hình ảnh, em muốn xây dựng phầnmềm mô phỏng tất cả các hiện tượng, sự vật có trong chương trình của cácmôn học nhằm hỗ trợ các giáo viên khi giảng dạy trên máy vi tính, có được
các hình ảnh minh hoạ phục vụ việc giảng dạy một cách thực tế hơn, sinh động hơn Một phương pháp giảng dạy mới “trực quan sinh động” và một phương pháp học mới “mắt thấy tai nghe”: đó là điều mà phần mềm này sẽ
mang lại cho ngành giáo dục Với phương pháp dạy và học này hứa hẹn sẽnâng cao chất lượng nền giáo dục nước nhà
Tuy nhiên do khả năng và điều kiện thời gian còn nhiều hạn chế nên đồ
án của em không tránh khỏi nhiều sai sót, em rất mong được sự chỉ bảo, đónggóp của các thầy giáo và tất cả mọi người quan tâm đến vấn đề này Em xincảm ơn các giáo viên trong Khoa công nghệ thông tin và đặc biệt là thầy giáoNguyễn Văn Giang đã chỉ bảo hướng dẫn tận tình, giúp em hoàn thành đồ ánnày
Nội dung của báo cáo đồ án bao gồm có các chương sau:
Chương I: Cơ sở lý thuyết
Chương II: Khảo sát hệ thống thực
Chương III: Phân tích hệ thống
Chương IV: Thiết kế và xây dựng chương trình
Trang 8CHƯƠNG I CƠ SỞ LÍ THUYẾT
I.1 GIỚI THIỆU VỀ XỬ LÝ ẢNH
I.1.1 Tổng quan về một hệ thống xử lý ảnh
Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngànhkhoa học khác, nhất là trên qui mô công nghiệp, song trong xử lý ảnh đã bắtđầu xuất hiện những máy tính chuyên dụng Để có thể hình dung cấu hìnhmột hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trongnghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử
lý ảnh
Trước hết là quá trình thu nhận ảnh Ảnh có thể thu nhận qua camera.Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểuCCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge CoupledDevice)
Hình 1.1 Các giai đoạn chính trong xử lý ảnhẢnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hayảnh, tranh được quét trên scanner Tiếp theo là quá trình số hoá (Digitalizer)
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
8
Trang 9để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằnglượng hoá, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trướchết là công việc tăng cường ảnh để nâng cao chất lượng ảnh Do nhữngnguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồnsáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải tăng cường vàkhôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm choảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng.Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, tríchchọn các đặc tính, v.v
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,phân lớp hay các quyết định khác Các giai đoạn chính của quá trình xử lý ảnh
có thể mô tả ở hình 1.1
Với các giai đoạn trên, một hệ thống xử lý ảnh (cấu trúc phần cứngtheo chức năng) gồm các thành phần tối thiểu như hình 1.2
Trang 10Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh
I.1.2 Một số khái niệm
Pixel (Picture Element): phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độsáng Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh.Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạcthông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hoá thànhphần giá trị mà thể về nguyên tắc bằng mắt thường không phân biệt được hai
điểm kề nhau Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel - phần tử ảnh Ở đây cũng cần phân
biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ hoạ máy tính Đểtránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị Khái niệmpixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
10
Trang 11đồ hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel Mỗipixel gồm một cặp tọa độ x, y và màu.
Cặp tọa độ x, y tạo nên độ phân giải (resolution) Như màn hình máy
tính có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân giải
là 320 x 200; màn hình VGA là 640 x 350,
Như vậy, một ảnh là một tập hợp các điểm ảnh Khi được số hoá, nóthường được biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột Ta nói ảnhgồm n x p pixels Người ta thường kí hiệu I(x,y) để chỉ một pixel Thường giátrị của n chọn bằng p và bằng 256
Gray level: Mức xám
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗiđiểm ảnh với một giá trị số - kết quả của quá trình lượng hoá Cách mã hoákinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất
do lý do kỹ thuật Vì 28 = 256 (0, 1, , 255), nên với 256 mức, mỗi pixel sẽđược mã hoá bởi 8 bit
Biểu diễn ảnh xám:
Trên ảnh hai chiều, mỗi điểm (x,y) trên mặt phẳng ảnh ứng với mộtf(x,y) giá trị mô tả mức xám cho điểm ảnh Trong đó, x là số hiệu cột và y là
số hiệu dòng trên ảnh
(x,y) f(x,y) f(x,y)
Ở đây f(x,y) là mức xám Chẳng hạn, nếu có 256 mức xám thì 0 f(x,y) 255
Nếu là ảnh màu, có bảng màu thì f(x,y) là số hiệu màu
Nếu là ảnh hơn 256 màu thì f(x,y) là ba byte thể hiện các giá trị R, G và
B của điểm ảnh
Trang 12I.2 BIỂU DIỄN ẢNH
I.2.1 Biểu diễn màu
Màu của một đối tượng phụ thuộc vào:
Bản thân đối tượng
Ánh sáng chiếu của nguồn sáng
Môi trường xung quanh
Thị giác của con người
Mô hình màu được xác định trên một số màu sơ cấp Xét theo cấu tạo củamắt, các màu đều là liên két của ba màu sơ cấp là:
Đỏ (RED) 700mm
Xanh lá cây (GREEN) 546,1 mm
Xanh da trời (BLUE) 435,8 mm
Các màu sơ cấp cộng với nhau cho màu thứ cấp Ví dụ:
Magenta := RED + BLUE
YELOW := RED + GREEN
CIE (The Commission International de I’Eclairage – Uỷ ban chuẩn quốc tế)
đã xây dựng một chuẩn cho tất cả các màu, xác định thông qua ba thành phần
cơ sở là RED, GREEN và BLUE
I.2.1.1 Mô hình màu RGB
Hệ RGB gồm các màu cơ sở là RED, GREEN và BLUE
Hệ màu RGB được sử dụng trong màn hình, trong đồ hoạ raster màu
Mô tả hệ RGB theo hệ toạ độ Decarte
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
12
Trang 13Hình 1.3 Hệ tọa độ màu
Hệ RGB là chuẩn công nghiệp cho các thao tác đồ hoạ Nếu thể hiện trên hệmàu khác, cuối cùng vẫn phải chuyển về RGB
Với các màn hình khác nhau, giá trị RGB có thể khác nhau
I.2.1.2 Mô hình màu CMY
Hệ CMY dựa trên các màu sơ cấp CYAN, MAGENTA và YELLOW
Các màu này là phần bù của RED, GREEN và BLUE
I.2.1.3 Mô hình màu HSV
HSV (Hue – màu sắc, Saturation - sự bão hoà và Value – giá trị), hay còn gọi
là HSB (Hue, Saturation, Brightness - cường độ sáng)
Hue nhận giá trị trong khoảng [0o 360o]
Saturation, Value nhận giá trị trong khoảng [0 1]
I.2.1.4 Mô hình ánh sáng
Ánh sáng nhìn thấy được là tổng hợp các thành phần đơn sắc
Trang 14Tỷ lệ trộn khác nhau dẫn đến các màu khác nhau Ví dụ về các màu đơn sắcnhư RED, GREEN, BLUE hoặc CYAN, MAGENTA, YELLOW.
Cường độ sáng phản xạ là giá trị đo được trên bề mặt của đối tượng tại điểmtới Cường độ sáng của tia phản xạ phụ thuộc vào góc tới và hệ số phản xạcủa bề mặt
I.2.2 Số hóa ảnh
Từ môi trường qua thiết bị thu nhận ảnh, sẽ ánh xạ thực thể thành matrận các điểm ảnh khác nhau, và tùy vào độ phân giải cũng như không gianmàu Việc số hóa thông qua quá trình lấy mẫu sau đó tiến hành lượng tử hóacác phần tử để lưu trữ
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
14
Trang 15I.2.3 Các định dạng ảnh cơ bản trong xử lý ảnh
+ 2 bytes tiếp theo: chứa độ dài mẫu tin Đó là độ dài của dãy các bytes
kề liền nhau mà dãy này sẽ được lặp lại một số lần nào đó Số lần lặp này sẽđược lưu trong byte đếm
+ 4 bytes tiếp: mô tả kích cỡ pixel
+ 2 bytes tiếp : số pixel trên một dòng ảnh
+ 2 bytes cuối: số dòng ảnh trong ảnh
Ảnh IMG được nén theo từng dòng Mỗi dòng bao gồm các gói (pack).Các dòng giống nhau cũng được nén thành một gói Có 4 loại gói sau:
Loại 1: Gói các dòng giống nhau.
Loại 2: Gói các dãy giống nhau.
Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén được Loại 4: Dãy các pixel giống nhau.
I.2.3.2 File ảnh PCX
Nếu ta hình dung trong một tệp ảnh xếp liên tiếp các byte từ đầu đến cuối và dồn chúng vào trong một hộp chữ nhật, thì có thể hình dung tệp ảnh PCX như hình vẽ sau:
Trang 16 Phần Header (IFH): có trong tất cả các tệp TIFF và gồm 8 byte:
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
16
Trang 17 Phần thứ 2 (IFD): Nó không ở ngay sau cấu trúc IFH mà vị trí của nóđược xác định bởi trường Offset trong đầu tệp Có thể có một hay nhiềuIFD cùng tồn tại trong file (nếu file có nhiều hơn 1 ảnh)
Cấu trúc phần dữ liệu thứ 3: các DE Các DE có độ dài cố định gồm 12byte
I.2.4 Một số phương pháp biểu diễn ảnh
I.2.4.1 Mã loạt dài
Phương pháp này hay dùng biểu diễn cho vùng ảnh hay ảnh nhị phân.Một vùng ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân:
u(m,n) = 1 nếu (m,n) R
0 nếu không Với cách biểu diễn trên, một vùng ảnh hay ảnh nhị phân được xem nhưgồm các chuỗi 0 hay 1 đan xen Các chuỗi này gọi là một mạch (run) Theophương pháp này, mỗi mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch
và chiều dài mạch theo dạng: (<hàng,cột>, chiều dài)
Trang 182 A 7
3 1 M 1 0 1 E 0
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bởimột hình chữ nhật Vùng này được chia làm 4 vùng con (quadrant) Nếu một
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
18
Trang 19vùng con gồm toàn điểm đen (1) hay toàn điểm trắng (0) thì không cần chiatiếp Trong trường hợp ngược lại, vùng con gồm cả đen và trắng gọi là vùngxám lại tiếp tục được chia làm 4 vùng con tiếp Quá trình chia dừng lại khikhông thể chia tiếp được nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểmđen hay trắng Như vậy, cây biểu diễn gồm một chuỗi các ký hiệu b(black),w(white) và g(grey) kèm theo ký hiệu mã hoá 4 vùng con Biểu diễn theophương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mãloạt dài Tuy nhiên, để tính toán số đo các hình như chu vi, mô men là khákhó.
I.3 NÂNG CAO CHẤT LƯỢNG ẢNH
I.3.1 Cải thiện ảnh dùng toán tử điểm
Toán tử điểm là toán tử không bộ nhớ, ở đó một mức xám u [0,N] được[0,N] đượcánh xạ sang một mức xám v [0,N]: v=f(u) Ánh xạ f tuỳ theo các ứng dụng[0,N] đượckhác nhau có các dạng khác nhau:
Tăng độ tương phản
Tách nhiễu phân ngưỡng
Biến đổi âm bản
Cắt theo mức
Trích chọn bít
Trừ ảnh
Nén dải độ sáng
I.3.1.1 Tăng độ tương phản.
Độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền,hay nói cách khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so vớinền
Trang 20Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau.
Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định.Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khácnhau sẽ cho cảm nhận khác nhau Vì vậy, ta có thể thay đổi độ tương phảncủa ảnh sao cho phù hợp
Để điều chỉnh độ tương phản của ảnh, ta điều chỉnh biên độ của ảnhtrên toàn dải hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độđầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hayhàm logarit) Khi dùng hàm tuyến tính các độ dốc , , phải chọn lớn hơn 1, , phải chọn lớn hơn 1 , phải chọn lớn hơn 1 phải chọn lớn hơn 1trong miền cần giãn Các cận a, b có thể chọn khi xem xét lược đồ xám củaảnh
f (u ) ={β (u−a ) +v α u 0≤u<a a a ≤ u≺b
Trang 21I.3.1.2 Tách nhiễu và phân ngưỡng.
f (u) ={α u a ≤ u≺b 0 0≤u<a
L b ≤ u
Trang 22Tách nhiễu là trường hợp đặc biệt của giãn độ tương phản khi hệ số góc
==0 Tách nhiễu được ứng dụng trong trường hợp khi biết tín hiệu nằmtrên khoảng [a, b]
Phân ngưỡng là trường hợp đặc biệt của tách nhiễu khi a=b=const.Trong trường hợp này ảnh đầu ra là ảnh nhị phân (vì chỉ có hai mức) Phânngưỡng hay dùng trong kỹ thuật in ảnh hai màu vì ảnh gần nhị phân khôngthể cho ra ảnh nhị phân khi quét ảnh bởi có sự xuất hiện của nhiễu do bộ cảmbiến và sự biến đổi của nền Thí dụ như trường hợp ảnh vân tay
I.3.1.3 Biến đổi âm bản.
uv
22
Trang 23f (u) ={L u a≤u≤b Khac di
Không nền
f (u) ={0L a≤u≤b Khac di
Biến đổi này cho phép phân đoạn một số mức xám từ phần còn lại củaảnh Nó hữu dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miềnmức xám khác nhau
a b
uv
Trang 24Hình 1.11 A- Ảnh gốc
Trang 25Hình 1.12 A- Ảnh gốc; B - Ảnh với bit 5; C - Ảnh với bit 4; D - Ảnh với bit 3
I.3.1.6 Trừ ảnh
Trừ ảnh dùng để tách nhiễu khỏi nền Ta quan sát ảnh ở hai thời điểmkhác nhau, so sánh chúng để tìm ra sự khác nhau, sau đó dóng thẳng hai haiảnh rồi trừ đi và thu được ảnh mới Ảnh mới đó chính là sự khác nhau Kỹthuật này hay được dùng trong dự báo thời tiết hay trong y học
I.3.1.7 Nén dải độ sáng
Đôi khi do dải động của ảnh lớn, việc quan sát không thuận tiện, cầnphải thu nhỏ dải độ sáng lại mà người ta gọi là nén dải độ sáng Người tadùng phép biến đổi Loga sau: v(m,n)=c log10 (+u(m,n))
Trang 26Với c là hằng số tỷ lệ, rất nhỏ so với u(m,n) Thường chọn cỡ 10
I.3.2 Cải thiện ảnh dùng toán tử không gian
I.3.2.1 Làm trơn nhiễu bằng lọc tuyến tính
a Lọc trung bình không gian
Mỗi điểm ảnh được thay thế bằng lọc trung bình trọng số của các điểm lâncận:
Với a kl=
1
N w ; Nw : là số điểm ảnh trong cửa sổ lọc
y(m,n) : ảnh đầu vào
v(m,n): ảnh đầu ra
w(m,n): cửa sổ lọc
a(m,n): trọng số lọc
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập
H Nhân chập H trong trường hợp này có dạng:
Trang 27Lọc thông thấp thường sử dụng để làm trơn nhiễu.
Khi b=1 Hb chính là nhân chập H1 (lọc trung bình)
Để hiểu rõ hơn, ta viết lại phương trình thu nhận ảnh dưới dạng:
Xqs[m,n] = Xgoc[m,n] + [m,n][m,n]
Trong đó [m,n] là nhiễu cộng có phương sai [m,n] 2
n Như vậy, theo cách tính củalọc trung bình ta có:
Trang 28Lọc đồng hình thực hiện lấy logarit của ảnh quan sát.
log(X(m,n)) = log(X (m,n))+log( (m,n))[m,n]
Rõ ràng nhiễu nhân có trong ảnh sẽ bị giảm
I.3.2.2 Làm trơn nhiễu bằng lọc phi tuyến:
a Lọc trung vị
v(m,n)= Trung vi(y(m-k,n-l) với (k,l) W [0,N] được (1.1)
Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tựtăng hay giảm dần so với giá trị trung vị Kích thước cửa sổ thường đượcchọn sao cho số điểm ảnh trong cửa sổ là số lẻ Các cửa sổ hay dùng là cửa sổ
- Lọc trung vị là phi tuyến vì:
Trung vị ((x(m) + y (m))# Trung vị(x(m)) + Trung vị(y(m))
- Hữu ích cho việc loại bỏ các điểm các điểm ảnh hay các hàng mà vẫn bảotoàn độ phân giải
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
28
Trang 29- Hiệu quả giảm khi số điểm nhiễu trong cửa sổ lớn hơn hay bằng một nửa sốđiểm trong cửa sổ Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớnnhất nếu Nw lẻ Lọc trung vị cho trường hợp 2 chiều coi như lọc trung vị táchđược theo từng chiều, có nghĩa là người ta tiến hành lọc trung vị cho cột tiếptheo cho hàng.
b Lọc ngoài (Outlier Filter)
Giả thiết rằng có một mức ngưỡng nào đó cho các mức nhiễu (có thể dựa vàolược đồ xám) Tiến hành so sánh giá trị của một điểm ảnh với trung bình sốhọc 8 lân cận của nó Nếu sự sai lệch này lớn hơn ngưỡng, điểm ảnh này đượccoi như nhiễu Trong trường hợp này ta thay thế giá trị của điểm ảnh bằng giátrị trung bình 8 lân cận vừa tính được Các cửa sổ tính toán thường là 3x3.Tuy nhiên cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tươngquan giữa các điểm ảnh Vấn đề quan trọng là xác định ngưỡng để loại nhiễu
mà vẫn không làm mất thông tin
I.4 BIẾN ĐỔI ẢNH
I.4.1 Biến đổi Fourrier-TF: khái niệm và công thức
Biến đổi Fourrier cho một tín hiệu có thể hình dung như sau:
x(t) TF X(f)
Miền thời gian Miền tần số
Một số ứng dụng cần miền phức, người ta dùng biến đổi phức (biến đổi z) :
x(n) TZ X(z) với z là biến phức
Biến đổi Fourrier cho một tín hiệu một chiều gồm một cặp biến đổi:
Trang 30- Biến đổi thuận: chuyển sự biểu diễn từ không gian thực sang khônggian tần số (phổ và pha) Các thành phần tần số này được gọi là các biểu diễntrong không gian Fourrier của tín hiệu.
- Biến đổi ngược: chuyển đổi sự biểu diễn của đối tượng từ không gianFourrier sang không gian thực
I.4.1.1 Không gian một chiều
Cho một hàm f(x) liên tục Biến đổi Fourrier của f(x), kí hiệu F(u), ubiểu diễn tần số không gian, được định nghĩa:
I.4.1.2 Không gian hai chiều
Cho f(x,y) hàm biểu diễn ảnh liên tục trong không gian 2 chiều, cặpbiến đổi Fourier cho f(x,y) được định nghĩa:
- Biến đổi thuận F(u,v) =
- Biến đổi ngược f(x,y) =
I.4.2 Biến đổi Fourrier rời rạc – DFT
Biến đổi DFT được phát triển dựa trên biến đổi Fourrier cho ảnh số Ởđây, ta dùng tổng thay cho tích phân Biến đổi DFT tính các giá trị của biếnđổi Fourrier cho một tập các giá trị trong không gian tần số được cách đều
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
30
Trang 31I.4.2.1 DFT cho tín hiệu một chiều
Với tín hiệu một chiều, người ta biểu diễn bởi một chuỗi trực giao cáchàm cơ sở Với các hàm liên tục, khai triển chuỗi trực giao sẽ cung cấp chuỗicác hệ số dùng trong nhiều quá trình khác nhau hay trong phân tích hàm Khaitriển Fourrier rời rạc DFT cho một dãy {u(n), n = 0, 1, , N-1} định nghĩabởi:
và biến đổi ngược u(n) =
1 0
I.4.2.2 DFT cho tín hiệu hai chiều (ảnh số)
Cặp DFT đơn vị hai chiều được định nghĩa:
I.4.3 Biến đổi KL
a Định nghĩa và khái niệm:
Trang 32Cho u là một véc tơ các số thực ngẫu nhiên; véctơ cơ sở của biến đổi
KL là các véc tơ riêng trực giao của ma trận hiệp biến R cho bởi phươngtrình: R k = k k ; 0 k N-1
Biến đổi KL của u là v = *Tu (1.10)
và biến đổi ngược u = v = k
u là véc tơ cột, v là véctơ hàng và k là cột thứ k của ma trận
Biến đổi đưa R về dạng đường chéo :
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
32
Trang 331
*TR = = 2
N
Thường người ta hay làm việc với ma trận A hơn
b Biến đổi KL của ảnh:
Nếu một ảnh u(m,n) NxN được biểu diễn bởi trường ngẫu nhiên, ma trận Acho bởi:
E[u(m,n)u(m',n')] = r(m,n;m',n') 0 m,m',n,n' N-1 (1.12) thì ảnh cơ sở của biến đổi KL là các hàm riêng, chuẩn và trực giao k,l là lờigiải của phương trình:
Nếu R là tách được thì ma trận N2 x N2 mà các cột là i sẽ tách được:
k,l(m,n) = 1 2 hay R = R1 R2 (1.15)
Biến đổi KL của U là V = * Tu = 1*T2*T
và biến đổi ngược U =1 V2 (1.16)
Trang 34I.5 LÀM NỔI VÀ TÁCH ĐƯỜNG BIÊN ẢNH
I.5.1 Làm nổi đường biên ảnh qua bộ lọc FIR
Vì đường biên ảnh chiếm ở dải tần số cao trong phổ của ảnh, nên ta cóthể làm nổi hoặc tách đường biên ảnh qua bộ lọc thông cao Dùng cho chứcnăng này, ta có thể dùng bộ lọc tương phản pha có điểm cắt tần số đủ cao đểlàm nổi đường biên ảnh và làm mờ các chi tiết khác của ảnh có tần số thấp
Một phương pháp khác hay dùng để làm nổi đường biên ảnh là dùng bộlọc Laplace, định nghĩa như sau:
(1.17)
ở đây f(x,y) là hàm cường độ của ảnh Đặc tính tần số của Laplace được định
nghĩa như sau:
H (ω1,ω2)=ω12+ω22 (1.18)
Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đườngbiên, xem sơ đồ ví dụ hình 1.14 Chúng là sự đơn giản hoá sườn âm và sườndương đường biên
Hình 1.13 (a) Kết quả sử dụng bộ lọc PCF với ω c=1.7 .
Trang 35Hình 1.14 Đạo hàm bậc nhất và bậc hai của đường biên.
Rõ ràng là đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh Thôngthường, các điểm cắt zero của đạo hàm bậc hai là nơi có đường biên ảnh Cầnphải nhớ rằng đạo hàm của một hàm hai biến tại bất kỳ điểm nào cũng phụthuộc vào hướng lấy đạo hàm
Các bộ lọc FIR có thể dùng xấp xỉ một Laplace
I.5.2 Tách đường biên ảnh qua cách tiếp cận khoảng cách
I.5.2.1 Toán tử Robert
Nó bao gồm hai mặt nạ sau đây :
Chiều dài đường biên ảnh có thể rút ra bằng cách dùng bất kỳ phép xử lýkhông tuyến tính nào sau đây
Trang 36Trong đó y 1 (i,j) và y 2 (i,j) là đáp ứng rút ra từ mẫu W1 và W2 Hai biểu thức
cuối cùng được dùng thường xuyên nhất Hướng của đường biên (i,j), tính
theo phương nằm ngang, có thể rút ra bởi:
I.5.2.2 Toán tử Sobel
Phương pháp Sobel được thiết kế để xấp xỉ hàm gradient rời rạc Mặt nạ xử lýSobel có dạng sau:
Và ảnh chiều dài đường biên tính ra từ tính toán dùng biểu thức (1.19), (1.20)hoặc (1.21) Hướng của đường biên tính từ:
Sinh viên: Nguyễn Thị Khuyên
Lớp: CNT43TT1-ĐHT2 - ĐH Hàng Hải
36
Trang 37cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng(xem hình 5.4) Bốn kiểu khác nhau của các mặt nạ của phương pháp này cho
ở phía dưới Chúng là sự phát triển dựa trên mô hình dữ liệu cơ sở cho đườngbiên trong ảnh
Hình 1.15 Các hướng xử lý.
I.6 NHẬN DẠNG ẢNH
I.6.1 Mô hình tham số
Sử dụng một véctơ để đặc tả đối tượng Mỗi phần tử của véctơ mô tả một đặctính của đối tượng
Giả sử tiếp :
x0 =
1 1
0
76
54
3
ENE