Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/ LỜI CAM ĐOAN Tôi xin cam đoan Luận văn “Nghiên cứu kỹ thuật xử lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng cho phiếu thi trắc ngh
Trang 1Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
BÙI NGỌC HUY
NGHIÊN CỨU KỸ THUẬT XỬ LÝ NHIỄU,
HIỆU CHỈNH ẢNH NHỊ PHÂN VÀ ỨNG DỤNG CHO
PHIẾU THI TRẮC NGHIỆM
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2013
Trang 2Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
BÙI NGỌC HUY
NGHIÊN CỨU KỸ THUẬT XỬ LÝ NHIỄU,
HIỆU CHỈNH ẢNH NHỊ PHÂN VÀ ỨNG DỤNG CHO
PHIẾU THI TRẮC NGHIỆM Chuyên ngành: Khoa học máy tính
Trang 3Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn “Nghiên cứu kỹ thuật xử lý nhiễu, hiệu chỉnh
ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm” là công trình nghiên cứu
của tôi, có sự hỗ trợ từ Giáo viên hướng dẫn là PGS TS Ngô Quốc Tạo Các
nội dung nghiên cứu và kết quả trong đề tài này là trung thực và chưa từng được ai công bố trong bất cứ công trình nghiên cứu nào trước đây
Những số liệu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập từ các nguồn khác nhau có ghi trong phần tài liệu tham khảo Tôi hoàn toàn chịu trách nhiệm về tính pháp lý quá trình nghiên cứu khoa học của luận văn này
Thái Nguyên, ngày tháng năm 2013
Tác giả luận văn
Bùi Ngọc Huy
Trang 4Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
LỜI CẢM ƠN
Trước tiên tôi bày tỏ lời cảm ơn chân thành đến các Thầy, cô giáo đã giảng dạy, hướng dẫn và giúp đỡ tôi trong thời gian học tập và nghiên cứu hoàn thành luận văn này
Tôi xin chân thành cảm ơn PGS TS Ngô Quốc Tạo - người đã trực tiếp hướng dẫn và định hướng giúp tôi có thể nhanh chóng tiếp cận, nắm bắt kiến thức và hoàn thành luận văn “Nghiên cứu kỹ thuật xử lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm”
Xin chân thành cảm ơn các thầy, cô giáo Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên, Viện Công nghệ thông tin
đã giúp đỡ và tạo điều kiện thuận lợi cho tôi trong thời gian học tập
Tôi xin gửi lời cảm ơn tới trường Cao đẳng Công nghiệp và Xây dựng, nơi tôi đang công tác đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và làm việc tại trường
Cuối cùng, xin chân thành cảm ơn gia đình và bạn bè đã động viên, quan tâm, giúp đỡ tôi hoàn thành khóa học và luận văn
Trang 5Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN vi
MỞ ĐẦU 1
Chương 1: KHÁI QUÁT VỀ XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH 3
1.1 Giới thiệu chung về xử lý ảnh 3
1.1.1 Xử lý ảnh là gì? 4
1.1.2 Các giai đoạn chính trong xử lý ảnh 5
1.2 Khái quát quá trình xử lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm 6
1.2.1 Giới thiệu chung 6
1.2.2 Quá trình xử lý nhiễu và hiệu chỉnh ảnh 7
1.3 Một số khái niệm liên quan 8
1.3.1 Ảnh là gì? 8
1.3.2 Điểm ảnh (pixel element) 8
1.3.3 Mức xám (Gray Level) 9
1.3.4 Độ phân giải của ảnh 9
1.3.5 Phân loại ảnh 9
1.4 Kết luận chương 1 11
Chương 2: MỘT SỐ KỸ THUẬT XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH 12
2.1 Các kỹ thuật tiền xử lý 12
2.1.1 Giới thiệu chung 12
2.1.2 Tăng, giảm độ sáng 13
2.1.3 Tăng, giảm độ tương phản 13
Trang 6Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
2.1.4 Tách kênh mầu đỏ 14
2.1.5 Chuyển ảnh xám 15
2.1.6 Nhị phân hóa ảnh bằng phân ngưỡng 16
2.2 Kỹ thuật nhận dạng form 20
2.2.1 Đặt vấn đề 20
2.2.2 Nhận dạng các điểm định vị 22
2.3 Một số thuật toán xử lý nhiễu 24
2.3.1 Căn chỉnh độ lệnh trang 24
2.3.2 Phân vùng ô cần tô 25
2.3.3 Nhận dạng ô cần tô 29
2.4 Một số kỹ thuật hiệu chỉnh ảnh 33
2.4.1 Phép giãn nhị phân (Dilation) 33
2.4.2 Phép co ảnh nhị phân (Erosion) 37
2.4.3 Phép mở ảnh (Opening), đóng ảnh (Closing) 40
2.4.5 Làm đầy ô cần tô 45
2.5 Kết luận chương 2 47
Chương 3: CHƯƠNG TRÌNH THỰC NGHIỆM 49
3.1 Quá trình xử lý nhiễu và hiệu chỉnh ảnh 49
3.1.1 Tách kênh màu đỏ 49
3.1.2 Phân ngưỡng 49
3.1.3 Lọc nhiễu 50
3.1.4 Căn chỉnh độ lệch 50
3.1.5 Khoanh vùng được tô 51
3.1.6 Xác định điểm định vị 51
3.1.7 Tách các vùng được tô 52
3.2 Chấm bài thi 52
3.3 Giới thiệu chương trình 53
KẾT LUẬN 58
Trang 7Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
TÀI LIỆU THAM KHẢO 59
Trang 8Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN
Hình 1.1 Quá trình xử lý ảnh 5
Hình 1.2 Các giai đoạn chính trong xử lý ảnh 5
Hình 1.3 Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh 7
Hình 1.4 Ví dụ về ảnh đen trắng 10
Hình 1.5 Ví dụ ảnh xám 10
Hình 1.6 Ví dụ về ảnh màu 11
Hình 2.1 Ảnh trước khi chuyển xám 16
Hình 2.2 Ảnh đã thực hiện chuyển xám 16
Hình 2.3 Chọn ngưỡng theo Zack 18
Hình 2.4 Phương pháp lấy ngưỡng 19
Hình 2.5 Phân ngưỡng theo thuật toán SIS 20
Hình 2.6 Các điểm định vị trong phiếu trả lời câu hỏi trắc nghiệm 22
Hình 2.7 Hệ tọa độ khi xoay ảnh 25
Hình 2.8 Các điểm lân cận gradient 27
Hình 2.9 Căn chỉnh đường biên 28
Hình 2.10 Vùng số báo danh và mã đề đã qua xử lý 29
Hình 2.11 Vùng đáp án đã qua xử lý 29
Hình 2.12 Các dạng tô trong phiếu trả lời trắc nghiệm 30
Hình 2.13 Ô bị tô trùng 30
Hình 2.14 Ô bị tô lệch, tô tràn lan 30
Hình 2.15 Ảnh cần kiểm tra tô được chia thành 3 vùng 31
Hình 2.16: Phép giãn nhị phân 35
Hình 2.17 Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân 36
Hình 2.18 Phép co nhị phân trên hai đối tượng 37
Hình 2.19 Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân 39
Trang 9Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Hình 2.20 Ứng dụng của phép co ảnh dưới dạng số nhị phân 39
Hình 2.21 Quá trình thực hiệp phép mở ảnh 41
Hình 2.22: Phép mở ảnh trên phương diện ý nghĩa hình học 42
Hình 2.24 Minh họa phép đóng ảnh trên phương diện ý nghĩa hình học 43
Hình 2.25 Minh họa phép biến đổi trúng hoặc trượt 45
Hình 2.26 Quá trình làm đầy đối tượng trong ảnh 47
Hình 3.1 Ảnh trước và sau khi tách kênh màu đỏ 49
Hình 3.2 Ảnh trước và sau khi phân ngưỡng, lọc nhiễu 50
Hình 3.3 Ảnh trước và sau khi căn chỉnh độ lệch 51
Hình 3.4 Vùng số báo danh và mã đề 52
Hình 3.5 Giao diện chính của chương trình 54
Hình 3.6 Menu hiển thị phần tệp 54
Hình 3.7 Menu hiển thị xử lý nhiễu và hiệu chỉnh ảnh 55
Hình 3.9 Mô phỏng quá trình phân ngưỡng và lọc nhiễu 56
Hình 3.10 Mô phỏng quá trình xoay ảnh 56
Hình 3.11 Mô phỏng phân vùng ô cần tô 56
Hình 3.12 Menu hiển thị xử lý bài thi 56
Hình 3.13 Mô phỏng đọc các câu trả lời bài thi 57
Hình 3.14 Mô phỏng kết quả chấm thi 57
Trang 10Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
MỞ ĐẦU
- Khoa học xử lý ảnh trên thế giới đang có nhiều bước tiến vững chắc Đây cũng là một trong những lĩnh vực có nhiều ứng dụng trong thực tế, góp phần vào sự lớn mạnh của ngành Công nghệ thông tin
- Việc xử lý nhiễu và hiệu chỉnh ảnh sau khi đã qua các thiết bị vào như máy scan về định dạng mẫu ban đầu là việc rất cần thiết, hưu ích trong đời sống hàng ngày trong việc ứng dụng Công nghệ thông tin
- Ở nước ta trong vài năm gần đây, Bộ Giáo dục và Đào tạo đã ứng dụng hình thức thi trắc nghiệm vào thi Đại học, Cao đẳng làm giảm bớt thời gian chấm thi một cách đáng kể Việc chấm thi đã được xử lý qua máy tính, không cần phải giáo viên hoặc các chuyên gia trong lĩnh vực có mặt trực tiếp chấm thi như trước đây Việc chấm các bài thi trắc nghiệm có thể được thực hiện thông qua giải pháp sử dụng các hệ thống máy chấm thi tự động Người dùng chỉ cần đưa các phiếu trả lời câu hỏi trắc nghiệm vào máy quét chuyên dụng,
và hệ thống sẽ tự động thực hiện tất cả các công việc xử lý như số hóa phiếu trả lời, so khớp đáp án và trả lại kết quả Tuy nhiên, những hệ thống này thường có chi phí lớn, mặc dù cho tốc độ xử lý cao nhưng độ chính xác lại không cao, dẫn đến việc phải chấm lại các bài thi gây tốn kém cả về thời gian
và tiền bạc
- Tại Trường Cao đẳng Công nghiệp và Xây dựng – Quảng Ninh các bài thi trắc nghiệm sau khi sử dụng máy quét scan thi được các file ảnh với chất lượng hình ảnh không cao Nên việc xử lý nhiễu và hiệu chỉnh ảnh là rất cần thiết
- Xuất phát từ những lý do trên, tôi chọn đề tài “Nghiên cứu kỹ thuật xử
lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm”, nhằm trợ giúp cho việc xử lý bài thi, chấm bài thi trắc nghiệm có độ chính xác cao, đảm bảo thời gian xử lý
- Nội dung luận văn không kể phần mở đầu, kết luận, tài liệu tham khảo
Trang 11Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
bao gồm 3 chương:
Chương 1 Khái quát về xử lý nhiễu và hiệu chỉnh ảnh: Chương này
nêu lên quá trình xử lý nhiễu và hiệu chỉnh ảnh nói chung Từ đó xây dựng được sơ đồ tổng quát của hệ thống xử lý nhiễu, hiệu chỉnh ảnh áp dụng cho phiếu thi trắc nghiệm Qua đó xây dựng tổng quát các bước thực hiện quá trình
xử lý nhiễu và hiệu chỉnh ảnh Chương này cũng nêu lên được các khái niệm liên quan đến ảnh của phiếu thi trắc nghiệm được biến đổi qua quá trình xử lý
Chương 2 Một số kỹ thuật xử lý nhiễu và hiệu chỉnh ảnh: Chương này
nêu lên được các phép toán, thuật toán áp dụng cho quá trình xử lý nhiễu cũng như hiệu chỉnh ảnh ứng dụng cho phiếu thi trắc nghiệm Toàn bộ chương tập trung làm rõ các khái niệm về: phép co nhị phân, phép giãn nhị phân, phép đóng ảnh, phép mở ảnh, phép trúng hoặc trượt, phép trích biên, phép làm đầy,…
Chương 3 Chương trình thực nghiệm: Chương này nêu rõ các ứng dụng
của phép toán, thuật toán xử lý nhiễu cũng như hiệu chỉnh ảnh ứng dụng cho phiếu thi trắc nghiệm Trên cơ sở lý thuyết đã tìm hiểu em xây dựng được chương trình thực nghiệm
Trang 12Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Chương 1 KHÁI QUÁT VỀ XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH
Trong ngành khoa học máy tính, xử lý ảnh là một dạng của xử lý tín hiệu cho đầu vào là một ảnh hoặc các frame của phim ảnh Đầu ra có thể là một hình ảnh, hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh Thường thì kỹ thuật xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều và được áp dụng bằng một chuẩn riêng về kỹ thuật xử lý ảnh cho nó Các khái niệm cơ bản để xử lý tín hiệu như, khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn,… Ngoài ra còn cần tới các công cụ toán học như đại số tuyến tính, thống kê Và một số kiến thức cần thiết như trí tuệ nhân tao, mạng nơron nhân tạo cũng được đề cập trong quá trình phân tích và xử lý ảnh
1.1 Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:
Thứ nhất: biến đổi ảnh và làm đẹp ảnh
Thứ hai: tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung của ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Trang 13Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể)
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, )
1.1.1 Xử lý ảnh là gì?
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy
Xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận
Trang 14Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Hình 1.1 Quá trình xử lý ảnh
1.1.2 Các giai đoạn chính trong xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Trước hết là quá trình thu nhận ảnh Ảnh có thể thu nhận qua camera Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device) Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, sách được quét qua scanner Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng hình ảnh Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải
Hình 1.2 Các giai đoạn chính trong xử lý ảnh
Hệ quyết định
Lưu trữ Lưu trữ
Trang 15Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
tăng cường và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên (Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc trưng (Feature Extraction),
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác Các giai đoạn chính của quá trình xử lý ảnh
có thể mô tả ở hình 1.2
Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng trong thực tiễn như:
hệ thông tin địa lý (GIS – Geographic Information System), quân sự, y học,…
1.2.1 Giới thiệu chung
Đầu vào của quá trình xử lý nhiễu, hiệu chỉnh ảnh là một ảnh gốc của phiếu thi trắc nghiệm thu được qua scanner, máy ảnh,… Ảnh ban đầu là một ảnh mầu, thường có chất lượng thấp do ảnh hưởng của nhiễu, bị nghiêng,
bị đứt nét do thí sinh khi tô không cẩn thận hoặc do thiết bị thu ảnh không tốt Quá trình xử lý nhiễu, hiệu chỉnh ảnh nhằm mục đích loại bỏ hay làm giảm tối thiểu các ảnh hưởng của môi trường bên ngoài lên ảnh thu nhận được Công đoạn này bao gồm các bước như lọc ảnh, khử nhiễu, quay ảnh, qua đó giảm bớt các biến dạng do quá trình quét ảnh gây ra và đưa ảnh về trang thái tốt nhất có thể
Đầu ra của quá trình xử lý nhiễu, hiệu chỉnh ảnh:
Trang 16Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
+ Một ảnh bài thi trắc nghiệm với chất lƣợng ảnh rõ, nét hơn rất nhiều
so với ảnh ban đầu
+ Trả về đƣợc kết quả thi của bài thi trắc nghiệm của thí sinh một cách chính xác, chấm điểm đúng với kết quả làm đƣợc của thí sinh
Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh:
Hình 1.3 Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh
1.2.2 Quá trình xử lý nhiễu và hiệu chỉnh ảnh
Sau khi thu đƣợc ảnh của phiếu thi trắc nghiệm thông qua máy camera hoặc scan,… ảnh sẽ đƣợc số hóa, sau đó thông qua quá trình xử lý nhiễu, hiệu chỉnh ảnh sẽ thu đƣợc:
- Ảnh bài thi trắc nghiễm đã đƣợc khử nhiễu với chất lƣợng ảnh tốt hơn
so vơi ảnh ban đầu giúp cho quá trình nhận dạng của hệ thống chấm thi thu đƣợc kết quả chính xác
- Đọc đƣợc kết quả bài thi, sau đó đối sánh với đáp án, đƣa ra kết quả chính xác đúng với nội dung của bài thi trắc nghiệm
Quá trình xử lý nhiễu và hiệu chỉnh ảnh đƣợc diễn ra qua các quá trình nhƣ sau:
XỬ LÝ NHIỄU, HIỆU CHỈNH HÌNH
ẢNH
Nhận dạng và chấm thi
Ảnh bài thi trắc nghiệm với chất lƣợng tốt hơn
Số hoá
Trang 17Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
+ Chuyển ảnh xám
+ Nhị phân hóa ảnh bằng phân ngưỡng
- N HậN DạNG FORM QUA CÁC ĐIểM Đị NH Vị
độ phân giải của ảnh
1.3.2 Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để
xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)
Trang 18Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
1.3.3 Mức xám (Gray Level)
Mức xám của điểm ảnh là kết quả sự biến đổi tương ứng một cường độ sáng của điểm ảnh đó với một giá trị số (kết quả của quá trình lượng hoá) Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28
= 256 (0, 1, , 255), nên với 256 mức mỗi pixel sẽ được mã hoá bởi 8 bit
1.3.4 Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor)
là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
1.3.5 Phân loại ảnh
Ảnh khi số hóa được chia làm 3 loại:
a, Ảnh nhị phân: Giá trị xám của tất các các điểm ảnh chỉ nhận giá trị 1
hoặc 0 Như vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bới 1 bit điểm đen được biểu trong ma trận là 0 và điểm sáng được biểu diễn là 1 Nhưng đôi khi để tiện cho quá trình cài đặt các thuật toán xử lý ảnh người ta
có thể quy định ngược lại là điểm đen là 1 và điểm trắng là 0
Trang 19Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Hình 1.4 Ví dụ về ảnh đen trắng
b, Ảnh xám: Giá trị xám nằm trong khoảng 0 255 Như vậy đối với ảnh
xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với 8 bit) như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám
Hình 1.5 Ví dụ ảnh xám
c, Ảnh màu: Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu
cơ bản: đỏ (R), lục (G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ
Trang 20Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần
24 bit 24 bit này được chia thành ba khoảng 8 bit Mỗi màu cũng phân thành
L cấp màu khác nhau (thường L=256) Mỗi khoảng này biểu diễn cho cường
độ sáng của một trong các màu chính
Mỗi pixel ảnh màu ký hiệu Px, được viết: (T: trong công thức dưới đây
- Chương này nêu lên quá trình xử lý nhiễu và hiệu chỉnh ảnh nói chung
- Xây dựng được sơ đồ tổng quát của hệ thống xử lý nhiễu, hiệu chỉnh ảnh
áp dụng cho phiếu thi trắc nghiệm
- Xây dựng tổng quát các bước thực hiện quá trình xử lý nhiễu và hiệu chỉnh ảnh
- Nêu lên các khái niệm liên quan đến ảnh của phiếu thi trắc nghiệm được biến đổi qua quá trình xử lý
- Từ đó là cở sở để hoàn thành chương tiếp theo của luận văn
Trang 21Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Chương 2 MỘT SỐ KỸ THUẬT XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH
2.1 Các kỹ thuật tiền xử lý
2.1.1 Giới thiệu chung
Giai đoạn tiền xử lý ảnh là giai đoạn quan trọng, có ảnh hưởng trực tiếp đến độ chính xác của quá trình xử lỹ nhiễu và hiệu chỉnh ảnh, tuy nhiên nó cũng làm tăng thời gian xử lý chung của toàn bộ hệ thống Vì vậy, tùy theo chất lượng ảnh thu nhận được của từng trường hợp cụ thể, mà chúng ta chọn
sử dụng một hoặc một số thủ tục tiền xử lý Thậm chí, trong trường hợp ảnh đầu vào có chất lượng tốt và cần ưu tiên tốc độ xử lý, chúng ta có thể bỏ qua giai đoạn tiền xử lý này
Đầu vào của quá trình xử lý ảnh là các ảnh gốc ban đầu, thu được qua scanner Ảnh ban đầu thường có chất lượng thấp do ảnh hưởng của nhiễu, bị nghiêng, bị đứt nét nên chúng ta cần phải có một quá trình tiền xử lý ảnh để nâng cao chất lượng ảnh đầu vào trước khi đưa vào nhận dạng Quá trình này bao gồm công đoạn khôi phục ảnh và tăng cường ảnh
Khôi phục ảnh nhằm mục đích loại bỏ hay làm giảm tối thiểu các ảnh hưởng của môi trường bên ngoài lên ảnh thu nhận được Công đoạn khôi phục ảnh bao gồm các bước như lọc ảnh, khử nhiễu, quay ảnh, qua đó giảm bớt các biến dạng do quá trình quét ảnh gây ra và đưa ảnh về trang thái gần như ban đầu
Tăng cường ảnh là một công đoạn quan trọng, tạo tiền đề cho xử lý ảnh Tăng cường ảnh không phải làm tăng lượng thông tin trong ảnh mà là làm nổi bật những đặc trưng của ảnh giúp cho công việc xử lý phía sau được hiệu quả hơn Công đoạn này bao gồm các công việc như lọc độ tương
Trang 22Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
phản, làm trơn ảnh, nhị phân hóa
2.1.2 Tăng, giảm độ sáng
Tăng cường độ sáng (Brightness) của một ảnh có thể được hiểu như sự phát sáng toàn bộ ảnh Hay nói một cách cụ thể đó là sự phát sáng toàn bộ của mọi Pixel trong ảnh đó
Đây là một kỹ thuật khá đơn giản: để tăng thêm độ sáng, tất cả các Pixel của ảnh cần được cộng thêm giá trị điều chỉnh vào mọi kênh màu RGB Tuy
kỹ thuật này đơn giản nhưng nó đem lại hiệu quả khá cao và rất hay được sử dụng trong lĩnh vực xử lý ảnh Nó giúp ích rất nhiều trong các ngành như y học, địa lý, quân sự, trong việc phân tích và nhận dạng
Ở đây điều chỉnh Brightness không chỉ được sử dụng để làm sáng lên những ảnh tối mà còn được sử dụng để làm tối đi các ảnh sáng Một ảnh sáng hoàn toàn đơn giản là tất cả các Pixel đều màu trắng trong khi một ảnh tối hoàn toàn là tất cả các Pixel đều màu tối Sự khác nhau duy nhất trong làm tối một ảnh là trừ đi giá trị điều chỉnh vào mỗi kênh màu RGB của ảnh
Đối với mỗi kênh màu, chúng chỉ nhận các giá trị [0 255] Chính vì thế khi tăng cường hay giảm độ sáng của một ảnh ta phải chú ý đến ngưỡng của các kênh Điều đó có nghĩa là với mỗi kênh màu của một Pixel nếu nhỏ hơn 0 thì ta phải gán bằng 0 và nếu lớn hơn 255 thì ta phải gán bằng 255
Biểu thức cho kỹ thuật Brightness có dạng:
g(x,y) = f(x,y) + b
Trong đó b là hằng số cộng thêm vào giá trị màu f(x,y) Độ sáng của ảnh tăng nếu b > 0, và giảm bớt nếu b < 0
2.1.3 Tăng, giảm độ tương phản
Độ tương phản (Contrast) thể hiện sự thay đổi cường độ sáng của đối tượng so với nền, hay nói cách khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền
Trang 23Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau
Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau Vì vậy ta có thể thay đổi độ tương phản của ảnh sao cho phù hợp
Việc làm tăng độ tương phản rất hữu ích khi tiến hành xử lý trước theo phương pháp phân ngưỡng Bằng việc làm tăng độ tương phản, sự khác nhau của giá trị nền và đối tượng, độ dốc của cạnh đối tượng được tăng lên Do đó sau khi làm tăng độ tương phản ta có thể tìm các giá trị màu thích hợp với một vùng sáng hơn
Trong một ảnh có độ tương phản cao, có thể xác định được các viền rõ ràng và chi tiết khác nhau của ảnh đó được nổi bật Còn trong một ảnh có độ tương phản thấp, tất cả các màu đều gần như nhau gây khó khăn cho việc xác định các chi tiết của ảnh
Biểu thức cho kỹ thuật Contrast có dạng:
đỏ làm nổi lên các vùng thông tin cần thiết vì nếu dùng cùng một màu để in,
có thể các vùng này sẽ ảnh hưởng đến các vùng thông tin làm bài của thí sinh, gây khó khăn trong quá trình xứ lý nhiễu và nhận dạng hoặc có thể dẫn đến
Trang 24Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
nhận nhầm Tuy nhiên việc sử dụng ảnh màu để xử lý cũng yêu cần một điều kiện hết sức cần thiết là chất lượng màu in và chất lượng của máy quét phải tốt và đồng đều để thu được ảnh quét với chất lượng như mong muốn
Ảnh đầu vào sau khi thu nhận về máy tính sẽ được thực hiện tách lấy kênh màu đỏ để khi trải qua quá trình phân ngưỡng thì các vùng thông tin được in màu đỏ sẽ trở thành màu nền Khi đó các ô được tô sẽ có màu đen nổi bật lên, giúp cho quá trình nhận dạng được thuận tiện
2.1.5 Chuyển ảnh xám
Đơn vị tế bào của ảnh số là pixel Tùy theo mỗi định dạng là ảnh màu hay ảnh xám mà từng pixel có thông số khác nhau Đối với ảnh màu từng pixel
sẽ mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh
lá cây (G) và Xanh nước biển (B) [Thomas 1892] Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B được bố trí sát nhau và có cường độ sáng khác nhau Thông thường, mỗi màu cơ bản được biểu diễn bằng 8 bit tương ứng
256 mức độ màu khác nhau, hay nói cách khác chúng ta sẽ có màu (khoảng 16.78 triệu màu) Đối với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với 8 bit) như vậy ảnh xám hoàn toàn
có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám
Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu trúc của ảnh và bỏ qua ảnh hưởng của yếu tố màu sắc Do đó bước chuyển từ ảnh màu thành ảnh xám là một công đoạn phổ biến trong các quá trình xử lý ảnh vì nó làm tăng tốc độ xử lý và mức độ phức tạp của các thuật toán áp dụng trên ảnh xám giảm hơn so với các thuật toán áp dụng trên ảnh màu
Chúng ta có công thức chuyển các thông số giá trị màu của một pixel thành mức xám tương ứng như sau:
G = CR + CG + CB
Trang 25Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Trong đó các giá trị CR, CG và CB lần lượt là các mức độ màu đỏ, xanh lá cây và xanh nước biển của pixel màu, + +
Hình 2.1 Ảnh trước khi chuyển xám
Hình 2.2 Ảnh đã thực hiện chuyển xám
2.1.6 Nhị phân hóa ảnh bằng phân ngưỡng
Quá trình phân ngưỡng là quá trình tìm ra ngưỡng của một ảnh để thực hiện việc phân vùng Ngưỡng đóng vai trò quyết định quá trình nhị phân hóa ảnh số có hiệu quả hay không Nếu chọn ngưỡng không tốt, một số đối tượng
sẽ bị bỏ qua hoặc cho ra đối tượng với kích thước và vị trí không đúng hoặc làm cho các đối tượng không phân biệt được với nhau
Có nhiều thuật toán tìm ngưỡng khác nhau cho ra các kết quả khác nhau, trong đó điển hình là tìm ngưỡng trung bình và tìm ngưỡng theo Histogram
Trang 26Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Với thuật toán tìm ngưỡng trung bình, ngưỡng được tính theo công thức:
Trong đó, n.m là kích thước ảnh Itb, Ing, ∆ tương ứng là mức xám trung bình, giá trị ngưỡng và số gia hiệu chỉnh
Tìm ngưỡng theo histogram là phương pháp tìm ngưỡng dựa theo lược đồ xám
Ngưỡng tìm được theo công thức I ng = (I max1 + I max2 )/2 Trong đó, I max1 và
I max2 là hai mức xám tương ứng cực đại trên histogram
Ngoài ra, còn một số kỹ thuật tìm ngưỡng khác, như thuật toán lặp, thuật toán tam giác được mô tả dưới đây:
- Thuật toán lặp (Ridler and Calvard) [9] Sử dụng ngưỡng ban đầu 0 =
2B-1 đểchia histogram thành hai phần Ký hiệu (mf,0) là giá trị trung bình của
các mức xám ở phần trước và (mb,0) là giá trị trung bình của các mức xám ở phần sau Giá trị ngưỡng mới 1 được tính bằng trung bình cộng của (mf,0) và
(mb,0) Thủ tục này được lặp cho đến khi nào ngưỡng không thay đổi, nghĩa là
ở bước k nào đó k = k-1
Trang 27Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
- Thuật toán tam giác (Zack) [9] Đoạn thẳng nối điểm cao nhất trên
histogram b max với điểm thấp nhất bên trái b min = (p=0)% Khoảng cách lớn
nhất d giữa đoạn thẳng [bmax, bmin] và giá trị histogram h[b] với b thay đổi trong khoảng b = b min đến b = b max Mức xám b o mà khoảng cách từ h[b o] đến đoạn thẳng [bmax, bmin] đƣợc coi là ngƣỡng, nghĩa là := b o
Hình 2.3 Chọn ngưỡng theo Zack
Trong ví dụ trên b0= 152, nhƣ vậy = 152
Giá trị cụ thể của ngƣỡng phụ thuộc vào từng ảnh, vùng ảnh đầu vào đang xét và không thể lấy cố định Ví dụ nhƣ trên hình 2.4, hình a) là ảnh ban đầu, hình b, c, d thể hiện ảnh đã đƣợc nhị phân hóa với cùng ngƣỡng thấp, trung bình và ngƣỡng cao
Chúng ta có thể thấy là giá trị ngƣỡng trong hình 2.4c là thích hợp hơn cả
a) ảnh gốc ban đầu b) Ngƣỡng thấp (90)
c ) Ngƣỡng trung bình (128) d ) Ngƣỡng cao (225)
Trang 28Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Hình 2.4 Phương pháp lấy ngưỡng
Người ta đã đề xuất nhiều phương pháp để xác định giá trị ngưỡng Một phương pháp là thiết lập ngưỡng sao cho số lượng các điểm đen đạt một ngưỡng chấp nhận được theo phân phối xác suất mức xám Ví dụ, chúng ta có thể biết rằng các ô được tô chiếm 10% diện tích của một ảnh phiếu thi thông thường Vì thế chúng ta có thể thiết lập ngưỡng sao cho số lượng điểm đen còn lại chiếm 1/10 diện tích ảnh Một cách tiếp cận khác là chọn ngưỡng nằm ở vị trí thấp nhất trên biểu đồ histogram giữa hai đỉnh của nó Tuy nhiên việc xác định vị trí này thường rất khó khăn do hình dạng của histogram thường lởm chởm Một giải pháp để giải quyết vấn đề này là xấp xỉ giá trị của histogram giữa hai đỉnh với một hàm giải tích và sử dụng vi phân để xác định điểm thấp nhất Ví dụ, coi x và y lần lượt là hoành độ và tung độ trên histogram Chúng ta
Một phương pháp rất hay được sử dụng là sử dụng thuật toán dựa vào số liệu thống kê SIS (Simple Image Statistics) cũng đạt hiệu quả khá tốt trong thực nghiệm Thuật toán SIS được mô tả như sau:
- Với mỗi điểm ảnh I(x, y) ta tính như sau:
Trang 29Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
ex = |I(x + 1, y) - I(x - 1, y)|
ey = |I(x, y + 1) - I(x, y - 1)|
weight = Max (ex, ey)
- Gọi Total weight là tổng các giá trị weight được tính
- Giá trị phân ngưỡng T sẽ là (Total/ Total weight)
Hình 2.5 Phân ngưỡng theo thuật toán SIS
2.2 Kỹ thuật nhận dạng form
2.2.1 Đặt vấn đề
Form là các mẫu biểu được xác định về kích thước, vị trí và có cấu trúc
cụ thể Việc nhận dạng các mẫu biểu này có thể được thực hiện thông qua kỹ
Trang 30Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
thuật nhận dạng dấu quang học (Optical Mark Recognition – OMR) Đây là tiến trình thu nhận bằng máy tính các dữ liệu được đánh dấu bởi con người từ những mẫu tài liệu như phiếu thăm dò hoặc phiếu thi Trong đó các dấu được xây dựng sao cho việc xử lý ảnh thu nhận về một cách dễ dàng nhất
Một trong những ứng dụng quen thuộc nhất của nhận dạng các điểm đánh dấu chính là việc sử dụng bút chì 2B để đánh dấu các câu trả lời trong bài thi trắc nghiệm Trong đó học sinh đánh dấu câu trả lời của họ và các thông tin liên quan bằng cách tô đen các đường tròn được đánh dấu trên các tờ thi đã in trước Sau đó các bài thi sẽ được quét thành ảnh làm đầu vào để chương trình nhận dạng ảnh tìm ra các vị trí đã được đánh dấu
Nhận dạng điểm tô là quá trình quét biểu mẫu để phát hiện sự có mặt hoặc vắng mặt của một dấu hiệu đánh dấu trên một vị trí được xác định trước Nhận dạng điểm tô được phát triển từ nhiều công nghệ khác nhau Ứng dụng của nhận dạng điểm tô đã được triển khai rất rộng rãi trong một số ngành như: bưu chính, xổ số, giáo dục, hải quan,…
Hiện nay, nhận dạng điểm tô đã và đang phát triển rất mạnh mẽ, sử dụng chủ yếu công nghệ xử lý ảnh số bằng phần mềm trên máy tính với thiết bị thu nhận ảnh là máy quét Một hệ thống nhận dạng bao gồm hệ thống phần cứng là máy quét kết nối với máy tính để thu nhận ảnh Trên máy tính có hệ thống phần mềm tương tác với các tệp ảnh thu nhận được, xử dụng công nghệ xử lý ảnh số Việc này đem lại thuận lợi rất lớn, ta chỉ cần nghiên cứu phát triển hệ thống phần mềm và các mẫu phiếu biểu, mẫu phiếu thi, còn hệ thống phần cứng được giữ nguyên, không thay đổi, tiết kiệm được chi phí đầu tư Mục đích của luận văn là tìm hiểu về phương pháp, thuật toán về xử lý ảnh và xây dựng một ứng
dụng “xử lý nhiễu và hiệu chỉnh ảnh nhị phân ứng dụng cho bài thi trắc
Trang 31Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
nghiệm” nhằm trợ giúp cho quá trình chấm thi trắc nghiệm trong các kỳ thi tốt
nghiệp hay tuyển sinh Đại học, Cao đẳng được nhanh chóng, chính xác hơn
2.2.2 Nhận dạng các điểm định vị
Các điểm định vị trong ảnh thường được sử dụng để làm cơ sở xác định xem liệu một ảnh có bị nghiêng hay không Ngoài ra, do Form là mẫu biểu đã được xác định cụ thể về kích thước cũng như vị trí, cấu trúc của các vùng trong ảnh, nên các điểm định vị còn được sử dụng để làm mốc xác định vị trí tương đối so với các vùng ảnh cần cắt Chính vì vậy, việc xác định các điểm định vị trong ảnh mẫu phiếu trả lời câu hỏi trắc nghiệm là cần thiết
Với ảnh phiếu trả lời câu hỏi trắc nghiệm, các điểm định vị được thiết kế nằm ở 4 góc ngoài cùng bên trong vùng phiếu thi như trong hình 2.6
Hình 2.6 Các điểm định vị trong phiếu trả lời câu hỏi trắc nghiệm
Do quá trình quét phiếu trả lời qua máy quét có thể tạo nên các vùng nhiễu xung quanh hai bên mép của ảnh, nên để xác định các điểm định vị này,
ta có thể thực hiện bằng cách như sau:
Trang 32Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Thuật toán xác định góc trái trên:
Với độ phân giải của ảnh đầu vào sau khi quét là cố định, ta chọn một
điểm I có tọa độ (x_start, y_start) là điểm bắt đầu và thực hiện dò trong góc
phần tư thứ nhất của vùng ảnh Tùy theo từng độ phân giải của ảnh mà chọn
được một điểm I với hai giá trị x_start và y_start phù hợp Trong chương trình thử nghiệm của luận văn, hai giá trị x_start và y_start cùng có giá trị là
Trang 33Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Việc xác định các điểm định vị còn lại cũng được thực hiện tương tự như trên
2.3 Một số thuật toán xử lý nhiễu
2.3.1 Căn chỉnh độ lệnh trang
Thực ra đây là phương pháp chuyển đổi các Pixel trong ảnh Do không làm thay đổi trị màu trong ảnh nên có thể thực hiện phương pháp này trên ảnh màu cũng như trên ảnh xám
Một ảnh được xem như là một mảng hai chiều, chuyển đổi lại vị trí các Pixel là sắp xếp lại mảng này Khi quay thì sự chia thang giữ nguyên chỉ có hướng trục thay đổi Còn trục mới xuất hiện bằng cách quay trục cũ đi một góc θ ngược chiều kim đồng hồ, khi đó tọa độ mới được theo theo công thức:
x’ = xcosθ - y.sinθ y’ = x.sinθ + y.cosθ
Với T là ma trận quay:
cossin
sincos
T
Như vậy, ảnh có kích thước I[w*h] Khi quay một góc θ thì kích thước mới sẽ được tính như sau:
w_moi= h_cu * |Sin(θ)| + w_cu *| Cos(θ)|;
h_moi = w_cu * |Sin(θ)| + h_cu * |Cos(θ)|;
Trang 34Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
x1(0,0)
x2(w,0)
W X4
Hình 2.7 Hệ tọa độ khi xoay ảnh
2.3.2 Phân vùng ô cần tô
Phân vùng ảnh là bước quan trọng của xử lý ảnh, giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên
hay các vùng liên thông
Vùng ảnh là một chi tiết, thực thể trong toàn cảnh, vùng ảnh nói lên tính chất bề mặt của ảnh, vùng ảnh được bao quanh bởi một biên, các điểm trong vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều Dựa vào đặc tính vật lý của vùng ảnh mà ta xác định nhiều kỹ thuật phân vùng
Phân vùng dựa vào đường biên: việc phân đoạn ảnh dựa vào biên được tiến hành qua một số bước:
Phát hiện và làm nổi biên
Làm mảnh biên
Nhị phân hóa đường biên
Mô tả biên
Phát hiện và làm nổi biên: Điểm biên là điểm ở đó có sự thay đổi đột ngột về
mức xám Tập hợp các điểm biên tạo thành biên của một đối tượng ảnh.Trước khi tìm biên, ảnh phải được loại bỏ nhiễu, biên cho phép xác định các thông tin vùng,