1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống chấm điểm thi trắc nghiệm sử dụng camera

85 532 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 85
Dung lượng 2,84 MB

Nội dung

Mục tiêu và nội dung thực hiện của đề tài Với những hạn chế của các loại máy chấm trắc nghiệm trên, mục tiêu của đề tài “Xây dựng hệ thống chấm điểm thi trắc nghiệm sử dụng camera” là đ

Trang 1

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi

Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ công trình nào khác

Tác giả

Tống Thị Lan

Trang 2

LỜI CẢM ƠN

Lời đầu tiên tôi xin được gửi lời cảm ơn tới PGS.TS Nguyễn Tiến Dũng – giáo viên định hướng và hướng dẫn đề tài Sự hướng dẫn trong quá trình tiếp cận đề tài, tài liệu tham khảo cũng như quá trình hoàn thành luận văn

Tôi xin gửi lời cảm ơn tới các bạn, các đồng nghiệp đã giúp đỡ tôi trong quá trình hoàn thành chương trình phần mềm

Tôi xin bày tỏ lòng biết ơn tới Ban Giám Hiệu trường Đại Học Thái Bình cùng các thầy, cô giáo trong Khoa - nơi tôi công tác đã tạo điều kiện cho tôi theo khóa học và hoàn thành chương trình phần mềm chấm thi trắc nghiệm sử dụng camera

Cuối cùng tôi xin bày tỏ lòng biết ơn tới gia đình, thầy cô giáo đã ủng hộ và động viên tôi trong suốt quá trình hoàn thành luận văn

Tác giả

Tống Thị Lan

Trang 3

MỤC LỤC

LỜI CẢM ƠN 2

MỤC LỤC……… 3

DANH SÁCH HÌNH VẼ 6

MỤC LỤC CÁC BẢNG BIỂU 7

DANH MỤC TỪ VIẾT TẮT 8

PHẦN MỞ ĐẦU 9

1 Tính cấp thiết của đề tài 9

2 Mục tiêu và nội dung thực hiện của đề tài 10

3 Kết quả đạt được 11

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG CHẤM ĐIỂM 12

THI TRẮC NGHIỆM 12

1.1 Giới thiệu hệ thống 12

1.2 Những hệ thống chấm thi hiện tại 12

1.2.1 Máy OMR 12

1.2.2 Phần mềm OMR 13

1.3 Mô tả hệ thống 13

1.3.1 Yêu cầu đặt ra 13

1.3.2 Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm 14

1.3.3 Cơ chế làm việc 15

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 16

2.1 Những khái niệm cơ bản về ảnh số 16

2.1.1 Pixel 16

2.1.2 Độ xám 16

2.1.3 Cấu trúc ảnh 17

2.1.4 Nhiễu ảnh 18

2.2 Những kỹ thuật xử lý ảnh cơ bản 19

2.2.1 Thiết bị thu nhận ảnh 19

2.2.2 Lấy mẫu và lượng tử hóa (Image Sampling and quantization) 20

Trang 4

2.2.3 Xứ lý và nâng cao chất lượng ảnh 25

2.2.4 Khôi phục ảnh 30

2.2.5 Lấy ngưỡng 30

2.3 Các kỹ thuật xử lý ảnh 31

2.3.1 Khái niệm về góc nghiêng 31

2.3.2 Thuật toán Otsu 31

2.3.3 Phương pháp phát hiện biên cục bộ Gradient 33

2.3.4 Thuật toán Harris 38

2.3.5 Thuật toán xoay ảnh 41

CHƯƠNG 3 PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG CHẤM ĐIỂM 45

THI TRẮC NGHIỆM SỬ DỤNG CAMERA 45

3.1 Phân tích hệ thống 45

3.1.1 Thuật toán nhận dạng phiếu thi 45

3.1.2 Tìm vùng chứa thông tin trên phiếu thi 47

3.1.3 Nhận dạng thông tin 50

3.2 Phần mềm chấm thi trắc nghiệm 52

3.3 Giới thiệu về thư viện mã nguồn mở OpenCV 53

CHƯƠNG 4: KẾT QUẢ ĐẠT ĐƯỢC VÀ ĐÁNH GIÁ 55

4.1 Mục đích và yêu cầu đề ra 55

4.2 Kỹ thuật hiệu chỉnh góc nghiêng và chuẩn hóa kích thước ảnh 55

4.2.1 Hàm lấy ngưỡng OTSU 55

4.2.2 Hàm xác định 4 góc: 56

4.2.3 Hàm xác định góc nghiêng 57

4.2.4 Hàm xoay ảnh 58

4.2.5 Hàm chuẩn hóa kích thước ảnh 60

4.3 Kỹ thuật định vị và nhận dạng thông tin trên phiếu trả lời trắc nghiệm 60

4.3.1 Hàm chuyển dữ liệu ảnh sang mảng hai chiều 60

4.3.2 Hàm đánh nhãn cho các đối tượng thông tin 61

Trang 5

4.3.4 Hàm xác định số báo danh 62

4.3.5 Hàm xác định mã đề 62

4.3.6 Hàm xác định phần trả lời của thí sinh 62

4.4 Xây dựng phần mềm chấm thi trắc nghiệm 63

4.4.1 Quản lý kỳ thi 64

4.4.2 Chấm điểm từ file 66

4.4.3 Chấm điểm từ camera 68

4.5 Kết quả của thuật toán 69

4.5.1 Dữ liệu ảnh đầu vào 69

4.5.2 Kết quả xây dựng thuật toán 72

4.5.3 Kết quả của thuật toán chấm thi trắc nghiệm đã đề xuất 80

4.6 Đánh giá kết quả 81

KẾT LUẬN VÀ KIẾN NGHỊ 83

TÀI LIỆU THAM KHẢO 85

Trang 6

DANH SÁCH HÌNH VẼ

Hình 1 1: Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm 14

Hình 2 3: Quá trình lượng tử hóa 23

Hình 2 4: Khuông lượng tử theo L mức xám 24

Hình 2 5: Lấy mẫu và lượng tử hóa 24

Hình 2 6: Kéo dãn độ tương phản 26

Hình 2 7: Tách nhiễu và phân ngưỡng 27

Hình 2 8: Lấy ngưỡng 30

Hình 2 9: Mặt nạ 8 hướng theo Kirsh 36

Hình 2 10: Hình ảnh trước và sau bộ tách biên Canny 38

Hình 2 11: Vùng giá trị trị riêng 40

Hình 2 12: Thuật toán xoay ảnh 41

Hình 2 13: Chuyển dịch tọa độ 42

Hình 2 14: Kết quả xoay ảnh Ánh xạ ngược (A) và Ánh xạ xuôi (B) 44

Hình 3 2: Thực hiện phép biến đổi phối cảnh để chuẩn hóa phiếu thi 47

Hình 3 4: Đặc điểm của các vùng chứa thông tin trên phiếu thi 49

Hình 3 6: Xác định nội dung thông tin vùng số báo danh và mã đề 51

Hình 3 7: Xác định nội dung thông tin vùng trả lời 52

Hình 3 8: Tổ chức thư viện OpenCV 53

Hình 4 1: Lưu đồ thuật toán xác định góc 56

Hình 4 2: Lưu đồ thuật toán xác định góc nghiêng 57

Hình 4 3: Lưu đồ thuật toán xoay ảnh 59

Hình 4 4: Sơ đồ khối thực hiện định vị và nhận dạng thông tin 60

Hình 4 5: Giao diện chính của chương trình 63

Hình 4 6: Giao diện module quản lý kỳ thi 64

Hình 4 7: Các chức năng thêm, sửa, xóa kỳ thi 64

Hình 4 8: Các chức năng thêm, sửa, xóa môn thi 64

Hình 4 9: Chức năng thêm đề thi 65

Trang 7

Hình 4 10: Chức năng sửa đề thi - đáp án 65

Hình 4 11: Giao diện module “Chấm điểm từ file” 66

Hình 4 12: Cấu trúc file excel 67

Hình 4 13: Ứng dụng IP Webcam 68

Hình 4 14: Giao diện module chấm điểm trực tiếp từ camera 69

Hình 4 15: Mẫu không nhận dạng đƣợc vùng phiếu thi 73

Hình 4 16: Ảnh gốc và ảnh nhị phân 73

Hình 4 17: Biên và 4 góc của phiếu thi 74

Hình 4 18: Ảnh đầu ra của thuật tìm phiếu thi 74

Hình 4 19: Ảnh phiếu thi sau khi chuyển mức xám và lọc nhiễu 75

Hình 4 20: Ảnh phiếu thi sau khi tăng độ sáng 75

Hình 4 21: Ảnh phiếu thi sau khi thực hiện phép mở 76

Hình 4 22: Các vùng chứa thông tin trên phiếu thi 76

Hình 4 23: Vùng số báo danh và vùng mã đề 77

Hình 4 24: Các vùng trả lời 77

Hình 4 25: Kết quả nhận dạng thông tin vùng số báo danh 78

Hình 4 26: Kết quả nhận dạng thông tin vùng mã đề 78

Hình 4 27: Kết quả nhận dạng thông tin vùng trả lời 79

Hình 4 28: Kết quả chấm thi trên các mẫu đã chuẩn bị 80

MỤC LỤC CÁC BẢNG BIỂU Bảng 4 1: Dữ liệu bài thi 70

Trang 8

DANH MỤC TỪ VIẾT TẮT

ORM Optical Mark Recognition (OMR) Machine

PTLTN Phiếu trả lời trắc nghiệm

CSDL Cơ sở dữ liệu

Trang 9

PHẦN MỞ ĐẦU

1 Tính cấp thiết của đề tài

Phương pháp thi trắc nghiệm từ lâu đã được các nước có nền giáo dục phát triển sử dụng nhằm đánh giá năng lực của học sinh Với những ưu điểm nổi bật của việc thi trắc nghiệm là đánh giá kiến thức một cách toàn diện nhất, tránh việc học tủ học lệch cũng như các vấn đề gian lận trong kỳ thi Do bài thi trắc nghiệm có các đáp án cố định nên giúp việc chấm thi trở nên khách quan, trung thực hơn, kết quả bài thi sẽ không phụ thuộc vào yếu tố mang tính chất chủ quan của người chấm Các máy chấm thi trắc nghiệm cũng được thiết kế để phục vụ công tác chấm thi Việc chấm thi bằng máy sẽ cho kết quả nhanh, chính xác đồng thời cũng giảm áp lực cho con người vì khi chấm bài thi trắc nghiệm bằng tay sẽ rất nhàm chán

Máy chấm thi trắc nghiệm chuyên dụng, hay còn gọi là Optical Mark Recognition (OMR) Machine là một loại máy được thiết kế ra để chấm điểm thi trắc nghiệm một cách nhanh và chính xác Máy OMR thường được sử dụng để đánh giá kết quả thi thông qua hình thức trắc nghiệm với số lượng lớn

Phương thức mà máy OMR dùng để nhận dạng và quyết định vị trí lựa chọn của sinh viên trong phiếu thi: Máy OMR sử dụng hàng loạt sensor để nhận dạng dấu tích của sinh viên – ô tròn được quy định tô bằng bút chì 2B (trở lên) Loại giấy mà máy này sử dụng cũng hoàn toàn là một loại giấy „transoptic‟ đặc biệt tương thích với việc sử dụng sensor để nhận dạng

Tính ổn định và độ chính xác cao của hệ thống làm cho máy OMR có được độ tin cậy cao và thường được sử dụng ở những tổ chức giáo dục và đánh giá lớn Nhưng những tính năng này cũng tạo nên giá thành cao của hệ thống và cản trở việc phổ biến máy OMR trên thị trường Không những giá thành của chúng rất đắt mà chi phí vận hành phải đi đôi với việc tiêu thụ rất nhiều giấy chuyên dụng Do đó, những tổ chức giáo dục vừa và nhỏ, những trường học muốn tổ chức những kỳ thi trắc nghiệm riêng của họ để tiến hành đánh giá học sinh, sinh viên định kỳ lại không

đủ chi phí mua cũng như duy trì những chiếc máy như thế này Chính vì những lý

do như thế này mà em đã chọn đề tài “Xây dựng hệ thống chấm điểm thi trắc

Trang 10

nghiệm sử dụng camera” với yêu cầu đặt ra là cấu trúc phần cứng nhỏ gọn, xử lý

nhanh, chi phí thấp mà vẫn có khả năng đạt được hiệu quả như mong muốn Hệ thống này phải có khả năng ứng dụng cao trong các kỳ thi ở mọi cấp bậc, kỳ thi tuyển sinh đại học, các kỳ thi tiếng Anh quốc tế, giảm thiểu đáng kể những chi phí không cần thiết cho việc chấm thi thủ công hoặc sử dụng những thiết bị được nhập

về như hiện nay

2 Mục tiêu và nội dung thực hiện của đề tài

Với những hạn chế của các loại máy chấm trắc nghiệm trên, mục tiêu của đề

tài “Xây dựng hệ thống chấm điểm thi trắc nghiệm sử dụng camera” là đề xuất

xây dựng hệ thống chấm điểm trắc nghiệm khắc phục được những hạn mà một số phần mềm đã có trên thị trường chưa giải quyết được như:

- Tốc độ lấy mẫu thông qua máy tời giấy nhanh, tính tự động cao, giá thành rẻ

- Thuật toán xử lý, nhận dạng nội dung phiếu thi phải nhanh, đảm bảo được độ chính xác, tin cậy cao Thuật toán này phải nhận dạng được cả các phiếu thi in trên các loại giấy thông dụng, yêu cầu về độ chính xác khi in ấn không cần quá cao

Do hạn chế về mặt thời gian nên đề tài tập trung giải quyết các vấn đề sau:

- Thực hiện giao tiếp giữa máy tính và camera, hiển thị hình ảnh ghi được từ camera lên máy tính

- Nghiên cứu, đề xuất hệ thống, thuật toán nhận dạng vùng ảnh và xử lý thông tin của phiếu thi

- Thiết kế, xây dựng dữ liệu quản lý tham số bài thi phục vụ công tác chuẩn bị trước khi chấm thi và lưu trữ thông tin sau khi chấm thi

Dựa trên các nội dung đó, luận văn này được chia thành 4 chương với các nội dụng chính như sau:

- Chương 1: Tổng quan về hệ thống chấm điểm thi trắc nghiệm

- Chương 2: Cơ sở lý thuyết

- Chương 3: Phân tích và thiết kế hệ thống chấm điểm thi trắc nghiệm sử dụng camera

Trang 11

3 Kết quả đạt được

Bằng phương pháp thực nghiệm, phần mềm chấm điểm thi trắc nghiệm sử dụng camera đã hoàn thành và đáp ứng các các yêu cầu đặt ra:

Module quản lý kỳ thi nhỏ, gọn, trực quan

Hiển thị hình ảnh từ camera và chấm điểm

Chấm điểm với nhiều file ảnh phiếu thi chụp từ trước

Thực nghiệm cho thấy thuật toán đã đề ra đạt độ chính xác 100% với các mẫu phiếu thi đã chuẩn bị, thời gian chấm thi nhanh

Để có thể thực hiện và hoàn thành đề tài này, tôi xin được chân thành cảm ơn PGS.TS Nguyễn Tiến Dũng đã tận tình hướng dẫn và giúp đỡ trong suốt quá trình thực hiện đề tài

Học viên

Trang 12

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG CHẤM ĐIỂM

THI TRẮC NGHIỆM 1.1 Giới thiệu hệ thống

Từ năm 2007, Bộ giáo dục và Đào tạo đã chuyển một số môn thi của các kỳ thi cấp Quốc gia như thi tốt nghiệp Trung học phổ thông, thi tuyển sinh vào các trường Cao đẳng, Đại học từ hình thức tự luận sang trắc nghiệm Không chỉ ở những kỳ thi cấp Quốc gia mà hiện nay nhiều trường trung học, cao đẳng, đại học cũng đã áp dụng hình thức thi trắc nghiệm ở rất nhiều môn học và đã nhận được những phản hồi tích cực từ phía học sinh, sinh viên

1.2 Những hệ thống chấm thi hiện tại

1.2.1 Máy OMR

Máy chấm thi trắc nghiệm chuyên dụng, hay còn gọi là Optical Mark Recognition (OMR) Machine [1] là một loại máy được thiết kế ra để chấm điểm thi trắc nghiệm một cách nhanh và chính xác Máy OMR thường được sử dụng để đánh giá kết quả thi thông qua hình thức trắc nghiệm với số lượng lớn

Phương thức mà máy OMR dùng để nhận dạng và quyết định vị trí lựa chọn của sinh viên trong phiếu thi: Máy OMR sử dụng hàng loạt sensor để nhận dạng dấu tích của sinh viên – ô tròn được quy định tô bằng bút chì 2B (trở lên) Loại giấy mà máy này sử dụng cũng hoàn toàn là một loại giấy „transoptic‟ đặc biệt tương thích với việc sử dụng sensor để nhận dạng

Tính ổn định và độ chính xác cao của hệ thống làm cho máy OMR có được độ tin cậy cao và thường được sử dụng ở những tổ chức giáo dục và đánh giá lớn Nhưng những tính năng này cũng tạo nên giá thành cao của hệ thống và cản trở việc phổ biến máy OMR trên thị trường Không những giá thành của chúng rất đắt mà chi phí vận hành phải đi đôi với việc tiêu thụ rất nhiều giấy chuyên dụng Do đó, những tổ chức giáo dục vừa và nhỏ, những trường học muốn tổ chức những kỳ thi trắc nghiệm riêng của họ để tiến hành đánh giá học sinh, sinh viên định kỳ lại không

đủ chi phí mua cũng như duy trì những chiếc máy như thế này

Trang 13

1.2.2 Phần mềm OMR

Trong khi những chiếc máy OMR làm chủ công nghệ và thị trường phục vụ nhu cầu đánh giá kỳ thi trắc nghiệm thì vẫn tồn tại những nhu cầu về một thiết bị nhỏ gọn hơn mà thỏa mãn được những yêu cầu về độ ổn định và độ chính xác cao Phần mềm OMR được phát triển nhanh chóng nhằm lấp đầy những nhu cầu trên Sự ra đời của phần mềm OMR kết hợp với máy scan thực sự đã là một giải pháp thay thế cho việc chấm thi trắc nghiệm tự động Đây là một giải pháp phần mềm, để thực hiện chấm thi được cần phải kết hợp với một hệ thống máy tính và máy scan

Máy scan là một loại thiết bị văn phòng phổ biến và sẵn có với đa dạng chủng loại cùng giá thành trên thị trường Có hai loại máy scan cơ bản mà chúng ta cần chú ý khi kết hợp với phần mềm OMR

Máy scan ép phẳng (hay còn gọi là flatbed scanner) [2] dùng để quét những

tài liệu nhỏ lẻ hoặc những mẫu đơn rời Nhược điểm của loại máy scan này là người

sử dụng phải thao tác bằng tay khi họ muốn scan tài liệu Điều này đồng nghĩa với tính tự động và tốc độ của hệ thống chấm thi sử dụng máy scan ép phẳng sẽ rất thấp

Máy scan tời giấy tự động (hay còn gọi là automatic document feeder –

ADF) [2] là dòng máy scan chuyên nghiệp hơn Máy ADF có thêm khay tời giấy tự động có thể đựng đuợc 50 tới 200 tờ giấy và scan lần lượt theo thời gian định sẵn Khi kết hợp ADF với phần mềm OMR sẽ tạo nên một hệ thống chấm thi khá khả quan Tuy nhiên giá thành cho cả hệ thống bao gồm phần mềm OMR, máy tính, và máy scan ADF rất đắt Chính vì vậy nên rất nhiều trường trung học phổ thông, đại học và các tổ chức giáo dục vừa và nhỏ đã không chọn phần mềm OMR kết hợp với máy scan làm công cụ chấm thi trắc nghiệm tự động

Trang 14

Yêu cầu về giá thành và độ phức tạp:

Hệ thống phải có giá thành cũng như chi phí vận hành rẻ hơn so với hệ thống

máy OMR và hệ thống sử dụng phần mềm OMR đồng thời phải đơn giản và dễ

dàng hơn trong quá trình làm việc cũng như bảo trì

Yêu cầu về chức năng:

- Hệ thống có thể chấm thi tự động với khay đựng được nhiều giấy

- Hệ thống nhận dạng và chấm được điểm thi trắc nghiệm ở nhiều hình thức

khác nhau

- Hệ thống phải hoạt động ổn định, chính xác ở tốc độ cao

Hệ thống tự động chấm thi trắc nghiệm đề xuất:

- Hệ thống tự động chấm thi trắc nghiệm đề xuất gồm 3 thành phần cơ bản:

khay tời giấy, camera độ phân giải cao và hệ thống máy tính

- Ý tưởng thực hiện khay tời giấy là một khay có thể tự động tời giấy theo

thời gian được lập trình Tời định kỳ theo khoảng thời gian mà camera có thể chụp

- Camera là thiết bị ghi hình nên yêu cầu có độ phân giải cao và tốc độ chụp

nhanh

- Hệ thống máy tính có thể là máy để bàn hoặc máy tính xách tay có cài hệ

điều hành Windows và một số phần mềm ứng dụng khác như Matlab, Office…

1.3.2 Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm

Hình 1 1: Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm

Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm do nhóm đề xuất được giới

thiệu trong hình 1.1, trong đó có những khối chức năng cơ bản sau:

Nhận dạng phiếu thi

Tìm vùng chứa thông tin trên phiếu thi

Nhận dạng thông tin

File hoặc CSDL Ảnh

Trang 15

kết nối với máy vi tính có cài đặt phần mềm OMR Phần cứng sẽ được điều khiển bởi driver được cài đặt trên máy tính

Nhận dạng vùng chứa phiếu thi trong ảnh, vùng chứa thông tin trên phiếu thi

(mã đề, số báo danh, phần trả lời) và xử lý thông tin để cho ra kết quả Kết quả sẽ

được lưu vào file hoặc CSDL để in ấn, thống kê

2 Quá trình đọc thông tin trên ảnh

Dữ liệu ảnh từ quá trình 1 được tiền xử lý nhằm mục đích lọc nhiễu và nâng cao chất lượng ảnh Sau đó, thông qua việc xác định 4 đỉnh của PTLTN trong ảnh, góc nghiêng của PTLTN sẽ được tính toán, tự động điều chỉnh góc nghiêng và chuẩn hóa ảnh theo một tỉ lệ xác định Ảnh sau chuẩn hóa được trích chọn các vùng thông tin: vùng số báo danh, vùng mã đề, vùng trả lời Việc sử dụng thuật toán nhận dạng dấu tích trên từng vùng sẽ cho ta thông tin bài thi

3 Quá trình đánh giá và xuất kết quả:

Thông tin bài thi từ quá trình 2 sẽ được xem xét, đánh giá Với mỗi mã đề của một môn thi trong một kỳ thi xác định sẽ có một đáp án tương ứng được lưu trong CSDL Tiến hành so sánh thông tin bài thi với đáp án tương ứng, ta sẽ đưa ra được kết quả bài thi Kết quả này sẽ ngay lập tức được cập nhật vào CSDL tạo điều kiện thuận lợi cho việc tra cứu và đánh giá

Trang 16

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Những khái niệm cơ bản về ảnh số

2.1.1 Pixel

Một bức ảnh hay một bức tranh ta nhìn thấy bằng mắt thường là một sự liên tục về không gian cũng như độ sáng Khi kỹ thuật số được ứng dụng vào lĩnh vực nhiếp ảnh, rất nhiều khái niệm mới đã được ra đời

Kỹ thuật số là một kỹ thuật xử lý rời rạc trên máy tính, kỹ thuật này chỉ áp dụng đối với các bit (các con số), chính vì vậy các bức ảnh liên tục về không gian

và độ sáng cần phải được “số hóa” Số hoá ảnh thực chất là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm rời rạc phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữa chúng Chính vì vậy, khi chúng ta nhìn một bức tranh là tập hợp của rất nhiều điểm rời rạc, chúng ta sẽ có cảm giác đó là một bức ảnh liên tục Mỗi một điểm như vậy gọi là một điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel [3] Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật

2.1.2 Độ xám

Mỗi một điểm ảnh (Pixel) sẽ được đặc trưng bởi hai tham số chính về không gian và độ xám Trong khuôn khổ ảnh hai chiều, tham số không gian được xác định bởi tọa độ Đề-các (x,y) của điểm ảnh đó Tham số độ xám được xác định là giá trị cường độ sáng tại điểm đó Máy tính thường sử dụng đơn vị byte (8bit) để biểu diễn giá trị số Chính vì vậy, giá trị lớn nhất của độ xám thường được sử dụng rộng rãi nhất là 2^8 = 256 tương đương với việc cường độ sáng của các điểm sẽ nằm trong dải từ 0 đến 256, khi đó, máy tính sẽ dùng 8bit = 1byte để biểu diễn giá trị cường độ

Trang 17

Thông thường, ta sẽ làm quen với 3 loại ảnh sau dựa vào cấu trúc cũng như độ xám điểm ảnh:

- Ảnh màu: là ảnh mà màu của các điểm ảnh được tạo nên bởi sự pha trộn 3

màu cơ bản (Red, Blue, Green) với các tỉ lệ cường độ sáng khác nhau Với mỗi một màu cơ bản, người ta sẽ sử dụng một byte để biểu diễn cường độ sáng, chính vì vậy cần 3 byte (24bit) để biểu diễn một điểm ảnh Khi đó giá trị màu sẽ nhận giá trị từ 0 cho đến 2^24 (vào khoảng ≈16,7 triệu màu)

- Ảnh đen trắng: là ảnh mà mỗi điểm ảnh chỉ có hai màu đen, trắng (không

chứa màu khác) với cường độ sáng (mức xám) ở các điểm ảnh có thể sử dụng nhiều bit để biểu diễn các giá trị khác nhau

- Ảnh nhị phân: là ảnh chỉ có hai màu đen, trắng (không chứa màu khác) với

cường độ sáng chỉ có 2 giá trị duy nhất 0 và 255 Người ta dùng duy nhất 2 bit để biểu diễn độ xám, bit “1” tương ứng điểm ảnh đen (0), bit “0” tương ứng điểm ảnh trắng (255)

| height; chiều dài ảnh

| imageData; con trỏ truy nhập dữ liệu ảnh

|

| dataOrder; 0 – các kênh màu đan xen

| 1 – các kênh màu độc lập

|

Trang 18

| origin; 0 – gốc ảnh tại vị trí trên cùng bên trái

| 1 – gốc ảnh dưới cùng bên trái

| colorModel[4]; kiểu màu

Khi sử dụng bộ thư viện OpenCV, các ảnh được lưu trữ và truy nhập các phần

tử điểm ảnh dưới dạng ma trận:

2.1.4 Nhiễu ảnh

Trước khi xem xét chi tiết các kỹ thuật xử lý ảnh cơ bản, chúng ta cần phân biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh Trên thực tế tồn tại nhiều loại nhiễu, tuy nhiên người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:

Hình 2 1: Cấu trúc dữ liệu ảnh

Trang 19

Một hệ thống xử lý ảnh có thể trang bị kèm theo các hệ thống thông tin địa lý -

GIS (Geographical Information System) [5] hay hệ MORPHO (giá khoảng 7 đến 8

triệu USD) hoặc có thể là hệ thống máy tính cá nhân Các thiết bị thu ảnh thông thường gồm máy quay (camera) cộng với bộ chuyển đổi tương tự số AD (Analog to Digital) hoặc máy quét (scanner) chuyên dụng

Các thiết bị thu nhận ảnh này có thể cho ảnh trắng đen B/W (Black and White) với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi Với ảnh B/W mức màu là 0 hoặc 1 Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255 Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2 8x3

= 224 màu (cỡ 16,7 triệu màu)

Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng) và cho ảnh với độ phân giải ngang khá tốt Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap) Bộ số hoá (digitalizer) sẽ tạo ảnh vector có hướng

Trang 20

Trong xử lý ảnh bằng máy tính, ta không thể không nhắc đến màn hình (monitor) để hiển thị hình ảnh Màn hình có nhiều loại:

Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ (ploter) Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực

Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình:

- Cảm biến: biến đổi năng lƣợng quang học (ánh sáng) thành năng lƣợng điện

- Một là: khoảng lấy mẫu

- Hai là: cách thể hiện dạng mẫu

Lựa chọn thứ nhất đƣợc đảm bảo nhờ lý thuyết lấy mẫu của Shannon Lựa chọn thứ hai liên quan đến độ đo (Metric) đƣợc dùng trong miền rời rạc

Khoảng lấy mẫu (Sampling Interval)

Ảnh lấy mẫu có thể đƣợc mô tả nhƣ việc lựa chọn một tập các vị trí lấy mẫu trong không gian hai chiều liên tục Đầu tiên mô tả qua quá trình lấy mẫu một chiều với việc sử dụng hàm

Trang 21

(2.4)

Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Δx như sau:

với r là số nguyên, Δx là khoảng lấy mẫu

Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ đến +∞) Giả sử

Trong thực tế, r không thể tính được trong khoảng vô hạn (từ − ∞ đến +∞) mà

là một số lượng NΔx mẫu lớn cụ thể Như vậy, để đơn giản có thể nói hàm liên tục

g(x) có thể biểu diễn trên một miền với độ dài NΔx mẫu thành chuỗi như sau:

g(x) ≈ {g(0), g(Δx), g(2Δx), , g((N −1)Δx) } (2.9)

Chú ý 1: Khoảng lấy mẫu (Sampling Interval) Δx là một tham số cần phải

được chọn đủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục lại được

từ tín hiệu lấy mẫu

Chú ý 2: Từ lý thuyết về xử lý tín hiệu số [6], (2-6) là tích chập trong miền

không gian x Mặt khác, phương trình trên tương đương với tích chập trong miền

tần số ω tức là biến đổi Fourier của g s (x) là

Trong đó ω x là giá trị tần số ứng với giá trị x trong miền không gian

Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lấy

mẫu của Shannon

Trang 22

Định lý lấy mẫu của Shannon [7]

Giả sử g(x) là một hàm giới hạn giải (Band Limited Function) và biến đổi Fourier của nó là G(ωx ) = 0 đối với các giá trị ωx > Wx Khi đó g(x) có thể được khôi phục lại từ các mẫu được tạo tại các khoảng Δx đều đặn Tức là:

(2.11) Định lý lẫy mẫu của Shannon có thể mở rộng cho không gian hai chiều Hàm răng lược hai chiều khi đó được xác định:

Hàm lấy mẫu hai chiều thu được:

(2.13)

và Δx, Δy được chọn thoả mãn các điều kiện tương ứng theo định lý lấy mẫu

của Shannon khi đó:

Các dạng lấy mẫu (Tesselation)

Dạng lẫy mẫu (Tesselation) điểm ảnh là cách bài trí các điểm mẫu trong không gian hai chiều Một số dạng mẫu điểm ảnh được cho là dạng chữ nhật, tam giác, lục giác Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết đặc điểm liên thông của chúng Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về các mẫu liền kề); mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6

Trang 23

Cần chú ý rằng, trong khuôn khổ luận văn này chỉ xét các mẫu điểm ảnh hình chữ nhật, đặc biệt là dạng hình vuông Nhiều trường hợp ứng dụng có dùng đến các mẫu tam giác hoặc lục giác.

2 Lượng tử hóa

Lượng tử hoá là một quá trình lượng hoá tín hiệu thật dùng chung cho các loại

xử lý tín hiệu trên cơ sở máy tính Vấn đề này đã được nghiên cứu kỹ lưỡng và có nhiều lời giải lý thuyết dưới nhiều giả định của các nhà nghiên cứu như Panter và Dite (1951), Max (1960), Panter (1965)

Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin đến lớn nhất Zmax Mỗi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu hạn số bit

để máy tính lưu trữ hoặc xử lý

Hình 2 3: Quá trình lượng tử hóa

Định nghĩa: Lượng tử hoá là ánh xạ từ các số thực mô tả giá trị lấy mẫu thành

một giải hữu hạn các số thực Nói cách khác, đó là quá trình số hoá biên độ

Hình 2 2: Các dạng mẫu điểm ảnh

Trang 24

Hình 2 4: Khuông lượng tử theo L mức xám Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh,

và Zmin<=Z’<=Zmax và giả sử chúng ta muốn lượng hoá giá trị đó thành một trong các mức rời rạc: l1, l2,…ln tương ứng với Zmin đến Zmax (Hình 2.4) Khi đó, quá trình lượng hoá có thể thực hiện bằng cách chia toàn bộ miền vào (Zmax - Zmin) thành L khoảng, mỗi khoảng là Δl và khoảng thứ i được đặt tại điểm giữa các khoảng liền kề li Họ các giá trị z được thực hiện và mô tả bằng li theo quá trình trên

đây, khi đó sai số của quá trình lấy mẫu có thể được xác định theo:

eq=li – Z (2.17)

Hình 2 5: Lấy mẫu và lượng tử hóa

Trang 25

2.2.3 Xứ lý và nâng cao chất lượng ảnh

Nâng cao chất lượng ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính là nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên ảnh, khuếch đại ảnh Tăng cường ảnh và khôi phục ảnh là hai quá trình khác nhau về mục đích Tăng cường ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện trạng thái quan sát của một ảnh Tập hợp các kỹ thuật này tạo nên giai đoạn tiền xử lý ảnh Trong khi đó, khôi phục ảnh nhằm khôi phục ảnh gần với ảnh thực chất trước khi nó bị biến dạng do nhiều nguyên nhân khác nhau

Nhiệm vụ của tăng cường chất lượng ảnh không phải là làm tăng lượng thông tin vốn có trong ảnh mà làm nổi bật các đặc trưng đã chọn làm sao để có thể phát hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh

1 Cải thiện ảnh dùng toán tử điểm

Cải thiện ảnh là làm cho ảnh có chất lượng tốt hơn theo ý đồ sử dụng Thường

là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi tiết như biên Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân theo nhóm theo công dụng: làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tách nhiễu người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình) Do bản chất của nhiễu là ứng với tần số cao và cơ sở lý thuyết của lọc là bộ lọc chỉ cho tín hiệu

có tần số nào đó thông qua (dải tần bộ lọc) Do vậy để lọc nhiễu ta dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, Laplace [8]

Tăng độ tương phản

Trước tiên cần làm rõ khái niệm độ tương phản; ảnh số là tập hợp các điểm,

mà mỗi điểm có giá trị độ sáng khác nhau Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định Thực tế chỉ ra rằng hai đối tượng có cùng

Trang 26

độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền Với định nghĩa này, nếu ảnh của ta có độ tương phản kém, ta có thể thay đổi tuỳ ý theo ý muốn Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh Để điều chỉnh lại độ tương phản của ảnh, ta điều chỉnh lại biên độ trên toàn dải hay trên dải

có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm lôgarít)

Hình 2 6: Kéo dãn độ tương phản

Hàm mũ thường được dùng để dãn độ tương phản Hàm có dạng:

(2.18) Với p là bậc thay đổi, thường chọn bằng 2

Tách nhiễu và phân ngưỡng

Tách nhiễu là trường hợp đặc biệt của dãn độ tương phản khi có hệ số góc α =

γ = 0 Tách nhiễu được ứng dụng có hiệu quả để giảm nhiễu khi biết tín hiệu vào trên khoảng [a,b]

Phân ngưỡng là trường hợp đặc biệt của tách nhiễu khi a = b = const Trong

trường hợp này ảnh đầu vào là ảnh nhị phân

Trang 27

Hình 2 7: Tách nhiễu và phân ngưỡng

2 Cải thiện dùng toán tử không gian

Làm trơn nhiễu bằng lọc tuyến tính

Vì có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nhƣ: nhiễu cộng, nhiễu xung, nhiễu nhân nên cần có nhiều bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân tạo dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (homomorphic); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (outlier) [9]

Với lọc trung bình, mỗi điểm ảnh đƣợc thay thế bằng trung bình trọng số của các điểm lân cận và đƣợc định nghĩa nhƣ sau:

Trang 28

v(m,n) = (2.21)

Trong đó y(m,n) là ảnh đầu vào; v(m,n) là ảnh đầu ra còn a(k,l) là cửa sổ lọc

= và là số điểm ảnh trong cửa sổ lọc W

Làm trơn nhiễu bằng lọc phi tuyến

Các bộ lọc phi tuyến cũng hay được dùng trong tăng cường ảnh Trong kỹ

thuật này người ta dùng bộ lọc trung vị (Median Filtering), bộ lọc giả trung vị

(Pseudo Median Filtering), lọc ngoài (Outlier) Với lọc trung vị, điểm ảnh đầu vào

sẽ được thay thế bởi trung vị các điểm ảnh Còn lọc giả trung vị sẽ dùng trung bình

cộng của 2 giá trị "trung vị" (trung bình cộng của max và min)

Lọc trung vị, với dãy x1, x2, xn đơn điệu tăng (giảm), trung vị được xác định

theo công thức sau:

Đó là trung vị của một dãy Ta có công thức lọc của phương pháp như sau: 2

v(m,n)= med với W (2.23)

Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự

tăng hay giảm dần so với giá trị trung vị Kích thước cửa sổ thường được chọn sao

cho số điểm ảnh trong cửa sổ là lẻ Các cửa sổ hay dùng là cửa sổ kích thước 3x3,

5x5 hay 7x7

Mặt nạ gờ sai phân và làm nhăn (Unharp Masking and Crispering) [10]

Mặt nạ gờ sai phân dùng khá phổ biến trong công nghệ in ảnh để làm đẹp

ảnh

Với kỹ thuật này, tín hiệu đầu ra thu được bằng tín hiệu ra của bộ lọc gradient

hay lọc dải cao

Lọc thông thấp, thông cao và lọc thông dải

Bộ lọc thông thấp thường dùng làm trơn nhiễu và nội suy Bộ lọc thông cao

Trang 29

dùng trong trích chọn biên và làm trơn ảnh, còn bộ lọc dải thông có hiệu quả làm nổi cạnh Tuy nhiên, dễ dàng nhận thấy rằng biên là điểm có độ biến thiên nhanh về giá trị mức xám Theo quan điểm về tần số tín hiệu, như vậy các điểm biên ứng với các thành phần tần số cao Do vậy, ta có thể dùng bộ lọc thông cao để cải thiện: lọc các thành phần tần số thấp và chỉ giữ lại thành phần tần số cao Vì thế, lọc thông cao thường được dùng làm trơn biên trước khi tiến hành các thao tác với biên ảnh

Khuếch đại và nội suy ảnh

Có nhiều ứng dụng cần thiết phải phóng đại một vùng của ảnh Có nghĩa là lấy một vùng của ảnh đã cho và cho hiện lên như một ảnh lớn Có 2 phương pháp được

sử dụng là lặp (Replication) [11] và nội suy tuyến tính (Linear Interpolation) [12] Phương pháp lặp: Người ta lấy một vùng của ảnh kích thước M x N và quét theo hàng Mỗi điểm ảnh nằm trên đường quét sẽ được lặp lại 1 lần và hàng quét cũng được lặp lại 1 lần nữa Như vậy ta sẽ thu được ảnh với kích thước 2N x 2N

Một số kỹ thuật cải thiện ảnh nhị phân

Với ảnh nhị phân, mức xám chỉ có hai giá trị là 0 và 1 Do vậy, ta xét một phần

tử ảnh như một phần tử logic và có thể áp dụng các toán tử hình học (Morphology Operators) dựa trên khái niệm biến đổi hình học của một ảnh bởi một phần tử cấu trúc (Structural Element) [13]

Phần tử cấu trúc là một mặt nạ dạng bất kỳ mà các phần tử của nó tạo nên một mô-típ Người ta tiến hành rê mặt nạ đi khắp ảnh và tính giá trị điểm ảnh bởi các điểm lân cận với mô-típ của mặt nạ theo cách lấy hội tụ hay lấy tuyển

Dựa vào nguyên tắc trên, người ta sử dụng hai kỹ thuật: Điền đầy (Dilation) và

ăn mòn (Erosion)

Điền đầy: nhằm loại bỏ điểm đen bị vây bởi các điểm trắng Trong kỹ thuật

này, một cửa sổ được rê đi khắp ảnh và thực hiện đối sánh một pixel của ảnh với - 1 điểm lân cận (không tính điểm ở tâm) Phép đối sánh ở đây được thực hiện bởi phép tuyển logic

Ăn mòn: là thao tác ngược lại của dãn ảnh, nhằm loại bỏ điểm trắng bị vây bởi

Trang 30

các điểm đen Trong kỹ thuật này, một cửa sổ được rê đi khắp ảnh và thực hiện đối sánh với - 1 điểm lân cận Việc so sánh này được thực hiện bởi phép hội logic

2.2.4 Khôi phục ảnh

Khôi phục ảnh đề cập tới các kỹ thuật loại bỏ hay tối thiểu hoá các ảnh hưởng của môi trường bên ngoài hay các hệ thống thu nhận, phát hiện và lưu trữ ảnh đến ảnh thu nhận được Ở đây, ta có thể liệt kê nguyên nhân các biến dạng do nhiễu bộ cảm nhận tín hiệu, ảnh mờ do camera, nhiễu ngẫu nhiên của khí quyển, v v Khôi phục ảnh bao gồm nhiều quá trình như: lọc ảnh, khử nhiễu nhằm làm giảm các biến dạng để có thể khôi phục lại ảnh gần giống ảnh gốc tuỳ theo các nguyên nhân gây ra biến dạng

Về nguyên tắc, khôi phục ảnh nhằm xác định mô hình toán học của quá trình

đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh

2.2.5 Lấy ngưỡng

Lấy ngưỡng [14] là một kỹ thuật xử lý ảnh cơ bản dùng để chuyển từ ảnh mức xám hoặc ảnh màu sang ảnh nhị phân khi so sánh cường độ điểm ảnh với giá trị ngưỡng cho trước Lấy ngưỡng thực sự là một công cụ mạnh để giữ lại những phần

có nghĩa của bức ảnh mà bỏ đi những phần ít có ý nghĩa hoặc nhiễu Hình 2.8 thể hiện quá trình biến đổi ảnh mức xám sang ảnh nhị phân bằng cách lấy mẫu qua biểu

đồ cường độ mức xám

Hình 2 8: Lấy ngưỡng

Trang 31

Thuật toán lấy ngưỡng sau đây sẽ giúp lấy ngưỡng T một cách tự động

b1 Chọn một ngưỡng ước đoán ban đầu T

b2 Phân đọan ảnh sử dụng T Quá trình này tạo ra 2 nhóm pixel: bao gồm tất cả pixel có giá trị độ xám nhỏ hơn T

bao gồm tất cả pixel có giá trị độ xám lớn hơn T

b3 Tính toán giá trị mức xám trung bình cho những pixel trong vùng và

b4 Tính toán giá trị ngưỡng mới

2.3 Các kỹ thuật xử lý ảnh

2.3.1 Khái niệm về góc nghiêng

Một bức ảnh chụp thông thường có kích thước dưới dạng hình chữ nhật, chủ thể của bức ảnh thường được coi là thẳng đứng khi hướng chính của chủ thể song song với cạnh đứng của bức ảnh Tuy nhiên không phải lúc nào, ta cũng có thể chụp được những bức ảnh "thẳng" như mong muốn Chính vì vậy, khái niệm góc nghiêng

đã ra đời

Góc nghiêng của bức ảnh là góc hợp bởi hướng chính của chủ thể trong bức ảnh với cạnh thẳng đứng của bức ảnh Khi chủ thể trong bức ảnh hướng theo một phương khác phương thẳng đứng thì lúc đó chúng ta gọi là bức ảnh tồn tại góc nghiêng Góc nghiêng là một khái niệm khá phổ biến trong toán học và những môn khoa học khác Góc nghiêng sẽ gây sai lệch khi chúng ta tiến hành định vị và nhận dạng thông tin trên bức ảnh Chính vì vậy, việc hiệu chỉnh góc nghiêng của bức ảnh

sẽ nâng cao độ chính xác và hiệu quả của hệ thống

Trước khi tiến hành hiệu chỉnh ảnh, chúng ta cần tìm hiểu các thuật toán quan trọng sẽ được sử dụng để hiệu chỉnh ảnh

2.3.2 Thuật toán Otsu

Lấy ngưỡng là một phương pháp được sử dụng rất nhiều trong kỹ thuật xử lý ảnh Tác dụng chính của lấy ngưỡng là giúp biến đổi ảnh xám trở thành nhị phân

Có rất nhiều phương pháp lấy ngưỡng được áp dụng giúp việc lấy ngưỡng hiệu quả,

Trang 32

trong đó, thuật toán Otsu được sử dụng rộng rãi nhất do sự chính xác, hiệu quả do thuật toán tính ngưỡng T một cách tự động (adaptive) dựa vào giá trị điểm ảnh của ảnh đầu vào, nhằm thay thế cho việc sử dụng ngưỡng cố định (fixed hay const) Đối với các ảnh đầu vào khác nhau, thuật toán sẽ tính toán được các giá trị ngưỡng T khác nhau

Thuật toán Otsu [16] đầu tiên sẽ tính toán tần suất và xác suất xuất hiện của mỗi một giá trị độ xám của điểm ảnh Với mỗi giá trị ngưỡng T, thuật toán tiến hành phân hoạch ảnh thành 2 nhóm điểm ảnh:

P(i) là xác suất xuất hiện của giá trị độ xám i

NG độ xám giới hạn của ảnh (ảnh 3bit =>256)

Từ giá trị trung bình và xác suất tích lũy trong mỗi nhóm, thuật toán tính toán giá trị phương sai riêng của từng nhóm:

σN12(T) = (2.27)

σN22(T) = (2.28)

Trang 33

The weighted within-class variance (tạm dịch: phương sai có trọng số trong

nhóm điểm ảnh) được xác định bởi tổng của các tích số xác suất tích lũy với phương sai riêng của từng nhóm điểm ảnh:

ưu nhất là mức ngưỡng cho giá trị The weighted within-class variance σw2

(T) nhỏ

nhất, hay giá trị The between-class variance σb 2

(T) lớn nhất

2.3.3 Phương pháp phát hiện biên cục bộ Gradient

Gradient [15] là một vector (x,y) có các thành phần biểu thị tốc độ thay đổi độ xám của điểm ảnh (theo khuôn khổ luận văn xử lý ảnh hai chiều, chúng ta chỉ xét theo hai hướng x,y) có nghĩa là:

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn dx=dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x,y Gradient trong tọa độ góc (r,θ) với r là vector, θ là góc

Trang 34

f(r,θ) đạt giá trị cực đại khi = 0

Khi đó: f ' x cos θ + f ' y cos θ = 0 hay:

(2.36) (2.37)

Để giảm độ phức tạp tính toán, A0 đƣợc tính gần đúng nhƣ sau:

Trang 35

Với mỗi điểm ảnh I(x,y) đạo hàm theo x, y được ký hiệu tương ứng:

Trang 36

• Toán tử 4-lân cận (4-Neighbour Operator)

Toán tử 4-lân cận được Chaudhuri và Chandor (1984) nêu ra, trong đó mặt nạ

có kích thước 3x3 được thay cho mặt nạ 2x2 của toán tử Robert Các mặt nạ này được cho:

Hình 2 9: Mặt nạ 8 hướng theo Kirsh

Trang 37

b) Kỹ thuật Canny:

Bộ tách sườn ảnh theo Canny (1986) [16] dựa trên cặp đạo hàm riêng bậc nhất

với việc làm sạch nhiễu Đây là phương pháp tách đường biên khá phổ biến được

dùng theo toán tử đạo hàm Như đã nói, phương pháp đạo hàm chịu ảnh hưởng lớn

của nhiễu Phương pháp đạt hiệu quả cao khi xấp xỉ đạo hàm bậc nhất của Gauss

Quá trình tiến hành phương pháp trải qua một số bước như sau:

1 Làm trơn ảnh bằng bộ lọc Gauss nhằm giảm thiểu ảnh hưởng của nhiễu và

các chi tiết không mong muốn trong cấu trúc ảnh

2 Sau đó tính gradient của ảnh nhờ một trong các toán tử Roberts, Sobel hay

- Dựa vào hướng Gradient để loại bỏ những điểm không thực sự là biên

Chúng ta kiểm tra các điểm nếu có giá trị lớn hơn hai điểm lân cận dọc theo

phương gradient thì giữ nguyên và ngược lại thì gán bằng 0

- Dùng ngưỡng kép và ( < ) tạo ra các điểm trung gian nhằm nối

liền các điểm biên đã xác định được từ trước theo cách sau:

Những điểm có giá trị gradient lớn hơn được xem là điểm biên

Những điểm có giá trị gradient nhỏ hơn thì loại bỏ Với những điểm có

giá trị gradient nằm trong khoảng và thì kiểm tra thêm nếu nó liền kề với một

điểm có gradient lớn hơn thì điểm này được xem là biên

Trang 38

Hình 2 10: Hình ảnh trước và sau bộ tách biên Canny

Kết quả chúng ta sẽ thu được các đường biên tạo từ vô số các điểm biên liền

kề liên tục Hình 2.10 cho chúng ta một ví dụ về ảnh gốc và ảnh đã qua bộ lọc Canny với các ngưỡng khác nhau

2.3.4 Thuật toán Harris

Thuật toán phát hiện góc Harris [17] được sử dụng khá rộng rãi trong kỹ thuật

xử lý ảnh số bởi sự ổn định trước sự thay đổi của các điều kiện ngoại cảnh như ánh sáng, góc nghiêng, tỉ lệ cũng như nhiễu ảnh Thuật toán này được thực hiện dựa trên hàm tự tương quan cục bộ của các tín hiệu Khi đó, hàm tự tương quan cục bộ sẽ tính toán các sự thay đổi cục bộ của các tín hiệu tại vùng được xét ban đầu với vùng mới được sinh ra sau khi dịch chuyển một lượng nhỏ theo các hướng khác nhau Xét một điểm có tọa độ (x,y) và một lượng dịch chuyển (∆x, ∆y ) nhỏ cho trước, khi đó, hàm tự tương quan được xác định bởi hàm

Trong đó:

W(x,y) là hàm cửa sổ Gaussian có tâm là (x,y)

(2.46)

Trang 39

(xi, yi) là các điểm nằm trong cửa sổ W(x,y)

I(xi, yi) là cường độ sáng tại điểm (xi,yi)

I(xi + ∆x, yi + ∆y) là cường độ sáng tại điểm (xi,yi) được dịch một lượng nhỏ (∆x, ∆y )

C(x,y) là tổng bình phương giá trị độ lệch

Cường độ sáng của điểm sau khi dịch chuyển có thể được tính xấp xỉ bằng khai triển Taylor như sau:

Trang 40

Giả sử λ1 ,λ2 là 2 trị riêng của ma trận A(x,y), sẽ có 3 trường hợp được xét:

TH1: Nếu cả 2 giá trị trị riêng λ1 và λ2 cùng nhỏ, hàm tự tương quan cục bộ sẽ khá phẳng (C(x,y) thay đổi ít theo tất cả các hướng) Khi đó cường độ ánh sáng các điểm nằm trong vùng cửa sổ sẽ gần như không thay đổi Đồng nghĩa, vùng cửa sổ đang xét là một vùng đồng đều, phẳng

TH2: Nếu một trị riêng lớn và một trị riêng bé hơn, hàm tự tương quan sẽ có dạng đường viền Do đó chỉ có những dịch chuyển cục bộ theo một hướng (dọc theo đường viền) gây nên những thay đổi nhỏ của C(x,y) và thay đổi quan trọng, đáng kể theo hướng trực giao Đồng nghĩa, vùng cửa sổ đang xét làm một đường biên

Ngày đăng: 23/11/2016, 23:55

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w