Áp dụng kỹ thuật nắn chỉnh xuôi

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nghiên cứu một số kỹ thuật nắn chỉnh ảnh 2d (Trang 49)

Ảnh quyển sách thu nhận được sau khi áp dụng kỹ thuật nắn chỉnh ngược kết với kỹ thuật nội suy nêu trên thường rất thô. Do đó, áp dụng kỹ thuật nắn chỉnh xuôi nhằm nâng chất lượng ảnh để thu được ảnh có màu sắc, đường nét rõ và đẹp hơn. Áp dụng các kỹ thuật nắn chỉnh xuôi sau đây:

- Lọc làm mịn: Sử dụng bộ lọc trung bình mean có kích thước vuông 3x3 để thay thế giá trị mỗi điểm ảnh trong hình ảnh bằng giá trị trung bình của các điểm ảnh lân cận, kể cả điểm ảnh đó.

- Lọc nhiễu: Sử dụng bộ lọc trung vị median để làm giảm nhiễu trong ảnh và lưu giữ các chi tiết hữu ích trong ảnh. Để thực hiện lọc trung vị tại một điểm trong ảnh, đầu tiên ta sắp xếp các giá trị của điểm ảnh trong lân cận theo thứ tự tăng dần, xác định giá trị trung tâm và gán giá trị đó cho điểm ảnh. Vì vậy, đối với lọc trung vị vấn đề quan trọng nhất là xây dựng một hàm cho phép lấy giá trị trung vị của một tập các giá trị.

- Lọc làm sắc nét: Sử dụng bộ lọc thông cao và bộ lọc high boost có kích thước vuông 3x3 để làm nổi bật các thành phần tần số cao, đại diện cho các chi tiết, nét đặc trưng hình ảnh.

- Điều chỉnh độ tương phản: Sử dụng kỹ thuật chuyển đổi mức xám và giãn độ tương phản đểtăng cường độ tương phản hình ảnh, do đó các chi tiết của một hình ảnh có thể nhìn rõ hơn. Phép biến đổi âm bản rất thích hợp cho việc làm nổi bật các chi tiết màu xám hay màu trắng trong các vùng tối của bức ảnh, đặc biệt là trong các vùng mà màu đen là chủ yếu.

- Làm sáng ảnh: Ảnh chụp của quyển sách bị biến dạng sau khi áp dụng kỹ thuật nắn chỉnh ngược để thực hiện nắn chỉnh thường thì bề mặt quyển sách bị mờ, do đó ta phải tăng giá trị màu cho mỗi điểm ảnh quyển sách sau khi thực hiện nắn chính bằng cách nhân giá trị màu của mỗi điểm ảnh đó với một hệ số làm sáng, nếu hệ số làm sáng càng lớn thì cho ảnh càng sáng.

Tuy nhiên, các kỹ thuật nắn chỉnh xuôi nhằm mục đích là để nâng chất lượng ảnh, nó chỉ nắn chỉnh bề mặt của quyển sách chứ không nắn chỉnh được hình dạng của quyển sách và không có quy tắc chung để xác định kỹ thuật nâng chất lượng

ảnh là tốt nhất. Do đó chỉ áp dụng cho trường hợp cụ thể và thường được phát triển theo kinh nghiệm. Như vậy, phụ thuộc vào từng ngữ cảnh mà người dùng chọn kỹ thuật để thực hiện cho phù hợp. Việc nâng cao chất lượng ảnh dùng để trích chọn dấu hiệu, phân tích ảnh và hiển thị thông tin trực quan. Quá trình này không làm tăng lượng thông tin mà chỉ nhấn mạnh các đặc trưng, đặc tả nào đó.

3.2. Chức năng, cấu trúc chương trình và kết quả thực hiện chương trình

3.2.1. Mô tả một số chức năng chương trình

3.2.1.1. Chức năng tạo khung ảnh mẫu

Chức năng này dùng để tạo các mẫu ảnh quyển sách làm khung mẫu cho quá trình nắn chỉnh ảnh quyển sách. Các công việc cần thực hiện khi xây dựng một mẫu ảnh là:

- Mở ảnh một quyển sách đã chụp sẵn để tạo khung ảnh làm mẫu.

- Tạo các điểm đặc trưng để định nghĩa khung mẫu quyển sách bằng việc tạo các điểm đặc trưng tương ứng trên khung đối tượng làm mẫu có trong ảnh (chẳng hạn các điểm chấm chấm trên hình 3.6 là các điểm đặc trưng, các điểm này do người dùng chọn).

(a) Ảnh gốc (b) Khung mẫu

Hình 3.6. Minh họa các điểm đặc trưng trên ảnh gốc và khung mẫu mong muốn

- Xác định các mặt nhìn thấy của quyển sách trong ảnh. Trong trường hợp này là phải xác định 3 mặt của quyển sách (ba hình bình hành tạo nên hình hộp). Mỗi mặt của quyển sách được xác định bởi bốn điểm đặc trưng chính tương ứng với bốn góc của mặt đó (bốn đỉnh của hình bình hành). Một số điểm điểm đặc trưng khác không là góc của mặt nào đó nhưng có khoảng cách tới một cạnh nào đó của mặt nhỏ hơn cũng được kết nạp tự động vào mặt đó. Việc làm này nhằm giảm bớt quá trình xác định biên của các mặt quyển sách.

- Lưu ảnh khung mẫu vừa tạo được, để đơn giản ta có thể lưu ảnh mẫu cùng với các điểm đặc trưng.

Công việc xác định các điểm đặc trưng là cần thiết cho việc nắn chỉnh biến dạng quyển sách vì các điểm đặc trưng sẽ ảnh hưởng trực tiếp đến chất lượng ảnh sau khi thực hiện nắn chỉnh ở bước tiếp theo. Do đó, đòi hỏi người dùng phải chọn một số điểm đặc trưng chính cho chính xác (điểm tạo các góc, các cạnh của quyển sách). Ở bước này người dùng dễ dàng có thể thêm các điểm đặc trưng vào ảnh cần nắn chỉnh, xóa các điểm đặc trưng khỏi ảnh cần nắn chỉnh hoặc thay đổi tọa độ các điểm đặc trưng.

3.2.1.2. Chức năng nắn chỉnh biến dạng

Khi đã thực hiện xong bước tạo khung ảnh mẫu ở trên, thực hiện tiếp chức năng nắn chỉnh biến dạng, phần mềm sẽ thực hiện nắn chỉnh một cách tự động, ánh xạ từng điểm của ảnh nguồn sang các điểm khung ảnh mẫu tương ứng (tọa độ, giá trị của điểm ảnh, màu sắc), ta thu được một ảnh mới.

3.2.1.3. Chức năng nâng chất lượng ảnh

Sau khi thực hiện chức năng nắn chỉnh biến dạng ảnh thường rất thô nên thực hiện tiếp chức năng nâng chất lượng ảnh, gồm các chức năng sau:

- Lọc làm mịn.

- Lọc làm sắc nét.

- Lọc nhiễu.

- Điều chỉnh độ tương phản.

- Làm sáng ảnh.

3.2.2. Cấu trúc, thiết kế chương trình

Chương trình viết bằng ngôn ngữ lập trình Microsoft Visual Basic gồm các module và thứ tự các bước thực hiện như sau:

- Module ảnh đầu vào: Sử dụng thư viện có sẵn để hỗ trợ việc đọc, hiển thị và xử lí ảnh đầu vào.

- Module tạo khung nắn chỉnh: Xây dựng khung ảnh mẫu cần nắn chỉnh dựa vào ảnh đầu vào. Người dùng chọn một số điểm đặc trưng chính (các đỉnh của hình bình hành, các đỉnh hình tam giác và một số điểm trên các cạnh của ảnh đầu vào dựa vào hình dạng, kích thước ảnh) bằng cách nhắp chuột chọn các điểm trên ảnh ảnh đầu vào (ảnh nguồn). Công việc này thực hiện một cách thủ công.

Sau khi thực hiện xong việc chọn các điểm đặc trưng thì lưu khung ảnh mẫu. Việc lưu khung ảnh mẫu, sử dụng thư viện có sẵn để hỗ trợ việc lưu trữ và hiển thị ảnh.

- Module nắn chỉnh ảnh: Dựa vào ảnh đầu vào và ảnh khung mẫu đã tạo (module ảnh đầu vào module tạo khung nắn chỉnh) để thực hiện nắn chỉnh biến dạng quyển sách. Tác giả cài đặt một số thuật toán để thực hiện chức năng này một cách tự động để ánh xạ từng điểm ảnh nguồn (ảnh đầu vào) sang ảnh khung mẫu, thu được ảnh đích, gồm các thuật toán sau: thuật toán xây dựng lưới tam giác, thuật toán xác định cặp hàm đa thức, thuật toán tìm các điểm thuộc một đa giác, thuật toán nội suy affine, thuật toán nội suy trường. Thu nhận được ảnh sau nắn chỉnh, tuy nhiên ảnh còn rất thô.

- Module nâng chất lượng ảnh: Dựa vào ảnh sau khi thực hiện module nắn chỉnh ảnh, tác giả cài đặt các thuật toán nâng chất lượng ảnh để cho ảnh có màu sắc, đường nét rõ và đẹp hơn, gồm các thuật toán lọc làm mịn (smooth), lọc làm sắc nét (sharp), lọc nhiễu (noise), điều chỉnh độ tương phản (contrast), làm sáng ảnh (bright).

- Module ảnh đầu ra: Sử dụng thư viện có sẵn để hỗ trợ việc lưu trữ, hiển thị ảnh đầu ra sau khi nắn chỉnh biến dạng và nâng chất lượng ảnh.

Trong phần nắn chỉnh ảnh nêu trên tác giả có sử dụng thư viện của Microsoft Visual Basic để lấy giá trị màu RGB của ảnh và hiển thị ảnh.

3.2.3. Giới thiệu chương trình

- Chương trình viết bằng ngôn ngữ lập trình Microsoft Visual Basic.

- Khởi động chương trình xuất hiện cửa sổ màn hình như sau.

- Khung bên trái chọn ảnh cần nắn chỉnh: mở tập tin ảnh quyển sách đã chụp sẵn.

- Khung bên phải chọn khung mẫu đã tạo sẵn: mở tập tin khung ảnh mẫu đã tạo sẵn.

- Ở khung bên trái người dùng dễ dàng có thể thêm, xóa, thay đổi tọa độ các điểm đặc trưng.

- Thực hiện chức năng nắn chỉnh biến dạng (thu được ảnh mới như ở khung bên phải).

- Thực hiện chức năng nâng chất lượng ảnh: Chọn filter (bộ lọc) -> chọn chức năng tương ứng: Lọc làm mịn (smooth), lọc làm sắc nét (sharp), lọc nhiễu (noise), điều chỉnh độ tương phản (contrast), làm sáng ảnh (bright). Tùy thuộc vào hình dạng, chất lượng ảnh như màu sắc, độ sáng, độ tương phản,… sau khi thực hiện chức năng nắn chỉnh biến dạng mà người dùng chọn chức năng này cho phù hợp với đối tượng trong bối cảnh đó.

- Lưu ảnh: Ảnh sau khi thực hiện chức năng nắn chỉnh biến dạng và nâng chất lượng có thể lưu lại để sử dụng, vào mục file -> save.

3.2.4. Một số kết quả thực hiện chương trình

Dưới đây minh họa một số hình ảnh kết quả thực hiện chương trình nắn chỉnh biến dạng sách.

Thử nghiệm chương trình trên ảnh chụp của 10 quyển sách bị biến dạng: Sau khi thực hiện nắn chỉnh biến dạng có khoảng 7 quyển sách đảm bảo về mặt hình dạng, về màu sắc và đường nét có thể lưu lại và sử dụng được ngay. Số sách còn lại nhìn thấy ở mép của nó vẫn còn xuất hiện hiện tượng răng cưa và lỗ hổng. Do đó, số sách này chưa sử dụng được ngay, đòi hỏi phải áp dụng thêm kỹ thuật để lấp lỗ hổng.

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Luận văn này đã trình bày một số kỹ thuật nắn chỉnh ảnh 2D như hiệu chỉnh độ nghiêng, cong vênh, biến dạng, lọc nhiễu, nâng độ tương phản ảnh, làm cho ảnh rõ hơn, nét hơn. Dựa vào một số kỹ thuật nắn chỉnh ảnh vừa nêu, đã chọn được kỹ thuật phù hợp để áp dụng cho đối tượng cụ thể là nắn chỉnh biến dạng quyển sách sau thu nhận.

Tuy nhiên, do thời gian và năng lực bản thân còn hạn chế nên mới nghiên cứu được một số kỹ thuật nắn chỉnh ảnh thông dụng chứ chưa tìm được kỹ thuật tối ưu nhất. Còn chương trình thử nghiệm mới tạo được một số ít các khuôn mẫu nắn chỉnh sách và chương trình chưa tự động nhận dạng được các ảnh quyển sách đầu vào để tìm khung mẫu nắn chỉnh có sẵn dựa trên cơ sở tương đương về hình dạng. Hạn chế khác nữa là sau khi nắn chỉnh một số quyển sách vẫn còn lỗ hổng.

Hướng phát triển là tiếp tục nghiên cứu các kỹ thuật nắn chỉnh ảnh 2D và phân tích, so sánh, đánh giá các kỹ thuật này, từ đó lựa chọn kỹ thuật phù hợp nhất để áp dụng vào việc nắn chỉnh biến dạng cho từng đối tượng cụ thể. Nghiên cứu các phương pháp để lấp lỗ hổng sau khi nắn chỉnh biến dạng (chẳng hạn phương pháp tam giác, phương pháp đoạn thẳng, sử dụng thuật toán tô màu). Phát triển chương trình nắn chỉnh biến dạng sách để tạo được nhiều khuôn mẫu nắn chỉnh đa dạng, phong phú hơn, áp dụng nắn chỉnh được nhiều loại sách khác nhau, mở rộng ra là không những nắn chỉnh biến dạng sách mà còn có thể nắn chỉnh biến dạng cho các đối tượng khác nữa.

Hướng mở của luận văn là tìm hiểu phương pháp để cài đặt chương trình có thể tự động nhận dạng và xử lý được nhiều ảnh đầu vào cùng lúc dựa trên các mô hình ảnh mẫu có sẵn dựa trên cơ sở sự tương đương về hình dạng của các hình ảnh đầu vào.

TÀI LIỆU THAM KHẢO

Tiếng Việt:

[1] Lương Mạnh Bá, Nguyễn Thanh Thủy (2002), Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học kỹ thuật.

[2] Nguyễn Đăng Bình (2011), Giáo trình xử lý ảnh số, Đại học khoa học Huế. [3] Võ Phương Bình (2010), Giáo trình đồ họa máy tính, Đại học Đà Lạt. [4] Nguyễn Quang Hoan (2006), Xử lý ảnh, Học viện công nghệ bưu chính viễn thông Hà Nội.

[5] Nguyễn Thị Nguyệt (2009), Nội suy ảnh và một số ứng dụng, Luận văn thạc sĩ – Đại học Thái Nguyên.

[6] Nguyễn Quang Sơn (2008), Nghiên cứu một số phương pháp phát hiện biên, Luận văn thạc sĩ – Đại học Thái Nguyên.

[7] Trần Lê Quang Thịnh (2013), Nghiên cứu một số kỹ thuật xóa đối tượng nhỏ trong ảnh, Luận văn thạc sĩ – Đại học Lạc Hồng.

[8] Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, Đại học Thái Nguyên.

[9] Trần Ngọc Tú (2010), Ứng dụng phép biến đổi Wavelet trong xử lý ảnh, Luận văn thạc sĩ – Học viện công nghệ bưu chính viễn thông.

Tiếng Anh:

[10] Dwayne Phillips (2000), Image Processing in C, Second edition.

[11] Frank Y. Shih (2010), Image Processing and Pattern Recognition, Fundamentals and Techniques, Copyright © 2010 by the Institute of Electrical and Electronics Engineers, Inc.

[12] Ian T. Young, Jan J. Gerbrands, Lucas J. Van Vliet (1998), Fundamentals of Image Processing, Version 2.2 copyright © 1998.

[13] Ioannis Pitas (2000), Digital Image Processing Algorithms and Applications, John Wiley & Sons, Inc. New York, NY, USA ©2000.

[14] Jonas Gomes (1997), Warping and Morphing of Graphical Objects. [15] Jonathan M. Blackledge (2005), Digital Image Processing, Mathematical and Computational Methods.

[16] Magdil Delport (2007), Morphing in Two Dimensions: Image Morphing, Copyright © 2007 Stellen bosch University.

[17] Rafael C. Gonzalez, Richard E. Woods (1992), Digital Image Processing, Second edition.

Trang Web:

[18] Henry Johan, Yuichi Koiso, Tomoyuki Nishita, Morphing Using Curves and Shape Interpolation Techniques, truy cập ngày 12 tháng 9 năm 2012,

<http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.26.8844&rep=rep1&typ e=pdf>.

[19] Image Processing, truy cập ngày 03 tháng 01 năm 2013,

<http://www.geo.mtu.edu/geoschem/docs/IDL_Manuals/IMAGE%20PROCESSIN G.pdf>.

[20] Lav Varshney (2004), Face Metamorphosis and Face Caricature: A User’s Guide, truy cập ngày 12 tháng 9 năm 2012,

<http://www.mit.edu/~lrv/cornell/publications/426%20Report%202.pdf>. [21] Nguyễn Đăng Bình, truy cập ngày 03 tháng 01 năm 2013, <http://nguyendangbinh.org/xulyanh/baigiang>.

[22] Image morphing techniques, truy cập ngày 12 tháng 9 năm 2012, <http://www.sorging.ro/en/member/serveFile/format/pdf/slug/image-morphing- techniques>.

[23] Lập trình một số bài toán cơ bản trong xử lý ảnh số, truy cập ngày 12 tháng 9 năm 2012, <http://www.thuvientructuyen.vn/chi-tiet-tai-

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nghiên cứu một số kỹ thuật nắn chỉnh ảnh 2d (Trang 49)