Nghiên cứu một số kỹ thuật nội suy ảnh và ứng dụng
Trang 2ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN - -
NGƯỜI HƯỚN DẪN KHOA HỌC
PGS.TS ĐỖ NĂNG TOÀN Thái Nguyên, 2009
Trang 3Sau quá trình làm luận văn, với nội dung đề tài nội suy và ứng dụng, tuy có nhiều khó khăn trong việc sưu tầm tài liệu, làm luận văn, nhưng đến nay luận văn của tôi đã hoàn thành với sự giúp đỡ, chỉ bảo tận tình của thầy giáo hướng dẫn, các
thầy cô trong Viện Công nghệ thông tin và Khoa Công nghệ thông tin- ĐH Thái Nguyên
Tôi xin cam đoan toàn bộ nội dung bản luận văn này là do tôi tự sưu tầm, tra cứu thông tin trên mạng, trong một số sách tham khảo và sắp xếp, hoàn thiện cho
phù hợp với nội dung yêu cầu của đề tài
Cho đến nay nội dung luận văn này của tôi chưa từng được công bố hay xuất bản dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ luận văn của
sinh viên nào hay bất kỳ một công trình nghiên cứu nào
Tất cả phần mã nguồn của chương trình đều do tôi tự học hỏi, thiết kế và xây dựng, trong đó có sử dụng một số thuật toán được các tác giả xuất bản công khai
và miễn phí trên mạng Internet, sách giáo trình xử lý ảnh Nếu sai tôi xin hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày10 tháng 11 năm 2009
Người cam đoan
Nguyễn Thị Nguyệt
Trang 4Năm tháng làm luận văn cũng là thời gian mà tôi đúc kết được nhiều kinh nghiệm trong việc tìm hiểu, nghiên cứu cũng như làm bài Để có được luận văn này tôi xin trân thành cảm ơn thầy giáo hướng dẫn PGS TS Đỗ Năng Toàn - Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt Nam Tôi cũng xin bày tỏ lòng biết ơn sâu sắc đến thầy, về sự hướng dẫn tận tình trong quá trình học tập, nghiên cứu Thầy đã tận tình, chỉ bảo, giúp đỡ tôi trong quá trình làm luận văn
Bên cạnh đó tôi xin bày tỏ lòng biết ơn đến Ban lãnh đạo Trường Đại học Thái Nguyên – Khoa Công nghệ thông tin, Trung tâm học liệu, trường CĐ Kinh tế - Kỹ thuật đã tận tình động viên tạo điều kiện giúp đỡ tôi trong thời gian học tập, làm luận văn
Tôi xin bày tỏ lòng biết ơn sâu sắc đến Viện Công nghệ Thông tin- Viện Khoa học và Công nghệ Việt Nam, Khoa Kỹ thuật công nghiệp- trường CĐ KT-KT đã tạo điều kiện thuận lợi cho tôi trong thời học tập nghiên cứu
Tôi xin gửi lời cám ơn chân thành đến những người thân trong gia đình, bạn bè và đồng nghiệp về những sự quan tâm, động viên và giúp đỡ tôi trong thời gian qua
Thái Nguyên, ngày10 tháng 11 năm 2009
Học viên
Trang 5[3] TS.Ngô Văn Sỹ (2007), “Bài giảng xử lý ảnh số”, Chương 1, Tr (1-28)
[4] rịnh Thị Vân Anh (2006), “Kỹ thuật đồ họa”, Chương trình FTIT,
Trang 6IEEE 90 (3): 319–342
[5] R Keys, (1981) "Cubic convolution interpolation for digital image processing" IEEE Transactions on Signal Processing, Acoustics, Speech, and Signal Processing
[6] T Beier, B Costa, L Darsa, L.Velho, “Morphing and Warping Graphical Object”, SIGGRAPH, 1997
[7] CHE N ,S E., AND WILLIA M S, L View interpolation for im- age synthesis Proc SIGGRAPH 93 In Computer Graphics (1993), pp 279–288 [8] HA RTLEY, R I In defence of the 8-point algorithm In Proc Fifth Intl Conference on Computer Vision (1995), pp 1064–1070
[9] KUMAR , R., ANANDAN , P., IRANI , M., BER G E N , J., AND HANNA , K Representation of scenes from collections of im- ages In Proc IEEE Workshop on Representations of Visual Scenes (1995), pp 10–17 [10] MC MILLA N, L., AND BI SHOP, G Plenoptic modeling Proc SIGGRAPH 95 In Computer Graphics (1995), pp 39–46
[11] SEITZ , S M., AND DYE R , C R Physically-valid view syn- thesis by image interpolation In Proc IEEE Workshop on Representations of Visual Scenes (1995), pp 18–25
[12] WOL BE RG , G Digital Image Warping IEEE Computer So- ciety Press, Los Alamitos, CA, 1990
Trang Web
Trang 7[3].Wikipedia, http://en.wikipedia.org/wiki/Interpolation, 6/10/09
[4].Wikipedia, http://en.wikipedia.org/wiki/Linear_interpolation, 6/10/09 [5].Wikipedia, http://en.wikipedia.org/wiki/Nearest neighbor_interpolation, 8/9/09 [6].Wikipedia, http://en.wikipedia.org/wiki/Bicubic_interpolation, 8/08/09
[7] http://www.dpreview.com/learn/?/key=interpolation, 8/09/09 DANH MỤC HÌNH VẼ
Trang
Hình 1.1 : Minh họa tọa độ của lân cận các điểm ảnh 9
Hình 1.2 : Quan hệ giữa các điểm ảnh 10
Hình 1.3 : Toàn bộ hình ảnh của một con rắn 19
Hình 1.4 : Hình ảnh da của con rắn (100%) 19
Hình 1.5 : Ảnh phóng to da của con rắn lên 500% .19
Hình 1.6 : Mô tả việc tạo mới điểm ảnh 20
Hình 1.7 : Biểu đồ hiện thị quá trình nội suy làm trơn răng cưa 20
Hình 1.8 : Ảnh phóng to không dùng nội suy 21
Hình 1.9 : Ảnh phóng to có dùng nội suy 21
Hình 1.10: Hình ảnh nội suy 22
Hình 1.11: Minh họa giá trị ước tính sinh ra nhờ nội suy 23
Hình 1.12: Minh họa việc thêm giá trị nội suy 23
Hình 1.13: Minh họa việc phóng to nhờ nội suy 24
Hình 1.14: Minh họa quá trình quay ảnh 24
Hình 2.1: Minh họa nội suy Nearest Neighbor .29
Hình 2.2: Minh họa phép nội suy Affine 30
Trang 8Hình 2.6: Minh họa phép nội suy Bilinear Interpolation 38
Hình 2.7: Minh họa nội suy trilinear 42
Hình 2.8: Biểu diễn định giá fc(x,y) bằng nội suy song tuyến 45
Hình 2.9: Ảnh tịnh tiến với di chuyển dx, dy 47
Hình 2.10: Nội suy sinh khung trung gian .49
Hình 2.11: Mô tả nội suy theo thời gian 50
Hình 2.12: Tái tạo cảnh theo ba bước 51
Ảnh chụp 3.1 : Hình ảnh nắn chỉnh 56
Ảnh chụp 3.2 : Hình ảnh nội suy sau nắn chỉnh 56
Hình 3.1 : Các điểm đặc trưng và điểm M 57
Ảnh chụp 3.3 : Kết quả nội suy sau khi nắn chỉnh 60
Ảnh chụp 3.4 : Mô phỏng các khung hình trung gian 61
Ảnh chụp 3.5 : Khung hình trung gian sinh ra bằng ước lượng 62
Ảnh chụp 3.6 : Giao diện của chương trình nội suy 65
Ảnh chụp 3.7 : Hình ảnh nhận được từ chức năng nội suy 66
Ảnh chụp 3.8 : Hình ảnh nhận được từ chức năng liệt kế 66
Ảnh chụp 3.9 : Hình ảnh nhận được từ phép lọc ảnh 67
Ảnh chụp 3.10: Hình ảnh nhận được từ phép thay thế 67
Trang 91.2.1 Những khai niệm cơ bản 6
1.2.1.1 Điểm ảnh (Picture Element) 6
1.2.1.2 Độ phân giải của ảnh 7
1.2.1.3 Mức xám của ảnh 7
1.2.1.4 Các kiểu ảnh 8
1.2.1.5 Quan hệ giữa các điểm ảnh 10
1.2.2 Một số thuộc tính cần quan tâm của ảnh số 12
1.2.3 Toạ độ ảnh 13
1.3 Nội suy ảnh 15
1.3.1 Khái niệm nội suy ảnh 15
1.3.2 Các vấn đề với nội suy ảnh số 18
1.3.3 Một số vấn đề liên quan đến nội suy ảnh 23
Chương 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH 27
2.1.1 Nội suy các pixel gần nhất (Nearest Neighbor Interpolation) 29
2.1.2 Nội suy tam giác (Affine interpolation) 30
2.1.3 Nội suy song khối (Bicubic Interpolation) 33
2.1.4 Nội suy tuyến tính (linear interpolation) 35
2.1.5 Nội suy song tuyến (bilinear interpolation) 39
2.1.6 Nội suy tam tuyến tính (trilinear) 43
2.1.7 Các phép nội suy không gian 44
2.1.8 Phương pháp ước lượng chuyển động: 47
2.1.9 Phép nội suy thời gian và bù chuyển động 49
Chương 3: MỘT SỐ ỨNG DỤNG CỦA NỘI SUY ẢNH 56
3.1 Nắn chỉnh hình thu nhận ảnh 56
3.2 Sinh ra hình ảnh khuyết thiếu trong làm phim hoạt hình 62
3.3 Mô tả chương trình đã cài đặt 64
3.2 Giới thiệu chương trình 66
PHẦN KẾT LUẬN……… 70 TÀI LIỆU THAM KHẢO
Trang 10PHẦN MỞ ĐẦU
Trong những năm gần đây công nghệ thông tin phát triển với tốc độ nhanh chóng về cả phần cứng và phần mềm Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế v.v Sự phát triển của phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hướng mới cho sự phát triển phần mềm, đặt biệt là lĩnh vực xử lý ảnh cũng như công nghệ thực tại ảo đã ra đời và thâm nhập mạnh mẽ vào đời sống của con người
Ảnh thu được sau quá trình thu nhận ảnh hoặc các phép biến đổi không tránh khỏi nhiễu hoặc khuyết thiếu Sự sai sót này một phần bởi các thiết bị quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả Việc khắc phục những nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh
Các hệ xử lý ảnh trong quá trình phân tích ảnh, tăng cường ảnh để nâng cao chất lượng ảnh Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh bị biến dạng
Xuất phát trong hoàn ảnh đó luận văn lựa chọn đề tài: Nghiên cứu một
số kỹ thuật nội suy ảnh và ứng dụng là một việc làm không chỉ có ý nghĩa
khoa học mà còn mang đậm tính thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh trong khi thực tế đang đặt ra những yêu cầu đòi hỏi
Trang 11Về lý thuyết: Tìm hiểu khái quát về xử lý ảnh, nghiên cứu các kỹ thuật nội suy trong việc bổ sung, làm trơn ảnh, sinh ảnh trung gian
Về thực tiễn: Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng hợp các kỹ thuật để hướng đến ứng dụng thực tế cho các kỹ thuật tìm hiểu này
Ngoài tài liệu tham khảo và phụ lục cấu trúc luận văn bao gồm phần mở đầu, phần kết luận và 3 chương nội dung, cụ thể:
Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH Chương 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH
Chương 3: ỨNG DỤNG NỘI SUY ẢNH
Nói chung việc xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá trình chụp Các chương trình xử lý ảnh thực hiện các phép xử lý đối với ảnh số trên máy tính Việc xử lý, biến đổi ảnh có sử dụng đến các kỹ thuật nội suy ảnh, các kỹ thật nội suy này sẽ tính toán để thêm một điểm ảnh (pixel) thích hợp vào giữa hai điểm ảnh kề nhau So với độ phân giải quang học, điểm ảnh nội suy sẽ làm tăng độ phân giải thực tế của bức ảnh Tiến trình này sẽ thêm pixel vào hình ảnh bằng cách tính toán những pixel có sẵn bao quanh các pixel mới thêm vào để xác định màu sắc tương ứng cho các pixel mới Việc nội suy này buộc phải dùng thuật toán gia tăng lượng pixel để chèn vào những pixel hiện có trong hình để thay đổi kích thước tổng thể của hình ảnh
Để hiểu thêm về xử lý ảnh, các quá trình xử lý ảnh có sử dụng đến kỹ thuật nội suy ta có thể đi vào từng phần trong luận văn sau:
Trang 12Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung quanh chúng ta
Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận biết thông qua thị giác (Nguồn: Chương I - Nhập môn xử lý ảnh - Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), NXB Khoa học kỹ thuật )
Việc trang bị cho máy tính có khả năng thị giác như con người không phải là việc dễ dàng Chúng ta đang sống trong một không gian 3D, khi máy tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến có sẵn như camera, lại thường cho ảnh 2D Như vậy, việc mất mát thông tin của hình ảnh sẽ xảy ra Với những cảnh động thì sự di chuyển của đối tượng
Trang 13hay sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai lệch thông tin rất lớn
Ngày nay cùng với sự phát triển của ngành CNTT, chúng ta mong muốn đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính để thực hiện các mục đích khác nhau của con người như: phân tích ảnh, phục hồi ảnh, nâng cao chất lượng ảnh với mục đích làm cho ảnh sắc nét hơn hoặc làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh bị biến dạng Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và biểu diễn dưới dạng số gọi là ảnh số Ngày nay một số máy ảnh số sử dụng giải thuật nội suy để tạo ra ảnh có dung lượng cao hơn, khả năng thu nhận của bộ cảm biến ảnh hoặc tăng cường khả năng zoom (phóng to, thu nhỏ) kỹ thuật số của máy
Việc xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá trình chụp Như vậy xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên máy tính Máy tính sử dụng các phần mềm xử lý ảnh để phân tích, biến đổi ảnh nhằm làm cho ảnh đẹp hơn Hầu như tất cả các phần mềm chỉnh sửa ảnh đều sử dụng 1 hoặc nhiều phương pháp nội suy Hình ảnh sẽ mịn màng, không bị "vỡ hạt" khi phóng to tùy vào thuật toán được sử dụng trong giải thuật nội suy Điều quan trọng cần ghi nhớ là giải thuật nội suy sẽ không thêm thông tin gì mới cho hình ảnh cả, nó chỉ thêm điểm ảnh và làm tăng dung lượng của tập tin mà thôi Tuy nhiên nhờ những phần mềm xử lý này mà ảnh có thể được phóng to, thu nhỏ hay biến đổi tuỳ ý mà ảnh vẫn đẹp Những biến đổi này đẹp hay xấu tuỳ theo mục đích của người sử dụng, nhưng muốn ảnh biến đổi theo đúng mục đích của mình thì điều quan trọng là người dùng cần phải hiểu ảnh
Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới
Trang 14xung quanh phần 1.2 sẽ cho biết ảnh hay điểm ảnh là gì ? điểm ảnh có độ phân giải như thế nào và có những loại ảnh nào ?
1 2 Những vấn đề cơ bản trong hệ thống xử lý ảnh 1.2.1 Những khai niệm cơ bản
1.2.1.1 Điểm ảnh (Picture Element)
Ảnh trong thực tế (ảnh tự nhiên) là một ảnh liên tục về không gian và về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính, cần thiết phải tiến hành số hoá ảnh nhằm biến đổi gần đúng một ảnh liên tục thành một tập điểm, phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian), và lượng hoá thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề nhau Trong quá trình này người ta sử dụng khái niệm điểm ảnh (pixel) Như vậy một ảnh là một tập hợp các điểm ảnh Khi sử dụng đến nội suy thì việc phân biệt hai điểm ảnh kề nhau là việc cần thiết
Điểm ảnh (pixel) được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng Mỗi pixel gồm một cặp toạ độ x, y và màu
Như vậy, một ảnh là một tập hợp các điểm ảnh Khi được số hoá, nó thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu, n dòng và p cột Ta nói ảnh gồm n x p pixels Người ta thường kí hiệu I(x,y) để chỉ một pixel Thường giá trị của n chọn bằng p và bằng 256 Một pixel có thể lưu trữ trên 1, 4, 8 hay 24 bit Mỗi điểm ảnh khi mã hoá sẽ được biểu diễn dưới dạng 8 bít Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28
= 256 (0, 1, , 255), nên với 256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit và từ đó có thể biểu diễn ảnh
Trang 15dưới nhiều dạng khác nhau Số pixel tạo nên một ảnh gọi là độ phân giải (resolution)
1.2.1.2 Độ phân giải của ảnh
Độ phân giải là mật độ điểm ảnh được ấn định trên một ảnh số Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không gian hai chiều
Ví dụ: Với màn CGA(320x200) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc x 200 điểm ảnh So sánh màn hình CGA 12 (Color Graphic Adaptor) thì thấy ảnh mịn hơn màn hình CGA 17 Như vậy diện tích càng rộng thì độ mịn của ảnh càng kém đi, cũng như khi phóng to một ảnh cũng vậy, ảnh càng to thì càng bị vỡ hạt, độ mịn càng kém
1.2.1.3 Mức xám của ảnh
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó Mỗi phần tử trong ma trận được gọi là một phần tử ảnh hoặc điểm ảnh (pixel) Một điểm ảnh có hai đặc trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám
a Các thang giá trị mức xám thông thường
Thông thường có các thang mức xám như : 16, 32, 64, 128, 256 (với lý do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám thì có thể biểu diễn: 28
= 256 mức (0… 255) thì mức 256 là mức phổ dụng
b Mức xám ở ảnh đen trắng
Ảnh đen trắng là ảnh chỉ có hai màu đen trắng, mức xám ở các điểm ảnh có thể khác nhau Nếu dùng 8 bit (1 byte) để biểu diễn mức xám, thì số
Trang 16các mức xám có thể biểu diễn được là 8
2 hay 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất
c Mức xám ở ảnh nhị phân
Ảnh chỉ có hai mức đen, trắng phân biệt, tức dùng 1 bít mô tả 21
mức khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1
d Mức xám ở ảnh màu
Ảnh màu được tạo nên từ ba màu cơ bản (Red, Blue, Green), người ta dùng 3 byte để mô tả mức mầu, khi đó giá trị màu: 28*3
= 224 = 16,7 triệu màu Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần 24 bit, 24 bit này được chia thành ba khoảng 8 bit Mỗi khoảng này biểu diễn
cho cường độ sáng của một trong các màu chính 1.2.1.4 Các kiểu ảnh
a Ảnh chỉ số (Index Images)
Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu (map) Ma trận dữ liệu có thể có kiểu thuộc lớp uint8, uint16 hoặc kiểu double Ma trận bản đồ màu là một mảng m x 3 kiểu double bao gồm các giá trị dấu phẩy động nằm giữa 0 và 1 Mỗi hàng của bản đồ chỉ ra các giá trị mà: red, green và blue của một màu đơn Một ảnh chỉ số sử dụng ánh xạ trực tiếp giữa giá trị của pixel ảnh tới giá trị trong bản đồ màu Màu sắc của mỗi pixel ảnh được tính toán bằng cách sử dụng giá trị tương ứng của X ánh xạ tới một giá trị chỉ số của bản đồ màu Giá trị 1 chỉ ra hàng đầu tiên, giá trị 2 chỉ ra hàng thứ hai trong bản đồ màu
Trang 17Một bản đồ màu thường được chứa cùng với ảnh chỉ số và được tự động nạp cùng với ảnh Tuy nhiên, ta không bị giới hạn khi sử dụng bản đồ màu mặc định, ta có thể sử dụng bất kì bản đồ màu nào Các pixel trong ảnh được đại diện bởi một số nguyên ánh xạ tới một giá trị tương ứng trong bản đồ màu
b Ảnh cường độ ( Intensity Images )
Một ảnh cường độ là một ma trận dữ liệu ảnh I mà giá trị của nó đại diện cho cường độ trong một số vùng nào đó của ảnh Ma trận có thể thuộc lớp double, uint8 hay uint16 Trong khi ảnh cường độ hiếm khi được lưu với bản đồ màu Những phần tử trong ma trận cường độ đại diện cho các cường độ khác nhau hoặc độ xám
c Ảnh nhị phân (Binary Images )
Trong một ảnh nhị phân, mỗi pixel chỉ có thể chứa một trong hai giá trị nhị phân 0 hoặc 1 Hai giá trị này tương ứng với bật hoặc tắt (on hoặc off ) Một ảnh nhị phân được lưu trữ như một mảng lôgíc của 0 và 1
d Ảnh RGB ( RGB Images )
Một ảnh RGB được lưu trữ dưới dạng một mảng dữ liệu có kích thước 3 chiều m x n x 3, định nghĩa các giá trị màu red, green và blue cho mỗi pixel riêng biệt Ảnh RGB không sử dụng bảng màu Màu của mỗi pixel được quyết định bởi sự kết hợp giữa các giá trị R,G,B (Red, Green, Blue) được lưu trữ trong một mặt phẳng màu tại vị trí của pixel Định dạng file đồ hoạ lưu trữ ảnh RGB giống như một ảnh 24 bít trong đó R,G,B chiếm tương ứng 8 bít 1 Điều này cho phép nhận được 16,7 triệu màu khác nhau
Một mảng RGB có thể thuộc lớp double, uint8 hoặc uint16 Trong một mảng RGB thuộc lớp double, mỗi thành phần màu có giá trị giữa 0 và 1 Một pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một pixel mà thành phần màu là (1,1,1) được hiển thị với màu trắng
Trang 18Trong một ảnh RGB khoảng trắng tương ứng với giá trị cao nhất của mỗi màu riêng rẽ Chẳng hạn trong ảnh mặt phẳng R, vùng trắng đại diện cho sự tập trung cao nhất của màu đỏ thuần khiết Nếu R được trộn với G hoặc B ta sẽ có màu xám Vùng màu đen trong ảnh chỉ ra giá trị của pixel mà không chứa màu đỏ R= 0 Tương tự cho các mặt phẳng màu G và B
1.2.1.5 Quan hệ giữa các điểm ảnh
Khi nội suy ảnh số chúng ta thường phải tìm lân cận của điểm ảnh để xác định giá trị màu, phục vụ cho công việc nội suy tô màu hay lấp lỗ hổng
Giả sử một ảnh số được biểu diễn bằng hàm f(x,y) Tập con của các điểm ảnh là s; cặp điểm ảnh có quan hệ với nhau là p, q Chúng ta nêu một số
khái niệm sau:
a Lân cận của điểm ảnh ( Image Neighbors)
Giả sử có hai điểm ảnh p tại toạ độ (x,y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang ( chính hướng Đông,Tây, Nam , bắc)
Các lân cận chéo: Các điểm lân cận chéo Np(p) (có thể coi lân cận
chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
(p x y x y x y x y
Tây Đông
Nam
Bắc
Hình 1.1.Minh họa tọa độ của lân cận các điểm ảnh
Trang 19Tập kết hợp:N8(p)N4(p)Np(p)là tập hợp 8 lân cận của điểm ảnh p,
còn gọi là liên kết 8
Chú ý: Nếu (x,y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh
Ví dụ : tìm lân cận 4 và lân cận 8 của điểm ảnh với việc cho điểm M như hình sau :
b Khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p toạ độ (x,y), q
toạ độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:
1 Dpq với D(p,q)0 nếu và chỉ nếu pq
2 Dpq Dqp
3 Dpz Dpq Dqz z là một điểm ảnh khác
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)
và q(s,t) được định nghĩa như sau:
(pqxs 2 yt 2 1/2
Khoảng cách khối: Khoảng cách D4(p,q) được gọi là khoảng cách khối
đồ thị (City-Block Distance) và được xác định như sau:
,(
Trang 20Khái niệm điểm ảnh lân cận là một khái niệm quan trọng của ảnh số và nó được ứng dụng rất nhiều trong việc tìm điểm ảnh lân cận trong việc sử dụng phương pháp nội suy ảnh để thêm điểm ảnh thích hợp vào ảnh
Bất kỳ 2 điểm ảnh được gọi là lân cận 4 nếu chúng có khoảng cách D4
=1 từ mỗi điểm ảnh Tương tự, 2 điểm ảnh gọi là lân cận 8 nếu khoảng cách giữa chúng là D8 =1 Lận cận 4 và lân cận 8 được minh hoạ như sau:
Hình 1.2 Quan hệ giữa các điểm ảnh
Khi xác định được khoảng cách giữa các điểm ảnh, người ta sẽ tìm được các điểm ảnh lân cận Điều này rất quan trọng trong việc sử dụng phương pháp nội suy để thêm điểm ảnh thích hợp vào giữa hai điểm ảnh lân cận nhau, nhằm mục đích cải thiện ảnh ban đầu Bên cạnh việc cần tìm ra lân cận của điểm ảnh thì người ta còn quan tâm đến một số vấn đề sau :
1.2.1.6 Một số thuộc tính cần quan tâm của ảnh số
a Đường viền (Border): đường viền của một vùng ảnh R là tập hợp các
điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R
b Biên ảnh (Edge): Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi
đột ngột về mức xám Tập hợp các điểm biên tạo thành đường bao của ảnh Thuộc tính biên gắn liền một điểm ảnh và lân cận của nó, đôi khi nó giúp cho việc xác định đặc tính giữa một cặp điểm lân cận
Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng lân cận
Trang 21c Độ sắc nét của ảnh: Độ sắc nét là khả năng phát hiện những chi tiết trong
ảnh Mắt người ít nhạy cảm với sự thay đổi nhanh hay chậm của độ sáng trong mặt phẳng ảnh nhưng nhạy cảm với sự thay đổi trung gian
Độ phân giải trong ảnh được giới hạn bởi khả năng phân giải ở mắt người Khi độ phân giải của ảnh cao hơn độ phân giải của mắt người thì con người không thể cảm nhận về ảnh được nữa
Độ phân giải trong quang học được định nghĩa là khoảng cách giữa 2 điểm ảnh gần nhất mà con người không thể phân biệt được
Mỗi một ảnh đều có độ sắc nét, độ phân giải riêng, việc xử lý ảnh nhằm mục đích làm cho ảnh sắc nét hơn, đẹp hơn hay gần với ảnh gốc hơn, và khi biến đổi bằng một trong các phương pháp nội suy là làm cho ảnh có khả năng zoom tốt, mà vẫn đảm bảo độ sắc nét, tránh được hiện tượng nhiễu hay răng cưa
Để sử dụng một trong các phương pháp nội suy trong xử lý ảnh làm cho ảnh tốt hơn phải trải qua quá trình tìm được điểm ảnh thích hợp để chèn điểm ảnh mới vào, việc tìm kiếm này người ta dựa vào toạ độ của điểm ảnh, hay toạ độ pixel
1.2.1.7 Toạ độ ảnh a Toạ độ pixel
Nhìn chung, phương pháp thuận tiện nhất cho việc biểu diễn vị trí trong một ảnh là sử dụng toạ độ pixel Trong hệ toạ độ này, ảnh được xử lý như một lưới của các phần tử riêng biệt được đánh thứ tự từ đỉnh tới đáy và từ trái sang phải
Với toạ độ pixel, thành phần đầu tiên r (hàng) được tăng khi đi từ trên xuống dưới trong khi c (cột) được tăng khi đi từ trái sang phải Hệ toạ độ pixel là giá trị nguyên, có giá trị nằm trong khoảng giữa 1 và chiều dài của hàng hay cột
Trang 22b.Toạ độ không gian
Trong toạ độ không gian, vị trí trong một ảnh được định vị trên một mặt phẳng và chúng được mô tả bằng một cặp x và y (không phải r(hàng) và c(cột) như toạ độ pixel)
Hệ toạ độ không gian gần tương ứng với hệ toạ độ pixel trong một chừng mực nào đó Chẳng hạn, toạ độ không gian của điểm giữa của bất kì pixel nào được phân biệt với toạ độ pixel của pixel đó Cũng có một vài khác biệt, tuy nhiên, trong tọa độ pixel, góc trên trái của một ảnh là (1,1) trong khi trong toạ độ không gian, vị trí này mặc định là (0.5,0.5) Sự khác nhau này là do hệ toạ độ pixel là rời rạc trong khi toạ độ không gian là liên tục Cũng vậy, góc trên trái luôn là (1,1) trong hệ pixel, nhưng ta có thể chỉ ra một điểm gốc không chính quy cho hệ toạ độ không gian Một sự khác biệt dễ gây nhầm lẫn nữa là quy ước: thứ tự của các thành phần nằm ngang và thẳng đứng được phục vụ cho kí hiệu của hai hệ thống Như đã đề cập trước đây, toạ độ pixel được đại diện bởi một cặp (r,c) trong khi toạ độ không gian được biểu diễn bởi (x,y) Khi cú pháp cho một hàm sử dụng r và c, nó tham chiếu đến hệ toạ độ pixel Khi cú pháp sử dụng x, y nó đang ngầm định sử dụng hệ toạ độ không gian
Khi sử dụng hệ toạ độ không gian không chính quy thì theo mặc định, toạ độ không gian của một ảnh tương ứng với toạ độ pixel Chẳng hạn, điểm giữa của pixel tại (5,3) có một toạ độ không gian là x=3, y=5 (nhớ rằng thứ tự của toạ độ bị đảo ngược)
Trong một số tình huống, ta có thể muốn sử dụng toạ độ không gian không chính quy (không mặc định) Chẳng hạn, ta có thể chỉ ra góc trên trái của một ảnh tại điểm (19.0,7.5) thay cho (0.5,0,5) Nếu ta gọi một hàm mà trả về toạ độ cho ảnh này, toạ độ được trả lại sẽ là giá trị trong hệ toạ độ không chính quy
Trang 231.3 Nội suy ảnh
1.3.1 Khái niệm nội suy ảnh
Trong toán học giải tích số, phép nội suy là một phương pháp xây dựng mới các điểm dữ liệu trong phạm vi của một tập hợp rời rạc những điểm dữ liệu được biết
Trong kỹ thuật và khoa học thường có một số điểm dữ liệu thu được bằng việc lấy mẫu hay thí nghiệm, và thử xây dựng một chức năng mà gần gũi phù hợp với những điểm dữ liệu đó
Có thể nói nội suy là 1 giải thuật phần mềm dùng để thêm vào (hoặc bỏ bớt) số điểm ảnh trên ảnh kỹ thuật số Tiến trình nội suy sẽ dựa trên màu sắc của những điểm ảnh cũ để xác định màu cho các điểm ảnh mới gần nó nhất Một số máy ảnh số sử dụng giải thuật nội suy để tạo ra ảnh có dung lượng cao hơn khả năng thu nhận của bộ cảm biến ảnh hoặc tăng cường khả năng zoom kỹ thuật số của máy Hầu như tất cả các phần mềm chỉnh sửa ảnh đều sử dụng 1 hoặc nhiều phương pháp nội suy Hình ảnh sẽ mịn màng, không bị "vỡ hạt" khi phóng to hay biến đổi ảnh tùy vào thuật toán được sử dụng trong giải thuật nội suy
Có nhiều phương pháp nội suy khác nhau, nhưng cần sử dụng phương pháp nội suy nào cho phù hợp cả về tốc độ và kinh tế Vì thế khi tính toán sử dụng phương pháp nội suy nào cần tính đến phương pháp đó cho độ chính xác đến bao nhiêu? Nó đắt bao nhiêu? Nội suy mịn bao nhiêu? Nhiều điểm dữ liệu được sử dụng như thế nào?
Một số phương pháp nội suy phổ biến nhất như: - Affine Interpolation (Nội suy tam giác)
- Nearest Neighbor Interpolation (Nội suy các pixel gần nhất ) - Bicubic Interpolation (Nội suy song khối )
- Billinear Interpolation ( Nội suy song tuyến tính)
Trang 24- Trilinear Interpolation (Nội suy tam tuyến tính) - Nội suy không gian
- Nội suy thời gian có bù chuyển động
Ngoài ra còn nhiều phương pháp nội suy hình ảnh khác nhưng không được sử dụng phổ biến, thế nhưng điều mà ta quan tâm là giải thuật nội suy sẽ không thêm thông tin gì mới cho hình ảnh cả, nó chỉ thêm điểm ảnh và làm tăng dung lượng của tập tin
Tuy nhiên các phương pháp nội suy làm việc theo một cách giống nhau Trong mỗi trường hợp, để tính giá trị của một pixel đã được nội suy, chúng tìm điểm trong ảnh ra mà pixel nằm tại đó Sau đó gán một giá trị tới các pixel ra bằng cách tính toán giá trị trung bình có trọng số của một số pixel lân cận Trọng số dựa trên cơ sở khoảng cách tới điểm đang xét
Trong xử lý ảnh người ta sử dụng rất nhiều đến kỹ thuật nội suy Sau khi thu nhận ảnh người ta bắt đầu xử lý và các quá trình xử lý này đã có sử dụng đến kỹ thuật nội suy như:
Xử lý điền đầy (Filling a region): Là quá trình tô màu một vùng nhất định bằng cách nội suy giá trị pixel từ viền của vùng
Thay đổi kích thước của ảnh như phóng đại ảnh, quay ảnh, bóp méo đều có thể chỉ ra kỹ thuật nội suy cần sử dụng
Sinh ra hình ảnh trung gian khi thực hiện nội suy từ một khung ảnh nguồn và một khung ảnh đích
Theo mặc định ở các chương trình, sử dụng phương pháp nội suy các pixel gần nhất để tính giá trị các pixel của ảnh ra, sử dụng nội suy không gian để thực hiện sinh các khung hình trung gian Tuy nhiên, ta có thể chỉ định các phương pháp nội suy khác
Các hàm sử dụng tuyến tính yêu cầu một tham số chỉ ra phương pháp nội suy Với hầu hết các hàm, phương pháp mặc định được sử dụng là nội suy
Trang 25các pixel gần nhất Phương pháp này tạo ra một kết quả có thể chấp nhận được cho hầu hết các ảnh và là phương pháp duy nhất thích hợp với ảnh chỉ số Với ảnh cường độ hay RGB thường chỉ ra kiểu song tuyến tính hoặc song khối bởi vì những phương pháp này cho kết quả tốt hơn
Với ảnh RGB, nội suy thường được thực hiện trên mặt phẳng R,B,G một cách riêng biệt Với ảnh nhị phân, nội suy gây ra những ảnh hưởng mà ta có thể nhận thấy được Nếu sử dụng nội suy song tuyến tính hoặc song khối, giá trị tính toán được cho pixel trong ảnh ra sẽ không hoàn toàn là 0 hoặc 1 Ảnh hưởng trên ảnh kết quả phụ thuộc vào lớp của ảnh vào
Nói chung với các loại ảnh khi tô màu lấp lỗ hổng, phóng to hay thu nhỏ để khắc phục được những khiếm khuyết của ảnh thì có thể sử dụng đến nội suy
Việc giảm kích thước (hình học) của một ảnh có thể gây ra những ảnh hưởng nhất định lên ảnh, chẳng hạn như hiện tượng xuất hiện răng cưa tại biên của ảnh Điều này là do thông tin luôn bị mất khi ta giảm kích thước một ảnh Răng cưa xuất hiện như những gợn sóng trong ảnh sau cùng
Vì vậy hầu như các phần mềm chỉnh sửa ảnh đều sử dụng 1 hoặc nhiều phương pháp nội suy Hình ảnh sẽ mịn màng, không bị "vỡ hạt" khi phóng to tùy vào thuật toán được sử dụng trong giải thuật nội suy Điều quan trọng là giải thuật nội suy sẽ không thêm thông tin gì mới cho hình ảnh cả, nó chỉ thêm điểm ảnh và làm tăng dung lượng của tập tin
Tóm lại: Nội suy là quá trình sử dụng để ước lượng một giá trị ảnh ở một vị trí giữa các pixel Chẳng hạn, nếu ta thay đổi kích thước một ảnh, nó sẽ chứa nhiều pixel hơn ảnh gốc, ta có thể sử dụng nội suy để tính giá trị cho các pixel thêm vào Có thể hiểu nôm na nội suy là phóng đại hình ảnh lên bằng các thuật toán tự có trong máy Hầu hết các máy ảnh kỹ thuật số hiện nay đều có số điểm ảnh được tính tới hàng triệu Các máy ảnh thế hệ trước có số điểm
Trang 26ảnh khoảng 1,3-2 triệu (1,3-2 Megapixel) trong khi các máy ảnh hiện nay thường đạt trên 3 Megapixel
Để in được các tấm ảnh đẹp và rõ nét ở kích thước 10x15 cm hoặc 13x18 cm, bạn cần sở hữu một chiếc máy có độ phân giải tối thiểu 1-2 Megapixel Để có được các bức ảnh lớn hơn, chẳng hạn 20x25 cm, nên sử dụng các loại máy ảnh lớn hơn 2 triệu điểm ảnh Hiện nay, các nhà sản xuất nổi tiếng đã tung ra các dòng máy ảnh có độ phân giải tương đương với chất lượng của máy ảnh chụp film (trên 13 Megapixel)
Cũng giống như các máy ảnh số, 1 số máy nghe nhạc cũng sử dụng thuật toán nội suy để bổ sung điểm ảnh vào độ phân giải quang học Các thuật toán nội suy sẽ tính toán để thêm một điểm ảnh thích hợp vào giữa hai điểm ảnh kề nhau So với độ phân giải quang học, điểm ảnh nội suy sẽ làm tăng độ phân giải thực tế của bức ảnh Tiến trình này sẽ thêm pixel vào hình ảnh bằng cách tính toán những pixel có sẵn bao quanh các pixel mới thêm vào để xác định màu sắc tương ứng cho các pixel mới
Việc nội suy này buộc phải dùng thuật toán gia tăng lượng pixel để chèn vào những pixel hiện có trong hình để thay đổi kích thước tổng thể của hình
Khi biến đổi ảnh người ta dùng đến một trong các phương pháp nội suy, đây chính là các giải thuật để chèn điểm ảnh hay thêm pixel vào hình ảnh Việc dùng phương pháp nội suy sẽ làm cho kích thước tổng thể của hình ảnh tăng lên hay làm tăng độ phân giải thực tế của bức ảnh
1.3.2 Các vấn đề với nội suy ảnh số
Chắc chắn không sớm thì sau này, chúng ta đều muốn làm cho bức ảnh hay bản in lớn tuy nhiên nếu một nhiếp ảnh gia in các hình ảnh ở kích thước của máy ảnh kỹ thuật số của mình anh ta có thể sẽ thất vọng trong kích cỡ của in ấn hay chất lượng in ấn sẽ bị giảm đi sau mỗi lần phóng to bức ảnh
Trang 27Như vậy làm thế nào để chúng ta nhận được bức ảnh với cỡ lớn mà chất lượng vẫn đảm bào Rõ ràng chúng ta cần tạo ra nhiều điểm ảnh (pixel) Quá trình tạo thêm điểm ảnh này gọi là nội suy ảnh Điều này có thể thực hiện bởi phầm mềm nội suy ảnh Phần mềm nội suy phân tích các điểm ảnh trong một hình ảnh và cho biết thêm chi tiết dựa trên các điểm ảnh được phân tích Ví dụ nội suy thay đổi kích thước của hình ảnh 200%, nói cách khác nó gấp đôi kích thước của hình ảnh Kết quả là mỗi điểm ảnh sẽ trở thành 4 điểm ảnh (chủ yếu là 2x2) Những hình ảnh có kích thước gấp 4 và bây giờ chúng ta có thể in hình ảnh đó với chất lượng tốt hơn Còn khi sử dụng nội suy trong việc tô màu vùng thì giá trị các pixel được nội suy từ viền của vùng Các pixel thêm vào này xác định giá trị màu nội suy từ các màu lân cận Việc nội suy giá trị màu được ứng dụng nhiều trong công việc nắn chỉnh hình học, bóp méo, sinh ảnh hình ảnh sẽ trở lại trạng thái đẹp như ban đầu và có màu như màu gốc dựa vào việc nội suy Tuy nhiên khi nội suy vẫn có một số vấn đề sau:
Vấn đề 1: Nội suy không tạo mới dữ liệu
Khi phóng to ảnh, nội suy chỉ chèn thêm điểm ảnh chứ không tạo mới dữ liệu Tức là các thông tin của bức ảnh sẽ được phân bố trên một diện tích lớn hơn khi phóng to ảnh, như vậy bức ảnh sẽ không nhìn tốt hơn như ở kích thước ban đầu Hình ảnh có thể bị xuống cấp Như vậy một tập tin được nội suy sẽ trông không giống như một hình ảnh chưa nội suy Nội suy chỉ khắc phục được hiện tượng răng cưa, làm hình ảnh mịn màng chứ không giữ nguyên trạng thái của bức ảnh ban đầu
Vấn đề 2: Nội suy khắc phục hiện tượng răng cưa
Răng cưa là một thuật ngữ dùng để mô tả các đường thẳng hoặc đường cong không trơn mượt, trở thành răng cưa Do bản chất của ảnh kỹ thuật số, mỗi ảnh kỹ thuật số được tạo ra bởi các điểm ảnh, bởi vậy các đường thẳng và các đường cong trong hình ảnh kỹ thuật số không thực sự là đường thẳng hay
Trang 28đường cong trơn mà là mô hình răng cưa của các điểm ảnh Có thể mô tả điều này bằng hình ảnh như sau:
Hình 1.3 cho thấy toàn bộ hình ảnh, Hình 1.4 (ảnh 100%) cho thấy hình ảnh da của con rắn, lúc này các đường cong răng hình thức xuất hiện tương đối mịn Hình 1.5 phóng to da của con rắn lên 500% có thể nhận thấy rằng các đường cong thực sự là mô hình răng cưa của các điểm ảnh
Với hình ảnh nhỏ các răng cưa này bằng mắt thường khó nhìn thấy được, nhưng khi phóng to hình ảnh lên thì lại rất rõ ràng
Nếu một hình ảnh đã được mở rộng bằng việc nhân đôi các điểm ảnh, hiện tượng răng cưa sẽ trở thành một vấn đề lớn (hình ảnh cuối cùng sẽ giống như hình 1.5) Tuy vậy các phần mềm nội suy xem hình ảnh tại một thời điểm nào đó Với ảnh cá nhân phần mềm nội suy xem màu sắc của những điểm ảnh
Hình 1.3 Toàn bộ hình ảnh con rắn Hình 1.4 Hình ảnh da con rắn
Hình 1.5: Hình ảnh phóng to da con rắn lên 500%
Trang 29như màu sắc của những điểm ảnh lân cận Khi tạo các điểm ảnh mới phần mềm cố gắng hiểu các con số màu sắc của các điểm ảnh mới phải dựa trên các điểm ảnh nguyên bản và các điểm ảnh lân cận nó
Hình 1.6 minh hoạ những gì phần mềm hiện nội suy, sau khi phân tích ban đầu điểm ảnh 1 và 2, phần mềm tạo mới một điểm ảnh với màu sắc là giữa các màu sắc ban đầu của các điểm ảnh
Nội suy giúp chúng ta khử răng cưa Nhìn lại hình 1.9 thấy rằng các răng cưa ở biên ảnh rất được chú ý, nơi ánh khá tối làm cho răng cưa rất nổi bật
Điểm ảnh nguồn 1
Hình 1.6: Mô tả việc tạo mới điểm ảnh
Sau nội suy
Điểm ảnh mới Điểm ảnh nguồn 2 Điểm ảnh nguồn 2 Điểm ảnh nguồn 1
Hình 1.7: Biểu đồ hiện thị quá trình nội suy làm trơn răng cưa
Trang 30Hình 1.7 mô tả quá trình giảm thiểu các răng cưa Minh chứng khái niệm trong màu đen và trắng
Biểu đồ đầu tiên chỉ ra các giá trị của một cạnh Các điểm ảnh đi từ tối (ở phí bên trái của biểu đồ) đến sáng (phía bên phải biểu đồ) Có thể nhận thấy việc chuyển đổi rất đột ngột Trong thời gian nội suy, các điểm ảnh mới được thêm vào cùng với các cạnh Các điểm ảnh mới sẽ được gán các giá trị giữa các điểm ảnh màu đen bên cạnh đường thẳng và các điểm ảnh màu trắng bên cạnh khác
Nói cách khác, nội suy sẽ tạo ra các điểm ảnh có tính chất khác nhau cùng một cạnh Điểm ảnh tạo ra có màu xám (giữa màu đen và màu trắng) Điều này được hiện thị trong biểu đồ thứ hai Việc chuyển trạng thái được thực hiện dần dần, được thể hiện bởi điểm ảnh màu xám mới Bây giờ thay vì các cạnh màu đen hay trắng cứng chuyển thành màu đen, xám, trắng mềm mại hơn Điều này cũng tạo ra các răng cưa mềm hơn, ít bị chú ý hơn
So sánh với hình 1.8 và hình 1.9 ở dưới hiện thị nội suy như thế nào để giảm các răng cưa
Hình 1.8 cho thấy phóng to ảnh 500% (phóng to hình ảnh, không nội suy) Hình 1.9 cho thấy ảnh phóng to 500% và có nội suy ở cùng một hình ảnh Rõ ràng khi thực hiện nội suy, hiện tượng răng cưa đã giảm đi đáng kể, các cạnh trở nên mềm mại hơn
Hình 1.8 Ảnh phóng to không nội suy Hình 1.9 Ảnh phóng to có nội suy
Trang 31Khi sử dụng phần mềm nội suy để giảm các răng cưa, nhưng không thể loại bỏ được hoàn toàn hiện tượng này
Vấn đề 3: Nội suy là nguyên nhân làm mất độ sắc nét
Cùng một quá trình làm trơn mượt các răng cưa, cũng giống như làm mượt các cạnh trong một hình ảnh
Hãy tưởng tượng, một hình ảnh có cạnh sắc nét, đẹp (nó có một sự chuyển đổi ngẫu nhiên giữa màu đen hoặc trắng) Nhìn lại hình 1.9 ta thấy những gì xảy ra khi thực hiện nội suy với các cạnh Việc chuyển đổi màu đen/trắng thành màu đen/xám/trắng một cách mềm mại Điều này đã làm giảm đi độ sắc nét của hình ảnh Đây cũng là lý do tại sao hầu hết các công việc làm sắc nét nên được thực hiện sau khi nội suy
Vấn đề 4: Nội suy không sinh ra hình ảnh thực sự tự nhiên
Kỹ thuật nội suy cho phép tạo ra các hình ảnh trung gian, rất hiệu quả, nhưng người ta không giám chắc rằng những trạng thái đó có thực sự tự nhiên hay không Điều này hoàn toàn quyết định bởi khả năng đánh giá của người sử dụng đối với một trạng thái hình ảnh và thiết kế làm sao để đạt được kết quả tốt nhất Nhược điểm của các phương pháp nội suy hiện tại là không tính toán được sự thay đổi về điểm nhìn hoặc tư thế của vật thể Điều này dẫn đến kết quả là những biến đổi hình ảnh ba chiều đơn giản (như: chuyển dịch hoặc xoay chiều) sẽ trở nên vô cùng khó khăn
1.3.3 Một số vấn đề liên quan đến nội suy ảnh
Phép nội suy ảnh xuất hiện trong mọi bức ảnh số tại giai đoạn nào đó
như bóp méo, nắn chỉnh, lấp lỗ hổng hay trong sự phóng to bức ảnh
Ảnh ban đầu
Sau nội suy Thay đổi kích cỡ
Bóp méo
Trang 32Ngay cả khi cùng một hình ảnh thay đổi kích cỡ hoặc bóp méo được thực hiện, kết quả có thể khác nhau đáng kể tùy thuộc vào thuật toán nội suy
Nội suy hoạt động bằng cách sử dụng các dữ liệu để biết giá trị ước tính ở điểm chưa rõ Ví dụ: nếu bạn muốn biết nhiệt độ tại buổi trưa, nhưng chỉ được đo ở 11h và 1h chiều, bạn có thể ước tính giá trị của nó bằng việc thực hiện một phép nội suy tuyến tính:
Nếu bạn đã có thêm một thước đo tại 11:30 AM, bạn có thể thấy rằng số lượng lớn của nhiệt độ tăng đã xảy ra trước khi giờ trưa, và có thể sử dụng điểm dữ liệu bổ sung này để thực hiện một phép nội suy bậc hai
Khi có càng nhiều những phép đo nhiệt độ gần buổi trưa, phức tạp hơn
và chính xác hơn thì giải thuật phép nội suy có thể được xây dựng
20 21 22
Hình 1.11: Biểu đồ minh họa giá trị ước tính sinh ra nhờ nội suy
20 21 22
suy mới
Điểm nội Suy trướcBiết
Biết
Hình 1.12: Biểu đồ minh họa việc thêm giá trị nội suy
Trang 33Ví dụ khi thay đổi kích cỡ hình ảnh
Phép nội suy ảnh làm việc trong hai phương hướng, và thử đạt được một phép xấp xỉ tối ưu Màu sắc và cường độ của điểm có được dựa vào những giá trị điểm ảnh ở xung quanh Ví dụ sau đây minh họa cách thay đổi kích thước ảnh làm việc như thế nào:
Không giống những sự thay đổi nhiệt độ bất thường không khí và đường dốc lý tưởng ở trên, những giá trị điểm ảnh có thể thay đổi xa bất ngờ hơn ở vị trí kế tiếp Như với ví dụ nhiệt độ, càng biết nhiều về các điểm ảnh lân cận, thì việc nội suy sẽ càng dễ hơn Bởi vậy kết quả hình ảnh nhanh bị giảm giá trị hơn là khi bạn kéo căng một hình ảnh và phép nội suy có thể chưa bao giờ thêm chi tiết nào vào ảnh cua bạn mà chưa sẵn sàng
Quay 6 X 150
Nội suy 2D
183%
Hình 1.13: Minh họa ảnh phóng to nhờ nội suy
Trang 34Quay 900 là sự quay không tổn hao bởi vì không bao giờ có điểm ảnh nào phải định vị lại biên giới giữa hai điểm ảnh Lưu ý làm thế nào hầu hết các chi tiết bị mất chỉ là lần quay đầu tiên Mặc dù vậy hình ảnh kế tiếp sẽ suy giảm (tổn hao) ở các lần quay tiếp theo Do đó nên tránh xoay ảnh và chỉ thực hiện khi cần thiết toàn bộ sự tổn hao hiển nhiên trong sự tương phản màu sẽ giảm đi những quầng tối được tạo ra xung quanh màu xanh nhẹ Màu kết quả ở trên có thể được cải thiện một cách đáng kể phụ thuộc vào giải thuật phép
nội suy và nội dung đối tượng Ví dụ về sự sinh ảnh trung gian
Kỹ thuật nội suy sử dụng hai hình ảnh để tạo ra một hình ảnh trung gian giữa hai hình ảnh này Rồi lại kết hợp từng nửa hình ảnh được phân tách ra từ hình ảnh trung gian Quá trình kéo căng hình ảnh được thực hiện một cách tự động, trong khi quá trình kết hợp hình ảnh lại được thực hiện bằng một số công cụ kiểm soát nhất định Bất cứ công cụ nào trong quá trình này cũng đều có thể được sử dụng vào việc ghép những hình ảnh đơn giản Những công nghệ tái tạo hình ảnh cơ bản trước đây thường tập trung vào những hình ảnh theo quy tắc
Những hình ảnh trung gian được tạo ra cho người ta ảo giác rằng vật thể biến chuyển một cách nhanh chóng (xoay vòng và chuyển sang 3D) từ vị trí này sang vị trí khác (giữa các trạng thái trung gian)
Những điểm ảnh tương đương sẽ được tạo ra từ việc kết hợp giữa những tác động của người sử dụng với những phối hợp tự động được tạo ra từ những kỹ thuật tái tạo hình ảnh hiện có Khi điểm tương đương được xác định chính xác thì có thể đảm bảo được rằng các phương pháp đã được đề cập trong phần này có thể tạo ra những hình ảnh bảo lưu được nguyên hình ảnh gốc Trong thực tế, chúng ta đã biết rằng một sự tương đương ở mức tương đối thường là đã đủ để tạo ra các biến thể hình ảnh khá thuyết phục
Trang 35Chương 2
MỘT SỐ KỸ THUẬT NỘI SUY ẢNH
Hầu như tất cả các phần mềm chỉnh sửa ảnh đều sử dụng 1 hoặc nhiều phương pháp nội suy trong quá trình biến đổi ảnh Hình ảnh sẽ mịn màng, không bị "vỡ hạt" khi phóng to, thu nhỏ tùy vào thuật toán được sử dụng trong giải thuật nội suy Điều quan trọng là giải thuật nội suy sẽ không thêm thông tin gì mới cho hình ảnh, nó chỉ thêm điểm ảnh và làm tăng dung lượng của tập tin
Trong chế bản hay những công việc có liên quan đến hình ảnh đều gặp phải một trở ngại đó là việc phóng to ảnh sẽ dẫn đến tình trạng ảnh bị bể, nên không thể in và chỉnh sửa được Muốn phóng to ảnh người ta thường dùng phương pháp chụp, rửa hình, dùng máy quét để quét ảnh với độ phân giải cao, nhưng làm như thế rất mất thời gian lại không kinh tế Hiện tại có rất nhiều nhà sản xuất phần mềm đã khắc phục được các vấn đề này bằng cách dùng các phương pháp nội suy ảnh, và bù đắp sự tương quan màu sắc trong quá trình biến đổi ảnh Các phương pháp nội suy này được ứng dụng rất nhiều trong thực tế, như để xử lý biến đổi ảnh, sản xuất những chiếc máy ảnh đời mới, Trong những chiếc máy ảnh kỹ thuật số này người ta sử dụng phương pháp nội suy để tính chất lượng pixel trên 1 đơn vị ảnh, trong các điều kiện ánh sáng được chụp của máy ảnh kỹ thuật số (KTS) Bộ cảm biến gắn trong chíp máy ảnh kỹ thuật số sẽ ghi nhận hình ảnh và ánh sáng, sau đó đưa ra các phép tính để kết xuất ra 1 file ảnh Tuy nhiên vì bộ cảm biến của hầu hết các máy chụp ảnh kỹ thuật số hiện nay hầu như vẫn chưa thể đưa ra được 1 file ảnh có kích thước tiêu chuẩn đúng như 1 mắt phim 35mm truyền thống, điều này đồng nghĩa với sự sai lệch giữa ống kính máy ảnh vốn được sản xuất theo các tiêu chuẩn truyền thống và bộ cảm biến của máy ảnh kỹ thuật số hiện đại
Trang 36Vì vậy giá trị nội suy được sinh ra nhằm tái tạo, phục hồi những sai lệch giữa ống kính và bộ cảm biến Giá trị nội suy càng cao thì file ảnh đưa ra càng không đẹp vì sự sai lệch đó là lớn Một số máy ảnh kỹ thuật số không có giá trị nội suy thì chất lượng càng kém vì bộ cảm biến và chíp vi xử lý chỉ có thể nhận được hình ảnh ở chất lượng thấp mà không có cách khắc phục
+ Nếu không có giá trị nội suy, chất lượng ảnh của máy ảnh kỹ thuật số sẽ hoàn toàn phụ thuộc vào ống kính, bộ cảm biến và chíp xử lý dữ liệu
Tuy nhiên hiện nay bên cạnh những máy ảnh kỹ thuật số có sử dụng phương pháp nội suy thì đã xuất hiện nhiều phần mềm nội suy ảnh cho phép phóng to ảnh, bóp méo ảnh hay biến đổi ảnh, sinh ảnh trung gian mà hình ảnh vẫn rõ nét, cho ra ảnh có dung lượng rất gọn nhẹ, tính tuỳ biến cao, cho phép phóng to ảnh theo dung lượng file, cho phép sinh ra các khung hình trung gian trông tự nhiên như thật
Mặc dù nội suy có những hạn chế nhưng để có thể khắc phục những nhược điểm của hình ảnh, chúng ta vẫn nên thực hiện nội suy với những bức ảnh kém chất lượng khi thực hiện phóng to hình ảnh Chất lượng của hình ảnh phụ thuộc rất nhiều vào việc sử dụng giải thuật nội suy, vì giải thuật nội suy chính là thuật toán xác định các giá trị màu sắc của các điểm ảnh mới được tính toán
Trang 37Thực hiện nội suy là tốt cho công việc phóng to hình ảnh, biến đổi hình ảnh, có nhiều phương pháp nội suy khác nhau, phương pháp này sử dụng tốt cho hình ảnh này, nhưng phương pháp khác lại thích hợp với hình ảnh khác Vì vậy việc sử dụng phương pháp nội suy thích hợp là rất quan trọng
Sự khác nhau của các thuật toán nội suy chính là cách phân tích màu sắc của các điểm ảnh và sử dụng thông tin đó để xác định giá trị màu sắc của các điểm ảnh mới
Các giải thuật nội suy có thể được nhóm thành hai loại: Thích nghi và không thích nghi Những phương pháp thích nghi thay đổi phụ thuộc vào những gì đang nội suy (tăng độ sắc nét, làm mịn cạnh), trong khi những phương pháp không thích nghi thực hiện với tất cả các điểm ảnh đều như nhau.Thuật toán không thích nghi bao gồm: Neighbor Nearest (nội suy các pixel gần nhất), Linear (tuyến tính), Bilinear (song tuyến), Trilinear (tam tuyến), Bicubic (song khối), Affine (tam giác) và một số thuật toán khác
Phụ thuộc vào sự phức tạp của thuật toán, được sử dụng từ 0 đến 256 (hoặc nhiều hơn) điểm ảnh kế tiếp khi nội suy, bao gồm nhiều điểm ảnh liền kề nhau Những giải thuật này có thể được sử dụng để bóp méo, sinh ảnh và thay đổi kích thước một bức ảnh
Giải thuật Thích nghi bao gồm nhiều giải thuật trong phần mềm được cấp phép như : Qimage, Pro PhotoZoom, fractal và nhiều phần mềm khác
Các thuật toán chủ yếu được thiết kế để tối đa hóa các chi tiết tự tạo trong hình ảnh mở rộng, do đó, một số có thể không được sử dụng để bóp méo hoặc xoay hình ảnh
2.1.1 Nội suy các pixel gần nhất (Nearest Neighbor Interpolation)
Đây là phương pháp cơ bản nhất của giải thuật nội suy Điểm ảnh mới sẽ lấy màu của điểm ảnh gốc gần nó nhất Nếu bạn phóng to ảnh 200%, 1 điểm ảnh sẽ được bổ sung thêm 4 điểm ảnh nữa (2 x 2) có màu sắc giống như
Trang 38điểm ảnh gốc Phương pháp này sẽ tạo ra hiệu ứng răng cưa (jaggies) khi ảnh được phóng lớn Nội suy các pixel gần nhất chỉ hiệu quả khi ứng dụng cho hình vẽ vì sẽ bảo toàn đường biên cứng, thời gian đáp ứng nhanh và không làm tăng nhiều dung lượng tập tin
Có thể nói nội suy các điểm gần nhất (còn được gọi là nội suy điểm lấy mẫu) là một phương pháp đơn giản, nội suy với nhiều kích thước Nội suy giá trị gần đúng không đưa ra một số điểm trong không gian chỉ đưa ra một số giá trị của các điểm xung quanh điểm đó
Thuật toán nội suy các điểm gần nhất chỉ cần chọn giá trị của các điểm gần nhất, và không xem xét các giá trị khác ở tất cả các điểm lân cận Thuật toán rất đơn giản để triển khai thực hiện, và thường được sử dụng trong thời gian thực 3D vẽ để chọn màu sắc cho một giá trị kết cầu bề mặt
Gải thuật này đơn giản, nhanh nhất nhưng cũng là tinh vi nhất Nó chỉ lấy màu sắc từ các điểm ảnh gần nhất rồi gán vào các điểm ảnh mới được tạo ra từ các điểm ảnh đó Do vậy phương pháp nội suy này được coi là khả dụng với việc tạo ra các ảnh có chất lượng cao Tuy nhiên nó chưa thực sự khắc phục được hiện tượng răng cưa vì vậy nó là phương pháp cũng ít được sử dụng
2.1.2 Nội suy tam giác (Affine interpolation)
Đây là phép nội suy hai tam giác trong hệ toạ độ Barycentric
Hình 2.1 Nội suy Nearest Neighbor
Trang 39
Giả sử chúng ta có hai tam giác và muốn nội suy hai tam giác này cho nhau Một cách đơn giản nhất là sử dụng kỹ thuật ánh xạ dựa trên hệ toạ độ
Barycentric được minh hoạ như hình 2.2
Trước tiên chúng ta định nghĩa một ánh xạ T cho các đỉnh của tam giác:
T(),(),() Với các điểm còn lại chúng ta sẽ ánh xạ chúng theo toạ độ Barycentric(1,2,3)nghĩa là: P1*A2*B3*C (2.1)
Trong đó: i 0 và 1 2 3 1
Một điểm Q là ánh xạ của P qua T được tính toán như sau:
Hệ tọa độ Barycentric (tọa độ trọng tâm)
Trong toán học, tọa độ Barycentric là tọa độ được xác định bởi các đỉnh của một tam giác, tọa độ Barycentric là một hình thức tọa độ đồng nhất
Gọi x1,x2 , xn là đỉnh của một đa giác đồng phẳng trong một không gian vectơ A Nếu đối với một số điểm p trong không gian véc tơ A thì ta có:
a )
( 1 2 1 1 2 2 , trong đó các hệ số a1, a2, an là những tọa độ trọng tâm (Barycentric) của P đối với x1,x2 ., xn Khi tọa độ không phải là duy nhất, điểm P trong đa giác lồi x1, x2 , xn là các đỉnh của đa giác
Hình 2.2: Phép nội suy Affine