Giờ đõy, mọi ngƣời đó quỏ quen thuộc với cỏc bức ảnh thụng thƣờng, nờn nú ớt gõy đƣợc sự chỳ ý. Chớnh vỡ thế mà một bức ảnh mang phong cỏch khảm mới lạ chắc chắn sẽ thu hỳt đƣợc sự chỳ ý của mọi ngƣời hơn. Điều này cú tỏc dụng tớch cực trong cỏc lĩnh vực quảng cỏo, giới thiệu sản phẩm. Vớ dụ nhƣ ảnh quảng cỏo ản phẩm của hóng Ikea – một hóng sản xuất đồ gia dụng, ảnh bỡa tạp chớ y học Georgetown …
CHƢƠNG 2: KỸ THUẬT KHẢM ẢNH 2.1 Kỹ thuật đan đa phõn giải (Multiresolution spline)
Kỹ thuật đan đa phõn là kỹ thuật đƣợc nghiờn cứu bởi PETER J. BURT và EDWARD H. ADELSON thuộc trung tõm nghiờn cứu RCA David Sarnoff.
Kỹ thuật này đƣợc dựng để kết hợp hai hoặc nhiều ảnh vào một ảnh khảm lớn hơn. Đầu tiờn, cỏc ảnh dựng để đan sẽ đƣợc phõn tớch thành tập band-pass[5] cỏc thành phần hỡnh ảnh đó đƣợc lọc. Sau đú, cỏc ảnh thành phần sẽ đƣợc ghộp lại thành ảnh khảm band-pass tƣơng ứng. Trong bƣớc này, cỏc ảnh thành phần đƣợc nối với nhau bằng hàm trung bỡnh trọng số bờn trong miền chuyển tiếp đú là tỉ lệ kớch thƣớc độ dài súng đƣợc biểu diễn trong cỏc band đú. Cuối cựng, cỏc ảnh khảm band-pass này đƣợc tổng hợp lại thành ảnh khảm mong muốn. Bằng cỏch này hàm nối đƣợc làm khớp với tỉ lệ với cỏc đƣờng bao bờn trong những ảnh đú. Khi cỏc đƣờng bao thụ xuất hiện gần biờn, chỳng đƣợc pha trộn dần dần qua một khoảng cỏch tƣơng đối lớn mà khụng đƣợc làm mờ đi cỏc chi tiết xung quanh đƣờng viền.
Hỡnh 2.1: Hai hỡnh ảnh đƣợc nối ghộp sao cho đƣờng nối càng mịn càng tốt Đối với cỏc ảnh chụp từ kớnh viễn vọng, trong trƣờng hợp này thỡ kỹ thuật khảm ảnh đƣợc dựng để tạo ra cỏ hỡnh ảnh cú phạm vi rộng lớn hoặc là mức độ chi tiết hơn một ảnh đơn. Trong lĩnh vực quảng cỏo hay đồ họa mỏy tớnh, cụng nghệ này cú thể tổng hợp lờn hỡnh ảnh từ cỏc thành phần khỏc nhau.
Một vấn đề chung cho tất cả cỏc ứng dụng của khảm ảnh đú là khi cỏc ảnh đƣợc ghộp nối với nhau thỡ đƣờng biờn giữa chỳng phải đƣợc làm ẩn đi. Chỉ cần một khỏc biệt nhỏ trong mức xỏm của ảnh trờn đƣờng biờn rộng cũng rất dễ nhận thấy. Thật khụng may là điều này rất khú trỏnh khỏi, cú thể do vị trớ đặt mỏy hay trong khõu xử lý. Nhƣ vậy một kỹ thuật cần đũi hỏi đú sẽ thay đổi mức xỏm của hỡnh ảnh trong vựng lõn cận của đƣờng biờn để đạt đƣợc sự chuyển tiếp mƣợt giữa cỏc ảnh. Hai hỡnh ảnh đƣợc dựng để ghộp nối cú thể xem nhƣ hai bề mặt, nơi mà cƣờng độ hỡnh ảnh I(x, y) tƣơng ứng đƣợc chiếu lờn khụng gian x, y. Vấn đề đặt ra, nhƣ trong hỡnh minh họa 2.1, cú thể đƣợc núi nhƣ sau: Làm thế nào để hai mặt đú cú thể đƣợc làm biến dạng một cỏch nhẹ nhàng để cú đƣợc một đƣờng nối trơn tru? Họ đó sử dụng thuật ngữ đan ghộp ảnh - ―image spline‖ để chỉ kỹ thuật làm nờn điều này. Một kĩ thuật đan ghộp ảnh tốt sẽ cho ra những bức ảnh ghộp cú đƣờng biờn mịn.
Hỡnh 2.2: Cỏc hàm trung bỡnh trọng số và chiều rộng T của miền chuyển tiếp Sự khỏc biệt của độ lớn trong mức xỏm của đƣờng biờn ảnh khảm cú thể đƣợc giảm xuống mức nào đú bởi lựa chọn đỳng đắn của vị trớ đƣờng biờn khi đan cỏc ảnh vào nhau. Đƣờng nối cú thể đƣợc cải thiện bằng cỏch thờm vào đú một đƣờng nối tuyến tớnh để giỏ trị điểm ảnh hai bờn cõn bằng nhau. Một quỏ trỡnh chuyển đổi vẫn mƣợt mà cú thể thu đƣợc bằng cỏch sử dụng một kỹ thuật gần đõy đó đƣợc đề xuất bởi Peleg [5]. Chức năng hiệu chỉnh ―mịn nhất cú thể‖ đó đƣợc xõy dựng, nú thờm vào mỗi ảnh của ảnh khảm để loại bỏ sự khỏc biệt của đƣờng biờn. Tuy nhiờn kĩ thuật này khụng thiết thực đối với cỏc ảnh lớn, bởi chức năng hiệu chỉnh phải đƣợc tớnh toỏn bằng việc sử dụng một thuật toỏn lặp đi lặp lại. Họ quan tõm tới phƣơng phỏp đan ghộp trung bỡnh trọng số. Để bắt đầu, ngƣời ta cho rằng những hỡnh ảnh sẽ đƣợc nối chồng lờn nhau để nú cú thể tớnh toỏn giỏ trị mức xỏm của cỏc điểm trong một khu vực
chuyển tiếp nhƣ trung bỡnh trọng số trong mỗi ảnh. Giả sử trong hai bức ảnh, Fl(i) ở bờn trỏi cũn Fr(i) nằm bờn phải hai bức ảnh này đƣợc nối chồng lờn nhau tại điểm i (biểu diễn trờn một chiều để đơn giản húa cỏc kớ hiệu). Đặt Hl(i) là hàm trọng số bờn trỏi và hàm này giảm đơn điệu từ trỏi sang phải và đặt Hr(i) = 1 – Hl(i). Sau đú hỡnh ảnh đƣợc đan ghộp F cho bởi:
F(i) = Hl(i— ) Fl(i) + Hr(i— ) Fr(i) (2.1) Rừ ràng là với một sự lựa chọn H thớch hợp, kĩ thuật trung bỡnh trọng số sẽ cho kết quả là miền chuyển tiếp mịn. Tuy nhiờn, chỉ riờng điều này chƣa đảm bảo đƣợc vựng biờn sẽ đƣợc làm mờ. Cho T là độ rộng của miền chuyển tiếp với Hl chạy từ 1 đến 0. Nếu T là nhỏ so với cỏc điểm đặc trƣng của ảnh thỡ biờn cú thể vẫn xuất hiện. Mặt khỏc, nếu T rộng so với cỏc điểm đặc trƣng của ảnh thỡ trong miền chuyển tiếp cỏc chi tiết của cả hai ảnh cú thể xuất hiện chồng lờn nhau, giống nhƣ trong một bức ảnh đƣợc phơi sỏng hai lần.
Trong hỡnh 2.3, cỏc bức ảnh gốc hỡnh 2.3a và hỡnh 2.3b cú cựng kớch thƣớc và chỉ khỏc nhau một số dịch chuyển khụng đỏng kể vị trớ thẳng đứng và một sự thay đổi nhỏ về mức xỏm. Sự khỏc biệt đầu tiờn cú thể nảy sinh từ sự biến dạng quang học hoặc độ lệch thực tế của ảnh, sự khỏc biệt thứ hai cú thể do sự khỏc biệt về điều kiện khớ quyển hoặc về cụng nghệ nhiếp ảnh.
Trong vớ dụ này, ảnh khảm đƣợc tạo bằng cỏch nối nửa trỏi của hỡnh 2.3a với nửa phải của hỡnh 2.3b. Nếu việc này đƣợc thực hiện mà khụng cú bất kỡ biện phỏp nào để làm mịn vựng chuyển tiếp ảnh (T = 0) thỡ đƣờng biờn sẽ xuất hiện rừ nột nhƣ trong hỡnh 2.3c. Nếu thay vào đú, cỏc ảnh đƣợc nối bằng phƣơng phỏp trung bỡnh trọng số trong một miền chuyển tiếp hẹp (T = 8) thỡ đƣờng biờn đú vẫn xuất hiện nhƣng nú sẽ mờ đi nhƣ trong hỡnh 2.3d. Khi cỏc ảnh đƣợc đan với miền chuyển tiếp rộng (T = 64) thỡ khụng nhỡn thấy cạnh nữa nhƣng trong miền chuyển tiếp cỏc ngụi sao nhỡn nhƣ đƣợc phơi sỏng hai lần nhƣ hỡnh 2.3e. Rừ ràng là kớch thƣớc vựng chuyển tiếp liờn quan đến kớch thƣớc của cỏc đặc trƣng trong hỡnh ảnh, nú đúng vai trũ rất quan trọng trong việc đan ghộp ảnh. Để loại bỏ đƣờng biờn hiện ra thỡ chiều rộng của vựng chuyển tiếp phải đƣợc so sỏnh ớt nhất với kớch thƣớc lớn nhất của cỏc đặc trƣng trong ảnh. Mặt khỏc để trỏnh hiệu ứng phơi sỏng hai lần, vựng chuyển tiếp khụng đƣợc lớn hơn nhiều so với đặc trƣng nhỏ nhất của hỡnh ảnh. Khụng cú sự lựa chọn nào của T thỏa món đủ cả hai yờu cầu trong những hỡnh ngụi sao của hỡnh 2.3 bởi sự khuếch tỏn nền và những ngụi sao nhỏ. Cỏc hạn chế cú thể đƣợc phỏt biểu chớnh xỏc hơn trong ảnh khụng gian tần số. Đặc biệt, một T phự hợp chỉ cú thể đƣợc lựa chọn nếu những hỡnh ảnh đƣợc đan chiếm một dải tần số khụng gian tƣơng đối hẹp. Với yờu cầu phức tạp, chỳng ta cú thể quy định rằng T sẽ đƣợc so sỏnh kớch thƣớc với độ lớn của tần số thấp nhất nổi bật trong ảnh. Nếu T nhỏ hơn, thỡ sự đan ghộp sẽ giới thiệu một khớa cạnh đỏng chỳ ý khỏc. Mặt khỏc để trỏnh hiệu ứng phơi sỏng hai lần, T khụng đƣợc lớn hơn nhiều so với độ dài hai súng của cỏc thành phần cú tần số cao nhất trong bức ảnh. Điều này đảm bảo rằng sẽ khụng cú nhiều thành phần trong khu vực chuyển tiếp. Trong khi nú cú khả năng là cỏc giới han này cú thể vƣợt quỏ một chỳt mà khụng cú sự thay đổi nào đỏng chỳ ý. Vậy độ rộng dải tần của hỡnh ảnh đƣợc đan nờn xấp xỉ một quóng 8[5].
Làm thế nào để đan cỏc ảnh cú dải tần vƣợt quỏ một quóng 8? Cỏch tiếp cận đƣợc đề xuất ở đõy là đầu tiờn cỏc ảnh này cú thể đƣợc tỏch ra thành một tập cỏc ảnh thành phần band-pass. Sau đú, mỗi phần đan với một T thớch hợp. Cuối cựng, cỏc thành phần band-pass đó đan đƣợc nối lại với nhau thành ảnh khảm mong muốn. Chỳng ta
gọi hƣớng tiếp cận này là đan đa phõn giải [5]. Kĩ thuật này đó đƣợc sử dụng để tạo nờn hỡnh 2.3f.
Trong việc phõn tớch ảnh thành nhiều dải tần số, điều quan trọng là dải tần trong ảnh gốc phải đƣợc phủ đều, mặc dự cỏc dải tần bản thõn chỳng cú thể chồng chộo lờn nhau. Thực tế, tập cỏc bộ lọc low-pass[5] - bộ lọc cho phộp những ảnh cú tần số bộ hơn một tần số xỏc định đi qua đƣợc dựng để sinh một chuỗi cỏc ảnh. Trong cỏc ảnh này, giới hạn dải tần của chỳng giảm dần qua từng ảnh với bƣớc nhảy là một quóng 8. Cỏc ảnh band-pass cú thể đƣợc tạo ra dễ dàng bằng cỏch trừ mỗi ảnh low-pass cho ảnh ngay trƣớc nú. Điều này khụng chỉ chắc chắn phủ hoàn toàn dải tần, mà cũn cú ý nghĩa là ảnh khảm cuối cựng cú thể dễ dàng tạo ra bằng cỏch tổng hợp cỏc ảnh band-pass thành phần.
Chuỗi cỏc ảnh lọc low-pass G0, G1, …, GN cú thể đƣợc tạo ra bằng cỏch cuộn liờn tiếp một hàm trọng số nhỏ với ảnh. Với kĩ thuật này, mật độ ảnh mẫu sẽ giảm đi sau mỗi lần lặp, do đú độ rộng dải tần cũng giảm trong cỏc bƣớc thống nhất một quóng 8. Sự giảm bớt mẫu cũng cú nghĩa là chi phớ tớnh toỏn sẽ giảm xuống mức tối thiểu.
Hỡnh 2.4: Mụ tả phƣơng phỏp lọc 1 chiều.
Dấu chấm của mỗi dũng trong hỡnh 2.4 biểu diễn cỏc mẫu, cỏc điểm ảnh của một trong cỏc ảnh đó đƣợc lọc. Dũng thấp nhất G0 là ảnh gốc. Giỏ trị của mỗi node ở dũng tiếp theo (G1) đƣợc tớnh bằng trung bỡnh trọng số của 1 mảng con kớch thƣớc 5 x 5 của cỏc node G0. Sau đú, cỏc node của dũng G2 đƣợc tớnh từ G1 cũng với trọng số tƣơng tự. Tiến trỡnh đƣợc lặp đi lặp lại để tớnh G2 từ G1, G3 từ G2 và cứ tiếp tục nhƣ vậy. Khoảng cỏch mẫu đƣợc nhõn đụi sau mỗi lần lặp, do đú cỏc mảng liờn tiếp chỉ rộng bằng một nửa mảng trƣớc nú. Nếu chỳng ta hỡnh dung cỏc mảng này đƣợc xếp
mảng nọ chồng lờn mảng kia thỡ kết quả sẽ là một cấu trỳc dữ liệu hỡnh chúp. Nếu kớch thƣớc ảnh gốc là (2N
+1) x (2N +1) thỡ hỡnh chúp sẽ cú N+1 mức.
Cả mật độ mẫu và độ phõn giải đều giảm theo từng mức của hỡnh chúp. Trong trƣờng hợp này, chỳng ta sẽ gọi tiến trỡnh sinh ra mỗi mức của hỡnh chúp từ mức liền trƣớc nú là phộp toỏn REDURE[5]. Đặt G0 là ảnh gốc. Sau đú cho 0<l<N:
Gl = REDUCE [Gl-1] (2.2)
Nghĩa là: Gl(i,j) = (2.3)
Mẫu trọng số w(m, n) đƣợc sử dụng để sinh mỗi mức hỡnh chúp từ mức liền trƣớc nú đƣợc gọi là nhõn hàm sinh. Cỏc trọng số này đƣợc chọn theo bốn điều kiện:
Đầu tiờn, để thuận tiện cho tớnh toỏn, nhõn hàm sinh phải tỏch đƣợc:
w(m, n) = (m) (n) (2.4)
Thứ hai, mỗi hàm một chiều là đối xứng:
(0) = a, (- 1) = (1) = b, và (- 2) = (2) = c (2.5) Thứ ba, thỡ đƣợc định mức: a + 2b + 2c = 1. (2.6) Cuối cựng, mỗi node của mức l phải đúng gúp cựng một trọng số tổng vào cỏc node của mức l +1, vỡ thế a + 2c = 2b. Bõy giờ, kết hợp cỏc ràng buộc, chỳng ta nhận thấy rằng a cú thể coi là biến tự do, b = 1/4 và c = 1/4 – a/2.
2.1.1 Hàm trọng số tƣơng đƣơng
Rừ ràng là mỗi node mức l trong hỡnh chúp tƣơng ứng với một trung bỡnh trọng số của mảng con 5 x 5 cỏc node của mức l - 1. Mỗi một lần lặp tƣơng ứng với một giỏ trị trung bỡnh của mảng con của mức l - 2. Theo cỏch này, chỳng ta cú thể truy vết đƣợc cỏc trọng số từ node đó cho của hỡnh chúp ngƣợc trở lại ảnh G0 để nhận đƣợc ―hàm trọng số tƣơng đƣơng‖[5] Wl thoả món. Nếu đƣợc cuộn trực tiếp với ảnh gốc, nú sẽ cho cỏc giỏ trị node giống mức l. Đú là thuận lợi để thảo luận về tớnh toỏn dựa trờn hỡnh chúp dƣới dạng cỏc hàm trọng số tƣơng đƣơng, mặc dự tiến trỡnh lặp REDUCE hiệu quả hơn nhiều và đƣợc sử dụng trong tất cả cỏc tớnh toỏn.
Cỏc hàm trọng số tƣơng đƣơng cú nhiều tớnh chất quan trọng trong cỏc toỏn tử lọc và đan ghộp. Tớnh co gión của cỏc hàm này tăng gấp đụi sau mỗi mức của hỡnh chúp trong khi khuụn dạng của chỳng khụng thay đổi. Khuụn dạng hàm phụ thuộc vào giỏ trị của cỏc tham biến a trong nhõn hàm sinh. Vớ dụ, nếu a = 0,5 thỡ tất cả cỏc hàm sẽ cú dạng tam giỏc (triangular in shape). Nếu a = 0,4 thỡ cỏc hàm sẽ tƣơng tự với hàm mật độ xỏc suất Gauss. Việc cuộn với hàm Gauss sẽ cho hiệu ứng ảnh lọc low-pass. Cấu trỳc hỡnh chúp tƣơng đƣơng với cuộn ảnh với một tập cỏc hàm giống nhƣ hàm Gauss để tạo ra tập cỏc ảnh lọc tƣơng ứng. Chỳng ta sẽ xột chuỗi cỏc ảnh G0 , … GN này nhƣ là hỡnh chúp Gauss.
Giả sử cỏc mẫu trong G0 cỏch nhau một đơn vị khoảng cỏch. Sau đú, cỏc mẫu tại mức l cỏch nhau khoảng 2l. Điều này cú thể đƣợc thể hiện bằng độ rộng của hàm trọng số tƣơng đƣơng Wl là 2l+2 – 4, phủ 2l+2 – 3 mẫu ảnh hoặc khoảng cỏch mẫu giảm 4 lần. Với mọi i, j và l:
(2.7) Kết quả này cú đƣợc từ tớnh chất phõn bố đều của nhõn hàm sinh. Khuụn dạng Gauss và cỏc đặc tớnh tổng hợp của cỏc hàm Wl cú ý nghĩa là chỳng ta cú thể xõy dựng hàm trọng số H cần tỡm để đan ảnh (Hỡnh 2.2). Giả sử rằng Wl liờn quan tới mỗi node trong nửa trỏi của Gl trong khi trọng số bằng 0 với cỏc node bờn phải (hỡnh 2.5). Sau đú, tổng của cỏc hàm này sẽ tạo thành một hàm điệu giảm từ 1 xuống 0 với miền chuyển tiếp độ rộng T gấp 3 lần khoảng cỏch mẫu mức l. Tớnh chất này sẽ đƣợc sử dụng trong kĩ thuật đan đa phõn giải dựa trờn hỡnh chúp (pyramid-based multiresolution spline), mặc dự cỏc hàm H và W khụng bao giờ tớnh đƣợc một cỏch cụ thể.
2.1.2 Hỡnh chúp Laplace
Hỡnh chúp Gaussian là tập cỏc ảnh lọc low-pass. Để tạo ra cỏc ảnh band-pass cần thiết cho đan đa phõn giải (multiresolution spline), chỳng ta trừ mỗi mức của hỡnh chúp cho mức thấp nhất trƣớc nú. Vỡ cỏc mảng này khỏc biệt về mật độ mẫu, nờn trƣớc khi trừ cần phải nội suy cỏc mẫu trung gian. Phộp nội suy cú thể đạt đƣợc bằng cỏch đảo chiều tiến trỡnh REDUCE. Chỳng ta sẽ gọi phộp toỏn tử này là EXPAND[5]. Đặt
Gl,k là ảnh thu đƣợc bằng cỏch mở rộng Gl k lần:
Gl,0=Gl (2.8)
Và với k>0:
Gl,k=EXPAND [Gl,k-1] (2.9)
Với EXPAND, chỳng ta đó thực hiện:
Gl,k (i, j) = 4 (2.10)
Ở đõy, (2i+m)/2 và (2j+n)/2 là cỏc số nguyờn và Gl,1cựng kớch thƣớc với Gl-1 và Gl,1 cựng khớch thƣớc với ảnh gốc. Bõy giờ, chỳng ta sẽ định nghĩa một chuỗi ảnh band-pass L0, L1,….,LN. với 0 < l < N
Ll = Gl – EXPAND[Gl+1]= Gl - Gl+1,1 (2.11) Vỡ khụng cú mảng mức cao hơn để trừ cho GN, nờn chỳng ta định nghĩa LN = GN. Khi giỏ trị của mỗi node trong hỡnh chúp Gaussian thu đƣợc trực tiếp từ việc cuộn hàm trọng số Wlvới ảnh. Mỗi node của Ll cú thể thu đƣợc trực tiếp bằng cỏch cuộn Wl
- Wl+1 với ảnh. Sự khỏc biệt của hàm Gaussian-like[5] giống nhƣ những ngƣời thƣờng