Xử lí ảnh và ứng dụng xử lí ảnh
http://www.ebook.edu.vn 1 Xử lý ảnh Mục tiêu: Nắm bắt được khái niệm cơ bản về xử lý ảnh, sau đó có thể sử dụng phần mềm xử lý ảnh, viết được một số thủ tục đơn giản về xử lý ảnh. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH I-Xử lý ảnh là gì? Ảnh số là gì: Ảnh tạo bởi các điểm ảnh, điểm ảnh có vô vàn thứ, ví dụ như: ảnh chân dung, ảnh X- quang, ảnh thân nhiệt. Điểm ảnh đặc trưng cho một giá trị nào đó là 1 hàm n biến. Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số hoá, ngươif ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gina) và lượng hoá thành phần giá trị mà về nguyên tắc bừng mắt thường không phân biệt được 2 điểm kề nhau. Trong quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ picture element. Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements) được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng. Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu. - Mức xám (gray level) Mức xám là kết qu ả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số-kết quả của quá trình lượng hoá. Ví dụ: xem cả lớp là một ảnh, mỗi người là một điểm ảnh. mỗi người có một đặc trưng. Nếu xem về đặc trưng giới tính thì ảnh có 2 mức xám là; nam và nữ. Nếu xem năm cuối của năm sinh thì ảnh có nhiều nhất 10 mức xám. Khái niệm điểm không có kích thước. Ảnh Số bit/pixel Số màu Ảnh đen trắng 1 2 Ảnh đa cấp xám 8 256 Ảnh RGB 24 256 3 Ảnh 32 bit (true color+độ sâu) 32 256 4 -Kỹ thuật xử lý ảnh: là quá trình biến đổi một hình ảnh thành một hình ảnh khác bằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của người sử dụng. -Hệ thống xử lý ảnh trên máy tính: là tập hợp các kỹ thuật xử lý ảnh phục vụ cho một mục đích ứng dụng nào đó. -Đồ hoạ máy tính thiên về tổng hợp hình ảnh, còn xử lý ảnh thiên về phân tích hình ảnh. http://www.ebook.edu.vn 2 Đồ hoạ máy tính: đầu vào: là ảnh hoặc không là ảnh đầu ra: là một ảnh trên máy tính Xử lý ảnh: Đầu vào: là ảnh đầu ra: là ảnh “tốt hơn” (theo nghĩa của người sử dụng) hoặc một đặc điểm hoặc một dãy đặc điểm Trong đồ hoạ máy tính, đối tượng xử lý là 2 hoặc 3 chiều. Còn xử lý ảnh không chỉ làm việc với dữ liệu 2 chiều hay 3 chiều có khi nhiề u hơn. - Thị giác máy: là một hệ xử lý ảnh hoàn chỉnh bao gồm thu nhận ảnh, tăng cường chất lượng ảnh, nhận dạng. II- Cấu trúc của hệ thống xử lý ảnh -Thu nhận ảnh: Ảnh có thể thu nhận qua camera (thường ảnh thu nhận qua camera là tín hiệu tương tự cũng có thể là tín hiệu số hoá), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên scanner. Sau đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá. -Tiền xử lý (preprocessing): làm tốt các ảnh để nâng cao chất lượng ảnh (xoá nhiễu, tăng cấp sáng, làm trơn các biên, lọc, tăng độ tương phản…). Do những nguyên nhân khác nhau; có thể do chất lượng thiết bị thu nhận, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng Photoshop dừng ở giai đoạn này. -Trích chọn dấu hiệu (Feature Extracting): phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính…tuỳ thuộc vào từng ứng dụng. Mỗi đối tượng ảnh có đặc trưng riêng phụ thuộc phương pháp nhận dạng, một ứng dụng có nhiều phương pháp nhận dạng, mỗi phương pháp nhận dạng có nhiều phương pháp chọn dấu hiệu. -Nhận dạng: nhận dạng chữ, vân tay,… Nhận dạng ảnh: là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. III- Các mức độ của hệ thống xử lý ảnh -Mức độ thấp: chỉ biết sử dụng các kỹ thuật xử lý ảnh đơn giản, thuần tuý, không có tri thức Thu nhận ảnh Tiền xử lý Trích chọn dấu hiệu Học Nhận dạng Hậu xử lý http://www.ebook.edu.vn 3 -Trung bình: có một chút về tri thức (trí tuệ nhân tạo) -Cao: thu nhận ảnh, xử lý, nhận dạng, phân tích ảnh, ra quyết định. IV-Ứng dụng của xử lý ảnh • Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt Image→Table + Text + Image : nhận dạng được cả chữ, ảnh, bảng Image→f orm Nhận dạng chữ OCR (Optical charater Recognition), Nhận dạng nhãn OMR (Optical Mark Recognition) Nhận dạng tiếng Anh Omnipage 12.0 của hang Scansoft, Fine Reader 6.0 của hang ABBRY. Nhận dạng tiếng việt VN Docr 3.0 của Viện CNTT, Image Scan của công ty Tcapro • Kiểm tra sản phẩm So sánh mầu của sản phẩm mẫu với sản phẩm mới Kiểm tra độ tròn của chai/lọ • Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản • Địa lý: véc tơ hoá bản đồ. Các phần mềm chuyển đổi ảnh Raster sang ảnh vector R2V của hãng Able MapScan của Viện CNTT TrixSystem R2V và V2R • Hoạt hình: biến đổi hình học, bóp méo hình học • Quân sự • Dự báo thời tiết, cháy rừng, lũ lụt, sâu bệnh, khoáng sản. • Thiên văn học, vật lý, sinh học • An ninh Nhận dạng vân tay,Water Marking Nhận dạng khuôn mặt người, Nhận dạng tội phạm Dấu thông tin trong ảnh Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi công cộng • Siêu thị bar code: nhận dạng mã vạch Các robot tự động phục vụ. • Thư viện: Dùng camera để điều khiển robot. Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học để khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa hoặc lưu trữ. http://www.ebook.edu.vn 4 CHNG 2: THU NHN NH V Mễ HèNH TH HIN NH I-Thu nhn nh v thụng tin v nh 1. Thu nhn nh -Cỏc thit b thu nh thụng thng gm Camera cng vi b chuyn i tng t s AD (Analog to Digital), scanner, sensor. Scaner A4: ADF (Automatic Document Feeder), Duplex. A3: Fujitshu, Vớớonhape cm tay A0: Intergraph 250 àp -Cỏc thit b thu nhn nh ny cú th cho nh en trng, a cp xỏm, nh mu, cú phõn gii t 100 n 1600 DPI (dot per inch) -Cỏc thit b thu nhn nh cú 2 loi chớnh ng vi 2 loi nh thụng dng l Raster (Scaner, camera) v vector (sensor, bn s hoỏ, hoc c chuyn t nh Raster). -Nhỡn chung cỏc h thng thu nhn nh thc hin hai quỏ trỡnh: + Cm bin: bin i nng lng quang hc thnh nng lng i n. +Tng hp nng lng in thnh nng lng nh Trong quỏ trỡnh s hoỏ, ngi ta bin i tớn hiu liờn tc sang tớn hiu ri rc thụng qua quỏ trỡnh ly mu v lng t hoỏ thnh phn giỏ tr. *Cm nhn mu Phn nhy cm vi nh: vừng mc (retina) retina bao gm hai loi t bo: rods (dng hỡnh que) v cones (dng hỡnh nún) cone nhy vi mu sc. Cỏc t bo que cho mt hỡnh nh chung v trng chiu sỏng, nú khụng nh y vi mu sc m nhy vi ỏnh sỏng cú mc thp. Biu din mu nh sỏng mu l t hp ca ỏnh sỏng n sc. Mt ngi ch cú th cm nhn c vi chc mu. Song li cú th phõn bit ti hng ngn mu: Brightness: sc mu, cũn gi l chúi Hue: sc lng hay cũn l sc thỏi mu Saturation: bóo ho. Vi ngun sỏng n sc, hue tng ng vi bc súng [380nm, 780 nm] http://www.ebook.edu.vn 5 2. Thông tin về ảnh • Chiều rộng: số pixel/ dòng ( số byte/dòng) • Chiều cao: số dòng • độ phân giải: số pixel/inch thường là 300dpi (dots per inch) • số bit/ pixel 1 bit↔ đen, trắng (2 màu) 4 bit↔16 màu 8 bit↔256 màu n bít ↔ 2 n màu số bit/ pixel ≤ 8 phải có pallete màu > 8 dùng màu trực tiếp header palette infor R G B palette i R G B data Pal: palette Pal[index].R, Pal[index].G, Pal[index].B, http://www.ebook.edu.vn 6 16 bit/pixel 1 5 5 5 R G B 24 bit/pixel, mỗi phần màu là một byte 8 8 8 R G B ảnh có 3 giá trị R=G=B là ảnh đa cấp xám không cần lưu giá trị palatte vì bản thân nó là giá trị điểm ảnh (pallete đúng bằng chỉ số giá trị điểm ảnh) II- Mô hình màu 1-Các mô hình màu Ánh sáng mà con người nhận biết (hay màu khác nhau) là dải tần hẹp trong quang phổ điện từ Xét cấu tạo của mắt và việc nhìn thì tất cả các màu đều là liên kết của 3 màu sơ cấp: đỏ (R), lục(B), lam(G). Bước sóng của 3 màu cơ bản là: B=435,8nm; G=546,1 nm; R=700nm a) RGB Mô hình màu RGB được biểu diễn bởi lập phương với các trục R, G, B Gốc biểu diễn màu đen Tọa độ (1, 1, 1) biểu diễn màu trắng. Tọa độ trên các cạnh trục biểu diễn các màu cơ sở. http://www.ebook.edu.vn 7 Các cạnh còn lại biểu diễn màu bù cho mỗi màu cơ sở . Đường chéo từ (0, 0, 0) đến (1, 1, 1) là biểu diễn màu xám. Cho 2 điểm ảnh P 1 (r 1 , g 1 , b 1 ), P 2 (r 2 , g 2 , b 2 ) khoảng cách Ơcơlit giữa 2 màu = 222 )21()21()21( bbggrr −+−+− Khoảng cách Hamono labus =(x-y) T A(x-y) A là ma trận xác định dương x T Ax >0 Biểu đồ RGB thuộc mô hình cộng: Phát sinh màu mới bằng cách cộng cường độ màu cơ sở Gán giá trị từ 0 đến 1 cho R, G, B Red+Blue -> Magenta (1, 0, 1) Nhận xét + Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy + Đủ cho các ứng dụng máy tính + Màn hình máy tính và TV sử dụng mô hình này + Được sử dụng rộng rãi nhất + Đơn giản và nó được sử dụng rộng rãi nhất biểu diễn trong hệ nhị phân. Red=4, Green=2, Blue=1, Magenta=R+B=5, Yellow=R+G=6, Cyan=G+B=3, Black=0, White=7. b) CMY, CMYK: Mô hình màu xác định bởi các màu cơ sở cyan, magenta và yellow dành cho máy in màu. Mô hình CMY là bù của mô hình RGB. Biểu đồ CMY thuộc loại mô hình trừ. Black (0,0,0) Green (0,1,0) Cyan (0,1,1) White (1,1,1) Magenta (1,0,1) Red (1,0,0) Blue (0,0,1) yellow (1,1,0) http://www.ebook.edu.vn 8 CMY(cộng tính) CMYK(trừ tính) C) HSV H (Hue) bước sóng gốc của ánh sáng S (Saturation) thước đo độ tinh khiết ánh sáng gốc Biểu diễn tỷ lệ tinh khiết của màu sẽ chọn với độ tinh khiết cực đại V (value) cường độ hay độ chói ánh sáng Mô hình HSV suy diễn từ mô hình RGB Hãy quan sát hình hộp RGB theo đường chéo từ White đến Black (gốc) -> ta có hình lục giác Sử dụng làm đỉnh hình nón HSV ⎩ ⎨ ⎧ ≤≤ ≤≤ 1,0 3600 VS H V=0,màu đen. Đỉnh lục giác có màu cực đại Red=(0 0 , 1, 1) Green=(120 0 , 1, 1) Blue=(240 0 , 1, 1) Mô hình HSV trực giác hơn mô hình RGB + Bắt đầu từ Hue (H cho trước và V=1, S=1) + Thay đổi S: Bổ sung hay bớt trắng + Thay đổi V: Bổ sung hay bớt đen http://www.ebook.edu.vn 9 + Cho đến khi có màu mong muốn Mắt người có thể phân biệt 128 Hues, 130 tints và cực đại 30 shades (Yellow): 128 x 130 x 30 = 382 720 màu khác nhau H ↔130 mức S, V↔ 23 mức Tổ hợp màu 130x23x23 là khoảng 16 triệu màu. Có thể truyền theo kênh tivi bằng HSV nhưng trên màn hình là RGB. d) HSI Hue 130 mứcH Red Cya Yellow Magent Green White Blue RGB V S Tones (add B&W) Black White Tints (add white) Shades (add Pure Hue http://www.ebook.edu.vn 10 Saturation 23 mức S Intension 23 mức I (cường độ sáng) 2. Chuyển đổi các mơ hình màu RGB chuyển đổi sang HSV, CMY, HIS và ngược lại. RGB ↔ CMY ⎪ ⎩ ⎪ ⎨ ⎧ =+ =+ =+ 1 1 1 YB MG CR CMYK, K=min (C, M, Y ) ⎪ ⎩ ⎪ ⎨ ⎧ −= −= −= KYY KMM KCC ********************************************************* CHƯƠNG 3: CÁC PHÉP BIẾN ĐỔI KHƠNG PHỤ THUỘC VÀO KHƠNG GIAN VÀ CÁC PHÉP TỐN TRÊN ĐA ẢNH 3.1. Giới thiệu Các phép tốn khơng phụ thuộc khơng gian là các phép tốn tồn cục khơng phụ thuộc vào vị trí của điểm ảnh. + Tăng giảm độ sáng + Điều chỉnh + Hiệu chỉnh độ tương phản + Phép tốn thống kê + Loại bỏ nền của ảnh + Tách theo ngưỡng và chồng nhiều ảnh 3.2. Các phép tốn khơng phụ thuộc khơng gian * Định nghĩa: (Histogram) Biểu đồ tần suất: Tần suất của cấp xám g là số điểm ảnh có mức xám g trong ảnh h(g): số điểm ảnh có giá trị bằng g h(g)= # {P| I(P)= g} giả sử ta có ảnh I= ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 43210 33211 52341 57231 g 0 1 2 3 4 5 7 h(g) 1 5 4 5 2 2 1 [...]... 8 7 7 7 8 8 7 8 *Kỹ thuật 2: Kỹ thuật cộng ảnh giả sử ta có 2 ảnh I1, I= có cùng kích thước và thuộc tính Kỹ thuật cộng ảnh nhằm tạo ra ảnh mới lai ghép giữa I1 và I2 cũng có kích thước và thuộc tính 2 ảnh ban đầu Iα[i,j]=(1-α)I1[i, j]+α I2[i, j] α ∈ [0,1] 17 http://www.ebook.edu.vn Ứng dụng: trong hoạt hình, tái tạo hình ảnh *Kỹ thuật 3: Lọc trung vị đa ảnh Định nghĩa1: Cho dãy x1≤ x2≤…≤ xn Nếu n... http://www.ebook.edu.vn *Kỹ thuật 4: Lọc trung bình đa ảnh Cho dãy x1, x2,…, xn khi đó trung bình của dãy là x= 1 n ∑ xi n i =1 Cho trước dãy ảnh I1, I2, …, In có cùng kích thước và thuộc tính Ảnh trung bình của dãy ảnh là ảnh ITB trong đó mỗi ITB(P) là trung bình của dãy I1(P), I2(P), ,In(P) P là toạ độ của ảnh I TB = 1 n ∑ Ik n k =1 Ứng dụng: để lấy ảnh đặc trưng trong dãy ảnh Mệnh đề 2 Cho dãy x1, x2, ,xn 2 n ∑... }=#{k| x ≤ xk } Ví dụ: Trung vị của dãy 1, 4, 5,2, 6,8, 7 là 5 Cho trước dãy ảnh I1, I2, …, In Ảnh trung vị của dãy ảnh là ảnh ITv trong đó mỗi ITv(P) là trung vị của dãy I1(P), I2(P), ,In(P) P là toạ độ của ảnh Ứng dụng: để lấy ảnh đặc trưng trong dãy ảnh Mệnh đề 1 Cho dãy x1, x2, ,xn n ∑ x−x k =1 k → min tại trung vị Chứng minh Ø(x)= n ∑ x−x k =1 φ ( x) = k ∑ (x − x ) + ∑ (x k x ≥ xk xk > x k − x)... tăng độ giãn của ảnh γ0 : ngưỡng I(x, y)= Max nếu I(x, y) > θ Min nếu I(x, y) 0 ảnh sáng lên C< 0 ảnh tối đi Ví dụ: Ảnh đã bị tối đi và sáng lên 1 4 2 8 5 7 1 4 2 8 5 7 1 4 2 8 5 7 1 4 2 8 5 7 1 4 2 8 5 7 1 4 2 8 5 7 1 4 2 8 5 7 31 34 32 38 35 37 34 32 38 35 37 31 Cộng C=30... (Mask) Cho ảnh có kích thước MxN Mặt nạ là cửa sổ kích thước mxn . xử lý ảnh. CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH I -Xử lý ảnh là gì? Ảnh số là gì: Ảnh tạo bởi các điểm ảnh, điểm ảnh có vô vàn thứ, ví dụ như: ảnh chân. đầu vào: là ảnh hoặc không là ảnh đầu ra: là một ảnh trên máy tính Xử lý ảnh: Đầu vào: là ảnh đầu ra: là ảnh “tốt hơn” (theo nghĩa của người sử dụng)