Qua quá trình tìm hiểu về kỹ thuật lấy mẫu nén và ảnh số, nhận thấy đây là một vấn đề mới mẻ và hấp dẫn, em đã chọn “Kỹ thuật lấy mẫu nén và ứng dụng trong xử lý ảnh” làm đề tài khóa luậ
Trang 1PHẦN I MỞ ĐẦU
1 Lí do chọn đề tài
Sự phát triển của khoa học kỹ thuật nói chung và những thành tựu tronglĩnh vực điện tử - viễn thông nói riêng đã góp phần thúc đẩy những tiến bộtrong đời sống kinh tế, chính trị, xã hội Sự ra đời của những phương pháp,công nghệ mới trong lĩnh vực điện tử - viễn thông là cơ sở cho sự ra đời nhữngthiết bị, hệ thống thông tin với các đặc điểm nổi bật như sự chính xác cao, tốc
độ nhanh gọn nhẹ, tiện dụng… Đó là những yếu tố rất cần thiết, làm phươngtiện hỗ trợ cho hoạt động của con người đạt hiệu quả ngày càng cao hơn
Kỹ thuật lấy mẫu nén (Compressed Sensing) là một trong những lý
thuyết mới của lĩnh vực viễn thông và xử lý tín hiệu hiện nay Đây là một kỹthuật lấy mẫu với tốc độ thấp hơn tốc độ Nyquist, một trong những tiêu chuẩnđược coi là chuẩn mực trong xử lý tín hiệu, mà vẫn đảm bảo việc khôi phụclại tín hiệu ban đầu Kỹ thuật lấy mẫu nén có nhiều ứng dụng trong viễnthông, xử lý tín hiệu nói chung và hình ảnh nói riêng
Qua quá trình tìm hiểu về kỹ thuật lấy mẫu nén và ảnh số, nhận thấy đây
là một vấn đề mới mẻ và hấp dẫn, em đã chọn “Kỹ thuật lấy mẫu nén và ứng dụng trong xử lý ảnh” làm đề tài khóa luận của mình.
2 Lịch sử vấn đề nghiên cứu
Kỹ thuật lấy mẫu nén là một trong những lý thuyết mới trong lĩnh vực xử
lý tín hiệu được giới thiệu bởi Emannuel Candès, Justin Romberg và TerenceTao vào năm 2006 Đây là một lĩnh vực có sức hấp dẫn lớn đối với nhữngngười làm về xử lý tín hiệu trên thế giới cũng như một số nhóm nghiên cứutrong nước
Kỹ thuật xử lý ảnh số là một lĩnh vực không còn mới nhưng đang đượcnghiên cứu ứng dụng nhiều hiện nay
Trang 2Vì vậy, việc tìm hiểu kỹ thuật lấy mẫu nén và ứng dụng trong xử lý ảnh
là một vấn đề mới đối với sinh viên hiện nay
3 Mục đích nghiên cứu
Tìm hiểu kỹ thuật lấy mẫu nén và ứng dụng trong xử lý ảnh
4 Nhiệm vụ nghiên cứu
- Tìm hiểu về kỹ thuật lấy mẫu nén
- Tìm hiểu về ảnh số
- Tìm hiểu ứng dụng của kỹ thuật lấy mẫu nén trong xử lý ảnh số
- Tìm hiểu phần mềm Matlab
5 Đối tượng nghiên cứu
Kỹ thuật lấy mẫu nén và ảnh số
6 Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết:
+ Tổng hợp các tài liệu, sách tham khảo, bài báo khoa học
+ Tìm kiếm các tài liệu lập trình
- Phương pháp nghiên cứu mô phỏng:
+ Mô phỏng khâu có ứng dụng của kỹ thuật lấy mẫu nén trong xử lý ảnh
7 Phạm vi của đề tài
Do hạn chế về mặt thời gian và kiến thức cơ sở về xử lý tín hiệu, về ảnh
số còn hạn chết, khóa luận chỉ tập trung giải quyết vấn đề về kỹ thuật lấy mẫunén và ứng dụng trong xử lý ảnh
8 Giới thiệu về khóa luận
Sau một thời gian tìm hiểu, nghiên cứu, tôi đã thực hiện thành công khóaluận của mình Ngoài phần mở đầu và kết luận, khóa luận được trình bàytrong 3 chương
Trang 3Chương 1 trình bày những vấn đề cơ bản về kỹ thuật lấy mẫu nén.
Chương 2 trình bày về cơ bản về ảnh số bao gồm những vấn đề cơ bảncủa hệ thống xử lý ảnh số, các vấn đề về thu nhận ảnh và nén ảnh
Chương 3 trình bày một số ứng dụng của kỹ thuật lấy mẫu nén trong việcnén ảnh và thu nhận ảnh
Trang 4PHẦN II NỘI DUNG
Chương 1
KỸ THUẬT LẤY MẪU NÉN
1.1 GIỚI THIỆU
Trong thực tế, ở nhiều hệ thống như xử lý âm thanh, xử lý hình ảnh, thiết
bị thu ảnh y học, bộ thu vô tuyến…, việc nén tín hiệu là cần thiết để tiết kiệmbăng thông trên đường truyền, tiết kiệm bộ nhớ lưu trữ dữ liệu Lấy mẫu làquá trình biến đổi tín hiệu tương tự thành tín hiệu rời rạc theo thang thời gian.Định lý lẫy mẫu của Shannon Nyquist nói rằng muốn khôi phục một tín hiệubăng tần gốc liên tục theo thời gian thì băng thông của tín hiệu ban đầu phải
có giới hạn và tần số lấy mẫu phải lớn hơn hai lần băng thông của tín hiệu bangốc Đối với các tín hiệu không có băng thông giới hạn, thông thường phải sửdụng bộ lọc thông thấp để hạn chế băng thông của tín hiệu trước khi lấy mẫu.Mặt khác trong các ứng dụng khác như ảnh số tốc độ cao, kỹ thuật siêu caotần, thu thập dữ liệu từ rada, tín hiệu có tần số rất cao như vậy nếu lấy mẫutheo nguyên lý Nyquist thì yêu cầu phải có bộ chuyển đổi ADC tốc độ cao gây
ra khó khăn cho việc chế tạo và giá thành đắt
Trong chương này của khóa luận trình bày về một phương pháp đã tạo racuộc cách mạng trong xử lý tín hiệu Đó là phương pháp lẫy mẫu nén(Compressed Sensing hay Compressed Sampling - CS) sử dụng ánh xạ tuyếntính của tín hiệu, sau đó tín hiệu được tái tạo lại sử dụng các thuật toán trong
lý thuyết tối ưu Đây một phương pháp mới để thu tín hiệu với tốc độ lấy mẫunhỏ hơn tốc độ Nyquist mà vẫn đảm bảo được việt khôi phục lại tín hiệu banđầu Hai tiền đề quan trọng để có thể sử dụng kỹ thuật lấy mẫu nén là i) tín hiệu có biểudiễn thưa theo một cơ sở nào đó và ii) điều kiện không liên kết – đây là điều kiện liênquan đến cấu trúc của ma trận lấy mẫu và cơ sở biểu diễn tín hiệu
Trang 51.2 MỘT SỐ KHÁI NIỆM
1.2.1 Biểu diễn tín hiệu
Để thuận lợi cho việc thiết kế các giải thuật thu, xử lý và tái tạo tín hiệu,tín hiệu thường được biểu diễn như là một véc tơ trong không gian véc tơ phù
hợp Khi tín hiệu f thuộc , ta có thể biểu diễn tín hiệu qua cơ sở của Một tập
chuẩn được gọi là một cơ sở củanếu chuẩn là một hệ véc tơ độc lập tuyến tính
và sinh ra không gian Tất cả các véc tơ thuộc không gian đều có biểu diễnduy nhất dưới dạng một tổ hợp tuyến tính của các véc tơ cơ sở Nói một cáchchính xác, bất kỳ một tín hiệu rời rạc có chiều dài hữu hạn là N, được xem
như một vectơ cột có kích thước N x 1 với các phần tử là f[ ]i
(với i= 1, 2,3…) thì có thể biểu diễn được như công thức (1.1):
(1.1)hay ta có thể biểu diễn ngắn gọn hơn như (1.2)
(1.2)Trong công thức (1.2), là các vectơ cột kích thước, là ma trận kíchthước với các cột là các cơ sở của , biểu diễn toán học là ; là véc tơ cột cókích thước là gồm các hệ số của tín hiệu ; giá trị các hệ số này được tính như
sau: với là ma trận chuyển vị của Nếu là tín hiệu liên tục trong miền thời
gian thì bằng cách tương tự có thể biểu diễn trong hệ các véc tơ trực chuẩnnhư (1.3):
(1.3)
Và là hệ số của ; Có thể nói, là biểu diễn trong hệ cơ sở trực chuẩn củatín hiệu
1.2.2 Tín hiệu thưa và tín hiệu có thể nén
Khi tín hiệu là sự kết hợp tuyến tính của véc tơ cơ sở, nói cách kháctrong biểu diễn theo hệ các véc tơ cơ sở trực chuẩn thì chỉ có hệ số là khác
không và trọng số là bằng không, với thì f được gọi là tín hiệu thưa (
Trang 6-sparse) Véc tơ các hệ số lúc đó được gọi là véc tơ thưa Trong khái niệm này,chúng ta chỉ đề cập đến số lượng các trọng số bằng 0 mà không quan tâm đến
1.3 KỸ THUẬT LẤY MẪU NÉN
1.3.1 Phương pháp lấy mẫu thông thường
Hình 1.1 thể hiện phương pháp lấy mẫu nén thông thường theo chuẩnNyquist, sau đó thực hiện nén dữ liệu cho các mục đích khác nhau
Trong mô hình này thì tín hiệu thưa có chiều dài được đo đạc lấy N
mẫu; sau đó sử dụng một phương pháp nén nào đó (như biến đổi sóng con haybiến đổi cosin rời rạc) để nén tín hiệu chỉ còn trọng số lớn đáng quan tâm;thực hiện việc truyền phát tín hiệu Ở phía thu, chúng ta thực hiện quá trìnhgiải nén (theo phương pháp phù hợp với phương pháp nén đã thực hiện ở phíaphát) để khôi phục lại tín hiệu
Hình 1.1.Phương pháp lấy mẫu và nén truyền thống [10]
Trang 7Nhận thấy, ở những phương pháp này, phải thu mẫu trong khi chỉ cómẫu có giá trị được giữ lại sau khi nén, như vậy đã làm chậm tốc độ xử lý tínhiệu; trong khi nếu tín hiệu có băng tần cao lại đòi hỏi tốc độ lẫy mẫu lớn đểđảm bảo khôi phục lại dữ liệu theo tiêu chuẩn Nyquist.
1.3.2 Phương pháp lấy mẫu thưa
Theo nguyên lý lấy mẫu của Nyquist: để đảm bảo cho việc khôi phụcchính xác một tín hiệu thì tần số lấy mẫu tín hiệu đó phải lớn hơn hoặc bằnghai lần tần độ rộng băng tần của tín hiệu đó , nếu không đảm bảo điều này thì
sẽ xảy ra hiện tượng chồng phổ Tuy nhiên, trong một số trường hợp như xử
lý ảnh, nén ảnh số hay chuyển đổi từ tương tự sang số (ADC) của tín hiệuthưa thì tần số lấy mẫu không cần thiết phải đáp ứng theo đúng yêu cầuNyquist, tức là số lượng mẫu cần lấy nhỏ hơn nhiều so với số lượng mẫu cầnthiết theo tiêu chí Nyquist [7, 9]
Tín hiệu f(t) được thu bởi m phép đo tuyến tính với:
(1.4)Trong công thức này, là các dạng sóng chuẩn Nếu phép đo nhỏ hơn rất
nhiều so với kích thước của tín hiệu thì thì trường hợp đó được gọi là lấy mẫu thưa (undersampled) Có một vài vấn đề đước đặt ra khi lấy mẫu thưa
như sau:
- Có thể khôi phục lại tín hiệu chỉ với phép đo hay không?
- Có thể thiết kế những dạng sóng nén thích hợp để lấy được toàn bộ thông tincủa chỉ với phép đo ?
- Làm thế nào có thể xấp xỉ được từ các thông tin thu được thông qua các giátrị này?
Giả sử ma trận là ma trận nén thì nó sẽ là ma trận của các véc tơ hàng ;quá trình khôi phục từ là không đúng trong trường hợp do sẽ có rất nhiều tínhiệu “ứng cử” của cho trường hợp (Điều này có thể hiểu như trong trườnghợp số nghiệm của hệ phương trình là lớn hơn 1) Nhưng yêu cầu của việc
Trang 8khôi phục luôn là tín hiệu tìm được sẽ tương đồng với tín hiệu thực nhất.Cách giải quyết những vấn đề này sẽ được trình bày trong phần tiếp dưới.
1.3.3 Kỹ thuật lấy mẫu nén
Kỹ thuật lấy mẫu nén được đề xuất như một lý thuyết về lấy mẫu mớivào năm 2006 bởi Emannuel Candès, Justin Romberg và Terence Tao chophép thu trực tiếp tín hiệu nén mà không thông qua việc thu mẫu rồi mới sửdụng các phương pháp nén như thông thường Trước hết việc này làm giảmđáng kể (về thời gian và cũng độ phức tạp của cấu trúc thực hiện) việc đo đạc
để thu tín hiệu
a Mô hình lấy mẫu nén
Mô hình lấy mẫu nén được thể hiện như hình 1.2
Hình 1.2 Mô hình lấy mẫu nén [10].Theo mô hình này, với một tín hiệu có chiều dài phương pháp lấy mẫunén sử dụng phép lấy mẫu thưa Dùng M phép đo tuyến tính (), khi đó cácmẫu đo được biểu diễn bởi phép nhân giữa và các véc tơ :
(1.5)Tập hợp các phép đo được sắp xếp trong một vectơ chiều dài và các véc
tơ hàng trong ma trận :
(1.6)
Trang 9Ma trận là ma trận đo trong phương pháp lấy mẫu nén, đó là một matrận đo không thích nghi (tức là cố định và không phụ thuộc vào tín hiệu ).
Ma trận đo này phải được thiết kế để có thể thu và lưu trữ các thông tin vềtín hiệu thưa- () trong phép đo mà vẫn đảm bảo khôi phục lại được tínhiệu Và cần tìm thuật toán khôi phục lại tín hiệu từ giá trị đo này
b Điều kiện khôi phục được tín hiệu
Một tín hiệu thưa- có kích thước , được lấy mẫu nén với giá trị từ phép
đo tuyến tính không thích nghi: (với )
Do việc lấy mẫu tín hiệu không tuân theo nguyên lý lấy mẫu Nyquist nênviệc để có thể khôi phục lại tín hiệu thì ma trận đo sử dụng trong phương phápnày phải có tính chất đẳng cự giới hạn, tính chất này được phát biểu thông quađiều kiện RIP như sau:
Điều kiện RIP (Ristricted Isometry Property): (điều cần và đủ về giới
hạn đẳng cự của ma trận đo để có thể xấp xỉ tín hiệu đã được đo từ mẫu) Một tín hiệu thưa - được lấy mẫu nén bởi ma trận đo thì ma trận phảithỏa mãn điều kiện sau:
(1.7)
Hình 1.3 M phép đo Y của tín hiệu thưa- sử dụng ma trận đo [8]
Trang 10Với là véc tơ hệ số của tín hiệu trong hệ các véc tơ trực chuẩn ; ; là
một hệ số lớn hơn 0, nhỏ hơn 1; nên
Ta có thể giải thích điều kiện này như sau: Khi đảm bảo điều kiện 1.7 thì
ma trận có tính chất gần như bảo toàn khoảng cách Euclide đối với các véc tơ
thưa K
Như vậy, muốn sử dụng làm ma trận đo, chúng ta phải kiểm tra điều kiệncủa ma trận sao cho thỏa mãn RIP Điều kiện tách biệt sau đây cũng là mộtđiều kiện để đảm bảo RIP và khôi phục trung thực tín hiệu
Điều kiện tách biệt (incoherence): Điều kiện tách biệt yêu cầu về cơ cấu
đo và biểu diễn phải thỏa mãn tính chất tách biệt giữa hai ma trận và Sự táchbiệt chính là nghịch đảo mối quan hệ tương quan giữa hai ma trận, được tínhbằng giá trị lớn nhất của vectơ hàng và véc tơ cột :
(1.8)Nếu hai véc tơ này có nhiều phần tử tương quan thì sự tương quan là lớn;
và ngược lại Giá trị tương quan biến đổi theo đại số tuyến tính: Phươngpháp lấy mẫu nén chủ yếu quan tâm tới những trường hợp có tương quan thấp:
ví dụ như khi là các xung delta và là ma trận cơ sở của biến đổi fourier thìtương quan của hai ma trận là nhỏ nhất
Trong nghiên cứu của Emmanuel Candès, Justin Romberg, và TerenceTao đã chứng minh rằng: “Việc sử dụng ma trận đolà ma trận ngẫu nhiên theophân bố Gauss thì điều kiện RIP và điều kiện tách biệt đều được thỏa mãn.Với việc sử dụng số các phép đo thỏa mãn với là một hằng số nhỏ thì hoàntoàn có thể tái tạo được tín hiệu thưa có chiều dài ban đầu.”
c Khôi phục tín hiệu
Một tín hiệu thưa có chiều dài được đo đạc và lấy mẫu theo phươngpháp lấy mẫu nén với mẫu có giá trị các hệ số là (với )
Trang 11Bài toán đặt ra là: Làm thế nào để khôi phục lại tín hiệu khi đã biết giá
trị của các mẫu?
Cách giải quyết: như đã trình bày ở trên thì tín hiệu được biểu diễn bởi
các hệ số trong hệ các vectơ cơ sở trực chuẩn là là: ; do đó cần tìm các hệ sốcủa Như vậy cần biết thêm thông tin hay điều kiện nào đó về các hệ số vàphải dùng thuật toán dự đoán, tối thiểu hóa để ước lượng các hệ số sao chođúng với giá trị thực nhất
(1.10)Phương pháp này có thể khôi phục chính xác dữ liệu tuy nhiên số lượngphép toán lớn do phải thử tất cả các trường hợp cho cả hai phương trình trênnên tốc độ tính toán là chậm nên không được dùng để khôi phục tín hiệu tronglấy mẫu nén
- Sử dụng :
(1.11)Với giả thiết như (1.10) là:
Thuật toán này cho khôi phục tương đối chính xác (kém hơn so với sửdụng ) tín hiệu thưa- từ phép đo tuyến tính không thích nghi ()
Trang 12Phương pháp này đã được nghiên cứu cải thiện bởi Emmanuel J.candès,Michael B.Walkin và Stephen P.Boyd vào năm 2007 cho phép khôi phụcchính xác hơn gọi là minimization được trọng số hóa (Reweighted L1minimization) Tín hiệu được khôi phục bằng phương trình:
(1.12)Cùng với giả thiết là:
Ở đó ma trận là ma trận chéo kích thước với các trọng số dương ; cònlại các trọng số khác là bằng không Các trọng số trên đường chéo được tínhbằng cách:
Tuy phương pháp này được đưa ra nhưng khôi phục không đúng dữ liệu
- Phương pháp BP (Basis Pursuit)
Sử dụng phương pháp tối thiểu hóa BP dùng cho khôi phục tín hiệu đượclấy mẫu nén, khi mà tín hiệu có nhiễu cộng trong quá trình lấy mẫu - khi đóphương pháp còn gọi là Basis Pursuit denoise ()
Trong quá trình đo đạt và lẫy mẫucủa tín hiệu thưa-được các giá trị mẫu
có nhiễu cộng :
Trang 13(1.14)Với là ma trận đo trong phép lẫy mẫu đó Phương pháp là áp dụng thuậttối thiểu hóa theo với – là các hệ số của tín hiệu và theo với là nhiễu cộng;
từ phương trình trên ta có thể biểu diễn nhiễu cộng này:
Tín hiệu khôi phục theo thuật tối thiểu hóa theo [7]:
(1.15)Với giả thiết:
(1.16)
Ở đó là số phân vị tương ứng của phân bố theo lý thuyết xác suất
Ngoài cách sử dụng thuật toán toán -minimization thì còn có thể dùngthuật toán OMP (Orthogonal Matching Pursuit) trong kỹ thuật lấy mẫu nénnghiên cứu để khôi phục tín hiệu trong lấy mẫu nén Tuy nhiên do giới hạncủa khóa luận nên vấn đề này không được trình bày ở đây
Trang 14Thu nhận ảnh CAMERA
SENNOR
dạng Lưu trữ
Chương 2
CƠ BẢN VỀ XỬ LÝ ẢNH SỐ
2.1 GIỚI THIỆU
Xử lý ảnh là một một lĩnh vực khoa học và ứng dụng còn tương đối mới
mẻ so với các lĩnh vực khác, nhất là trên qui mô công nghiệp, song trong xử lýảnh đã bắt đầu xuất hiện những máy tính chuyên dụng Để có thể hình dungcấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnhdùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cầnthiết trong xử lý ảnh được thể hiện qua hình 2.1 [2]
Trước hết là quá trình thu nhận ảnh Ảnh có thể thu nhận qua camera.Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểuCCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge CoupledDevice)
Hình 2.1 Các giai đoạn chính trong xử lý ảnh
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensing), hayảnh, tranh được quét trên scanner Tiếp theo là quá trình số hoá (Digitalizer)
Trang 15để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu), lượng tử hóa và
số hoá trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trướchết là công việc tăng cường ảnh để nâng cao chất lượng ảnh Do nhữngnguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồnsáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải tăng cường và khôiphục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnhgần giống nhất với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng Giaiđoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọncác đặc tính, v.v Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạnnhận dạng, phân lớp hay các quyết định khác
Hình 2.2, 2.3, 2.4, 2.5 là một số hình ảnh thu được từ các kỹ thuật khácnhau [11]
Hình 2.2 Ảnh MRI của con người (a) đầu gối, và (b) gai (Hình ảnh (a)
của Dr.Thomas R Gest, Division of Anatomical Sciences, Trường Đại họcMichigan trường y; và hình ảnh (b) của Dr David R Pickens, Cục Phóng xạhọc và Khoa học Phóng xạ học, Vanderbilt Đại học Y Dược.)
Trang 16(a) (b)
Hình 2.3 Ảnh tia gama ( a ) chụp cắt lớp xương (b)ảnh PET (c)
Cygnus Loop (d) Bức xạ gama (đốm sáng loá) từ van bình phản ứng.(Hìnhảnh (a) của G.E Medical Systems; hình ảnh (b) của Dr Michael E Casey,CTI PET Systems; hình ảnh (c) là của NASA; hình ảnh (d) của ProfessorsZhong He and David K.Wehe, University of Michigan.)
Trang 17(d)(b)
Hình 2.4 Ảnh Tia X (a) Chụp X - quang ngực (b) Chụp X-quang động
mạch chủ (c) CT đầu (d) Bảng mạch điện (e) Cygnus Loop (Hình ảnh (a)
và (c) của Mr David R Pickens, Khoa X Quang và Khoa học phóng xạ,Trung tâm Y tế Đại học Vanderbilt; hình ảnh (b) của Dr.Thomas R GEST,Phòng Khoa học giải phẫu, Đại học Michigan y tế; hình ảnh (d) của Mr.Joseph E Pascente, Lixi, Inc; hình (e) của NASA.)
Trang 182.2.1 Một số khái niệm
a Phần tử ảnh (điểm ảnh – pixel)
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh Trongquá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thôngqua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hoá thành phần giátrị mà thể về nguyên tắc bằng mắt thường không phân biệt được hai điểm kềnhau Trong quá trình này, người ta sử dụng khái niệm điểm ảnh (Pictureelement – Pixel) hay phần tử ảnh Ở đây cũng cần phân biệt khái niệm pixelhay đề cập đến trong các hệ thống đồ họa máy tính Để tránh nhầm lẫn ta tạmgọi khái niệm pixel này là pixel thiết bị Khái niệm pixel thiết bị có thể xemxét như sau: khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình khôngliên tục mà gồm nhiều điểm nhỏ, gọi là pixel Mỗi pixel gồm một cặp toạ độ
x, y và màu
Trang 19Cặp toạ độ x, y tạo nên độ phân giải (resolution) Như màn hình máy tính
có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân giải là
320 x 200; màn hình VGA là 640 x 350,
Như vậy, một ảnh là một tập hợp các điểm ảnh Khi được số hoá, nóthường được biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột Ta nói ảnhgồm n x p pixels Người ta thường kí hiệu I(x,y) để chỉ một pixel Thường giátrị của n chọn bằng p và bằng 256 [2]
b Gray level: Mức xám
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗiđiểm ảnh với một giá trị số - kết quả của quá trình lượng hoá Cách mã hoákinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất
do lý do kỹ thuật Vì 2 8 = 256 (0, 1, , 255), nên với 256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit.
2.2.2 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của mộtảnh để đưa ra một mô tả đầy đủ về ảnh Các kỹ thuật được sử dụng ở đâynhằm mục đích xác định biên của ảnh Có nhiều kỹ thuật khác nhau như lọc viphân hay dò theo quy hoạch động
Người ta cũng dùng các kỹ thuật để phân vùng ảnh Từ ảnh thu được,người ta tiến hành kỹ thuật tách (split) hay hợp (fusion) dựa theo các tiêuchuẩn đánh giá như: màu sắc, cường độ, v.v Các phương pháp được biết đếnnhư Quad-Tree, mảnh hoá biên, nhị phân hoá đường biên Cuối cùng, phải kểđến cac kỹ thuật phân lớp dựa theo cấu trúc
Trang 202.2.3 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọncác đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc ( nhận dạng theo cấu trúc)
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công vớinhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữcái, chữ số, chữ có dấu)
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá trìnhđọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máytính.Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,kiểu chữ, v ,v phục vụ cho nhiều lĩnh vực
Ngoài 2 kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựavào kỹ thuật mạng nơ ron đang được áp dụng và cho kết quả khả quan [1]
2.3 THU NHẬN ẢNH
2.3.1 Thiết bị thu nhận ảnh
Một hệ thống xử lý ảnh có thể trang bị kèm theo các hệ thống thông tinđịa lý - GIS (Geographical Information System) hay hệ MORPHO (giákhoảng 7 đến 8 triệu USD) hoặc có thể là hệ thống máy tính cá Các thiết bịthu ảnh thông thường gồm máy quay (camera) cộng với bộ chuyển đổi tương
tự số AD (Analog to Digital) hoặc máy quét (scanner) chuyên dụng
Các thiết bị thu nhận ảnh này có thể cho ảnh trắng đen B/W (Black &White) với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi.Với ảnh B/W mức màu z là 0 hoặc 1 Với ảnh đa cấp xám, mức xám biếnthiên từ 0 đến 255 Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh(quét theo hàng) và cho ảnh với độ phân giải ngang khá tốt Đầu ra của
Trang 21scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap) Bộ sốhoá (digitalizer) sẽ tạo ảnh vector có hướng.
Trong xử lý ảnh bằng máy tính, ta không thể không nói đến thiết bịmonitor (màn hình) để hiện ảnh Monitor có nhiều loại khác nhau:
- CGA : 640 x 320 x 16 màu,
- EGA : 640 x 350 x 16 màu,
- VGA : 640 x 480 x 16 màu,
- SVGA: 1024 x 768 x 256 màu
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau Theo lý thuyết màu
do Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản:Red (đỏ), Green (xanh lục) và Blue (xanh dương)
Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ(ploter) Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực
Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình:
- Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện
- Tổng hợp năng lượng điện thành ảnh
2.3.2 Các định dạng ảnh cơ bản trong xử lý ảnh
Ảnh thu được sau quá trình số hoá có nhiều loại khác nhau, phụ thuộcvào kỹ thuật số hoá ảnh Như đã nói ở phần trên, ta chia làm 2 loại: ảnh đentrắng và ảnh màu Ảnh thu nhận được có thể lưu trữ trên tệp để phục vụ chocác bước xử lý tiếp theo Dưới đây sẽ trình bày một số định dạng ảnh thôngdụng hay dùng trong quá trình xử lý ảnh hiện nay [2]
Trang 22- 2 bytes tiếp theo: chứa độ dài mẫu tin Đó là độ dài của dãy các bytes kề liềnnhau mà dãy này sẽ được lặp lại một số lần nào đó Số lần lặp này sẽ được lưutrong byte đếm Nhiều dãy giống nhau được lưu trong một byte
- 4 bytes tiếp: mô tả kích cỡ pixel
- 2 bytes tiếp : số pixel trên một dòng ảnh
- 2 bytes cuối: số dòng ảnh trong ảnh
Ảnh IMG được nén theo từng dòng Mỗi dòng bao gồm các gói(pack).Các dòng giống nhau cũng được nén thành một gói
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất Nó
sử dụng phương pháp mã loạt dài RLE (Run-Length-Encoded) để nén dữ liệuảnh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh Thực tế,phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG Tệp PCX gồm
3 phần: đầu tệp (header), dữ liệuảnh (image data) và bảng màu mở rộng
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân
+ 1 byte: số bit cho một điểm ảnh plane
+ 1 word: toạ độ góc trái trên của ảnh Với kiểu PCX nó có giá trị là(0,0); còn PCC thì khác (0,0)
+ 1 word: toạ độ góc phải dưới
+ 1 word: kích thước bề rộng và bề cao ảnh
+ 1 word: số điểm ảnh
Trang 23+ 1 word: độ phân giải màn hình.
+ 1 word
+ 48 byte: chia thành 16 nhóm, mỗi nhóm 3 byte Mỗi nhóm này chứathông tin về một thanh ghi màu Như vậy ta có 16 thanh ghi màu
+ 1 byte: không dùng đến và luôn đặt là 0
+1 byte: số bit plane mà ảnh sử dụng Với ảnh 16 màu, giá trị này là 4,với ảnh 256 màu (1 pixel/8 bit) thì số bit plane lại là 1
+ 1 byte: số bytes cho một dòng quét ảnh
+ 1 word: kiểu bảng màu
+ 58 byte: không dùng
Tóm lại, định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tácđơn giản, cho phép nén và giải nén nhanh Tuy nhiên vì cấu trúc của nó cốđịnh, nên trong một số trường hợp nó làm tăng kích thước lưu trữ Và cũng vìnhược điểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khácmềm dẻo hơn: định dạng TIFF (Targed Image File Format) sẽ mô tả dưới đây
Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quanđến việc mở rộng tệp ảnh cố định Về cấu trúc, nó cũng gồm 3 phần chính:
- Phần Header (IFH): có trong tất cả các tệp TIFF và gồm 8 byte:
+ 1 word: chỉ ra kiểu tạo tệp trên máy tính PC hay Macintosh Hai loạinày khác nhau rất lớn ở thứ tự các byte lưu trữ trong các số dài 2 hay 4 byte.Nếu trường này có giá trị là 4D4Dh thì đó là ảnh cho máy Macintosh; nếu là4949h là của máy PC
+ 1 word: version Từ này luôn có giá trị là 42 Có thể coi đó là đặctrưng của file TIFF vì nó không thay đổi