Chƣơng 1 : TỔNG QUAN VỀ CHỮ NễM
3.2. Lấy khung xƣơng
3.2.1. Lấy khung xương theo phương phỏp Hit-or-Miss
Khung xƣơng đƣợc hiểu là trục chớnh của đối tƣợng ảnh. Để thu đƣợc khung xƣơng ảnh dựng một số phƣơng phỏp để loại bỏ dần những điểm ảnh bờn ngoài, chỉ lấy ngƣỡng điểm ảnh giữa của đối tƣợng ảnh. Hỡnh 3.1 thể hiện một vớ dụ lấy khung xƣơng của chữ Nụm, trong đú hỡnh a thể hiện chữ ban đầu, hỡnh b thể hiện khung xƣơng lấy đƣợc.
a. Ảnh gốc b. Khung xƣơng ảnh
Hỡnh 3.2. Vớ dụ khung xương chữ Nụm
Phộp biến đổi “Hit-or-Miss” đƣợc đƣa ra bởi Serra [11] và là một cụng cụ cơ bản để ứng dụng vào phỏt hiện hỡnh dạng của đối tƣợng. Cho phần tử cấu trỳc B với B = (B1, B2), trong đú B1 là tập hợp đƣợc tạo từ cỏc phần tử của B đƣợc liờn kết với đối tƣợng (B1 A), và B2 là tập hợp đƣợc tạo từ cỏc phần tử của B với mục đớch liờn kết tới phần bự của đối tƣợng (B2 Ac ). Hay núi cỏch khỏc, nếu cho B1 là phần tử cấu trỳc đƣợc ỏp dụng lờn đối tƣợng, thỡ B2 sẽ là phần tử cấu trỳc đƣợc cấu tạo từ cỏc phần tử nằm trờn phần bự của phần tử cấu trỳc B1. Với điều kiện này, tựy thuộc vào cỏch chọn phần tử cấu trỳc B1 và B2 mà chỳng ta sẽ cú nhiều đối tƣợng mới khỏc nhau với cỏc cặp phần tử cấu trỳc tƣơng ứng.
Chớnh vỡ vậy, “Hit-or-Miss” là phộp biến đổi cơ sở để xõy dựng cỏc thuật toỏn nhƣ: Thuật toỏn bao lồi, làm mảnh …
Với A s* B là ký hiệu của “Hit-or-Miss” giữa tập hợp A và phần tử cấu trỳc B. Khi đú trỳng hoặc trƣợt đƣợc định nghĩa nhƣ sau:
A s*B=(A⊝ B1)c⊝ Lƣu ý, phộp co nhị phõn của phần bự của A và tập hợp B2 là một trƣờng hợp đặc biệt của trỳng hoặc trƣợt bởi vỡ phần tử cấu trỳc lờn tập hợp B2 là rỗng.
Mặt khỏc ( Ac⊝B2) = ( A 2 B )c nờn cụng thức (3.1) cú thể đƣợc viết lại nhƣ sau: A s*B=(A⊝ B1)( AB2)c Suy ra: A s*B=(A⊝ B1)( A 2 B ) (3.3) Hỡnh 3.3 minh họa phộp biến đổi “Hit-or-Miss”
Hỡnh 3.3. Minh họa phộp biến đổi “Hit-or-Miss”
A là đối tƣợng trong ảnh (tập hợp cỏc phần cú nhón là 1 và đƣợc bụi đậm); Ac
bự của A trong ảnh; B1, B2 Phần tử cấu trỳc; A1: Kết quả của phộp co nhị phõn giữa phần tử cấu trỳc B1 và A; A2: Kết quả của phộp gión nhị phõn giữa phần tử cấu trỳc B2 với Phần bự của A.
Trong luận văn, chỳng tụi đó cài đặt kỹ thuật Hit-or-Miss trờn để lấy khung xƣơng chữ Nụm nhƣ minh họa trong Hỡnh 3.4. Tuy nhiờn, khung xƣơng lấy đƣợc vẫn cũn nhiễu nờn chỳng tụi sẽ thực hiện một số kỹ thuật làm mịn khung xƣơng nhƣ trong phần sau.
Hỡnh 3.4. Khung xương của chữ Nụm
3.2.2. Hiệu chỉnh khung xương
Trờn khung xƣơng thể hiện rừ những nột vẽ mà ta gọi là cỏc cạnh. Mỗi nột cú cỏc thuộc tớnh gồm điểm đầu, điểm cuối và độ dài. Cú ba loại nột trong khung xƣơng là nột trong, nột ngoài và nột độc lập. Nột trong là nột mà cả điểm đầu và điểm cuối đều là điểm giao với cỏc nột khỏc; Nột ngoài là nột mà chỉ cú một điểm (điểm đầu hoặc điểm cuối) là điểm giao với nột khỏc cũn điểm cũn lại là điểm tự do; Nột độc lập là nột mà cả điểm đầu và điểm cuối đều khụng phải là điểm giao với nột khỏc (đều thuộc điểm tự do). Trong cỏc nột của chữ, nột cú độ dài lớn hơn 1 điểm ảnh là nột rất bỡnh thƣờng, nhƣng nột cú độ dài bằng 1 điểm ảnh là nột đặc biệt vỡ nú cú điểm đầu và điểm cuối trựng nhau. Những nột dạng này thƣờng là nột thừa, cần chuẩn húa chỳng về nột lõn cận hoặc loại bỏ nú.
Từ tập cỏc nột của khung xƣơng ta cú đƣợc tập cỏc điểm đầu, tập cỏc điểm cuối để phục vụ việc tinh chỉnh và xỏc định cỏc loại nột. Ngoài ra cũn cú tập cỏc điểm tự do mà ta nhắc tới ở trờn. Điểm tự do ở đõy chớnh là điểm đầu hoặc điểm cuối của một nột nhƣng khụng phải là điểm giao của nột. Từ tập cỏc điểm tự do ta cú thể định nghĩa lại cỏc nột nhƣ sau:
- Một nột của chữ cú điểm đầu và điểm cuối đều nằm trong danh sỏch điểm tự do (FreeEnd) thỡ nột đú là nột độc lập, khụng giao với nột khỏc;
- Một nột của chữ chỉ cú điểm đầu hoặc điểm cuối thuộc danh sỏch điểm tự do thỡ nột đú là nột ngoài;
- Một nột mà cả điểm đầu và điểm cuối đều khụng thuộc danh sỏch điểm tự do thỡ nột đú là nột trong;
Vớ dụ về nột: AB và BC là nột ngoài; BD là nột trong; EF là nột độc lập
Hỡnh 3.5. Vớ dụ cỏc nột của khung xương chữ Nụm
Khung xƣơng khi trớch ra từ ảnh gốc thƣờng cú nhiều nột thừa, cần loại bỏ trƣớc khi xử lý tiếp. Cú nhiều cỏch để loại bỏ những nột thừa này, nhƣng để đảm bảo khụng loại bỏ nhầm những nột khụng thừa ta căn cứ vào điểm đầu điểm cuối và độ dài của nột. Một nột đƣợc cho là thừa nếu cả điểm đầu và cuối của nú đều thuộc danh sỏch điểm tự do và độ dài của nú nhỏ hơn một giỏ trị nào đú (thƣờng là 3 điểm ảnh). Hỡnh 3.5 thể hiện những nột thừa bị loại bỏ trong khung xƣơng, trong đú Hỡnh 3.6 (a) là hỡnh khung xƣơng ban đầu, Hỡnh 3.6 (b) là hỡnh khung xƣơng đó loại bỏ nột thừa.
a. Khung xương ban đầu b. Khung xương đó loại bỏ cạnh thừa
Hỡnh 3.6.Vớ dụ về loại bỏ cỏc nột thừa của khung xương chữ Nụm
Ngoài ra, trong luận văn, chỳng tụi cũng đó cài đặt thử nghiệm kỹ thuật xấp xỉ đa thức, nắn cạnh và loại bỏ cỏc cạnh ngắn và dƣ thừa để làm mịn khung xƣơng nhƣ minh họa trong Hỡnh 3.7.
a. Khung xương đó xấp xỉ cạnh b. Khung xương đó đồng nhất cạnh cựng loại và bỏ
cạnh ngắn
Hỡnh 3.7. Vớ dụ về khung xương loại bỏ nột ngắn sau khi xấp xỉ cạnh
Từ khung xƣơng này ta đƣa ra cỏc điểm giao (Junction point), cỏc điểm cuối (Free End Point), cỏc nột ngang (Horizontal edge), cỏc nột đứng (Vertical edge), cỏc nột xiờn trỏi 450 (SL), cỏc nột xiờn phải 450 (SR), Xiờn trỏi 250 (TL), xiờn phải 250 (TR), đấy chớnh là đặc trƣng theo nột của chữ Nụm.