Thiết kế hệ thống

Một phần của tài liệu Nhận dạng chữ viết và phân tích trang tài liệu (Trang 22 - 25)

Chương II: CÁC PHƯƠNG PHÁP TIẾP CẬN

II.3. Thiết kế hệ thống

II.3.2. Ảnh đầu vào

- Ảnh đầu vào đƣợc chọn là ảnh đa cấp xám với định dạng “*.JPG”. Do thời gian có hạn nên đề tài chỉ tập trung vào loại ảnh này, với anh màu cần phải chuyển sang đa cấp xám trước khi qua phân tích.

- Về kích thước ảnh đầu vào về mặt thiết kế là không giới hạn.

- Với ảnh nhị phân là trường hợp đặc biệt của ảnh đa cấp xám thì đã được các đề tài trước phân tích và trong thực tế thì thao tác với ảnh nhị phân đơn giản hơn so với ảnh đa cấp xam (vì không cần phân ngƣỡng) nên đề tài không cài đặt cho loại ảnh này.

Ảnh tài liệu đa cấp xám

Tiền xử lý Lọc và làm trơn nhiễu

Phân tích Sử dụng Fractal signature

Ảnh đã đƣợc khoanh vùng Văn bản và Đồ họa

Hình 29: Sơ đồ khối hệ thống phân tích tài liệu trong phạm vi đề tài

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

40 GVHD: PGS. TS. Ngô Quốc Tạo - Về độ phức tạp của ảnh về mặt thiết kế là không giới hạn.

II.3.3. Module Tiền xử lý

Nhằm nâng cao hiệu quả cho quá trình phân tích, ảnh sẽ đƣợc qua khâu tiền xử lý trước khi qua khâu phân tích. Trong phạm vi đề tài này khâu tiền xử lý chỉ dừng ở mức lọc và làm trơn nhiễu. Lý do là khâu phân tích sử dụng giải pháp FS không bị ảnh hưởng bởi góc nghiêng của tài liệu, tham số duy nhất ảnh hưởng đến giá trị của FS là nhiễu.

Vì bản chất của FS là đi tính hiệu thể tích của hai lớp đƣợc tạo ra từ mỗi block ảnh chuyển sang không gian 3D và dịch theo phương z một khoảng ±Δ. Có thể so sánh quá trình FS nhƣ đi tính thiết diện bề mặt của mỗi Block hay còn gọi là độ nhám từ đó đƣa ra các miền giá trị FS đặc trƣng cho mỗi vùng (Text, Graphic,…) (Hình-30). Từ đó dễ nhận ra rằng nếu tồn tại các nhiễu dạng muỗi thì có thể làm một vùng nền (độ nhám =0) trở thành một vùng bề mặt cực nhám dẫn đến FS của nó có thể trùng vào miền Text hoặc Graphic. Để khắc phục một giải pháp là khử và làm trơn nhiều nhằm làm giảm ảnh hưởng của vùng nhiễu muỗi lên vùng nền và ảnh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

41 GVHD: PGS. TS. Ngô Quốc Tạo

Hình 30: Ví dụ một bolck chuyển sang dạng bề mặt trong không gian

3D

Hình 31: Ví dụ chuyển ảnh chữ "c" sang dạng bề mặt trong không gian 3D

II.3.4. Phân tích sử dụng giả pháp Fractal Signature Chi tiết thuật toán FS[1]

Đầu vào: Ảnh đa cấp xám của một trang tài liệu F;

Đầu ra: Anh đã khoanh vùng vùng văn bản và đồ họa;

Thuật toán:

Trước tiên ta chia F thành n vùng không trùng nhau có kích thước NxN gọi là Rk(x,y), trong đó k là vùng NxN thứ k của tài liệu và k=1,2,…,n

Bước 1:

For x=1 to Xmax do For y=1 to Ymax do

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Tính hàm mức xám gk(x,y) cho F;

Bước 2:

For x=1 to Xmax do For y=1 to Ymax do

 Bước 2.1: Khởi tạo cho δ = 0 khi đó lớp trên và lớp dưới của Blanket đƣợc chọn bằng với hàm mức xám gk(x,y) nhƣ sau:

;

 Bước 2.2 Cho δ = δ1

a) đƣợc tính theo công thức sau:

b) đƣợc tính theo công thức sau:

c) Thể tích của Blanket đƣợc tính theo công thức sau:

 Bước 2.3: Cho δ = δ2

a) đƣợc tính theo công thức sau:

b) đƣợc tính theo công thức sau:

c) Thể tích của Blanket đƣợc tính theo công thức sau:

Bước 3:

Tính các FS cho mỗi Rk(x,y) là theo công thức sau:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Bước 4:

Tổ hợp các FS thành FS của tài liệu theo công thức sau:

Nhận xét: Dễ nhận thấy với một ảnh đầu vào có cùng kích thước thì tốc độ thực hiện thuật toán là không đổi và chỉ phải duyệt qua mỗi điểm ảnh một lần duy nhất.

Ví dụ:

Giả thiết ta có gk(x,y) là

Cho δ = 1, ta có:

Thu đƣợc kết quả là:

Ta có:

Thu đƣợc kết quả là:

Luận văn tốt nghiệp cao học Học viên: Nguyễn Văn Huy

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

44 GVHD: PGS. TS. Ngô Quốc Tạo Ví dụ về một kết quả áp dụng thuật toán này:

Hình 32: (a) Ảnh một tài liệu gốc, (b) kết quả sau khi áp dụng FS

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Một phần của tài liệu Nhận dạng chữ viết và phân tích trang tài liệu (Trang 22 - 25)

Tải bản đầy đủ (PDF)

(53 trang)