Mạng nơron MPL tổng quát

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 47 - 50)

Mỗi liên kết gắn với một trọng số, trọng số này được thêm vào trong q trình tín hiệu đi qua liên kết đó. Các trọng số có thể dương, thể hiện trạng thái kích thích, hay âm, thể hiện trạng thái kiềm chế. Mỗi nơron tính tốn mức kích hoạt của chúng bằng cách cộng tổng các đầu vào và đưa ra hàm chuyển. Một mạng nơ ron đơn giản được xây dựng như thật toán 2.10

Thuật toán 2.10. Xây dựng mạng nơ ron Intput: Cho: Mạng nơ ron có sơ lớp (với sơ lớp>1). Intput: Cho: Mạng nơ ron có sơ lớp (với sơ lớp>1).

Mỗi lớp có số nơron trong một lớp (số neural>=1).

Trọng số w liên kết nơ ron ngẫu nhiên trong khoảng (-a,a).

Output: Mạng nơ ron nhân tạo.

Kiểu dữ liệu: chọn lưu dữ kiểu mảng : int số lớp;

int số nơ ron[số lớp]; w[i][j][k]; với 2<=i<=số lớp, 1<=j,k<=số nơ ron[] ,

Bước 1. Chọn lớp i=2 là lớp bắt đầu Bước 2. Chọn lớp i là lớp hiện thời.

Bước 3. Tại lớp đang xét i , xét nơ ron thứ j .

Bước 4. Thực hiện khởi tạo ngẫu nhiên trọng số kết nối với nơ ron k của lớp i-1

trong khoảng (-a,a). w(i,j,k)=random(-a,a)

Bước 5. Nếu k <= số nơ ron[i-1] quay lại “Bước 4”, ngược lại thực hiện “Bước 6”. Bước 6. Nếu j<= số nơ ron[i] quay lại “Bước 3”, ngược lại thực hiện “Bước 7”.

48 Một khi đầu ra của tất cả các nơron trong một lớp mạng cụ thể đã thực hiện xong tính tốn thì lớp kế tiếp có thể bắt đầu thực hiện tính tốn của mình bởi vì đầu ra của lớp hiện tại tạo ra đầu vào của lớp kế tiếp. Khi tất cả các nơron đã thực hiện tính tốn thì kết quả được trả lại bởi các nơron đầu ra. Tuy nhiên, có thể là chưa đúng u cầu, khi đó một thuật tốn huấn luyện cần được áp dụng để điều chỉnh các tham số của mạng. Xét trường hợp mạng có hai lớp, cơng thức tính tốn cho đầu ra theo cơng thức (2.24).

𝒂𝟐=𝒇𝟐(𝒘𝟐(𝒇𝟏(𝒘𝟏p+𝒃𝟏))+𝒃𝟐 (2.24)

Mạng có nhiều lớp có khả năng tốt hơn là các mạng chỉ có một lớp, chẳng hạn như mạng hai lớp với lớp thứ nhất sử dụng hàm sigmoid và lớp thứ hai dùng hàm đồng nhất có thể áp dụng để xấp xỉ các hàm toán học khá tốt, trong khi các mạng chỉ có một lớp thì khơng có khả năng này.

2.4.9. Kết luận chương

Trong chương này trình bày cơ sở lý thuyết, luận văn đã đã trình bày ba kỹ thuật tiền xử lý ảnh quan trọng, thường xuyên được sử dụng trong các hệ thống nhận dạng: Nhị phân ảnh, căn chỉnh độ nghiêng của ảnh và một số phép tốn hình thái. Đây là bước rất cần thiết đối với một hệ phân tích ảnh và nhận dạng ảnh tài liệu, nó khơng chỉ khơi phục lại các đặc trưng của ảnh như ban đầu mà còn làm nổi bật các đặc trưng trong ảnh. Mạng nơ-ron, máy học chuyên sâu tiên tiến giúp cho chúng ta xây dựng đựợc những hệ thống thơng minh với độ chính xác cao như hiện nay. Trong luận văn này chúng tôi đi vào nghiên cứu về mạng nơrơn cũng như ý tưởng của mơ hình trong phân lớp ảnh, và áp dụng trong việc xây dựng hệ thống. Trên cơ sở lý thuyết vừa tìm hiểu ở chương này, chúng tôi sẽ ứng dụng mơ hình cho việc nhận dạng ảnh được trình bày trong chương tiếp theo sẽ ứng dụng các kỹ thuật đã nêu trên để xác định các trường thông tin trên ảnh CCCD.

49

CHƯƠNG 3: XÂY DỰNG THUẬT TOÁN PHÂN TÍCH THẺ CĂN CƯỚC CƠNG DÂN

3.1. Tiền xử lý

Ảnh đầu vào thường có chất lượng rất khác nhau: có thể bị ố, mốc, nhàu, mờ… trong quá trình sử dụng hoặc bị lệch, nghiêng, méo, cong. Mặt khác, mặt trước có hoa văn nền khá rõ nét. Do đó, để đảm bảo cho việc tách các trường thơng tin được chính xác (cũng như kết quả nhận dạng sau này), cần áp dụng các kỹ thuật xử lý ảnh để nâng cao chất lượng ảnh đầu vào. Các kỹ thuật đó bao gồm:

+ Chuyển từ ảnh màu về ảnh đa cấp xám + Làm trơn ảnh

+ Nhị phân ảnh

+ Căn chỉnh độ nghiêng

3.1.1. Chuyển ảnh màu về ảnh đa cấp xám

Các phương pháp nhị phân ảnh thường được áp dụng trên ảnh đa cấp xám, do đó cần chuyển ảnh màu đầu vào về ảnh đa cấp xám trước khi chuyển sang bước nhị phân ảnh. Trong không gian màu RGB, mỗi điểm ảnh được tổ hợp từ ba thành phần màu R (Red), G (Green) và B (Blue) (mỗi thành phần màu có giá trị từ 0 đến 255), còn trong ảnh đa cấp xám, mỗi điểm ảnh mang một trị số mức xám từ 0 đến 255. Để chuyển đổi giữa hai không gian màu này, nếu áp dụng cơng thức tính độ sáng theo chuẩn NTSC (dựa trên thị giác của con người) thì ảnh thu được có hoa văn nền khá rõ nét (khá tương đồng với nét chữ).

Nhận thấy rằng, với những điểm sảnh nền thì giá trị của thành phần màu G chênh lệch lớn so với thành phần màu R. Do đó, để chuyển đổi từ ảnh màu về ảnh đa cấp xám, ta lấy thành phần màu G cộng với độ chênh lệnh giữa hai thành phần màu G và R theo công thức (3.1).

50 Điều này không những làm nổi bật được các nét chữ (hoa văn nền mờ đi, trong khi đặc trưng nét chữ không đổi) mà còn làm mờ đi mực nhoè màu đỏ ở trường Số CCCD lên trường Họ tên, hình 3.1.

(a) (b) (c)

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 47 - 50)

Tải bản đầy đủ (PDF)

(82 trang)