Hàm kích hoạt trong mạng nơ-ron nhận dạng chữ viết tay tiếng Việt

MỤC LỤC

Nơ-ron nhân tạo

Các hàm kích hoạt thường bị ép vào một khoảng giá trị xác định, do đó thường được gọi là các hàm nén (squashing). Hàm biến đổi tín hiệu đầu vào net cho tín hiệu đầu ra out được gọi là hàm kích hoạt. Hàm này có đặc điểm là không âm và bị chặn, dùng để giới hạn biên độ đầu ra của nơ-ron. Có nhiều dạng hàm kích hoạt, người ta thường sử dụng một hàm kích hoạt chung cho toàn mạng. Một số hàm kích hoạt thường được sử dụng:. 1) Hàm đồng nhất (Linear function, Identity function). Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơ- ron có thể giải quyết được các lớp bài toán nhất định, như: Bài toán người du lịch, bài toán tô màu bản đồ, bài toán xếp loại, bài toán lập thời khóa biểu, bài toán tìm kiếm, bài toán nhận dạng mẫu.

Đồ thị hàm đồng nhất (Identity function)
Đồ thị hàm đồng nhất (Identity function)

Phạm vị ứng dụng của mang nơron nhân tạo 1. Những bài toán thích hợp

    Trái lại, nếu các đối tượng là nhiều, sẵn có nhưng phân bố ngẫu nhiên trong không gian biến, đầu tiên phải giảm thiểu chúng sao cho vẫn bao trùm toàn không gian, sau đó mới dùng làm số liệu cho việc mô hình hoá. Trong phân loại, chúng ta muốn định danh các nhóm hoặc lớp mà đối tượng thuộc vào, còn trong biến đổi, chúng ta quan tâm đến toàn bộ các đối tượng và từ đó chúng ta thu nhận được các nhóm từ các đối tượng học. Trong mô hình hoá phụ thuộc thời gian, các biến của tín hiệu vào bao gồm các giá trị hiện tại và quá khứ của các biến quá trình, trong đó tín hiệu ra dự báo giá trị trong tương lai của những biến quá trình đó.

    Để tạo ra mô hình hoàn chỉnh của một quá trình, tất cả các biến quá trình phải được huấn luyện tại đầu ra của mạng, nhưng không phải tất cả các biến trong quá trình đều ảnh hưởng như nhau đối với kết quả cuối cùng, chỉ có một số biến là đáng quan tâm. - Các hệ tài chính: Gồm phân tích thị trường chứng khoán, định giá bất động sản, cho vay, kiểm tra tài sản cầm cố, đánh giá mức độ hợp tác, phân tích đường tín dụng, cấp phát thẻ tín dụng, dự báo tỷ giá tiền tệ và thương mại an toàn.

    Mạng KOHONEN

    Giới thiệu về mạng Nơron Kohonen

    - Vấn đề lập kế hoạch, điều khiển và tìm kiếm: Gồm cài đặt song song các bài toán thỏa mãn ràng buộc, bài toán lập thời khóa biểu cho trường đại học, bài toán người đi du lịch,. - Giải các bài toán tối ưu: Vấn đề chính là tìm những thuật toán huấn luyện mạng để góp phần tìm nghiệm cho nhiều lớp bài toán tối ưu toàn cục. Tóm lại, mạng nơ-ron nhân tạo được xem là một cách tiếp cận đầy tiềm năng để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong tình hình các dữ liệu đầu vào không tường minh.

    Điểm khác biệt quan trọng nhất giữa mạng Kohonen va mạng nơron truyền thẳng lan truyền ngược là mạng nơron Kohonen học theo phương pháp học không giám sát, có nghĩa là mạng nơron Kohonen thao tác với dữ liệu nhưng đầu ra chính xác tương ứng vói dữ liệu vào không được chỉ định trước. Mạng nơron Kohonen được sử dụng bởi vì nó là một mạng tương đối đơn giản về cấu trúc, và có thể huấn luyện rất nhanh.

    Cấu trúc của mạng nơron Kohonen [9]

      Khi tính toán được đầu ra với từng nơron, tiến hành so sánh chúng để tìm xem nơron nào có đầu ra lớn nhất (khoảng cách nhỏ nhất) thì nơron đó được quyết định là nơron chiến thắng. - Nếu tỷ lệ lỗi được cải thiện đáng kể thì quay trở lại tiếp tục đưa mẫu huấn luyện vào và điều chỉnh trọng số của nơron chiến thắng rồi tính toán lại tỷ lệ lỗi xem mức cải thiện của nó như thế nào. Chu kỳ huấn luyện mới này lại tiếp tục giống như chu kỳ trước và sẽ phân tích các thời kỳ để quyết định bỏ qua hay tạo ra tập trọng số mà tạo ra mức lỗi chấp nhận được.

      Việc xác lập các tham số đầu vào cho mạng rất dễ dàng, ta có thể hiệu chỉnh các tham số này bằng thực nghiệm trong quá trình thực hiện bài toán cụ thể để đạt được kết quả hoạt động tốt. Qua việc nghiên cứu về mạng nơron Kohonen và nghiên cứu về mạng nơron tổng quan ở phần trước, chúng ta đã thấy được các đặc điểm giống và khác nhau cơ bản của: học có giám sát, mạng dẫn tiến đa lớp, thuật toán lan truyền ngược vốn rất phổ biến.

      Hình 1.7: Cấu trúc của mạng Kohonen
      Hình 1.7: Cấu trúc của mạng Kohonen

      ỨNG DỤNG MẠNG NƠRON KOHONEN TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY TIẾNG VIỆT

      • Các bước giải quyết bài toán sử dụng mạng nơron Kohonen

        Một số sản phẩm được nghiên cứu và đã được ứng dụng trên thế giới và ở Việt Nam như: xe đẩy thuốc thông minh tại các bệnh viện ở Anh sử dụng công nghệ nhận dạng mã vạch trên tay các bệnh nhân để phỏt thuốc và theo dừi sức khỏe cho bệnh nhõn trỏnh những sự nhầm lẫn khụng đáng có. - RFID (Radio Frequency Identification) là kỹ thuật nhận dạng bằng sóng vô tuyến từ xa, là hệ thống không dây cho phép tự động nhận dạng thu nhập dữ liệu kể cả dữ liệu không tiếp xúc đọc hoặc tài liệu viết tay. RFID ưu điểm là:. RFID xử lý tự động, tiết kiệm năng lượng …và nhược điểm là: RFID có giá thành cao nên không thể ứng dụng rộng rãi, chưa có chuẩn chung, chưa có các giải pháp hiệu quả ). Tuy nhiên, cho đến ngày nay thì nhận dạng chữ viết tay có thể nói là chưa được ứng dụng nhiều trong thực tế, nhận dạng chữ viết tay được thực hiện qua hai hình thức chính đó là nhận dạng chữ viết tay trực tuyến (online) và nhận dạng chữ viết tay ngoại tuyến (offline).

        - Không chỉ kiểu chữ, kích thước, hình dáng khác nhau mà chữ viết tay đôi khi còn bị thiếu nét thừa nét, giữa các kí tự trong cùng một từ thường có những nét nối hoặc thậm chí chúng còn bị dính vào nhau hay kí tự thuộc dòng dưới bị dính, bị chồng lên các kí tự thuộc dòng trên nên rất khó khăn trong việc tách dòng, xác định phân cách giữa chúng…. Hệ nhận dạng chữ viết tay trong lĩnh vực kiểm tra tài khoản ở ngân hàng của nhóm nghiên cứu Simon và O.Baret ở Paris.Ở Việt Nam, chúng ta mới chỉ có được những sản phẩm thử nghiệm như hệ thống nhận dạng chữ số và chữ cái viết tay rời rạc trên các phiếu xuất nhập cảnh của nhóm nghiên cứu ở Đại học quốc gia thành phố Hồ Chí Minh,… Có thể nói, bài toán nhận dạng chữ viết tay vẫn cần được đầu tư nhiều thời gian và công sức của con người để có được những sản phẩm có ý nghĩa thực tiễn rộng hơn.

        Hình 2.1: Mô hình chung trong nhận dạng chữ viết
        Hình 2.1: Mô hình chung trong nhận dạng chữ viết

        MÔ PHỎNG NHẬN DẠNG KÝ TỰ VlẾT TAY TIẾNG VIỆT RỜI RẠC SỬ DỤNG MẠNG NƠRON KOHONEN

        Giới thiệu

        Giảm mẫu hình ảnh, hình ảnh được ánh xạ vào một lưới nhỏ có kích thước 10*10. Nhờ lấy mẫu xuống nên số đầu vào ít hơn khi ký tự đầy đủ kích thước. Đồng thời ký tự được quy về kích thước cố định, do đó không còn phải quan tâm ký tự được vẽ lớn hay nhỏ khi huấn luyện hay khi nhận dạng.

        Chương trình trả về ký tự tương ứng với ký tự người sử dụng vẽ.

        Thực hiện chương trình nhận dạng ký tự

        • Lấy mẫu xuống hình ảnh
          • Lớp mạng nơron Kohonen

            Mặc dù không trực tiếp liên quan đến mạng nơron, song quá trình người sử dụng vẽ ký tự là một phần quan trọng của ứng dụng nhận dạng ký tự viết tay tiếng Việt. Để cắt hình ảnh và loại bỏ bất kỳ khoảng trống xung quanh, việc cắt được thực hiện bằng cách kéo bốn đường ảo từ trên, bên trái, bên phải va từ dưới của hình ảnh, nếu gặp điểm ảnh nào thì dừng lại không quét nữa. Tưởng tượng rằng ta vẽ một lưới lên trên ký tự, phân chia thành các hình vuông với 10 đường ngang va 10 đường xuống, Nếu bất kỳ điểm ảnh nào được điền đầy thì trong lưới 10* 10 đó điểm ảnh tương ứng cũng được điền đầy.

            Sao chép ma trận trọng số là điều quan trọng bởi vì khi huấn luyện mạng Kohonen, ma trận trọng số mới tìm được thỏa mãn là ma trận trọng số tốt nhất, nó phải được sao chép để lưu lại ma trận trọng số tốt nhất này. Ví dụ, muốn đưa hình ảnh huấn luyện cho ký tự Ô vào trong mạng, và nơron chiến thắng là nơron #4, thì phải biết rằng nơron #4 là nơron được học để nhận dạng ra mẫu của ký tự Ô.

            Chương trình mô phỏng

              Chúng ta có thể tải tập huấn luyện ra từ file tạo sẵn sample.dat bằng cách nhấn nút "Mẫu" hoặc chúng ta có thể tự nhập mẫu để huấn luyện bằng cách vẽ ký tự vào vùng vẽ ký tự rồi nhấn "Thêm ký tự", khi đó có một hộp thoại xuất hiện, nhắc bạn đánh vào ký tự tương ứng để khi nhận dạng nó sẽ chỉ ra ký tự tương ứng với ký tự vừa vẽ. Nếu các ký tự gần giống nhau, khi nhận dạng dễ lẫn sang nhau thì khi huấn luyện ta thêm mẫu tương ứng với các ký tự đến khi nào đạt được tỷ lệ nhận dạng cao. Để nhận dạng được nhiều kiểu viết khác nhau thì tập mẫu huấn luyện cho mỗi ký tự phải có nhiều dạng phong phú, tương ứng với các cách viết mà người sử dụng có thể viết ra.

              Quá trình huấn luyện này giải quyết được khía cạnh phức tạp của bài toán nhận dạng chữ viết tay, đó là sự đa dạng của chữ viết tay, đặc biệt là chữ viết tay tiếng Việt. Giải quyết được mức độ tổng quát, đa dạng, phong phú trong quá trình xây dựng và huấn luyện mạng để đạt được độ chính xác cao khi nhận dạng.

              Hình 3.3 Nhận dạng ký tự Ô
              Hình 3.3 Nhận dạng ký tự Ô