.9 Hình mơ tả qúa trình xác định đầu ra

Một phần của tài liệu Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu. (Trang 55 - 58)

Tầng transcription là q trình chuyển mỗi kết quả dự đốn của RNN sang chuỗi dự đốn. Ở đây, transcription tìm nhãn với xác suất lớn nhất trên mỗi dự đoán trên mỗi frame. Trong thực tế tồn tại hai mơ hình để thực hiện việc chuyển đổi từ xác suất dự đốn sang nhãn tương ứng, đó là lexicon-free và lexicon-based. Trong đó lexicon là một tập các chuỗi có nhãn cố định. Người ta sử dụng CTC cho quá trình đào đạo và q trình dự đốn, phương pháp này được đề xuất bởi Graves. Sau đây sẽ trình bày cơ bản về phương pháp này.

Phương pháp này bao gồm hai q trình là mã hóa và giải mã văn bản, q trình từ chuỗi xác suất đưa ra chuỗi văn bản gọi là quá trình giải mã, bởi vì khơng giống q trình đào tạo là sử dụng mã hóa, khi đã biết nhãn của chuỗi trước đó. Q trình giả mã khác q trình đào tạo ở chỗ chúng ta đã có một mơ hình đã được đào tạo và chúng ta sử dụng nó để nhận dạng văn bản khơng nhìn thấy trước đó, nghĩa là chúng dựa vào ma trận đầu ra của mạng để xác định chuỗi. Nhưng chúng ta chưa biết nhãn thực tế của nó, mà đang mong muốn mơ hình xác định nhãn đó. Nếu thử tất cả các trường hợp có thể nếu chỉ có một vài chuỗi cố định, nhưng thực tế thì khơng thể sử dụng cách này. Sử dụng một thuật tốn đơn giản nhưng nó cho kết quả tốt với thực tế, gồm hai bước sau

• Tìm chuỗi tốt nhất bằng cách lấy kí tự có xác suất cao nhất tại tầng frame

• Xóa bỏ nhưng tất cả nhưng “blank” từ chuỗi đó Ví dụ: Các kí tự là “a”, “b” và “-”(blank)

Nhìn vào hình dưới, giả sử có 5 đặc trưng chuỗi, áp dụng đường mã hóa tốt nhất từ ma trận, ở to kí tự phù hợp nhất là “a” tương tự với t1 , t2. blank có điểm số cao nhất tại t3 , và cuối cùng tại t4 là “b”. Như vậy kết quả nhận được là “aaa-b”, sau đó xóa bỏ đi nhưng kí tự lặp lại gần nhau thì kết quả đạt được là “a-b”, sau đó xóa bỏ đi blank kết quả sẽ thu được là “ab”. Vậy đầu ra của nhận dạng chuỗi là “ab”

Một phần của tài liệu Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu. (Trang 55 - 58)

Tải bản đầy đủ (DOC)

(70 trang)
w