Ứng dụng CRFs trong trích chọn thông tin

Một phần của tài liệu Lập trình song song trên nền đơn vị xử lý đồ họa và ứng dụng (Trang 36 - 38)

CRFs đƣợc ứng dụng thành công rất nhiều trong các lĩnh vực nhƣ tin- sinh học, xử lý ngôn ngữ tự nhiên và khai phá Text/Web. Ở đây điểm qua một số ví dụ thành công của CRFs trong trích chọn thông tin.

- Ứng dụng CRFs trong trích chọn thông tin bảng biểu từ văn bản [17]. Trong ứng dụng này, CRFs đƣợc sử dụng để đoán nhận các dòng trong văn bản xem dòng nào thuộc các đoạn văn thông thƣờng, dòng nào chứa thông tin về bảng biểu. Thông tin đƣợc đoán nhận dựa rất nhiều vào đặc điểm của các dòng văn bản và các kỹ tự đặc biệt (ký tự tạo bảng). Các dòng kề nhau cũng có tính phụ thuộc lẫn nhau và rất thích hợp để mô hình hóa bằng CRFs. Kết quả cho thấy CRFs cho độ chính xác cao hơn đáng kể so với các phƣơng pháp khác.

- Ứng dụng CRFs trong trích chọn thông tin từ văn bản nhằm hỗ trợ quá trình điền form (form filling) bán tự động [18]. Trong ứng dụng này CRFs đƣợc thay đổi một chút với các ràng buộc (constraints) đƣợc tích hợp vào thuật toán giải mã Viterbi cho phép thông tin trích chọn từ các văn bản khi điền vào form có tính phụ thuộc và ràng buộc lẫn nhau. Ví dụ, nếu một trƣờng đã là họ tên thì các trƣờng khác không thể là họ tên, hoặc nếu một trƣờng đã là số điện thoại văn phòng thì các trƣờng khác ít có khả năng là số điện thoại văn phong nữa, vì thƣờng chỉ có một số điện thoại văn phòng. Bằng cách đó, ngƣời ta nâng độ chính xác của điền form bán tự động lên đáng kể. Bài toán này quan trọng khi các công ty nhận đƣợc những đơn đặt hàng hoặc hợp đồng qua email bằng văn xuôi và hệ thống sẽ trích chọn thông tin từ các email này một cách bán tự động để điền vào cơ sở dữ liệu. Ứng dụng này sẽ giảm đáng kể công sức của nhân viên nhập dữ liệu ở những công ty, tổ chức có lƣợng giao dịch lớn.

Ngoài ra CRFs còn có nhiều ứng dụng khác nhƣ trong bài toán nhận dạng thực thể, trích chọn thông tin từ đầu mục của các bài báo nghiên cứu. Ngoài ra CFRs cũng đƣợc chỉnh sửa thay đổi để phù hợp với các bài toán trích chọn dữ liệu trên Web. Sau đây là một số ứng dụng:

- Ứng dụng CRFs cho bài toán nhận biết thực thể (named entity recognition) [25].

- Ứng dụng CRFs trong trích chọn thông tin từ các bài báo nghiên cứu [26]. - Ứng dụng CRFs để trích chọn các nguồn ý kiến đánh giá [27].

CHƢƠNG 4: ỨNG DỤNG GPU SONG SONG TỪNG PHẦN CÔNG CỤ CRF++

Một phần của tài liệu Lập trình song song trên nền đơn vị xử lý đồ họa và ứng dụng (Trang 36 - 38)