3. TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU
3.2. Những kết quả nghiên cứu đã áp dụng vào thực tế
Việc ứng dụng của cơng nghệ phân loại hiện nay đang phát triển rất mạnh ở rất nhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế...) và các đối tượng (nhà nghiên
cứu xã hội, chính phủ và các tổ chức phi lợi nhuận khác). Vì các tổ chức này sở hữu một lượng lớn dữ liệu khơng cĩ cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiều nếu như các dữ liệu này được chuẩn hĩa bởi các chủ đề/nhãn. Nền tảng cơng nghệ để thực hiện bài tốn phân loại văn bản chính là trí tuệ nhân tạo (Artificial Intelligence – AI) áp dụng giải thuật học sâu (Deep Learning) với mơ hình mạng nơ- ron được áp dụng như:
- Nghiên cứu của ơng Andrews Sobral: Ơng Andrews Sobral và cộng sự đã
nghiên cứu nhận diện phương tiện qua phương pháp Haar Cascades using OpenCV. Nghiên cứu sử dụng thư viện thị giác máy tính mã nguồn mở JavaScript và OpenCV để nhận diện hình ảnh được truy cập vào webcam.
- Nghiên cứu nhận diện và theo dõi xe sử dụng OpenCV và Kalman Filter: Ơng
Ronit Sinha và cộng sự sử dụng OpenCV và Kalman Filter để nhận diện và theo dõi xe từ luồng trực tuyến của Camera giao thơng. Bộ lọc OpenCV và Kalman sẽ phát hiện và theo dõi xe ơ tơ từ video được phát trực tiếp từ camera.
- Nghiên cứu về nhận diện vật thể bằng thuật tốn YOLO: Yolo được Redmon
và Farhadi phát triển vào năm 2015, trong thời gian học tiến sĩ. YOLO (‘You only look once”) là một thuật tốn nhận diện phổ biến nhờ độ chính xác cao trong thời gian thực, đạt đến 45 khung hình trên giây.
- Nghiên cứu nhận diện phương tiện và hướng đi (Vehicle Detection for
Autonomous Driving): Ơng Junsheng Fu và cộng sự đã sử dụng các cơng cụ, bao gồm
OpenCV3, Python3.5, tensorflow, CUDA8 OS: Ubuntu 16.04. Cĩ 2 hướng đi: SVM tuyến tính và mạng nơ-ron.
Ở Việt Nam, cộng đồng nghiên cứu trí tuệ nhân tạo xử lý ngơn ngữ tự nhiên để áp dụng vào bài tốn xử lý tiếng Việt đang rất phát triển. Do đặc thù của tiếng Việt và sự khác biệt về bộ ngơn ngữ trong các thư viện, cơng cụ hỗ trợ, nên cộng đồng các nhà nghiên cứu trí tuệ nhân tạo (AI) của Việt Nam đã xây dựng và phát triển một số các thuật tốn, thư viện và cơng cụ dành riêng cho tiếng Việt. Một số doanh nghiệp và trường đại học hoạt động trong lĩnh vực cơng nghệ thơng tin đã và đang nghiên cứu đưa bài tốn phân loại văn bản vào ứng dụng thực tế như: Framgia, Đại học Lê Quý Đơn, FPT, Đại học Khoa học Cơng nghệ thuộc Đại học Quốc gia Việt Nam,…. Cịn trong lĩnh vực quân sự, do là là mơi trường đặc thù, vì vậy, việc thu thập thơng tin trên các trang báo điện tử, diễn đàn, mạng xã hội,… để theo dõi tình hình, nắm bắt thơng
tin là một trong những nhiệm vụ mới, quan trọng trên khơng gian mạng. Do lượng thơng tin thu thập được qua mạng Internet là rất lớn, nên đã đặt ra yêu cầu phân tích và xử lý lượng dữ liệu khổng lồ trên một cách tự động và nhanh chĩng.