Huấn luyện mô hình

Một phần của tài liệu Nghiên cứu mạng nơ ron deepface và ứng dụng trong bài toán đánh giá chất lượng phục vụ khách hàng dựa trên nhận dạng cảm xúc (Trang 63 - 66)

CHƯƠNG 3. KẾT QUẢ THỬ NGHIỆM TRONG BÀI TOÁN ĐÁNH GIÁ CHẤT LƯỢNG PHỤC VỤ KHÁCH HÀNG DỰA TRÊN NHẬN DẠNG CẢM XÚC

3.3. Huấn luyện mô hình

Mô hình VGG-Face [13] trong nền tảng Deepface sẽ được sử dụng để phát triển hệ thống này. Sau khi thu thập được cơ sở dữ liệu, chúng ta sẽ tiến hành huấn luyện mô hình mạng VGG-Face trên cơ sở dữ liệu huấn luyện (FER-2013). Nhiệm vụ huấn luyện mô hình này rất quan trọng vì nó ảnh hướng trực tiếp đến chất lượng của hệ thống.

3.3.1. Mô hình VGG-Face

Mô hình VGG-Face là một trong những mô hình quan trọng và hiệu quả trong lĩnh vực nhận dạng khuôn mặt sử dụng mạng nơ-ron tích chập. Mô hình này được phát triển dựa trên kiến trúc VGG16, một kiến trúc mạng nơ-ron học sâu được phát triển bởi nhóm nghiên cứu Visual Geometry Group (VGG) tại Đại học Oxford. VGG- Face chủ yếu được áp dụng để nhận dạng khuôn mặt và phân loại người dựa trên hình ảnh khuôn mặt.

- Giới thiệu về VGG-Face:

VGG-Face là một mô hình học sâu (deep learning) được thiết kế để nhận dạng khuôn mặt con người. Nó là một biến thể của kiến trúc VGG16, được điều chỉnh và đào tạo lại với mục tiêu nhận dạng và biểu diễn đặc điểm khuôn mặt của con người.

Mô hình này có khả năng học được các đặc trưng phức tạp từ hình ảnh khuôn mặt, giúp nó có khả năng phân loại và nhận dạng khuôn mặt hiệu quả.

- Kiến trúc của VGG-Face:

Mô hình VGG-Face được xây dựng dựa trên kiến trúc VGG16, với một số thay đổi và điều chỉnh để phù hợp với nhiệm vụ nhận dạng khuôn mặt. Kiến trúc của VGG16 bao gồm 16 lớp chồng chéo, trong đó có 13 lớp tích chập và 3 lớp kết nối đầy đủ (fully connected layers). Các lớp tích chập sử dụng các bộ lọc nhỏ để tìm ra các đặc trưng cục bộ từ hình ảnh. Lớp kết nối đầy đủ cuối cùng thực hiện phân loại dựa trên các đặc trưng đã học từ các lớp trước đó.

Hình 3.3. Cấu trúc mô hình VGG-Face.

- Cách thức hoạt động:

VGG-Face hoạt động bằng cách trích xuất các đặc trưng từ hình ảnh khuôn mặt và sử dụng chúng để phân loại người. Quá trình này bao gồm các bước sau:

Tiền xử lý hình ảnh: Hình ảnh khuôn mặt đầu vào được chuẩn hóa kích thước và tiền xử lý để đảm bảo chất lượng hình ảnh tốt nhất cho việc trích xuất đặc trưng.

Trích xuất đặc trưng: Hình ảnh qua mạng nơ-ron tích chập VGG-Face để trích xuất các đặc trưng chính từ hình ảnh. Các đặc trưng này thể hiện các chi tiết quan trọng của khuôn mặt như đường viền mắt, mũi, miệng và các điểm nổi bật khác.

Phân loại: Các đặc trưng được đưa vào các lớp kết nối đầy đủ để thực hiện phân loại người.

- Ứng dụng của VGG-Face:

VGG-Face đã tạo ra sự cách mạng trong lĩnh vực nhận dạng khuôn mặt và biểu cảm. Ứng dụng chính của nó bao gồm:

Nhận dạng khuôn mặt: VGG-Face có khả năng xác định người dựa trên hình ảnh khuôn mặt. Điều này có thể ứng dụng trong an ninh, quản lý sự ra vào, và thậm chí trong công nghệ mở khóa khuôn mặt của điện thoại di động.

Phân loại biểu cảm: Với khả năng học đặc trưng từ biểu cảm khuôn mặt, VGG- Face có thể phân loại các biểu cảm như vui, buồn, bất ngờ, giúp trong việc nghiên cứu tâm lý học và ứng dụng trong quản lý tương tác con người - máy.

3.3.2. Cài đặt môi trường

Thiết bị phần cứng: Nghiên cứu này được triển khai trên máy tính có CPU core i7 3.70 GHz, hệ điều hành Windows 64 bit, RAM 32 GB, GPU (NVIDIA TITAN V)

Phần mềm: Nghiên cứu này sử dụng nền tảng Anaconda để phát triển chương trình. Anaconda là một nền tảng mã nguồn mở được phát triển để hỗ trợ việc quản lý môi trường lập trình, phát triển ứng dụng và thực hiện các dự án khoa học dữ liệu.

Nền tảng này được phát triển bởi công ty Anaconda, Inc. và đã trở thành một công cụ cần thiết cho các nhà phân tích dữ liệu, lập trình viên và nhà khoa học dữ liệu. Trong bài viết này, chúng ta sẽ khám phá chi tiết về Anaconda, từ đặc điểm, cách cài đặt, quản lý môi trường và ứng dụng.

Anaconda cung cấp một số đặc điểm quan trọng cho việc phát triển và quản lý dự án:

Môi trường ảo: Anaconda cho phép bạn tạo các môi trường ảo độc lập, cho phép bạn quản lý các phiên bản khác nhau của các gói và thư viện. Điều này giúp tránh xung đột giữa các gói và tạo môi trường ổn định cho từng dự án.

Quản lý gói và thư Viện: Anaconda cung cấp một hệ thống quản lý gói và thư viện mạnh mẽ. Bạn có thể dễ dàng cài đặt, cập nhật và xóa các gói cũng như quản lý các phụ thuộc của chúng.

Giao diện đồ họa: Anaconda cung cấp một giao diện đồ họa (Anaconda Navigator) để quản lý môi trường, cài đặt gói, và thực hiện các tác vụ liên quan đến dự án khoa học dữ liệu một cách trực quan.

Hỗ trợ đa nền tảng: Anaconda có sẵn cho nhiều hệ điều hành như Windows, MacOS và Linux, giúp bạn dễ dàng sử dụng trên môi trường làm việc của bạn.

- Cách cài đặt Anaconda:

Cài đặt Anaconda là một quá trình đơn giản. Bạn chỉ cần tải bản cài đặt phù hợp với hệ điều hành của bạn từ trang chính thức của Anaconda và thực hiện các bước cài đặt thông qua giao diện đồ họa. Sau khi cài đặt, bạn có thể mở Anaconda Navigator để quản lý môi trường và các dự án.

- Quản lý môi trường với Anaconda:

Một trong những tính năng quan trọng của Anaconda là khả năng tạo và quản lý các môi trường ảo. Điều này cho phép bạn tạo ra môi trường độc lập với các phiên bản gói và thư viện khác nhau để phù hợp với từng dự án. Để tạo môi trường mới, bạn có thể sử dụng lệnh trong dòng lệnh hoặc sử dụng giao diện đồ họa của Anaconda Navigator.

Một phần của tài liệu Nghiên cứu mạng nơ ron deepface và ứng dụng trong bài toán đánh giá chất lượng phục vụ khách hàng dựa trên nhận dạng cảm xúc (Trang 63 - 66)

Tải bản đầy đủ (PDF)

(74 trang)