Dựa vào kết quả test and score từ phần mềm Orange, có thể thấy thuật tốn với bộ chỉ số đánh giá cao nhất là Mạng Nơron - Neural Network: 0.86 AUC, 0.804 CA, 0.803 F1, 0.807 Precision và 0.804 Recall. Vì vậy nhóm quyết định chọn sử dụng mơ hình Neural Network để tiến hành phân lớp.
B/ Mơ Hình Mạng Neuron
- Khái niệm:
Mạng nơ-ron, cịn được gọi là mạng nơ-ron nhân tạo (ANN) hoặc mạng nơ-ron mơ phỏng (SNN), là một mơ hình quản lý thông tin được vận hành bằng cách mô phỏng lại hệ thống thần kinh sinh học của não bộ và cách các tế bào thần kinh hoạt động cùng nhau để hiểu đầu vào từ các giác quan của con người.
Mạng Nơron được xây dựng từ các nút nơron và những kết nối giữa những nút này, trong đó Mỗi nút này sẽ đại diện cho một hàm đầu ra cụ thể còn các kết nối giữa các nút sẽ đại diện cho mức độ ảnh hưởng của nút đó lên các nút xung quanh và được gán trọng số tương ứng. Chính vì vậy, kết quả đầu ra của một mạng Nơron nhân tạo sẽ phụ thuộc vào cách mà các nút trong mạng được kết nối và trọng số tương ứng với những kết nối này. Mạng Nơron đã được ứng dụng trong nhiều lĩnh vực đa dạng như: phân loại các chữ số viết tay, nhận dạng giọng nói và dự đốn giá cổ phiếu, xếp hạng tín dụng, phân tích hành vi khách hàng, hỗ trợ ra quyết định, dự đoán tỷ giá hối đoái và lãi suất,... Ưu điểm của mạng Nơron nhân tạo là khả năng xấp xỉ các hàm phi tuyến, nhờ đó có thể phát hiện những mối liên hệ phức tạp ẩn trong dữ liệu. Tuy nhiên, hiệu năng của mạng Nơron nhân
38 | K h o a h ọ c d ữ l i ệ u
tạo lại phụ thuộc nhiều vào cấu trúc mạng mà việc tìm ra cấu trúc tối ưu thường phức tạp và tốn nhiều tài nguyên.
- Cách thức hoạt động:
Mỗi một nút Nơron có thể được xem như là một mơ hình hồi quy tuyến tính riêng biệt, bao gồm dữ liệu đầu vào, trọng số, độ lệch (hoặc ngưỡng) và đầu ra.