Hình 3.6. Đồ thị biểu diễn tập huấn luyện mô hình M2 sau khi xử lý các giá trị bị thiếu
Hình 3.8. Đồ thị biểu diễn tập huấn luyện mô hình M2 sau giảm chiều dữ liệu với LDA
Hình 3.9 Đồ thị biểu diễn tập kiểm thử mô hình M2 sau giảm chiều dữ liệu với LDA
Hình 3.10 Ma trận nhầm lẫn của mô hình M2 với tập kiểm thử với thuật toán XGBoost
Bảng 3-3. Ma trận nhầm lẫn của mô hình M2 với tập kiểm thử
Giá trị dự đoán Cao (H) Trung bình (M) Thấp (L) Giá trị thực tế Cao (H) 53 0 9 Trung bình (M) 4 9 2 Thấp (L) 12 1 10
Độ chính xác của mô hình với tập huấn luyện: 0.89 Độ chính xác của mô hình với tập kiểm thử: 0.77
Hình 3.11. Đồ thị biểu diễn tập huấn luyện mô hình M3 sau khi xử lý các giá trị bị thiếu
Hình 3.13. Đồ thị biểu diễn tập huấn luyện mô hình M3 sau giảm chiều dữ liệu với LDA
Trên đồ thị Hình 3.13, các điểm H, M, L không chỉ mô tả 1 điểm dữ nhiều mà rất nhiều điểm dữ liệu chồng lên nhau sau khi sử dụng thuật toán LDA
Hình 3.14. Đồ thị biểu diễn tập kiểm thử mô hình M3 sau giảm chiều dữ liệu với LDA
Hình 3.15. Ma trận nhầm lẫn của mô hình M3 với tập kiểm thử với thuật toán XGBoost
Bảng 3-4. Ma trận nhầm lẫn của mô hình M3 với tập kiểm thử
Giá trị mô hình dự đoán
Có (Active) Không (Inactive)
Giá trị thực tế
Có (Active) 787 192
Không (Inactive) 324 1121
Độ chính xác của mô hình với tập huấn luyện: 0.90 Độ chính xác của mô hình với tập kiểm thử: 0.79
3.1.4. Mô hình dự đoán Khả năng ức chế bơm tống thuốc P-Glucoprotein (P- gp)
Hình 3.16. Đồ thị biểu diễn tập huấn luyện mô hình M4 sau khi xử lý các giá trị bị thiếu
Hình 3.18. Đồ thị biểu diễn tập huấn luyện mô hình M4 sau giảm chiều dữ liệu với LDA
Hình 3.19. Đồ thị biểu diễn tập kiểm thử mô hình M4 sau giảm chiều dữ liệu với LDA
Hình 3.20. Ma trận nhầm lẫn của mô hình M4 với tập kiểm thử với thuật toán XGBoost
Bảng 3-5.Ma trận nhầm lẫn của mô hình M4 với tập kiểm thử
Giá trị mô hình dự đoán
Có (Active) Không (Inactive)
Giá trị thực tế
Có (Active) 90 7
Không (Inactive) 6 152
Độ chính xác của mô hình với tập huấn luyện: 0.99 Độ chính xác của mô hình với tập kiểm thử: 0.95