Các bước của quá trình học máy

Một phần của tài liệu DATN-HỆ THỐNG GIÁM SÁT THAM SỐ MÔI TRƯỜNG (Trang 57 - 58)

Để cĩ thể bắt đầu 1 mơ hình học máy, ta cần liên kết mọi thứ để tạo ra 1 hệ thống trả lời 1 câu hỏi cụ thể. Hệ thống trả lời câu hỏi này được gọi là một mơ hình được tạo ra thơng qua quá trình đào tạo. Mục tiêu chính của quá trình đào tạo là tạo ra một mơ hình giúp trả lời chính xác các câu hỏi ít nhất với hầu hết các lần được hỏi. Nhưng để đào tạo được một mơ hình trước hết chúng ta cần cĩ dữ liệu về những gì mà chúng ta cần đào tạo. Các bước của quá trình học máy bao gồm:

- Thu thập dữ liệu

Để biết được chính xác những gì chúng ta muốn với các thiết bị cĩ trong tay, chúng ta cần thực hiện quá trình Thu thập dữ liệu. Đây là bước rất quan trọng vì chất lượng và số lượng dữ liệu thu thập được sẽ xác đinh xem mơ hình dự đoan sẽ tốt như thế nào. Dữ liệu thu thập được sẽ được lưu trữ dạng bảng được gọi là Dữ liệu đào tạo.

- Chuẩn bị dữ liệu

Sau khi hồn thành Thu thập dữ liệu để đào tạo, bước tiếp theo là Chuẩn bị dữ liệu. Đây là lúc dữ liệu được nạp vào một nơi phù hợp và chuẩn bị sử dụng trong đào tạo học máy. Ở đây, trước tiên dữ liệu được đặt cùng nhau sau đĩ sẽ được sắp xếp một cách ngẫu nhiên nhưng khơng ảnh hưởng đến quá trình học.

Dữ liệu tại bước này sẽ được chia làm 2 phần. Phần đầu tiên được sử dụng trong đào tạo mơ hình sẽ chiếm phần lớn trong tập dữ liệu, phần thứ 2 được sử dụng để đánh giá hiệu suất của mơ hình đào tạo.

- Chọn mơ hình đào tạo

Tại đây các mơ hình đào tạo cĩ sẵn sẽ được áp dụng vào hệ thống. Việc lựa chọn sử dụng mơ hình nào phụ thuộc vào việc hệ thống sẽ phục vụ mục đích gì và như thế nào.

Tiếp theo của quá trình học máy là Đào tạo dữ liệu, đây là bước giúp máy học tăng dần khả năng dự đốn mơ hình của hệ thống. Quá trình đào tạo liên quan đến việc khởi tạo một số giá trị ngẫu nhiên của mơ hình, dự đốn đầu ra, sau đĩ so sánh nĩ với mơ hình dự đốn trước đĩ và điều chỉnh sao cho phù hợp. Quá trình này được lặp lại nhiều lần. Mỗi lần như vậy được gọi là một bước đào tạo.

- Đánh giá

Sau quá trình đào tạo, chúng ta cần đánh giá xem mơ hình cĩ thực sự tốt khơng. Việc đánh giá cho phép thử nghiệm mơ hình dựa trên dữ liệu khơng xuất hiện trong tập dữ liệu đào tạo. Điều này sẽ giúp chúng ta đánh giá mơ hình hoạt động hiệu quả ra sao khi được áp dụng vào trong đời sống để xử lý các cơng việc. - Điều chỉnh thơng số

Sau khi kết thúc quá trình đánh giá, chúng ta cĩ thể cải thiện mơ hình bằng các điều chỉnh các thơng số. Một vài thơng số được giả định trong quá trình đào tạo. Một số khác là tỷ lệ các dịng dữ liệu thay đổi trong mỗi bước, dựa trên thơng tin từ bước đào tạo trước đĩ. Những giá trị này cĩ độ chính xác khi mơ hình và thời gian đào tạo diễn ra.

Đối với các mơ hình phức tạp hơn, các điều kiện ban đầu đĩng vai trị quan trọng trong việc xác định kết quả đào tạo. Sự khác biệt cĩ thể thấy được tùy thuộc vào việc mơ hình đào tạo bắt đầu với giá trị khởi tạo. Việc điều chỉnh các thơng số này phụ thuộc vào tập dữ liệu, mơ hình và quy trình đào tạo. Khi đã cĩ thể chỉnh được các thơng số này ta cĩ thể chuyển sang bước cuối cùng.

- Dự đốn

Học máy là cơ bản sử dụng dữ liệu để trả lời câu hỏi. Vì vậy bước cuối cùng là trả lời các câu hỏi được đặt ra. Đây là điểm mà giá trị của học máy được đưa ra. Ở đây máy học cĩ thể dự đốn những gì mà ta muốn thực hiện.

Một phần của tài liệu DATN-HỆ THỐNG GIÁM SÁT THAM SỐ MÔI TRƯỜNG (Trang 57 - 58)

Tải bản đầy đủ (DOCX)

(107 trang)
w