Thành phần xây dựng mô hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) hướng tiếp cận thời gian thực cho việc tính toán và ước lượng tài nguyên sử dụng của chương trình 01 (Trang 27 - 31)

CHƯƠNG 2 TỔNG QUAN VỀ PHÂN TÍCH CHƯƠNG TRÌNH

3.3. Thành phần xây dựng mô hình

Thành phần xây dựng mô hình khởi tạo một mô hình toán học mô tả tài nguyên sử dụng dựa trên dữ liệu đầu vào là kết quả của bộ quan sát và đo đạc ở phần đầu. Hướng tiếp cận của chúng tôi chọn ra những phương pháp hồi qui tham số như là bộ xấp xỉ thay vì sử dụng những bộ xấp xỉ đã có khác, ví dụ mạng Nơ-ron, SVR [11]. Lý do cho việc này đó là phương pháp hồi qui tham số có thể đánh giá được những tham số cụ thể của mô hình kết quả trong khi mô hình mạng Nơ-ron không tham số không thể làm được. Bằng cách sử dụng một mô hình kết quả cụ thể, chúng tôi có thể dễ dàng đánh giá khả năng mở rộng của chương trình.

3.3.1. Phương pháp hồi qui

Khái niệm của phương pháp hồi qui được định nghĩa như sau. Phương pháp hồi qui là một phương pháp thống kê mà giá trị kì vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên khác. Phân tích hồi qui không chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất với một tập điểm dữ liệu) mà nó còn phải trùng khớp với một mô hình các thành phần ngẫu nhiên và xác định. Thành phần xác định được gọi là bộ dự đoán và thành phần ngẫu nhiên được gọi là phần sai số. Ví dụ, cho một tập điểm (xi, yi), phương pháp hồi qui khởi tạo một mô hình để tính xấp xỉ y bởi yx. Phần dư của mô hình ở điểm (x y) là:

Trong đó, yi là giá trị thứ i của biến được dự đoán, xi là giá trị thứ i của biến giải thích và 𝑦̂𝑖là giá trị được dự đoán của yi. Ứng dụng vào nghiên cứu trong luận văn này, yi là bộ đếm và xi là đặc điểm (cặp <counter, feature> đã được định nghĩa ở trên). Phương thức hồi qui của chúng tôi sử dụng phương pháp hồi qui bình phương tối thiểu. Nguyên tắc của phương pháp này là phương pháp toán học thống kê áp dụng trong việc tìm các thông số của hàm hồi quy. Trong sử dụng thống kê ứng dụng, chúng ta có thể hiểu đơn giản là phương pháp bình phương tối thiểu thực hiện việc tính toán các thông số của hàm hồi quy sao cho tổng bình phương các chênh lệch giữa giá trị dự đoán 𝑦̂𝑖

với giá trị thực tế yi của yếu tố phụ thuộc là tối thiểu

Có năm mô hình hồi qui được lựa chọn để khởi tạo và xây dựng mô hình của các chương trình cần ước lượng. Chúng được chọn bởi vì chúng là những mô hình toán học phức tạp phổ biến.

- Mô hình logarit

- Mô hình logarit tuyến tính

- Mô hình đa thức

- Mô hình lũy thừa

Trong đó, A, B, A0, A1,… được gọi là cơ số. Còn ln x là hàm logarit dạng chuẩn, xk và eBx là hàm mũ dạng chuẩn.

3.3.2. Đánh giá mô hình toán học

Sau khi khởi tại những mô hình trên, chúng tôi sử dụng một số công cụ đánh giá bao gồm công cụ đo hệ số xác định R2 (Coefficient of Determination R2) và Công cụ tính sai số lỗi (Mean of relative Errors MRE) [2] để đánh giá các mô hình toán học trên. Những công cụ này sẽ đánh giá độ chính xác của mô hình, quyết định khi nào thì việc dự đoán có thể dừng lại và mô hình nào là mô hình có độ chính xác cao nhất. Sau đó mô hình có độ chính xác cao nhất sẽ được lựa chọn làm mô hình để đánh giá tài nguyên sử dụng của chương trình.

- Công cụ đo hệ số xác định (Coefficient of Determination), R2, mô tả tính đúng đắn của việc khớp với mô hình trong dữ liệu mô tả (xi, yi) và dự đoán y khi so sánh với việc chỉ sử dụng 𝑦 để dự đoán y. Nói một cách đơn giản, công cụ này có thể đánh giá độ chính xác của mô hình hồi qui. Giá trị của R2 trong khoảng [0,1] và giá trị của R2 càng cao thì mô hình càng tốt.

Trong đó SSR là tổng của phép bình phương dựa trên phương pháp hồi qui (Sum of Square due to Regression) và tổng của phép bình phương (Sum of Square Total - SST) đánh giá độ lệch của phép đo đạc so với ý nghĩa thực của nó

Và (Sum of Square Errors – SSE) đo đạc và đánh giá độ lệch của phép đo đạc từ các giá trị dự đoán. Trong đó, yi là giá trị thứ i của biến được dự đoán và 𝑦̂𝑖là giá trị được dự đoán của yi.

- Công cụ tính sai số lỗi (Mean of Relative Errors - MRE) mô tả khoảng giao động độ chính xác trung bình của một mô hình. Giá trị tốt nhất của MRE là 1 và giá trị ý càng lớn thì mô hình càng thiếu chính xác. Chính vì vậy, giá trị của phép toán (MRE - 1) chính là khái niệm để xác định lỗi lỗi của mô hình. Kết quả của phép toán nà càng lớn đồng nghĩa với việc mô hình càng thiếu chính xác.

- Biểu đồ phân tán (Scatter plots): Biểu đồ phân tán gồm có hai loại điểm bao gồm tập dữ liệu các điểm quan sát phù hợp nhất với 𝑦(x) và tập các điểm quan sát sai số hay còn gọi là tập điểm phân tán. Ví dụ như trong biểu đồ đầu tiên của hình 4.4 , đường biểu diễn mô hình kết quả được vẽ sát với tập dữ liệu quan sát được trong khi ở biểu đồ sau, các điểm phân tán được phân bố đều xung quanh đường thẳng y = 0 [6].

CHƯƠNG 4. CÔNG CỤ QUAN SÁT VÀ ĐO ĐẠC TÀI NGUYÊN SỬ DỤNG CHƯƠNG TRÌNH

Một phần của tài liệu (LUẬN văn THẠC sĩ) hướng tiếp cận thời gian thực cho việc tính toán và ước lượng tài nguyên sử dụng của chương trình 01 (Trang 27 - 31)

Tải bản đầy đủ (PDF)

(52 trang)