Vì dữ liệu thu được của chúng ta là khá bé để phục vụ cho quá trình phân tích và mô hình hóa dữ liệu, nên chúng ta buộc phải nội suy để tăng sinh dữ liệu phục vụ cho việc dự đoán về sau.
Quan sát kĩ các đồ thị trực quan dữ liệu, chúng ta nhận thấy đa phần các chuỗi dữ liệu là chuỗi dữ liệu có xu hướng tăng (giảm) theo thời gian. Một số chuỗi dữ liệu không có định hướng phát triển rõ rệt, và giá trị trung bình là không đổi theo thời gian. Tùy vào từng đặc trưng của mỗi chuỗi dữ liệu mà chúng ta sẽ lựa chọn phương pháp krigging phù hợp.
Một vài thành phần chuỗi có xu hướng global trend sẽ được nội suy bằng phương pháp univershal krigging. Các chuỗi dừng sẽ được nội suy bằng phương pháp ordinary krigging.
Đối với các chuỗi xu hướng global trend, điều quan trọng là chúng ta phải xác định được hàm xu hướng (trend function) nào là phù hợp. Việc ước lượng này đòi hỏi nhiều về kinh nghiệm trong quá trình dự đoán với mục tiêu tối thiểu hóa phần dư (residual) sau khi tìm được hàm xu hướng của hàm mục tiêu.
Đối với những chuỗi tăng và không có tính chu kì, ta sử dụng các hàm polynomial để xác định hàm xu hướng. Sử dụng curve fitting và polynomial interpolation để xác định các tham số của hàm. Sau cùng dùng các tham số đó để mô hình hóa hàm polynomial.
Dữ liệu chuỗi của chúng ta gồm có các chuỗi có tính dừng (stationary), một số chuỗi có tính xu hướng (trend), một số ít có tính vòng lặp trong thời gian ngắn. Mục tiêu của chúng ta là phải sử dụng các hàm được giới thiệu ở trên để phân ra các thành phần xu hướng và phần dư của chuỗi ra thành những thành phần riêng biệt. Các hàm ước lượng về sau sẽ được sử dụng cho phương pháp nội suy krigging. Việc phát hiện tính dừng của một chuỗi dữ liệu có thể được thực hiện bằng rất nhiều phương pháp: sử dụng kinh nghiệm quan sát bằng mắt thường, dùng biểu đồ autocorrelation function (ACF), hoặc sử dụng các phương pháp kiểm thử thống kê như ADF. Chúng ta tiến hành nội suy các chuỗi theo thứ tự các bảng. Lần lượt nội suy các chuỗi dữ liệu trong các bảng báo cáo tài chính. Chi tiết kết quả nội suy các bảng được trình bày trong phần phụ lục.
55 a. Bảng cân đối kế toán
Trước khi đi vào nội suy dữ liệu cho các chuỗi trong bảng, ta cần xác định tính dừng của các chuỗi và ước lượng hàm xu hướng cho các chuỗi (nếu có) để phần dư các chuỗi đảm bảo tính dừng
Quan sát biểu đồ ACF các chuỗi dữ liệu trong bảng cân đối kế toán kết hợp với những nhận xét ban đầu trong phần trực quan dữ liệu mục 4.1, ta nhận thấy hầu hết các chuỗi dữ liệu trong bảng cân đối kế toán đều có tính xu hướng mạnh
Hình 4.12 Biểu đồ ACF chuỗi dữ liệu bảng cân đối kế toán-1
56
mẽ, rất phù hợp cho việc nội suy dữ liệu bằng phương pháp Univershal Kriging. Duy chỉ có chuỗi dữ liệu “CapitalLeaseObligations” chỉ có tính xu hướng trong khoảng thời gian ngắn. Cụ thể là tính tương quan xu hướng trong vòng 7 lags đầu tiên trong tổng số 60 lags được quan sát. Thực nghiệm nội suy cũng cho thấy việc áp dụng mô hình Univershall Kriging vào chuỗi dữ liệu này cho kết quả khá khác biệt so với mô hình gốc ban đầu. Tuy nhiên, nếu sử dụng mô hình Ordinary Kriging và ngầm thừa nhận việc xuất hiện xu hướng trong một thời gian đủ ngắn lại cho kết quả khả quan hơn trước rất nhiều.
Sử dụng các hàm ước lượng để phân rã thành phần xu hướng, thành phần chu kì ra khỏi chuỗi dữ liệu không có tính dừng. Sử dụng hàm kiểm thử ADF để xác định tính dừng phần dư
Bảng 4.1 Bảng phân rã thành phần các chuỗi thuộc bảng cân đối kế toán
Chuỗi Hàm xu hướng Hàm chu kì
StockholdersEquity 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None TotalCapitalization 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None
CommonStockEquity 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None
CapitalLeaseObligations None None
NetTangibleAssets 1 + 𝑓(𝑥) + 𝑓(𝑥)2 None WorkingCapital 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None InvestedCapital 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None TotalDebt 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None ShareIssued 1 + 𝑓(𝑥) + 𝑓(𝑥)2 None OrdinarySharesNumber 1 + 𝑓(𝑥) + 𝑓(𝑥)2 None
Tính dừng và trực quan phần dư của các chuỗi có tính xu hướng được mô phỏng trong hình dưới.
57
Hình 4.15 Phân rã các thành phần không có tính dừng ra khỏi các chuỗi bảng cân đối kế toán-1
58
Sau quá trình xác định tính dừng các chuỗi có trong bảng và quá trình bóc tách các thành phần xu hướng và mùa (seasonal) ra khỏi các chuỗi không có tính dừng (non-stationary), ta tiến hành nội suy dữ liệu. Đối với các chuỗi này, tôi sử dụng phương pháp Univershal Kriging. Đối với các chuỗi có tính dừng (yếu), sử dụng phương pháp Ordinary Kriging.
Hình 4.17 Phân rã các thành phần không có tính dừng các chuỗi thuộc bảng cân đối kế toán-2
Hình 4.16 Biểu đồ ACF cho phần dư các chuỗi không có tính dừng trong bảng cân đối kế toán-2
59
Nghiên cứu sử dụng 3 loại mô hình variogram phổ biến để ước lượng mô hình, gồm “gaussian”, “spherical”, “exponential”. Việc xác định loại mô hình variogram sẽ dựa theo nguyên tắc mô hình nào cho giá trị RMSE thấp nhất sẽ được chọn. Nếu mô hình variogram được chọn không cho kết quả khớp nhất với chuỗi ban đầu, mô hình variogram sẽ được chọn lại theo nguyên tắc trên sau khi đã lược bỏ mô hình xấu ra khỏi hàng ước lượng.
Kết quả nội suy dữ liệu các chuỗi thuộc bảng cân đối kế toán được trình bày trong phần phụ lục, gồm bảng Bảng 0.1, Hình 0.1 và Hình 0.2
Từ kết quả thu được, ta rút ra nhận xét: Mặc dù các mô hình variogram ước lượng không phải là mô hình fit nhất với dữ liệu, nhưng đã cho kết quả khá tốt.
b. Bảng tài chính
Tương tự, ta thực hiện xác định tính dừng của các chuỗi thuộc bảng tài chính thông qua các biểu đồ ACF
60
Nhận xét: Nhìn vào biểu đồ ACF thể hiện sự tự tương quan các chuỗi trong bảng tài chính, ta nhận thấy đa phần các chuỗi đều có tính xu hướng, ngoại trừ hai chuỗi “DilutedAverageShares” và “BasicAverageShares”. Tương tự như ở phần trên, ta sử dụng phương pháp Ordinary Kriging và Univershal Kriging để nội suy dữ liệu. Tuy nhiên, thực tế khi sử dụng hai phương pháp để nội suy, đã phát hiện ra rằng các chuỗi “InterestExpense”, “DilutedEPS”, “BasicEPS” cho ra kết quả không như mong đợi. Mặc dù 3 chuỗi này nhìn trên biểu đồ ACF đều nhận thấy có sự tương quan theo thời gian rõ rệt theo thời gian, và sự tương quan này đều giảm rất chậm về 0. Tuy nhiên, khi nhìn vào biểu đồ trực quan 3 chuỗi dữ liệu này ở mục 4.1, ta nhận thấy sự tăng trưởng xu hướng này là trong thời gian rất ngắn hoặc là không đáng kể cho toàn bộ chuỗi. Vì vậy, tôi đã thử thay phương pháp Univershal Kriging bằng Ordinary Kriging và đã thu được kết quả khá tốt.
Sau đây là kết quả phân rã các thành phần xu hướng để phục vụ cho phương pháp Univershal Kriging cho các chuỗi trong bảng tài chính.
Bảng 4.2 Phân rã thành phần bảng tài chính
Chuỗi Trend func Seasonal func
TotalRevenue 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None CostOfRevenue 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None
GrossProfit 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None
OperatingIncome 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None
61 PretaxIncome 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None NetIncomeFromContinuing AndDiscontinuedOperation 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None NormalizedIncome 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None InterestIncome 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None NetInterestIncome 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None EBIT 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None NormalizedEBITDA 1 + 𝑓(𝑥) + 𝑓(𝑥)2+ 𝑓(𝑥)3 None
Trực quan hóa quá trình phân rã thành phần xu hướng các chuỗi trong bảng tài chính:
62
Hình 4.22 Biểu đồ ACF cho phần dư các chuỗi thuộc bảng tài chính-1
63
Sau quá trình bóc tách các thành phần xu hướng ra khỏi các chuỗi thuộc bảng tài chính, ta tiến hành nội suy dữ liệu và thu được kết quả như trong phần phụ lục. Kết quả gồm Bảng 0.2, Hình 0.3 và Hình 0.4:
Từ kết quả có thể thấy: Việc ước lượng mô hình variogram đôi khi cho kết quả không như mong đợi. Một mô hình variogram quá fit với dữ liệu đầu vào đôi khi sẽ cho ra kết quả nội suy không tốt, mà thay vào đó, việc lựa chọn một mô hình variogram có độ lỗi nhiều hơn lại mang lại kết quả tốt hơn.
c. Bảng dòng tiền
Tương tự, ta tiến hành phân tích biểu đồ ACF để xác định tính dừng các chuỗi thuộc bảng dòng tiền.
Hình 4.23 Biểu đồ ACF cho phần dư các chuỗi thuộc bảng tài chính-2
64 Nhận xét:
Quan sát biểu đồ ACF các chuỗi thuộc bảng dòng tiền, ta nhận thấy các chuỗi có sự xuất hiện xu hướng rõ rệt là “OperatingCashFlow”, “EndCashPosition”, “FreeCashFlow”, “FinancingCashFlow”, “RepaymentOfDebt”, “RepurchaseOfCapitalStock”. Có 3 chuỗi là “InvestingCashFlow”, “IssuanceOfCapitalStock”, “IssuanceOfDebt” với các giá trị tự tương quan lên xuống không nhất quán theo một hướng nào cả, và về 0 rất là nhanh. Chính vì vậy, 3 chuỗi này là 3 chuỗi có tính dừng.
Với các chuỗi có tính xu hướng, tương tự như các bảng trên, ta tiến hành phân rã thành phần xu hướng của các chuỗi không có tính dừng trong bảng dòng tiền. Dưới đây là kết quả phân rã các thành phần xu hướng các chuỗi thuộc bảng dòng tiền
Bảng 4.3 Bảng xác định thành phần xu hướng và chu kì của chuỗi thuộc bảng dòng tiền
Chuỗi Hàm xu hướng Hàm chu kì
OperatingCashFlow 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None FinancingCashFlow 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None EndCashPosition 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None RepaymentOfDebt 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None RepurchaseOfCapitalStock 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None FreeCashFlow 1 + 𝑓(𝑥) + 𝑓(𝑥)2+𝑓(𝑥)3 None
65
Ta thấy sau khi bóc tách các thành phần xu hướng ra khỏi các chuỗi không có tính dừng thuộc bảng tài chính, biểu đồ ACF cho phần dư các chuỗi đã thay đổi. Các phần dư này đã hoàn toàn có tính dừng. Kết quả nội suy dữ liệu sau quá trình sử dụng phương pháp Kriging được ghi lại tại mục phụ lục. Kết quả gồm Bảng 0.3, Hình 0.5 và Hình 0.6
Từ kết quả nội suy, ta rút ra nhận xét: Việc sử dụng các mô hình variogram mặc dù không phải fit nhất với dữ liệu, nhưng đã cho kết quả nội suy khá tốt, không
Hình 4.26 Phân rã thành phần xu hướng khỏi các chuỗi thuộc bảng dòng tiền
66 trật ra khỏi xu hướng của chuỗi ban đầu quá nhiều.