Dữ liệu timeseries thu được là dữ liệu nghiên cứu được lấy từ báo cáo tài chính của công ty Google1, gồm 3 bảng: bảng cân đối kế toán (balance sheet), bảng tài chính (finance sheet), bảng dòng tiền (cashflow sheet). Ngoài ra, dữ liệu nghiên cứu còn được lấy từ dữ liệu cổ phiếu chứng khoán2 của Google trong cùng một khoảng thời gian và giá vàng3 trong khoảng thời gian đó.
Các dữ liệu trong các bảng báo cáo tài chính đã được lọc bớt các trường được cho là không ảnh hưởng đến việc dự báo dòng tiền, và chỉ giữ lại những trường dữ liệu cần thiết.
Dữ liệu được sử dụng trong quá trình nghiên cứu là dữ liệu được thu thập trong khoảng thời gian từ ngày 30/06/2003 đến ngày 30/09/2020.
Bảng cân đối kế toán gồm các trường sau:
• StockholdersEquity: vốn chủ sở hữu, là số tài sản còn lại dành cho các cổ đông sau khi đã hoàn tất các khoản nợ được thanh toán.
• TotalCapitalization: tổng vốn có được của doanh nghiệp.
• CommonStockEquity: Tài sản cổ phiếu phổ thông
• CapitalLeaseObligations: Chi phí thuê vốn phải trả
• NetTangibleAssets: Giá trị tài sản hữu hình ròng
• WorkingCapital: Vốn lưu động
• InvestedCapital: Vốn đầu tư
• TotalDebt: Tổng nợ
• ShareIssued: Cổ phiếu phát hành
• OrdinarySharesNumber: Cổ phần thường, đơn vị vốn cổ phần cố định của một công ty mang lại lợi nhuận so với tổng lợi nhuận của công ty
Bảng tài chính gồm các trường:
• TotalRevenue: Tổng doanh thu
• CostOfRevenue: Chi phí doanh thu, bao gồm tổng chi phí sản xuất và phân phối sản phẩm, dịch vụ của một công ty.
1 Link dữ liệu báo cáo tài chính: https://finance.yahoo.com/quote/GOOG/financials?p=GOOG
2 Link dữ liệu cổ phiếu chứng khoán: https://finance.yahoo.com/quote/GOOG/history?p=GOOG
47
• GrossProfit: Lợi nhuận gộp, được tính bằng sự sai khác giữa doanh thu và chi phí sản xuất hoặc cung cấp dịch vụ, trước khi khấu trừ chi phí chìm, lương bổng, thuế và trả lãi.
• OperatingIncome: Thu nhập hoạt động, là doanh thu còn lại sau khi đã trừ đi chi phí hoạt động và giá vốn hàng bán. Chỉ số này thể hiện lợi nhuận mà một công ty kiếm được từ các hoạt động kinh doanh cốt lõi của mình và không bao gồm các khoản thu nhập khác không liên quan trực tiếp đến hoạt động hàng ngày của doanh nghiệp.
• PretaxIncome: Thu nhập trước lãi vay và thuế.
• BasicEPS: Thu nhập trên một cổ phiếu cơ bản.
• DilutedEPS: Chất lượng thu nhập trên mỗi cố phiếu của công ty.
• BasicAverageShares: Lượng cổ phiếu trung bình cơ bản đang lưu hành.
• DilutedAverageShares: Lượng cổ phiếu pha loãng trung bình đang lưu hành.
• NetIncomeFromContinuingAndDiscontinuedOperation: Thu nhập ròng từ hoạt động kinh doanh liên tục và không liên tục.
• NormalizedIncome: Thu nhập thường, được điều chỉnh để loại bỏ các yếu tố mùa vụ, doanh thu, và chi phí bất thường hoặc chỉ có một lần ảnh hưởng.
• InterestIncome: Thu nhập lãi doanh thu kiếm được bằng cách cho vay tiền hoặc để một thực thể khác sử dụng tiền của mình.
• InterestExpense: Chi phí lãi vay.
• NetInterestIncome: Thu nhập lãi thuần.
• EBIT: Lợi nhuận trước lãi vay và thuế, được thể hiện bằng lợi nhuận kiếm được từ hoạt động kinh doanh.
• NormalizedEBITDA
Bảng dòng tiền gồm các trường:
• OperatingCashFlow: Dòng tiền từ hoạt động kinh doanh
• InvestingCashFlow: Dòng tiền từ hoạt động đầu tư.
• FinancingCashFlow: Dòng tiền từ hoạt động tài chính.
• EndCashPosition: Tiền cuối kì.
• IssuanceOfCapitalStock: Vốn từ phát hành cổ phiếu phổ thông.
• IssuanceOfDebt: Nợ do gây quỹ từ bên cho vay.
48
• RepurchaseOfCapitalStock: Mua lại cổ phiếu vốn do chính công ty đó phát hành.
• FreeCashFlow: Dòng tiền tự do
Dữ liệu chứng khoán của Google gồm 6 trường chúng ta cần quan tâm: Open, High, Low, Close, Adj Close, Volume.
Dữ liệu giá vàng gồm 2 trường cần quan tâm:
• USD (AM)
• USD (PM)
Để tiện cho vấn đề nội suy dữ liệu và các thao tác xử lí dữ liệu về sau, ta thống nhất đưa trường thời gian (time) trong các bảng dữ liệu về dạng số nguyên. Lấy mốc ngày 30/06/2003 làm gốc. Gía trị thời gian được chuyển đổi từ dạng date sang dạng số nguyên tương ứng. Mỗi một ngày tăng thêm tương ứng với giá trị thời gian được cộng lên 1. Đối với dữ liệu chứng khoán và giá vàng, do sự thiếu hụt dữ liệu của một số ngày với số lượng bé, nên tôi không sử dụng phương pháp nội suy Kriging để nội suy các điểm dữ liệu thiếu. Thay vào đó, các điểm dữ liệu thiếu sẽ được ước lượng dựa vào 2 điểm gần nhất, và được lấy bằng trung bình cộng của hai điểm đó.
Dưới đây là sự biến động các chuỗi dữ liệu
49
Nhận xét: Các thành phần trong bảng cân đối kế toán có sự phân hóa rõ rệt theo 3 loại tăng trưởng khác nhau như trong Hình 4.1, Hình 4.2, Hình 4.3. Ở Hình 4.1, các chuỗi dữ liệu có sự tăng trưởng mang nét xu hướng một cách rõ rệt. Sang Hình 4.2, tính xu hướng này đã giảm đi rất nhiều, thậm chí là có những chuỗi dữ liệu chỉ có tính xu hướng trong một thời gian ngắn như chuỗi “CapitalLeaseObligations”. Ở Hình 4.3, các chuỗi dữ liệu vẫn giữ được nét đặc trưng tăng trưởng theo xu hướng. Tuy nhiên, chiều xu hướng đã không còn nhất quán như ban đầu mà thay vào đó là có sự giảm nhẹ vào cuối kì dữ liệu.
Hình 4.2 Trực quan bảng cân đối kế toán-2
50
Hình 4.5 Trực quan hóa các chuỗi dữ liệu bảng tài chính-1
51
Hình 4.7 Trực quan hóa các chuỗi dữ liệu bảng tài chính-3
52
Nhận xét: Xu hướng tăng trưởng của các chuỗi dữ liệu trong bảng tài chính là không đồng nhất và có sự phân hóa rõ rệt. Ở Hình 4.4 và Hình 4.5, xu hướng tăng thể hiện rất rõ nét và mạnh. Ở Hình 4.7, xuất hiện một vài chuỗi dữ liệu có tính cycle trong một thời gian rồi sau đó phát triển bình thường, không có tính xu hướng nhiều. Một số chuỗi mất một thời gian đầu gần như không có sự thay đổi lớn về dữ liệu, chỉ bắt đầu phát triển tính xu hướng rõ rệt về sau. Sang Hình 4.6, chuỗi dữ liệu xuất hiện tính xu hướng chỉ trong thời gian ngắn, sau đó lại quay về trạng thái stationary. Đến Hình 4.9, các chuỗi dữ liệu có thể hiện tính xu hướng. Tuy nhiên, tính xu hướng này tăng rất chậm so với tính xu hướng của các chuỗi kể trước.
Hình 4.9 Trực quan hóa chuỗi dữ liệu bảng tài chính-5
53
Nhận xét: Ở bảng dòng tiền, các chuỗi dữ liệu vẫn có tính xu hướng. Tuy nhiên, tính xu hướng của các chuỗi dữ liệu không được rõ nét như ở bảng tài chính và bảng cân đối kế toán. Các chuỗi dữ liệu phát triển theo hướng phức tạp hơn và không nhất quán theo một hướng ban đầu như ở hai bảng trước.
Hình 4.11 Trực quan hóa chuỗi dữ liệu bảng dòng tiền-2
54