CHƯƠNG 4 : PHƯƠNG PHÁP NGHIÊN CỨU
4.2. Phương pháp thu thập và xử lý dữ liệu
4.2.1. Thu thập dữ liệu
Trong nghiên cứu này, tác giả lựa chọn thu thập dữ liệu theo quý cho tất cả các biến trong mơ hình vì khoảng thời gian này là tương đối hợp lý để xem xét những thay đổi của những biến số vĩ mô của nền kinh tế. Dữ liệu được lấy từ quý I năm 2007 đến quý IV năm 2018. Năm 2007 là năm mà Việt Nam bắt đầu gia nhập WTO, chính là thời điểm bắt đầu giai đoạn mà đề tài này đang hướng đến nghiên cứu. Còn năm 2018 là năm gần nhất mà dữ liệu vĩ mô đã được cơng bố rộng rãi và có thể sử dụng được. Nguồn dữ liệu cho các biến được thu thập như sau:
- Số liệu về khối lượng xuất khẩu và khối lượng nhập khẩu của Việt Nam
trong mối quan hệ song phương với các nước đối tác thương mại được lấy từ trang Direction of Trade Statistics, được cơng bố trên website chính thức của IMF.
- Số liệu về chỉ số CPI dùng để tính tốn tỷ giá thực của Việt Nam với các
nước đang khảo sát thì được lấy từ trang International Financial Statistics, phần Prices, Production and Labor, được cơng bố trên website chính thức của IMF.
- Số liệu về tỷ giá của Việt Nam và các nước được khảo sát so với USD thì
được lấy từ trang International Financial Statistics, phần Exchange Rates incl. Effective Ex. Rates, được cơng bố trên website chính thức của IMF.
- Số liệu về thu nhập thực ở các nước vào hàng quý được lấy từ trang
International Financial Statistics, phần GDP, được cơng bố trên website chính thức của IMF.
- Số liệu về thu nhập thực của Việt Nam được tổng hợp từ số liệu của Tổng cục Thống kê, Niên giám Thống kê từng năm, khoản mục Tài khoản Quốc gia, Ngân sách Nhà nước và Bảo hiểm; kết hợp với số liệu từ Vietstock, phần Dữ liệu Vĩ mơ, khoản mục Thu nhập để có dữ liệu theo quý cho trường hợp của Việt Nam.
Như vậy điều thuận lợi của đề tài này là hầu hết các số liệu cần thiết đều là số liệu vĩ mô của các nền kinh tế. Những dữ liệu này đều dễ dàng tiếp cận và có độ chính xác cao do được các tổ chức lớn, có uy tín tổng hợp và cơng bố. Tác giả quyết định lựa chọn 5 nước đối tác lớn của Việt Nam để tiến hành thu thập và chuyển sang bước xử lý dữ liệu. Đó là: Hoa Kỳ, Trung Quốc, Nhật Bản, Hàn Quốc, Đức.
Nguyên nhân của việc lựa chọn 5 quốc gia này:
Thứ nhất, đây đều là các nước có nền kinh tế phát triển trên thế giới.
Thứ hai, các nước này đều có quan hệ thương mại nhiều năm với Việt Nam. Thứ ba, các nước trên có tỷ trọng xuất nhập khẩu song phương với Việt Nam
so với tổng kim ngạch xuất nhập khẩu của Việt Nam là tương đối lớn. Cụ thể năm 2018 Trung Quốc chiếm 22,2%, Hàn Quốc chiếm 13,7%, Hoa Kỳ chiếm 12,6%, Nhật Bản chiếm 7,9%, Đức là đối tác lớn nhất ở thị trường EU, do đó tổng kim ngạch với 5 nước này chiếm khoảng 60% của Việt Nam nên sẽ là những đại diện phản ánh khá chính xác về tình hình thương mại của Việt Nam.
4.2.2. Xử lý dữ liệu
Như đã trình bày ở phần giới thiệu mơ hình nghiên cứu, để thuận tiện cho việc tính tốn cũng như theo mơ hình của các bài nghiên cứu được lấy ra để tham khảo, Tác giả tiến hành lấy logarit của tất cả các biến kể trên, nghĩa là:
- Về cán cân thương mại, như đã phân tích ở trên, sẽ khơng sử dụng cách
tính lấy xuất khẩu trừ đi nhập khẩu, mà sẽ lấy tỷ lệ xuất khẩu chia cho nhập khẩu, sau đó lấy logarit tự nhiên của tỷ số này. Trong đó thì các số liệu về xuất nhập khẩu đều được điều chỉnh lại theo năm gốc được lựa chọn đó là năm 2010. Lý do chọn năm 2010 làm năm gốc là để cho tăng tính thống nhất bởi các số liệu về CPI và GDP được lấy từ IMF đều đang sử dụng năm gốc là 2010.
- Về tỷ giá thực của Việt Nam với các nước được lựa chọn thì sẽ lấy tỷ giá
danh nghĩa nhân với CPI của nước đó, rồi chia cho CPI của Việt Nam. Tỷ giá danh nghĩa thì lại tính tốn bằng cách lấy tỷ giá VND/USD chia tỷ giá đồng tiền của nước đang tính so với USD. Ngoại trừ trường hợp của Hoa Kỳ thì có thể lấy trực tiếp tỷ giá VND/USD đã thu thập được ở phần trước. Tuy nhiên tỷ giá này sau đó cũng phải được lấy logarit tự nhiên.
- Về biến thu nhập thực của Việt Nam và các nước đối tác thì sẽ được lấy
logarit tự nhiên của các dữ liệu đã thu thập được ở bước ban đầu.
Bảng 4.1: Cách thu thập dữ liệu và tính tốn các biến trong mơ hình
Biến số Cách lấy dữ liệu Cách xử lý dữ liệu Thời gian
Cán cân thương mại Direction of Trade
Statistics, IMF
Lấy logarit tự nhiên của tỷ số xuất khẩu so với
nhập khẩu Quý I năm 2007 đến Quý IV năm 2018
Thu nhập thực (VN) International Financial Statistics, phần GDP,
IMF
Lấy logarit tự nhiên của thu nhập
thực của các nước
Thu nhập thực (Đối tác)
CPI (VN) International Financial
Statistics, phần Prices, IMF và từ GSO Dùng tỷ số để tính tỷ giá thực nên khơng cần xử lý CPI (Đối tác)
Tỷ giá thực
International Financial Statistics, phần Exchange Rates, IMF
Lấy logarit tự nhiên của tỷ giá
thực
Nguồn: Tác giả tổng hợp
4.3. Cách thức tiến hành
Như đã trình bày ở trước, bài nghiên cứu sẽ sử dụng mơ hình hiệu chỉnh sai số vector (VECM). Tác giả sẽ dùng phần mềm Stata 12 để hỗ trợ cho việc chạy mơ hình hồi quy.
Mơ hình VECM là mơ hình có dạng một vector đồng tích hợp, vector này sẽ quy định mối liên hệ trong dài hạn giữa các biến trong mơ hình khi có sự biến động nào đó xảy ra trong ngắn hạn.
Lí do sử dụng mơ hình VECM:
Thứ nhất, với các chuỗi khơng dừng nhưng có mối quan hệ đồng liên kết
giữa các biến thì có thể sử dụng VECM mà khơng sợ hiện tượng hồi quy giả mạo. Đó là khi các thống kê t, F, đều tốt và R bình phương cao, tuy nhiên vì các biến đều có xu hướng tăng nên thật ra không có sự liên kết thực sự giữa chúng. Mơ hình VECM là lựa chọn thay thế cho mơ hình VAR trong trường hợp này, vì khi sử dụng VAR thì tất cả các biến số đều phải dừng.
Thứ hai, mơ hình VECM có lợi thế là nó chứa đựng mối quan hệ dài hạn
giữa các biến để hiệu chỉnh sai số trong ngắn hạn, do đó với các biến số vĩ mơ thì sử dụng VECM sẽ có ưu điểm trong việc dự báo trong dài hạn hơn so với VAR.
4.3.1. Kiểm định tính dừng
Số liệu được sử dụng trong bài này được lấy trong khoảng thời gian là 48 quý liên tiếp, từ quý I năm 2007 đến quý IV năm 2008. Như vậy nói về mặt dữ liệu thì đây là dữ liệu dạng chuỗi thời gian. Với loại dữ liệu này thì cần phải kiểm định xem dữ liệu có dừng hay là khơng. Theo đó chúng ta sẽ xem một chuỗi thời gian có tính dừng khi mà cho dù có lựa chọn kiểm định vào thời điểm nào thì các giá trị trung bình, phương sai và hiệp phương sai đều khơng đổi. Nói một cách khác thì lúc
này các giá trị sẽ dao động quanh giá trị trung bình và chỉ phụ thuộc vào khoảng thời gian và độ trễ mà không bị phụ thuộc thời điểm được tính.
Nguyên nhân cần phải có kiểm định này là vì với dữ liệu dạng chuỗi thời gian thì nếu một chuỗi khơng đạt tính dừng thì các kiểm định như t, F, R bình phương đều trở nên khơng đáng tin cậy và lúc này nếu thực hiện việc hồi quy sẽ mơ hồ và khơng cịn nhiều ý nghĩa. Cụ thể hơn, nếu chuỗi thời gian là khơng dừng thì mỗi giai đoạn thời gian là riêng biệt và có những hành vi khác nhau, nên không thể lấy gian đoạn này để dự báo cho một giai đoạn khác. Nói cách khác, khơng thể khái qt hóa những phân tích ở một giai đoạn cho cả quá trình, nên lúc này việc hồi quy khơng có giá trị để ứng dụng cho thực tiễn.
Có nhiều phương pháp dùng cho kiểm định tính dừng. Trong khn khổ của nghiên cứu này, tác giả sẽ dùng kiểm định Dickey Fuller bổ sung (ADF) để xác định việc các biến có dừng hay khơng.
4.3.2. Lựa chọn độ trễ
Trong thực tế, các biến độc lập tác động lên biến phụ thuộc không phải là tức thời giống như mơ hình lý thuyết mà ln có độ trễ nhất định. Có nhiều nguyên nhân gây nên sự chậm trễ và “ì” của tác động này. Thứ nhất, các chính sách điều tiết của chính phủ thì gặp phải độ trễ thực thi và mất nhiều thời gian để các biến số vĩ mô thay đổi theo ý muốn khi ban hành những chính sách đó. Thứ hai, với một nền kinh tế như Việt Nam thì năng lực sản xuất hàng hóa trong nước rất hạn chế, do đó cần mất nhiều thời gian để điều chỉnh theo sự thay đổi cung-cầu của thị trường. Thêm vào đó, khi những biến số như GDP và CPI trong và ngồi nước thay đổi thì cũng cần phải mất một khoảng thời gian để người ta thay đổi hành vi mua sắm của mình. Chính những yếu tố này làm cho các biến thuộc về kinh tế ln có độ trễ nhất định.
Nếu bỏ qua bước này cho mơ hình thì sẽ dễ dẫn đến tình trạng những kết quả phân tích từ nghiên cứu sẽ khơng cịn đáng tin cậy nữa. Tác giả quyết định lựa chọn phần mềm Stata 12 và đưa vào các biến của mơ hình, sau đó cho độ trễ chạy từ 0
tiêu được tính tốn ra với giá trị càng nhỏ thì càng tốt. (Các chỉ tiêu cụ thể sẽ được trình bày ở phần 4.4). Sau khi tìm ra độ trễ thích hợp thì tác giả sẽ sử dụng nó để
tính tốn cho các phần tiếp theo.
4.3.3. Phân tích đồng liên kết
Tiếp theo nghiên cứu sẽ dùng phân tích tính đồng liên kết theo cách của Johansen. Điều này sẽ giúp kiểm tra xem các cặp biến số trong mơ hình như tỷ giá với cán cân thương mại, GDP có sự liên hệ trong ngắn hạn cũng như dài hạn hay không. Điều này sẽ tạo tiền đề để ứng dụng mơ hình VECM trong ước lượng.