Trong nghiên cứu, tác giả sử dụng kết hợp các mô hình của Gould và Gruben (1996) và của Falvey và Greenaway (2006) đã điều chỉnh giảm các biến giải thích để mô hình đơn giản và phù hợp hơn tình trạng số liệu thu thập được. Ngoài ra, nghiên cứu này tiến xa hơn trong việc:
- Xem xét tất cả các loại tài sản trí tuệ có thể thống kê được theo thống kê của WIPO
- Xác định tác động của tài sản trí tuệ trong mối tương quan với biến kiểm soát là mức bảo hộ sáng chế ứng với từng quốc gia
- Xét tác động của bảo hộ sở hữu trí tuệ và tài sản trí tuệ theo các nhóm quốc gia khác nhau theo phân loại của WB về GNI bình quân.
Mô hình nghiên cứu tổng quát
= + + + + + +
+ + +
Qua các lý giải về việc sử dụng các biến ở phần 2.3.3, tác giả đã chi tiết hóa mô hình nghiên cứu tổng quát bên trên thành mô hình hồi quy sử dụng dữ liệu bảng như sau:
= + + + + + +
+ + + +
3.2.1 Biến và nguồn dữ liệu sử dụng trong nghiên cứu
Bảng 3.1 Mô tả biến dùng trong nghiên cứu
Stt Biến Giải thích biến Kỳ vọng dấu Giải thích Nguồn dữ liệu
1. rGDP Tốc độ tăng GDP bình quân
đầu người Biến phụ thuộc
(Gould và Gruben, 1996; Thompson và Rushing, 1999; Falvey và Greenaway, 2006) sử dụng trong mô hình nghiên cứu tăng trưởng kinh tế của mình. Chỉ số này thể hiện khả năng tăng trưởng của GDP bình quân nhanh hay chậm
World Bank GDP per capita growth (annual %) 2. GDP GDP bình quân đầu người theo sức mua ngang giá (theo giá cố định) (+) (Gould và Gruben, 1996; Thompson và Rushing, 1999; Schneider, 2005; Falvey và cộng sự, 2006; Kim và cộng sự, 2012; Hudson và Minea, 2013) đều dùng GDP bình quân đầu người để đo mức độ phát triển kinh tế như một biến giải thích trong mô hình.
World Bank GDP per capita, PPP (constant 2011 international $) 3. IPT Số tài sản trí tuệ trên 100,000 dân (+) (Schneider, 2005; Kim và cộng sự, 2012; Hudson và Minea, 2013) xem xét năng lực sáng chế đo bằng tỷ số bằng sáng chế và cho thấy số bằng sáng chế có tác động tích cực tới tăng trưởng kinh tế
Số liệu tự tính toán từ số liệu của WIPO
4. IPR Chỉ số (+) (Thomson và Rushing, 1999; Schneider, 2005; Kim và cộng
Stt Biến Giải thích biến Kỳ vọng dấu Giải thích Nguồn dữ liệu quyền sáng chế (Patent Rights Index) sự, 2012; Hudson và Minea, 2013) đều sử dụng số liệu về mức độ bảo hộ sáng chế của Park (2008). Các kỳ vọng của các tác giả này đều là quyền sở hữu trí tuệ tác động tích cực tới tăng trưởng kinh tế hoặc đổi mới với các mức độ khác nhau.
(2008)
5. INV Tỉ lệ đầu tư
(+)
(Gould và Gruben, 1996; Kim và cộng sự, 2012) đều dùng chỉ số này để giải thích với quan điểm đầu tư tác động tích cực tới tăng trưởng.
Tác giả dùng chỉ số tỉ lệ đầu tư với quan điểm đầu tư sẽ tác động lên cơ sở hạ tầng kỹ thuật và nghiên cứu và phát triển và từ đó sẽ tác động tích cực lên tốc độ tăng trưởng
World Bank
Gross capital formation (% of GDP)
Stt Biến Giải thích biến Kỳ vọng dấu Giải thích Nguồn dữ liệu 6. EDU Tỉ lệ chi phí cho giáo dục (+) (Thompson và Rushing, 1999; Gould và Gruben, 1996; Kim và cộng sự, 2012; Hudson và Minea, 2013) đều sử dụng tỷ lệ nhập học trường trung học, đại học để phản ánh chất lượng về tri thức của nhân lực. Tác giả dùng chi phí cho giáo dục trung học để thay thế, kỳ vọng giáo dục được đầu tư sẽ làm tăng chất lượng vốn con người từ đó tác động gián tiếp tới tăng trưởng kinh tế thông quan khả năng tạo ra đổi mới
World Bank, Education expenditure (% of GNI) 7. OPE Độ mở của nền kinh tế (+) (Leamer, 1988; Hudson và Minea, 2013) sử dụng kim ngạch xuất khẩu hoặc tổng kim ngạch xuất, nhập khẩu so với GDP của một quốc gia. Các nền kinh tế có độ mở cao sẽ tăng cơ hội giao thương, tác động tích cực tới nền kinh tế. World Bank, Trade (% of GDP) 8. LAB Tỉ lệ tăng trưởng lực lượng lao
(+) (Falvey và Greenaway, 2006; Todaro và Smith, 2012; Kim và cộng sự, 2012) dùng biến
World Bank,
Labor force participation
Stt Biến Giải thích biến Kỳ vọng dấu Giải thích Nguồn dữ liệu
động tốc độ tăng dân số như một biến giải thích trong mô hình. Khi tăng lực lượng lao động sẽ tác động tích cực tới tăng trưởng kinh tế. Tác giả dùng biến tốc độ gia tăng lực lượng lao động LAB (labor force) trong mô hình hồi quy.
rate, total (% of total population ages 15+)
9. GOC Chi tiêu của Chính phủ
(+)
Gould và Gruben (1996) xem chi tiêu của Chính phủ tác động không đáng kể lên trong việc thay đổi năng suất sản xuất do nó chỉ chiếm một tỉ trọng nhỏ trong sản lượng. Chi tiêu công được xem như có khả năng tác động tích cực đến nền kinh tế. World Bank, General government final consumption expenditure (% of GDP) 10. INF Tỉ lệ lạm phát trung bình (+/-) Falvey và Greenaway (2006) sử dụng tỉ lệ lạm phát để kiểm soát mức ổn định của nền kinh tế. Lạm phát với các mức độ khác nhau sẽ có tác dụng thúc đẩy hay kìm hãm tăng trưởng kinh tế.
World Bank,
Inflation, GDP deflator
(annual %)
3.2.2. Quy trình nghiên cứu
Để tiến hành nghiên cứu, tác giả đã thực hiện các hoạt động nghiên cứu theo các bước trong hình 3.1 như sau:
Bước 1 - Xem xét cơ sở khoa học của nghiên cứu: xem xét các lý thuyết liên quan đến tăng trưởng, lý thuyết và các nghiên cứu định lượng đã được thực hiện
Bước 2 - Phương pháp nghiên cứu: Trên cơ sở các lý thuyết và nghiên cứu định lượng đã xem xét ở bước 1, tác giả xác định và mô tả các dữ liệu dùng để thực hiện nghiên cứu và xây dựng mô hình mô hình hồi quy cho dữ liệu bảng. Đồng thời, xây dựng quy trình nghiên cứu cho mô hình
Bước 3 - Thống kê mô tả dữ liệu : Dữ liệu sau khi thu thập sẽ được thống kê để xem xét mức độ đầy đủ (balanced) hay không, có những bất thường gì về mặt dữ liệu để có biện pháp xử lý dữ liệu kịp thời, đảm bảo bộ dữ liệu sẵn sàng đưa vào nghiên cứu định lượng.
Bước 4 - Kiểm định đa cộng tuyến: Tác giả tiến hành kiểm định hiện tượng đa cộng tuyến của các biến trong mẫu (thông qua kiểm tra hệ số khuếch đại phương sai VIF). Trường hợp có đa cộng tuyến, tác giả điều chỉnh lại mô hình cho đến khi hiện tượng này không còn quá nghiêm trọng.
Bài viết chỉ sử dụng dữ liệu bảng với trong khoảng thời gian tương đối ngắn (15 năm), do đó không thực hiện kiểm định về:
- Tính dừng (Stationery) của panel-data
- Tính độc lập của các đơn vị chéo (Cross-sectional dependence) - Hiện tượng tương quan chuỗi (Serial correlation) trong bảng dữ liệu
Bước 5- Thực hiện hồi quy dữ liệu với mô hình Pooled OLS và mô hình REM
Bước 6- Thực hiện kiểm định Pagan LM để kiểm tra hiện tượng phương sai của sai số ước lượng thay đổi.
- Trường hợp p_value ≥ 0.05 : chọn kết quả hồi quy Pooled OLS để giải thích - Trường hợp p_value < 0.05 : chọn kết quả hồi quy REM để giải thích
Bước 7 - Thực hiện hồi quy dữ liệu với mô hình FEM và mô hình REM
Bước 8 - Kiểm định Hausman
- Trường hợp p_value ≥ 0.05 : chọn kết quả hồi quy REM để giải thích - Trường hợp p_value < 0.05 : chọn kết quả hồi quy FEM để giải thích
Bước 9 - Thực hiện hồi quy FEM hoặc REM tùy theo kết quả kiểm định ở bước 7
Bước 10 – Xem xét khả năng xuất hiện hiện tượng nội sinh bằng cách xem xét độ lớn của hệ số thống kê Rho (Cohen và Cohen, 1983) và hệ số tương quan giữa phần dư với các biến.
- Nếu các hệ số này không lớn (Rho so với 0.3, Corr(u_i, x) so với 0.2) thì chọn kết quả từ hồi quy REM hoặc FEM để giải thích
- Nếu các hệ số Rho ≥ 0.3, Corr(u_i, x) ≥ 0.2 thì chọn giải thích kết quả theo GMM
Lưu ý : Hiện vẫn chưa có kiểm định đặc thù cho tính chất của biến giải thích có nội sinh hay không. Tác giả sử dụng cách lấy phần dư từ ước lượng để xem tương quan giữa phần dư này với các biến. Biến được xem là có thể có hiện tượng nội sinh khi có hệ số tương quan lớn.
Bước 11– Đọc kết quả hồi quy
Căn cứ theo các kiểm định, tiến hành đọc và diễn giải kết quả ước lượng theo một trong các mô hình hồi quy đã được giới thiệu. Trong quá trình thực hiện hồi quy, một số kiểm định đã được thực hiện đồng thời như sau
- Kiểm định Arellano-Bond (AB): dùng để kiểm định hiện tượng tương quan chuỗi theo bậc sai phân. Thông thường, kiểm định này được quan tâm có tự tương quan ở bậc 2 hay không. Khi p-value < 0.1 cho thấy có hiện tượng tự tương quan, đòi hỏi phải thay đổi biến công cụ cho thích hợp hơn hoặc chuyển từ GMM sai phân sang sử dụng GMM hệ thống.
- Kiểm định Sargan-Hansen (SH) hay J-test: dùng để kiểm định có thừa biến công cụ hay không. P-value < 0.05 cho phép kết luận ước lượng không thừa biến.
Hình 3.1 Quy trình nghiên cứu
Nguồn: Quy trình do tác giả tự thiết lập
P-value ≥0.05 P-value <0.05 P-value <0.05 P-value ≥0.05 Rho ≥ 0.3 Corr ≥ 0.2 Rho ≥ 0.3 Corr ≥ 0.2 1. Cơ sở khoa học 2. Phương pháp nghiên cứu
3. Thống kê mô tả dữ liệu
4. Kiểm định đa công tuyến
5. Hồi quy với Pooles OLS và REM
6. Kiểm định Pagan LM
7. Hồi quy với FEM và REM
8. Kiểm định Hausman
9.2. Hồi quy với FEM 9.1. Hồi quy với REM
10.1. Kiểm
định nội sinh định nội sinh 10.2. Kiểm
11.1 Giải thích kết
Kết luận Chương 3
- Trong chương này, tác giả đã mô tả bộ dữ liệu gồm 100 quốc gia ở các nhóm nước có thu nhập khác nhau.
- Căn cứ vào xem xét các mô hình nghiên cứu và cách thức chọn biến cho mô hình, tác giả xây dựng mô hình nghiên cứu tổng quát và mô hình hồi quy, đồng thời giải thích các biến dùng trong mô hình và kỳ vọng dấu dự kiến cho hệ số của các biến.
- Tác giả xây dựng quy trình nghiên cứu xuyên suốt từ giai đoạn xem xét lý thuyết đến các bước hồi quy, kiểm định.
Chương 4 – NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU 4.1. Thống kê mô tả dữ liệu
- Mẫu được chọn theo phương pháp lấy mẫu có chọn lọc, là số liệu từ các quốc gia có thể cung cấp được dữ liệu đủ cho hầu hết các năm. Tác giả nhận thấy các nhóm quốc gia công bố số liệu với mức đầy đủ khác nhau. Dữ liệu thiếu nhiều ở các nước thuộc nhóm thu nhập thấp và đầy đủ dần ở các nước thuộc nhóm nước thu nhập cao.
- Để tăng tính đầy đủ của bảng dữ liệu, tác giả chỉ chọn được 100 trong số 214 quốc gia được Ngân hàng Thế giới công bố trên webite của mình. Số liệu về tài sản trí tuệ cũng chưa thật sự đầy đủ, ví dụ số liệu về tổng tài sản trí tuệ ở các nước có thu nhập trung bình cao chỉ thu thập được 75.83%.
Bảng 4.1 Bảng thống kê tính đầy đủ về số liệu của các biến
Bi
ến
Mẫu chung Các nhóm nước (theo thu nhập)
Cao TB cao TB thấp Thấp Tỉ lệ số liệu (%) Số quan sát Tỉ lệ số liệu (%) Số quan sát Tỉ lệ số liệu (%) Số quan sát Tỉ lệ số liệu (%) Số quan sát Tỉ lệ số liệu (%) Số quan sát rgdp 99.33 1490 100 570 100 370 98.41 310 98.67 240 gdp 98.73 1481 100 570 100 371 95.24 300 98.93 240 ipt 90.87 1363 98.60 562 75.83 334 90.48 285 89.07 182 ipr 100 1500 100 570 100 375 100 315 100 240 inv 97.33 1460 92.42 561 96.67 365 95.87 302 97.33 232 edu 98.33 1475 100 570 95.83 375 95.24 300 100 230 ope 97.87 1468 98.95 564 99.17 365 95.56 301 97.33 238 lab 100 1500 100 570 100 375 100 315 100 240 goc 97.13 1457 98.42 561 96.25 364 95.56 301 97.07 231 inf 99.33 1490 100 570 100 370 98.41 310 98.67 240
- Tác giả tiến hành thống kê mô tả dữ liệu (xem bảng 4.2). Sau khi xem xét độ lệch min - max giữa các biến, tác giả lấy logarit các biến giải thích trong mô hình ngoại trừ biến IPR để mô hình ổn định hơn (xem bảng 4.3), đây cũng là cách thông thường của các nhà nghiên cứu trước đây đã thực hiện cho mô hình của mình như (Gould & Gruben, 1996; Schneider, 2005; Kim và cộng sự, 2012).
- Nhận xét :
o Thống kê mô tả nhằm xem xét đặc tính của các biến, tìm mối quan hệ giữa các biến thông qua suy diễn thống kê.
o Số liệu chưa thật sự đầy đủ hoàn toàn, tuy nhiên, đây là một thực tế khách quan với loại dữ liệu thứ cấp này. Trong đó nhóm nước có thu nhập cao có số lượng mẫu nhiều hơn (38 nước) cùng với tỉ lệ số liệu đầy đủ cao nhất.
o Dữ liệu chưa thật sự đầy đủ cho tất cả các biến, tuy nhiên vẫn được phần mềm Stata chấp nhận với kết quả “strongly balanced”
Bảng 4.2 Thống kê mô tả dữ liệu
Biến
Mẫu chung Nước thu nhập cao Nước thu nhập trung bình cao Nước thu nhập trung bình thấp Nước thu nhập thấp Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn rgdp 2.36 3.93 2.03 3.35 2.74 3.86 2.55 3.19 2.30 5.73 gdp 17618.88 16811.7 34940.99 14176.57 12087.32 3826.03 4669.6 2010.18 1216.36 497.30 ipt 231.44 342.16 437.78 443.78 139.54 104.61 71.71 95.28 13.06 16.14 ipr 3.24 0.95 4.076 0.63 3.09 0.66 2.63 0.70 2.29 0.56 inv 22.52 6.11 22.01 4.15 24.57 6.46 22.87 6.29 20.07 7.96 edu 4.22 1.56 4.88 1.45 4.16 1.42 3.64 1.66 3.45 1.17 ope 86.64 59.17 104.37 80.19 85.09 41.98 78.42 33.95 57.43 23.05 lab 63.25 10.17 60.35 5.63 60.06 10.00 62.87 9.70 75.61 10.14 goc 15.45 5.22 18.84 4.58 14.58 4.34 12.37 3.85 12.61 4.74 inf 9.31 98.43 3.10 5.29 8.92 12.03 9.58 8.62 24.23 244.26
Bảng 4.3 Thống kê mô tả dữ liệu đã logarit hóa
Biến
Mẫu chung Nước thu nhập cao Nước thu nhập trung bình cao Nước thu nhập trung bình thấp Nước thu nhập thấp Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn Trung bình Độ lệch chuẩn rgdp 2.36 3.93 2.03 3.35 2.74 3.86 2.55 3.19 2.30 5.73 gdp_ln 9.17 1.27 10.38 0.40 9.35 0.33 8.35 0.45 7.02 0.43 ipt_ln 4.35 1.98 5.65 1.09 4.51 1.24 3.45 1.57 1.46 2.02 ipr 3.24 0.95 4.08 0.63 3.09 0.66 2.63 0.70 2.29 0.56 inv_ln 3.07 0.34 3.07 0.19 3.17 0.25 3.09 0.28 2.87 0.61 edu_ln 1.36 0.41 1.54 0.31 1.36 0.36 1.17 0.52 1.18 0.34 ope_ln 4.30 0.54 4.45 0.60 4.32 0.51 4.27 0.45 3.98 0.36 lab_ln 4.13 0.16 4.10 .095 4.08 0.17 4.13 0.16 4.32 0.14 goc_ln 2.67 0.37 2.90 0.27 2.63 0.31 2.46 0.33 2.46 0.41 inf_ln 1.54 1.10 0.89 1.02 1.86 0.95 1.99 0.87 1.89 1.10
4.2. Kiểm định hiện tượng đa cộng tuyến
Khi các biến giải thích trong mô hình có tương quan tuyến tính với nhau được gọi là đa cộng tuyến. Nếu có đa cộng tuyến cao hoặc đa cộng tuyến hoàn hảo thì ước lượng hệ số hồi quy trong mô hình sẽ không ổn định và sai số chuẩn của hệ số bị khuếch đại dẫn đến khả năng kết luận sai và khó phát hiện các tác động