Mục đích của phương pháp hồi qui tương quan là ước lượng mức độ liên hệ (tương quan) giữa các biến độc lập (các biến giải thích) đến biến phụ thuộc (biến được giải thích), hoặc ảnh hưởng của các biến độc lập với nhau (các yếu tố nguyên nhân). Phương pháp này được ứng dụng trong kinh doanh và kinh tế để phân tích mối liên hệ giữa hai hay nhiều biến ngẫu nhiên. I. HỆ SỐ TƯƠNG QUAN (Correlation coefficient) Top Hệ số tương quan đo lường mức độ quan hệ tuyến tính giữa hai biến; chính xác hơn là quan hệ tuyến tính giữa hai biến, không phân biệt biến này phụ thuộc vào biến kia. 1. Hệ số tương quan mẫu (r): (Sample correlation coefficient) Top Gọi (x1, y1), (x2, y2), ..., (xn, yn) là n cặp quan sát của một mẫu ngẫu nhiên của hai biến ngẫu nhiên X Y. Hệ số tương quan mẫu tính từ mẫu n cặp giá trị quan sát của hai biến X và Y với trung bình (x và (y và phương sai (x2 và (y2 được thể hiện trong công thức sau: 2. Ðặc tính của hệ số tương quan: Top Hệ số tương quan (r) không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyến tính của X và Y. (r) luôn luôn biến động trong khoảng ( 1 (1 ( r ( 1), nếu hệ số tương quan (r) dương cho biết X và Y biến động cùng chiều và âm thì ngược lại. Ðể biểu hiện mức độ chặt chẽ của mối liên hệ giữa các biến ta có các nhận xét sau đây: ( r = ( 1 : Mối liên hệ giữa các biến hoàn toàn chặt chẽ. ( r = 0 : Giữa các biến không có mối liên hệ. Ðể thấy được đặc tính của r, sáu trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y và giá trị của r. Trong tất cả 6 trường hợp chỉ có (x y là thay đổi, còn các giá trị còn lại như dưới đây: Ví dụ: Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ báo hoặc tạp chí. Liên quan đến chiến dịch quảng cáo này có hai biến liên hệ (bảng 6.1) X: chi phí quảng cáo (100.000 đồng) Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí quảng cáo) Từ số liệu bảng trên ta tính trung bình mẫu như sau: r = 0.441 chỉ ra mối quan hệ giữa chi phí và thu nhập là mối tương quan nghịch, có nghĩa rằng chi phí cao thì thu nhập thấp và giữa chúng mối liên hệ không chặt chẽ lắm. Hệ số tương quan của mẫu thì hữu ích khi dùng để mô tả tính chặt chẽ của mối quan hệ tuyến tính trong một mẫu. Vì vậy, nó có thể dùng làm cơ sở cho kiểm định giả thuyết của tổ hợp không tuyến tính (không tương quan) trong tổng thể (nghĩa la ìhệ số tương quan tổng thể ( = 0). Ðặt r là hệ số tương quan mẫu được tính từ một mẫu ngẫu nhiên gồm n cặp quan sát từ một phân phối chuẩn. Ta có các trường hợp tổng quát để kiểm định ( = 0) nghĩa là không có mối liên hệ giữa các biến như sau: Trở lại ví dụ về chi phí và thu nhập trong chiến dịch quảng cáo chúng ta sẽ kiểm định giả thuyết H0 rằng không có mối quan hệ tương quan trong tổng thể. Trường hợp kiểm định dạng 2 đuôi ta có: Tra bảng phân phối Student t trong trường hợp n = 17, ta có (n 2) =15 và kiểm định trong hai trường hợp ( = 10% và ( = 5%. t15,5% = 1,753 và t15,2,5% = 2,131. Như vậy: t = 1, 903 nằm trong khoảng giữa của t15,5% và t15,10%, nghĩa là: Vậy theo điều kiện quyết định bác bỏ giả thuyết H0 trong trường hợp kiểm định dạng 2 đuôi thì quan sát trên cho phép bác bỏ giả thuyết H0 ở mức ý nghĩa 10% (có tương quan giữa chi phí quảng cáo và thu nhập) và chấp nhận giả thuyết H0 ở mức ý nghĩa 5% (không tương quan giữa chi phí quảng cáo và thu nhập), nghĩa là nếu chọn một xác suất sai lầm (bác bỏ giả thuyết H0 khi giả thuyết này đúng) nhỏ thì số liệu quan sát trên không đủ điều kịên để bác bỏ H0. II. TƯƠNG QUAN HẠNG: (RANK CORRELATION) Top Tương quan hạng dùng để sử dụng cho kiểm định mối liên hệ giữa các biến khi phân phối của tổng thể được giả sử không phải là phân phối chuẩn hoặc trong trường hợp hiện diện các giá trị bất thường của biến quan sát (lớn quá hoặc nhỏ quá). Ðặt xi và yi là những cặp quan sát được xếp hạng riêng biệt theo thứ tự được bắt đầu từ 1. Ta có hai trường hợp: • Nếu các hạng được xếp có trùng nhau (đồng hạng) thì sử dụng công thức (11.1) để tính hệ số tương quan r. • Nếu các hạng được xếp không trùng nhau thì sử dụng công thức của Spearman như dưới đây để tính hệ số tương quan hạng. Trong đó: di là chênh lệch của 2 hạng được xếp của biến xi và yi Tương tự các bước kiểm định cho trường hợp tổng quát không có mối liên hệ giữa các biến (( = 0) ta có: Trở lại ví dụ của chi phí quảng cáo và thu nhập ta có: Bảng 6.2. Chi phí quảng cáo (xi) và tỉ suất lợi nhuận (yi) trên 17 tờ báo và tạp chí: xi hạng yi hạng xi hạng yi hạng 4,07 2,15 1,25 14,67 16,02 3,81 9,87 1,27 1,80 14 8 1 16 17 13 15 2 7 17,41 22,25 106,84 14,41 24,18 29,73 35,95 61,81 48,36 2 4 16 1 5 6 8 11 9 1,50 1,68 2,72 1,61 1,52 3,10 3,32 3,07 3 6 9 5 4 11 12 10 78,74 66,42 121,95 21,93 31,29 88,31 92,70 59,06 13 12 17 3 7 14 15 10 Ta thấy rằng hạng được xếp cho các cặp của hai biến X và Y không trùng nhau. Vì vậy ứng dụng công thức của Spearman ta có hệ số tương quan mẫu: Tra bảng phân phối Spearman ở mức ý nghĩa ( = 5% và ( = 10% ta có: rs,5% = 0,412 và rs,2,5% = 0,490 rs,2,5% < rS < rs,5% Bởi vì giá trị tính được r = 0,431, và rs,2,5% < r < rs,5% ta có thể kết luận rằng giả thuyết H0 (không có sự liên hệ giữa chi phí quảng cáo và thu nhập) có thể bị bác bỏ trên cơ sở kiểm định dạng hai đuôi ở mức ý nghĩa 10% nhưng không bị bác bỏ ở ( = 5%. III. MÔ HÌNH HỒI QUI TUYẾN TÍNH: (LINEAR REGRESSION) Top Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích). 1. Hồi qui tuyến tính một chiều (tuyến tính đơn): (Simple linear regression) Top Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích). a) Phương trình hồi qui tuyến tính một chiều: Top Ðặt (x1,y1), (x2,y2)... (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:. Theo phương pháp bình phương bé nhất thì ước lượng các hệ số ( và ( là các giá trị a và b sao cho tổng bình phương sai số của phương trình sau đây là bé nhất: Các hệ số a và b được tính như sau: Và đường hồi qui tuyến tính mẫu của y trên x là: y = a + bx Ví dụ: Chúng ta có thể quan sát số tiền chi tiêu (yi) và thu nhập (xi) của 22 hộ gia đình trong một tháng có mối quan hệ với nhau như thế nào (1.000đ). Số liệu thu thập được trình bày ở bảng 11.3. Từ bảng bên ta có: n = 22
Trang 1PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG
QUAN (Linear Correlation and Regression)
I. HỆ SỐ TƯƠNG QUAN
1. Hệ số tương quan mẫu
2. Đặc tính của hệ số tương quan
II. TƯƠNG QUAN HẠNG
III. MÔ HÌNH HỒI QUI TUYẾN TÍNH
1. Hồi qui tuyến tính một chiều
a. Phương trình hồi qui tuyến tính một chiều
b. Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều
c. Kiểm định tham số hồi qui tổng thể ((): (Test of the population regression slope)
d. Phân tích phương sai (ANOVA) hồi qui
e. Dự báo trong phương pháp hồi qui tuyến tính đơn
2. Hồi qui nhiều chiều
a. Phương trình hồi qui nhiều chiều
b. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều chiều
c. Kiểm định giả thuyết cho các tham số hồi qui
d. Kiểm định trên tất cả các tham số của một mô hình hồi qui
e. Dự báo trong phương pháp hồi qui tương quan nhiều chiều
BÀI TẬP
Mục đích của phương pháp hồi qui tương quan là ước lượng mức độ liên hệ (tương quan)giữa các biến độc lập (các biến giải thích) đến biến phụ thuộc (biến được giải thích), hoặc ảnhhưởng của các biến độc lập với nhau (các yếu tố nguyên nhân) Phương pháp này được ứng dụngtrong kinh doanh và kinh tế để phân tích mối liên hệ giữa hai hay nhiều biến ngẫu nhiên
I HỆ SỐ TƯƠNG QUAN (Correlation coefficient)
Trang 2Hệ số tương quan đo lường mức độ quan hệ tuyến tính giữa hai biến; chính xác hơn làquan hệ tuyến tính giữa hai biến, không phân biệt biến này phụ thuộc vào biến kia.
1 Hệ số tương quan mẫu (r): (Sample correlation coefficient)
Gọi (x1, y1), (x2, y2), , (xn, yn) là n cặp quan sát của một mẫu ngẫu nhiên của hai biếnngẫu nhiên X & Y Hệ số tương quan mẫu tính từ mẫu n cặp giá trị quan sát của hai biến X và Yvới trung bình (x và (y và phương sai (x2 và (y2 được thể hiện trong công thức sau:
2 Ðặc tính của hệ số tương quan:
Hệ số tương quan (r) không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyếntính của X và Y (r) luôn luôn biến động trong khoảng ( 1 (-1 ( r ( 1), nếu hệ số tương quan (r)dương cho biết X và Y biến động cùng chiều và âm thì ngược lại Ðể biểu hiện mức độ chặt chẽcủa mối liên hệ giữa các biến ta có các nhận xét sau đây:
( r = ( 1 : Mối liên hệ giữa các biến hoàn toàn chặt chẽ
( r = 0 : Giữa các biến không có mối liên hệ
Ðể thấy được đặc tính của r, sáu trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y
và giá trị của r Trong tất cả 6 trường hợp chỉ có (x y là thay đổi, còn các giá trị còn lại nhưdưới đây:
Trang 3
Ví dụ: Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ báo hoặc tạp chí Liên quan đến
chiến dịch quảng cáo này có hai biến liên hệ (bảng 6.1)
X: chi phí quảng cáo (100.000 đồng)
Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí quảng cáo)
Từ số liệu bảng trên ta tính trung bình mẫu như sau:
Trang 4không tuyến tính (không tương quan) trong tổng thể (nghĩa la ìhệ số tương quan tổng thể ( = 0)
Ðặt r là hệ số tương quan mẫu được tính từ một mẫu ngẫu nhiên gồm n cặp quan sát từmột phân phối chuẩn Ta có các trường hợp tổng quát để kiểm định ( = 0) nghĩa là không có mối
liên hệ giữa các biến như sau:
Trở lại ví dụ về chi phí và thu nhập trong chiến dịch quảng cáo chúng ta sẽ kiểm định giảthuyết H0 rằng không có mối quan hệ tương quan trong tổng thể Trường hợp kiểm định dạng 2đuôi ta có:
Tra bảng phân phối Student t trong trường hợp n = 17, ta có (n - 2) =15 và kiểm định trong haitrường hợp ( = 10% và ( = 5%
t15,5% = 1,753 và t15,2,5% = 2,131
Trang 5Như vậy: t = -1, 903 nằm trong khoảng giữa của t15,5% và t15,10%, nghĩa là:
Vậy theo điều kiện quyết định bác bỏ giả thuyết H0 trong trường hợp kiểm định dạng 2 đuôi thìquan sát trên cho phép bác bỏ giả thuyết H0 ở mức ý nghĩa 10% (có tương quan giữa chi phíquảng cáo và thu nhập) và chấp nhận giả thuyết H0 ở mức ý nghĩa 5% (không tương quan giữachi phí quảng cáo và thu nhập), nghĩa là nếu chọn một xác suất sai lầm (bác bỏ giả thuyết H0 khigiả thuyết này đúng) nhỏ thì số liệu quan sát trên không đủ điều kịên để bác bỏ H0
II TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Tương quan hạng dùng để sử dụng cho kiểm định mối liên hệ giữa các biến khi phân phốicủa tổng thể được giả sử không phải là phân phối chuẩn hoặc trong trường hợp hiện diện các giátrị bất thường của biến quan sát (lớn quá hoặc nhỏ quá)
Ðặt xi và yi là những cặp quan sát được xếp hạng riêng biệt theo thứ tự được bắt đầu từ 1
Trong đó: di là chênh lệch của 2 hạng được xếp của biến xi và yi
Tương tự các bước kiểm định cho trường hợp tổng quát - không có mối liên hệ giữa các biến (( =0) ta có:
Trở lại ví dụ của chi phí quảng cáo và thu nhập ta có:
Bảng 6.2 Chi phí quảng cáo (xi) và tỉ suất lợi nhuận (yi) trên 17 tờ báo và tạp chí:
Trang 624161568119
1,501,682,721,611,523,103,323,07
36954111210
78,7466,42121,9521,9331,2988,3192,7059,06
13121737141510
Ta thấy rằng hạng được xếp cho các cặp của hai biến X và Y không trùng nhau Vì vậy ứngdụng công thức của Spearman ta có hệ số tương quan mẫu:
III MÔ HÌNH HỒI QUI TUYẾN TÍNH: (LINEAR REGRESSION)
Trang 7Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biếnđộc lập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giảithích).
1 Hồi qui tuyến tính một chiều (tuyến tính đơn): (Simple linear regression)
Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độclập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích)
a) Phương trình hồi qui tuyến tính một chiều:
Ðặt (x1,y1), (x2,y2) (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:
Theo phương pháp bình phương bé nhất thì ước lượng các hệ số ( và ( là các giá trị a và bsao cho tổng bình phương sai số của phương trình sau đây là bé nhất:
Các hệ số a và b được tính như sau:
Và đường hồi qui tuyến tính mẫu của y trên x là: y = a + bx
Ví dụ: Chúng ta có thể quan sát số tiền chi tiêu (yi) và thu nhập (xi) của 22 hộ gia đình trong mộttháng có mối quan hệ với nhau như thế nào (1.000đ) Số liệu thu thập được trình bày ở bảng11.3
Từ bảng bên ta có:
n = 22
Trang 8
Ðường hồi qui quan sát như sau: y = 1923 + 0,3815x
Phương trình này hàm ý rằng nếu thu nhập của hộ gia đình tăng lên 1.000đ thì trung bìnhchi tiêu tăng thêm là 381,5 đ Còn 1923đ là phần chi tiêu do các nguồn khác
b) Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều:
Giả sử đường hồi qui tuyến tính có dạng: yi = ( +(xi + (i
và đặtĠ là phương sai của sai số và được ước lượng từ công thức sau:
Trang 9Trong đó:Ġ là một số sao choĠ
Ví dụ: Trong sự liên hệ giữa chi tiêu và thu nhập mỗi hộ Chúng ta có những thông tin như sau:
n = 22; b = 0,3815; Sb= 0,0253
Khoảng tin cậy 99% cho ( được tính như sau:
Tra bảng phân phối t ta có: Ġ
Suy ra: 0,3815 - (2,845)(0,0253) < < 0,3815 + (2,845)(0,0253)
0,3095 < < 0,4535
Vì vậy, với khoảng tin cậy 99%, cứ 1000 đồng tăng lên trong thu nhập/hộ thì chi tiêu tăng thêmnằm trong khoảng 309,5 đồng đến 453,5 đồng
Trang 10c) Kiểm định tham số hồi qui tổng thể ((): (Test of the population regression slope)
Ở mức ý nghĩa (, giả thuyết H0 có thể kiểm định dưới các trường hợp sau:
d) Phân tích phương sai (ANOVA) hồi qui:
Trong ước lượng các tham số của mô hình hồi qui tuyến tính đơn theo phương pháp bình phương nhỏ nhất, có thể chứng minh được rằng:
Trang 11
SSR càng lớn thì mô hình hồi qui càng có độ tin cậy cao trong việc giải thích biến động của
Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân tích phương saihồi qui như sau:
Trang 12
e) Dự báo trong phương pháp hồi qui tuyến tính đơn
Giả sử ta có mô hình hồi qui của tổng thể y = ( + (xi + (i (i =1, , n) và (i có phân phối chuẩn.Ðặt a và b là hai tham số được ước lượng theo phương pháp bình phương bé nhất của ( và (, dựavào n cặp quan sát (x1,y1); (x2,y2); ; (xn,yn) Ta ước lượng được:
Khoảng tin cậy 100(1-()% của giá trị thật (yn +1) tại (xn+1):
Với Ġ vàĠ Ĩ là một giá trị của x mà tại đó chúng ta muốn dự báo về giá trị của y)
Ví dụ: Giả sử rằng chúng ta quan tâm đến dự đoán doanh thu bán lẻ trên hộ trong một năm màtrong đó thu nhập trên hộ/năm là 12 triệu đồng
Trang 13Thế các đại lượng trên vào công thức (6.6) và (6.7) ta có kết luận sau:
· Dự báo giá trị thật cho doanh thu bán lẻ là 6,501 ( 321 Có nghĩa là với khoảng tin cậy 95%của doanh thu trong một năm tại mức thu nhập là 12 triệu nằm trong khoảng 6,18 triệu đến6,82 triệu
· Và dự báo cho giá trị mong đợi của doanh thu bán lẽ là 6,501 ( 91 Như vậy, rõ ràng rằngtrong cùng khoảng tin cậy nhưng sự không chắc chắn trong việc dự báo cho giá trị thật thìlớn hơn giá trị mong đợi vì dự báo giá trị thật có khoảng ước lượng rộng hơn
Chú ý: Nếu tất cả các yếu tố khác không đổi thì:
- Cỡ mẫu n càng lớn, càng hẹp khoảng tin cậy khi ước lượng, dự báo càng chính xác -Ġ càng lớn, khoảng tin cậy ước lượng càng lớn, dự báo càng kém chính xác
- Phương saiĠ càng lớn, thì khoảng tin cậy ước lượng càng hẹp, dự báo càng chính xác -Ġcàng lớn, khoảng tin cậy ước lượng càng rộng, và dự báo càng kém chính xác
2 Hồi qui nhiều chiều: (Multiple Regression)
a) Phương trình hồi qui nhiều chiều:
Mục tiêu của mô hình này giải thích biến phụ thuộc (y) bị ảnh hưởng bởi nhiều biến độclập (xi) Ví dụ, trong kinh doanh ngành ngân hàng, lợi tức thu được từ việc chênh lệch giữa lãisuất tiền gởi và cho vay phụ thuộc ít nhất vào hai yếu tố: Phần trăm tăng lên trong lượng tiền gởi(x1) và số đơn vị đến gởi (x2) Ðể xét mối quan hệ này ta sử dụng tài liệu thu thập của ngân hàngqua 25 năm như sau:
Trang 14Bảng 6.4: Lợi tức, % tăng của tiền gởi và số đơn vị gởi tiền qua 25 năm
Trang 15Phương trình hồi qui nhiều chiều cho ví dụ này có dạng:
từ phần mềm Excel như sau:
Trang 16
Hệ số xác định R2 : (Multiple coefficient of determination)
R2 được định nghĩa như là tỉ lệ (hay phần trăm) biến động của biến phụ thuộc (y) đượcgiải thích bởi các biến đởc lập xi Chẳng hạn, R2=0,52 cĩ nghĩa là 52% sự thay đổi trong lợi tức
là do ảnh hưởng bởi % tăng trong lượng tiền gởi và số đơn vị tiền gởi Hệ số xác định được tínhnhư sau:
Hệ số tương quan bội R : (Multiple Correlation Corfficient)
R nĩi lên tính chặt chẽ của mối liên hệ giữa biến phụ thuộc (y) và các biến độc lập (xi)
Trang 17 Tỷ số F = MSR/MSE trong bảng kết quả: dùng để so sánh với F trong bảng phân phối F ởmức ý nghĩa ( Tuy nhiên, cũng trong bảng kết quả ta có giá trị Significance F, giá trị này cho
ta kết luận ngay mô hình hồi qui có ý nghĩa khi nó nhỏ hơn mức ý nghĩa ( nào đó (thay vìphải tra bảng phân phối F phía sau sách), và giá trị Sig F cũng là cơ sở để quyết định bác bỏhay chấp nhận giả thuyết H0 trong kiểm định bao quát các tham số của mô hình hồi qui Nóichung F càng lớn, khả năng bác bỏ giả thuyết H0 càng cao - giả thuyết H0 cho rằng tất cả cáctham số hồi qui đều bằng 0, nghĩa là các biến độc lập (xi) không liên quan tuyến tính tới biếnphụ thuộc y
Trở lại bảng kết quả trên ta thấy giá trị Sig F = 0,000282 = 0,023% là rất thấp so với mức ýnghĩa trong kiểm định 5% nên mô hình hồi qui rất có ý nghĩa, nghĩa là các biến độc lập x1 (%tăng lên trong lượng tiền gởi) và x2 (lượng đơn vị tiền gởi) có ảnh hưởng đến biến phụ thuộc y(lợi tức ngân hàng)
b) Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều chiều:
Mô hình hồi qui nhiều chiều cho tổng thể có dạng:
Trang 18
Ðặt a, b1, b2, ,bk là những tham số được ước lượng cho tổng thể; là những
độ lệch chuẩn đã ước lượng, và coi phân phối chuẩn thì biến ngẫu nhiên t được tính như sau:
Trang 19Phần kiểm định này giống như trong hồi qui một chiều nhưng thay độ tự do tn-2 bằng 1:
Giả thuyết H0 cho (1làĠ nếu giả thuyết H0 bị bác bỏ thì có nghĩa là khi các nhân tố kháckhông thay đổi thì lượng tiền gởi ảnh hưởng đến lợi tức
· Giá trị kiểm định:ĉ
Tra bảng phân phối t ta có: tn-k-1,( = t22,0,5% = 2,819
Kết luận: Vì -1,71 lớn hơn -2,819 cho nên giả thuyết H0 bị bác bỏ ngay cả ở mức ý nghĩa 0,5%,điều này có nghĩa rằng, khi số lượng đơn vị tiền gởi không đổi, % tăng lên trong lượng tiền gởi
Trang 20d) Kiểm định trên tất cả các tham số của một mô hình hồi qui:
Chúng ta hãy xét mô hình hồi qui nhiều chiều sau:
Trang 21Giả sử ta có một mô hình hồi qui tổng thể có dạng tổng quát như sau:
1 Một mẫu ngẫu nhiên gồm 8 dự án có gía/sản phẩm và doanh thu lần lượt như sau:
Doanh thu (triệu đồng): 12,2 18,6 29,2 15,7 25,4 35,2 14,7 11,1
Giá (ngàn đồng): 29,2 30,5 29,7 31,3 30,8 29,9 27,8 27,0
Trang 22a Tìm sự tương quan giữa doanh thu và giá?
b Kiểm định ở mức ý nghĩa 5% dựa vào kiểm định dạng 2 đuôi với giả thuyết H0 rằng
hệ số tương quan của tổng thể thì bằng 0?
2 Những công ty đa quốc gia thường chuyển từ một sang nhiều liînh vực buôn bán hàng hóa vàdich vụ khác nhau trên trường quốc tế Họ có một sự linh hoạt rất lớn trong giá chuyển giao củacác mặt hàng Một nghiên cứu của hai công ty lớn đang hoạt động ở Việt Nam là P & G vàUnilever nhằm xác định tầm quan trọng của 20 biến có liên hệ, những biến này có thể được xemxét trong việc thành lập chính sách chuyển giao giá quốc tế Các biến này đã được xếp hạngtrong bảng như sau:
a Hãy tính hệ số tương quan hạng của Spearman (Tied Rank)?
b Kiểm định giả thuyết H0 rằng không có sự tương quan giữa các biến ở mức ý nghĩa5%?
3 Một công ty đặt những giá khác nhau cho hệ thống âm ly đặc biệt cho 8 khu vực khác nhautrong nước Bảng sau đây trình bày doanh thu và giá cả như sau: (triệu đồng)
Giá 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0
Trang 23Doanh thu 420 380 350 400 440 380 450 420
Hãy ước lượng phương trình hồi qui của doanh thu trên giá và giải thích?
4 Một mẫu gồm 25 công nhân ở một phân xưởng sản xuất được chọn ra Mỗi công nhânđược yêu cầu để đánh giá sự thỏa mãn trong nghề nghiệp (x) trong phạm vi từ 1 đến 10 Hơnnữa, số lượng ngày vắng mặt (y) trong công việc trong năm rồi đã được liệt kê cho số côngnhân này theo đường hồi qui mẫu:
y = 13,6 - 1,2x và Sb = 80,6
a Giải thích phương trình hồi qui?
b Kiểm định ở mức ý mghĩa 1% dạng một đuôi giả thuyết H0 rằng không có quan hệtuyến tính giữa sự thỏa mãn nghề nghiệp và sự vắng mặt (nghỉ việc trong năm)?
5 Một nhà phân tích tin rằng nhân tố quyết định quan trọng của lợi tức ngân hàng (y:%) là chênhlệch giữa lãi suất cho vay và lãi suất tiền gởi (x:%) Một mẫu ngẫu nhiên gồm 20 nhà băng được chọn và đường hồi qui mẫu như sau: y = 0,97 + 0,47x và hệ số xác định R2 = 0.72
a Giải thích phương trình hồi qui?
b Kiểm định hai đuôi ở mức ý nghĩa 5% giả thuyết H0 rằng không có tổ hợp tuyến tínhgiữa x và y?
6 Trong nghiên cứu nhận dạng vấn đề của một công ty muốn thâm nhập thị trường mới, công ty tiến hành đánh giá sự ảnh hưởng của các nhân tố khác nhau trong việc có nên đặt một chi nhánh hay đặt một cơ sở sản xuất tại một nơi nào đó hay không Một mẫu ngẫu nhiên gồm 70 khu vực được khảo sát với các nhân tố như trong mô hình hồi qui sau đây được ước lượng:
y: Thâm nhập thị trường mới
x1: Dân số (triệu người)
x2: Phạm vi hay mức độ rộng lớn của ngành