lệch chuẩn (Standard deviation)

a. Độ lệch chuẩn của tổng thể: σx =pσ2 x = r P (xi−µ)2 N b. Độ lệch chuẩn của tổng thể: Sx = r P (xi−x)2 n−1 3.4.5. 5. Hệ số biến thiên (Coefficient of Variation)

Hệ số biến thiên là chỉ tiêu tương đối phản ánh mối quan hệ so sánh giữa độ lệch chuẩn với số bình quân số học. Công thức tính: V = σ x Trong dó: V; Hệ số biến thiên; σ Độ lệch chuẩn; x; Số trung bình số học;

Hệ số biến thiên cũng dùng để đánh giá độ biến thiên của tiêu thức và tính chất đồng đều của tổng thể. Hệ số này biểu hiện bằng số tương đối nên còn có thể được dùng để so sánh cả những chỉ tiêu cùng loại nhưng ở các quy mô khác nhau như so sánh độ đồng đều về thu nhập bình quân của hộ gia đình ở khu vực nông thôn (có thu nhập thấp và số hộ ít hơn) với thu nhập bình quân của hộ gia đình ở thành thị (có mức thu nhập cao hơn và số hộ nhiều hơn), đặc biệt để so sánh được những chỉ tiêu của các hiện tượng khác nhau và có đơn vị đo lường khác nhau như so sánh hệ số biến thiên về bậc thợ với hệ số biến thiên về tiền lương bình quân, hệ số biến thiên về năng suất lao động bình quân, so sánh hệ số biến thiên về chỉ tiêu thu nhập của hộ gia đình với hệ số biến thiên về chi tiêu của hộ gia đình,...

Hệ số biến thiên còn có thể tính theo độ lệch tuyệt đối bình quân, nhưng hệ số biến thiên tính theo độ lệch chuẩn thường được sử dụng rộng rãi hơn, tuy phần tính toán có phức tạp hơn phải sử dụng độ lệch tuyệt đối trung bình.

Hệ số biến thiên tính theo độ lệch tuyệt đối bình quân có công thức tính: V = d

x Trong dó:

Bài tập 3.1. Một xí nghiệp có kế hoạch tăng sản lượng kỳ nghiên cứu so với kỳ gốc 10%. Trên thực tế sản lượng kỳ nghiên cứu so với kỳ gốc tăng 15%. Tính tỷ lệ hoàn thành kế hoạch về sản lượng của xí nghiệp.

Bài tập 3.2. Một xí nghiệp có kế hoạch giá thành kỳ nghiên cứu so với kì gốc giảm 5%. Trên thực tế, giá thành kỳ nghiên cứu so với kì gốc giảm 3%. Tính tỉ lệ hoàn thành kế hoạch giá thành và cho biết xí nghiệp có hoàn thành kế hoạch hay không? .

Bài tập 3.3. Giá trị tăng thêm của doanh nghiệp X trong năm gốc là 4,200 triệu đồng. Mục tiêu năm báo cáo phấn đấu tăng 15% so với năm gốc. Giá trị tăng thêm thực hiện được ở năm báo cáo là 4,900 triệu đồng.

1. Tính tỷ lệ % hoàn thành giá trị gia tăng năm báo cáo;

2. Tính số tương đối động thái (tốc độ phát triển) năm báo cáo so với năm gốc về giá trị tăng thêm.

Bài tập 3.4. Nhà máy B chuyên sản xuất loại sản phẩm X. Năm 2011, nhà máy phấn đấu hạ giá thành sản phẩm 2.5% và nâng cao sản lượng lên 10% so với năm 2010. Kết thúc năm 2011, nhà máy hoàn thành vượt mức kế hoạch hạ giá thành 2% và vượt mức kế hoạch sản lượng 6%. Xác định biến động giá thành và biến động sản lượng năm 2011 so với 2010.

Bài tập 3.5. Có số liệu về giá thành một loại sản phẩm A như sau: - Giá thành một đơn vị sản phẩm A ở kỳ gốc là 500,000 đồng.

- Giá thành một đơn vị sản phẩm A ở kỳ báo cáo so với kỳ gốc giảm được 5%.

- Kết quả thực hiện kế hoạch giá thành đơn vị sản phẩm A giảm được chi phí là 15,000 đồng.

1. Xác định nhiệm vụ kế hoạch đề ra phấn đấu giảm giá thành đơn vị sản phẩm A bao nhiêu theo số tương đối và số tuyệt đối.

2. Tính tỷ lệ % thực hiện kế hoạch giảm giá thành đơn vị sản phẩm A.

Bài tập 3.6. Có số liệu thống kê về tài sản cố định (TSCĐ) dùng sản xuất trong toàn bộ TSCĐ của doanh nghiệp X năm 2012 là 80%. Số tương đối động thái năm 2013 so với năm 2012 của TSCĐ dùng trong sản xuất là 108%, TSCĐ không dùng trong sản xuất là 115% và của toàn bộ TSCĐ là 110%. Hãy tính tỷ lệ kết cấu TSCĐ trong năm 2013.

Bài tập 3.7. Ta có số liệu thống kê về tình hình hoạt động của các cửa hàng trong một doanh nghiệp cho bởi bảng sau:

Tên cửa hàng Doanh số bán (triệu đồng)

Thực hiện 2012 Kế hoạch 2013 Thực hiện 2013

A 1,000 1,500 1,700

B 2,000 2,500 2,800

C 3,000 3,500 3,000

D 4,000 5,000 5,200

1. Tính số tương đối nhiệm vụ kế hoạch và hoàn thành kế hoạch năm 2013 của mỗi cửa hàng và doanh nghiệp;

2. Tốc độ phát triển của mỗi cửa hàng và doanh nghiệp;

3. Tính tỷ trọng doanh số bán của mỗi cửa hàng theo mức thực hiện năm 2012 và năm 2013. 4. Nếu cửa hàng C hoàn thành đúng kế hoạch thì tỷ lệ (%) hoàn thành kế hoạch của doanh

nghiệp là bao nhiêu?

Bài tập 3.8. Ta có số liệu thống kê về tình hình sản xuất của doanh nghiệp Y trong năm 2014 cho bởi bảng sau:

Nhà máy Số công nhân Mức lương tháng Năng suất lao động

Giá thành đơn vị sản phẩm

(người) (triệu đồng) (tấn/người) (tr.đ/tấn)

A 150 600 25 185

B 200 650 30 180

C 250 700 35 175

1. Tính năng suất lao động bình quân năm của công nhân; 2. Tính mức lương tháng bình quân của công nhân;

3. Giá thành bình quân của 1 tấn sản phẩm.

Bài tập 3.9. Tài liệu tổng hợp về doanh số bán hàng của 50 công ty dệt may trong tháng 12 năm 2012 của ngành dệt may có số liệu cho bởi bảng sau:

Doanh số bán (tr.đ) 500-600 600-700 700-800 800-900 900-1000

Số công ty 5 22 18 3 2

1. Tính doanh số bán bình quân của một công ty;

Chương 4

TƯƠNG QUAN VÀ HỒI QUY

4.1. TƯƠNG QUAN

Trong chương này ta sẽ nói đến việc nghiên cứu mối liên hệ giữa hai hay nhiều biến ngẫu nhiên với hai phương pháp tương quan và hồi qui.

4.1.1. Hệ số tương quan

Hệ số tương quan là hệ số đo lường mức độ tuyến tính giữa hai biến không phân biệt biến nào là phụ thuộc biến nào là độc lập.

Giả sử X, Y là 2 biến ngẫu nhiên hệ số tương quan tổng thểρXY là khái niệm dùng để thể hiện cường độ và chiều hướng của mối liên hệ tuyến tính giữa X và Y nếu nó thoả mãn 5 điều kiện sau:

1. −1≤ρ≤1;

2. ρ <0 :Giữa X và Y có mối liên hệ nghịch, nghĩa là nếu X tăng thì Y giảm và ngược lại;

3. ρ >0 :Giữa X và Y có mối liên hệ thuận, nghĩa là nếu X tăng thì Y tăng và ngược lại;

4. ρ= 0 : Giữa X và Y không có mối liên hệ tuyến tính;

5. |ρ|: Càng lớn thì mối liên hệ giữa X và Y càng chặt chẽ.

Trong thực tế ta không biết chính xác được hệ số tương quan tổng thể mà phải ước lượng từ dữ liệu mẫu thu thập được.

Gọi (xi, yi) là mẫu n cặp quan sát thu thập ngẫu nhiên từ X và Y. Hệ số tương quan tổng thể ρXY được ước lượng từ hệ số tương quan mẫu rXY.RXY còn được gọi là hệ số tương quan Pearson, được xác định bởi công thức sau:

r= Pn i=1(xi−x)(yi−y) pPn i=1(xi−x)2Pn i=1(yi−y)2 (4.1)

4.1.2. Kiểm định giả thuyết về mối liên hệ tương quan

Giả sử có mẫu n cặp quan sát chọn ngẫu nhiên từX và Y có phân phối chuẩn. Kiểm định giả thuyết về hệ số tương quan của tổng thể ρ0 = 0, tức là không có mối liên hệ giữa các biến X và Y. Các dạng kiểm định như sau:

Một phía phải Một phía trái Hai phía Đặt giả thiết    H0 :ρ≤0 H1 :ρ >0    H0 :ρGiieq0 H1 :ρ <0    H0 :ρ= 0 H1 :ρ6= 0 Giá trị kiểm định tqs= r r (1−r2) (n−2) Quyết định bác bỏ H0 khi: tqs> tα;n−2 tqs <−tα;n−2 tqs> tα;n−2;tqs<−tα;n−2 Hệ số tương quan có một vài ứng dụng quan trọng trong việc kiểm định mô hình hồi qui tuyến tính, do đó chúng ta cũng cần quan tâm đúng mức khi đi sâu vào lĩnh vực kinh tế lượng.

4.2. MÔ HÌNH HỒI QUY

Như phần tương quan tuyến tính dùng để đo lường mức độ liên hệ tuyến tính giữa hai biến ngẫu nhiên X và Y nhưng trong đó X và Y có tính đối xứng (tức là X phụ thuộc vào Y thì Y cũng phụ thuộc vào X).

Trong phần này ta cũng nghiên cứu mối liên hệ tuyến tính giữaX vàY, trong đóX ảnh hưởng đến Y và Y được xem là phụ thuộc vào X. Mối liên hệ giữa X và Y đã được xác định bằng một qui luật khách quan đã có.

Mục tiêu của phân tích hồi qui là mô hình hoá mối liên hệ bằng một mô hình toán học nhằm thể hiện một cách tốt nhất mối liên hệ giữa X và Y.

Để bắt đầu, chúng ta hãy tìm hiểu các khái niệm cơ bản. 4.2.1. Mô hình hồi quy tuyến tính đơn giản

Giả sử ta có các bộ số liệu (Xi;Yi,j) cho tổng thể, với i = 1, n, j = 1, m(i) , . Ứng với mỗi giá trị của X, X =Xi , vớii = 1, n , ta có thể có nhiều giá trị của Y tương ứng nên quan hệ của Y theo X không là quan hệ “hàm số”. Tuy nhiên, ứng với mỗi giá trị của X,X =Xi , ta có duy nhất giá trị trung bìnhE(Y|X =Xi) =f(Xi)nên quan hệ này trở thành quan hệ hàm số

E(Y|X =Xi) =f(Xi) (4.2)

và hàm số này được gọi là hàm hồi quy tổng thể, PRF (Population Regression Functions) mà trong trường hợp này, ta còn gọi làhàm hồi quy đơn (hồi quy hai biến), do nó chỉ có một biến độc lập. Trường hợp có nhiều hơn một biến độc lập, ta gọi là hàm hồi quy bội.

Trước hết, giả sử PRF là hàm tuyến tính

E(Y|X =Xi) =β1+β2Xi mà ta còn viết là

E(Y|X) = β1+β2X,

trong đóβ1 và β2 là các tham số chưa biết nhưng cố định, được gọi là các hệ số hồi quy; β1 gọi là hệ số tự do hay hệ số chặn,β2 gọi là hệ số góc (nó cho biết tỷ lệ thay đổi của Y đối với X). Tính tuyến tính ở đây đúng đối với cả tham số cũng như đối với các biến. Điều này không đúng trong nhiều trường hợp khác, chẳng hạn hàmE(Y|X) = β1+β2X2 tuyến tính đối với tham số nhưng không tuyến tính (phi tuyến) đối với biến. Ngược lại, hàmE(Y|X) =β1+√

β2X tuyến tính đối với biến nhưng phi tuyến đối với tham số.

Chú ý 4.1. Trong phân tích hồi quy tuyến tính, hàm hồi quy tổng thể được hiểu là tuyến tính đối với tham số nhưng không nhất thiết tuyến tính theo các biến.

Ngoài ra, do Y là biến số ngẫu nhiên, nên ứng với quan sát thứ i trong tổng thểX =Xi , giá trị Y =Yi tương ứng sai khác với giá trị trung bình β1+β2Xi một đại lượng sai số ngẫu nhiên, ký hiệu εi . Do đó, ta còn viết

Y =β1+β2X+ε (4.3)

trong đó ε là một đại lượng ngẫu nhiên và (4.3) được gọi là hàm hồi quy tổng thể ngẫu nhiên. Thông thường, đại lượng ngẫu nhiên ε được ngầm hiểu và khi đó, hàm hồi quy tổng thể (ngẫu nhiên) được viết tắt là

Y =β1+β2X

4.2.2. Phương trình hồi qui tuyến tính mẫu

Cũng như vấn đề về mẫu và tổng thể trong lý thuyết thống kê, chúng ta hoặc không có tổng thể, hoặc có nhưng không thể nghiên cứu được toàn bộ tổng thể. Do đó, ta chỉ có thể ước lượng hàm hồi quy tổng thể với những thông tin từ các mẫu ngẫu nhiên lấy ra từ tổng thể. Hàm hồi quy xây dựng trên cơ sở của một mẫu ngẫu nhiên được gọi làhàm hồi quy mẫu, SRF (Sample Regression Function), hay hồi quy mẫu.

Rõ ràng là với nhiều mẫu khác nhau, ta có nhiều SRF khác nhau. Do đó, vấn đề đặt ra là cần ước lượng PRF bằng SRF tốt nhất theo nghĩa là SRF này có các tính chất : tuyến tính, không chệch, có độ lệch chuẩn nhỏ nhất.

Cụ thể, với hàm hồi quy tổng thể tuyến tính, hàm hồi quy mẫu có dạng

Y =β1b +β2X,b

trong đó Yb là ước lượng điểm của E(Y|X) , βb1 là ước lượng điểm của β1 và βb2 là ước lượng điểm của β2.

4.2.3. Phương pháp bình phương nhỏ nhất.

Phương pháp bình phương nhỏ nhất, OLS (Ordinary Least Square), do nhà toán học Đức Carl Fredrich Gauss đưa ra. Với phương pháp này, kèm theo một vài giả thiết, các ước lượng thu được có một số tính chất đặc biệt mà nhờ đó nó trở thành phương pháp hồi quy mạnh và phổ biến nhất.

Giả sử chúng ta có n cặp quan sát(Xi;Yi);i= 1;n. Tìm hàm hồi quy mẫu: Ybi =βb1+βb2Xi nghĩa là tìm các giá trị βb1;βb2 sao cho:

ε2i =X(Yi−Ybi)2 =X(Yi−βb1 +βb2Xi)−→min Các tham số hồi quy mẫu sẽ là nghiệm của hệ phương trình sau:

   ∂L ∂βb1 = 0 ∂L ∂βb2 = 0 ⇔    b β1n+βb2P Xi =P Yi b β1P Xi+βb2P X2 i =P XiYi

Khi hệ trên có nghiệm duy nhất, thì nghiệm của hệ là b β2 = P Xi.Yi−n.X.Y P X2 i −n.[X]2 = XY −X.Y X2−X2 (4.4) và b β1 =Y −βb2X (4.5)

Các giả thiết của phương pháp OLS:

Phương pháp OLS là phương pháp rất đáng tin cậy trong việc ước lượng các tham số của mô hình, tuy nhiên mô hình ước lượng phải thỏa mãn các giả thiết. Khi thỏa mãn các giả thiết, ước lượng bình phương nhỏ nhất (OLS) là ước lượng tuyến tính không chệch có hiệu quả nhất trong các ước lượng. Vì thế phương pháp OLS đưa ra ước lượng không chệch tuyến tính tốt nhất. Kết quả này được gọi là Định lý Gauss-Markov. Các giả thiết sau:

1. E(εi) = 0.

2. V ar(εi) =σ2. 3. Cov(εi;εj) = 0.

4. Cov(εi;Xi) = 0.

5. εi có phân phối chuẩn.

6. Hàm hồi quy được chỉ định đúng.

Ví dụ 4.1. Bảng sau cho số liệu về lãi suất ngân hàng (Y) và tỷ lệ lạm phát (X) trong năm 1988 ở 9 nước

Y 11.9 9.4 7.5 4.0 11.3 66.3 2.2 10.3 7.6 X 7.2 4.0 3.1 1.6 4.8 51.0 2.0 6.6 4.4

Lập mô hình hồi quy của lãi suất ngân hàng phụ thuộc vào tỷ lệ lạm phát và nêu ý nghĩa kinh tế của các hệ số hồi quy tìm được;

Giải. Sử dụng máy tính cá nhân ta có các kết quả sau: X X2 = 2770.97;XX = 84.7;n = 9;XY2 = 4994.29;XY = 130.5 X XY = 3694.29;X = 9.4111;Y = 14.5;SX = 14.8093;SY = 18.5653 Do đó: βb2 = P XY−n.X.Y P X2−n.X2 = 3694.292770.97−9−×99.4111×9.4111×14.52 = 1.2494 Suy ra: β1b =Y −B2X = 14.5−1.2494×9.4111 = 2.74169 hay, ta giải hệ phương trình:

   9βb1+ 84.7βb2 = 130.5 84.7βb1+ 2770.97bβ2 = 3694.29 ⇒    b β1 = 2.74169 b β2 = 1.2494

Vậy mô hình hàm hồi quy:Yb = 2.74169 + 1.2494X

Ý nghĩa kinh tế : Nếu X thay đổi 1 đơn vị thì Y thay đổi 1.2494 đơn vị. Hay, nếu tỷ lệ lạm phát tăng hay giảm 1% thì lãi suất ngân hàng tăng hay giảm 1.2494%

4.2.4. Dự báo trong phương pháp hồi qui tuyến tính đơn giản

Trong các công thức σ2 chưa biết, σ2 được ước lượng bằng ước lượng không chệch của nó là bσ2 =

n−2 = RSSn−2. Nó chính là độ lệch chuẩn của các giá trịY quanh đường hồi quy mẫu. 1. T SS =P

(Yi−Y)2 =P Y2

i −n(Y)2;

TSS: Tổng bình phương của tất cả các sai lệch giữa các giá trị quan sátYi và giá trị trung bình.

2. ESS =P

(Ybi −Y)2 = (βb2)2.[P

X2−n(X)2];

ESS: Tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Ybi nhận được từ hàm hồi quy mẫu và giá trị trung bình của chúng. Phần này đo độ chính xác của hàm hồi quy.

3. RSS =T SS−ESS =P ε2

RSS: Tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi và các giá trị nhận được từ hàm hồi quy.

Lệch chuẩn (Standard deviation)

Số trung bình nhân (Geometric mean)