Đặt tên đầy đủ cho những số liệu ở dạng số

Một phần của tài liệu Giáo trình lý thuyết thống kê Kinh doanh thương mại (Trang 86)

77

tên đầy đủ sau khi mã hóa lại các biến số. Muốn mã hóa các giá trị bằng một số nào đó, hãy nhắp chuột vào cột Values của trang Variable View. Khi đó một cửa sổ Value Labels xuất hiện (Hình 3.16). Để mã hóa số 1 cho biến “Thu nhập thấp”, trƣớc hết đặt con chỏ chuột vào ô Value và đánh số 1. Tiếp theo, đặt con chỏ chuột vào ô Label và đánh chữ “Thu nhập thấp”. Sau đó nhấp nút Add để máy ghi nhận các thay đổi này. Trình tự đặt nhãn cho các giá trị khác cũng đƣợc thực hiện tƣơng tự nhƣ trên. Lƣu ý rằng, sau mỗi lần đặt nhãn cho một số thì phải nhấp nút Add. Nếu cần thay đổi nhãn cho một số nào đó thì nhấp nút Change (thay đổi) và đổi lại nhãn khác. Nếu cần loại bỏ một nhãn nào đó thì nhấp nút Remove. Nếu có giá trị khuyết thiếu (tức một mẫu nào đó thiếu số liệu), thì nhấp nút Define Missing Variable và ghi số trung bình của chuỗi số liệu.

Bƣớc 3. Xác định những đặc trƣng thống kê mô tả bằng phần mềm SPSS. Sau khi nhập xong các dữ liệu nhƣ ở bƣớc 1 và bƣớc 2, chúng ta có thể tính

tốn các đặc trƣng thống kê mô tả. Dƣới đây là một số thủ tục cơ bản để xác định những đặc trƣng thống kê mô tả bằng phần mềm SPSS.

(1) Sử dụng thủ tục Descriptives Statistics. Thủ tục thống kê mô tả (Descriptive Statistics) giúp chúng ta xác định những đặc trƣng thống kê nhƣ giá trị trung bình, phƣơng sai, phạm vi biến động, trị lớn nhất và nhỏ nhất, độ lệch, độ nhọn, khoảng tin cậy của trung bình mẫu…Giả thiết cần xác định những đặc trƣng thống kê đối với thu nhập (Triệu đồng/tháng) theo số liệu ở Bảng 3.14. Để nhận đƣợc những thống kê mô tả, chúng ta thực hiện các bƣớc nhƣ dƣới đây.

Bƣớc 1. Nhập số liệu. Số liệu về thu nhập của 40 hộ gia đình có thể đƣợc nhập trực tiếp vào bảng tính SPSS hoặc nhập vào bảng tính Excel; sau đó Copy và dán sang bảng tính SPSS.

Bƣớc 2. Gọi chƣơng trình tính tốn. Từ Menu chính, mở Analyze  Descriptive Statistic  Descriptives. Khi cửa sổ Descriptives xuất hiện, hãy chuyển biến số thu nhập vào ơ Variables (Hình 3.17a).

Bƣớc 3. Từ của sổ Descriptives, chọn Options và đánh dấu những thống kê

78

đây chƣơng trình sẽ hiện thị những thống kê mô tả theo chỉ định của chúng ta (Bảng 3.4).

Bảng 3.17. Thống kê thu nhập của 40 hộ gia đình ở thơn A bằng thủ tục

Descriptives.. Statistics Thunhap N Statistic 40 Range Statistic 9.5 Minimum Statistic 5.8 Maximum Statistic 15.3 Sum Statistic 402.5 …

(2) Sử dụng thủ tục Explore. Thủ tục Explore cho phép chúng ta không chỉ

xác định các thống kê mơ tả (trung bình, phƣơng sai, độ lệch, độ nhọn…), khoảng tin cậy (95%, 99%..) cho số trung bình, trung bình bị loải bỏ 5% dữ liệu (5% Trimmed Mean), trung vị (Median), mà còn các ƣớc lƣợng số trung bình M – Estimators, các giá trị cực trị (Extreme Values), kiểm định phân bố chuẩn (Tests of

Hình 3.17. Xác định thống kê mơ tả bằng thủ tục Descriptive.

(a)

79

Normality)…Để nhận đƣợc các thống kê trên đây, hãy thực hiện theo các bƣớc dƣới đây.

Bƣớc 1. Từ Menu chính, mở Analyze  Descriptive Statistic  Explore. Đến đây chọn biến cần xử lý và chuyển nó vào ơ Dependent list (Hình 3.18).

Bƣớc 2. Từ cửa sổ Explore, chọn Statistics và đánh dấu các ô Descriptives,

M – Estimators, Outliers... Cuối cùng chọn Continue rồi chọn OK để chƣơng trình tính tốn và hiển thị kết quả (Bảng 3.18).

Bảng 3.18. Kết quả thống kê thu nhập ở thôn A bằng thủ tục Explore.

Statistic Std. Error

Thu nhập

Mean 10.063 .3108

95% Confidence Interval for Mean

Lower Bound 9.434 Upper Bound 10.691 5% Trimmed Mean 10.011 Median 9.800 Variance 3.864 Std. Deviation 1.9658 Minimum 5.8 Maximum 15.3 Range 9.5 Interquartile Range 2.9

80 Skewness .376 .374 Kurtosis .233 .733 Trung bình Huber's M- Estimatora Tukey's Biweightb Hampel's M- Estimatorc Andrews' Waved Nangsuatlua 9.971 9.917 9.981 9.914 Case Number Value Thu nhập Highest 1 28 15.3 2 29 13.9 3 1 12.8 4 3 12.8 5 11 12.2 Lowest 1 37 5.8 2 33 7.1 3 17 7.5 4 22 7.7 5 40 7.9a

Giải thích kết quả của thủ tục Explore. Khi phân bố của các đại lƣợng không tuân theo luật phân bố chuẩn, việc ƣớc lƣợng số trung bình đƣợc thực hiện theo thủ tục M – Estimators. Thủ tục này cung cấp 4 ƣớc lƣợng số trung bình là Huber, Tukeys’s Beweight, Hample và Andrew. Các số trung bình của Huber và số trung bình bị loại bỏ 5% là các ƣớc lƣợng gần đúng cho trung bình mẫu. Trung bình bị loại bỏ 5% đƣợc tính bằng cách: Trƣớc hết sắp xếp các số liệu từ nhỏ nhất đến lớn nhất; Tiếp theo bỏ bớt 5% số liệu ở mỗi phía của dãy số; Sau đó tính số trung bình trên những số liệu cịn lại.

Chƣơng trình đƣa ra 10 giá trị cực trị (Extreme Values); trong đo bao gồm 5 giá trị nhỏ nhất và 5 giá trị lớn nhất của dãy số liệu. Báo cáo các kiểm định về phân bố chuẩn (Test of normality) của dãy số liệu bằng kiểm định Kolmogorov-Smirnov và Shapiro-Wilk. Khi P < 0.000 (giá trị làm trịn của số 0.0005), thì giả thuyết về phân bố chuẩn bị bác bỏ. Ngƣợc lại, khi P > 0.0005, thì giả thuyết về phân bố chuẩn đƣợc chấp nhận.

81

Cùng với các thống kê đƣợc tính tốn, chƣơng trình cịn hiển thị 5 đồ thị là Histogram (giản đồ), Stem and Leaf Plot (đồ thị cành và lá), Normal Q-Q plot (đồ thị xác suất chuẩn), Detrended normal q – q plot (đồ thị xác suất chuẩn đã khử xu hƣớng) và Boxplot (đồ thị hộp). Các đồ thị này cũng giúp chúng ta nhận định sơ bộ về dãy số liệu có tn theo luật phân bố chuẩn hay khơng. Đồ thị xác suất chuẩn (Normal Q-Q plot) đƣợc vẽ với trục hồnh là trị số quan sát, cịn trục tung là trị số chuẩn hoá kỳ vọng. Khi các giao điểm giữa các trị số quan sát và các trị số chuẩn hoá kỳ vọng cùng nằm trên một đƣờng thẳng, thì phân bố của dãy số liệu là tiệm cận chuẩn.

Khi ƣớc lƣợng khoảng tin cậy cho số trung bình và phƣơng sai, chúng ta cũng có thể thay đổi mức tin cậy khác nhau (Ví dụ: 90%, 95%, 99%); trong đó mặc định là mức tin cậy 95%. Việc chọn mức tin cậy nào là tùy thuộc vào yêu cầu của cuộc nghiên cứu.

Chúng ta cũng có thể sử dụng thủ tục Explore để tính tốn các thống kê cho từng nhóm đối tƣợng. Ví dụ: Tính tốn các thống kê cho tồn bộ 40 gia đình và cho nhóm gia đình có thu nhập trung bình…Để đạt đƣợc mục đích đặt ra, việc mã hóa các nhóm đối tƣợng (thu nhập cao, thu nhập trung bình và thu nhập thấp) bằng các con số hay các ký tự là việc làm cần thiết. Sau đó chuyển các biến số cần tính tốn vào ơ Dependent variable, cịn biến lập nhóm đƣợc đƣa vào Factor List. Cuối cùng chọn các thống kê mô tả rồi chọn OK. Đến đây kết quả cần tính tốn sẽ hiện thị ra màn hình.

(3) Sử dụng thủ tục Frequencies. Thủ tục này cho phép chúng ta xác định những thống kê mô tả khuynh hƣớng trung tâm (trung bình = Mean; trung vị = Median; Mode…), các đặc trƣng phân tán (phƣơng sai = S2; sai tiêu chuẩn = S; phạm vi biến động = Max – Min…), các tần số, các đặc trƣng hình dạng của đƣờng cong phân bố tần số (độ lệch = Skew; độ nhọn = Kurtosis), các phân vị (Percentiles = 25%, 50% và 75%), giản đồ cột cùng với một đƣờng cong chuẩn…Để thu đƣợc các thống kê mô tả, hãy thực hiện theo các bƣớc dƣới đây.

82

Bƣớc 1. Từ Menu chính, mở Analyze  Descriptive Statistic  Frequencies. Đến đây chọn những biến số cần xử lý và chuyển chúng vào ơ Variables (Hình 3.19a).

Bƣớc 2. Từ cửa sổ Frequencies, chọn Statistics và đánh dấu những thống kê

cần quan tâm (Hình 3.19b). Cuối cùng chọn Continue rồi chọn OK để chƣơng trình tính tốn và hiển thị kết quả (Bảng 3.19).

Bảng 3.19. Kết quả thống kê thu nhập ở thôn A bằng thủ tục Frequencies.

Thống kê Giá trị Thống kê Giá trị

N 40 Skewness .376 Mean 10.062 Kurtosis .233 Median 9.800 Range 9.5 Mode 7.9a Minimum 5.8 Std. Deviation 1.9658 Maximum 15.3 Variance 3.864

(4) Sử dụng thủ tục Report. Thủ tục Reports (Tóm tắt) cho phép chúng ta

xác định các thông tin về từng đối tƣợng (trƣờng hợp) hoặc một nhóm đối tƣợng. Ví dụ: Thống kê điểm số theo các nhóm sinh viên (nam, nữ; giỏi, khá, trung bình);

Hình 3.19. Xác định thống kê mơ tả bằng thủ tục Frequencies.

83

thống kê năng suất lao động theo nhóm cơng nhân…Để đạt đƣợc mục đích đặt ra, hãy thực hiện theo các bƣớc dƣới đây.

Bƣớc 1. Thu thập dữ liệu. Chẳng hạn chúng ta thu thập số liệu về thu nhập

(Y, triệu đồng/tháng) của 40 hộ gia đình ở hai thơn A và B; trong đó mỗi thơn 20 hộ (Bảng 3.20).

Bảng 3.20. Thu nhập (Y) của 40 hộ gia đình ở thơn A và B. Đơn vị tính:

Triệu/tháng.

Y Thơn A Y Thôn A Y Thôn B Y Thôn B

(1) (2) (3) (4) (5) (6) (7) (8) 12,8 1 12,2 1 9,3 2 9,8 2 11,8 1 11,8 1 7,7 2 9,8 2 12,8 1 7,9 1 8,3 2 7,1 2 11,2 1 8,7 1 8,7 2 12,0 2 9,3 1 12,0 1 8,7 2 8,8 2 10,1 1 9,6 1 9,9 2 10,3 2 9,0 1 7,5 1 10,1 2 5,8 2 9,3 1 11,7 1 15,3 2 7,9 2 9,8 1 11,1 1 13,9 2 9,6 2 11,5 1 10,3 1 11,2 2 7,9 2

Bƣớc 2. Nhập số liệu vào bảng tính. Những số liệu của mỗi thơn đƣợc nhập

vào bảng tính SPSS hoặc bảng tính Excel. Thu nhập (Y, triệu đồng/tháng) đƣợc nhập vào cột 1, mã thôn (Thôn A với Code = 1; Thôn B với Code = 2) đƣợc nhập vào cột 2. Sau đó ghi tên các biến theo những chỉ dẫn trên đây.

Bƣớc 3. Tóm tắt từng trƣờng hợp và tất cả các trƣờng hợp (Summarize

Cases). Từ cửa sổ chính, chọn Analyze  Reports  Case Summaries. Đến đây cửa sổ Summarize Cases xuất hiện (Hình 3.14). Tại cửa sổ Summarize Cases, chọn biến “Thunhap” và chuyển nó sang ơ Variables. Nếu cần biết các đặc trƣng thống kê đối với từng thôn, chọn biến “Code = Thôn” rồi chuyển nó sang ơ Grouping

84

Variables (Biến lập nhóm hay biến phân loại) (Hình 3.20a). Kế đến, chọn Statistics. Tại đây chúng ta chọn các thống kê mơ tả theo mục đích báo cáo (Hình 3.20b). Cuối cùng chọn OK để chƣơng trình xử lý và hiển thị kết quả.

Cấu trúc của bảng kết quả có thể thay đổi theo mong muốn. Để chọn cách định dạng bảng kết quả, chọn Pivot  Move Layers to Row. Để có đƣợc bảng theo mong muốn, thực hiện nhƣ sau đây.

+ Tại Bảng OLAP CUBES, đặt con trỏ chuột vào bảng kết quả và nhấp đúp nút chuột trái. Thao tác này làm xuất hiện một bảng Pivot. Trên bảng Pivot, chúng ta thấy có một nút chọn. Khi dị mũi chuột vào nút chọn này và nhấn nút chuột trái, chúng ta sẽ thấy xuất hiện một cửa sổ. Tại đây, chọn những chủ đề theo yêu cầu của mình. Thao tác này giúp chúng ta nhận đƣợc tất cả các đặc trƣng thống kê cho từng nhóm đối tƣợng. Nếu muốn chuyển hàng thành cột hoặc ngƣợc lại, thì chọn Pivot trên Menu chính. Sau đó chọn Pivot  Transpose Rows to Columns. Nếu muốn có đƣợc các bảng với cấu trúc khác, hãy chọn Pivot trên thanh Menu chính. Bảng 3.21 là cấu trúc của bảng báo cáo những đặc trƣng thống kê thu nhập của 40 hộ gia đình ở thơn A và B; trong đó tên của những đặc trƣng thống kê đƣợc đặt theo hàng ngang và hàng dọc.

Hình 3.20. Xác định thống kê mô tả bằng thủ tục Report.

(a)

85

Bảng 3.21. Đặc trƣng thống kê thu nhập của 40 hộ gia đình ở thơn A và B. Đơn vị

tính: Triệu đồng/tháng.

Cấp thu nhập N Mean Min Max Range S2 ±S

Thu nhập thấp 22 8.6 5.8 9.9 4.1 1.1 1.05

Thu nhập trung bình 13 11.16 10.1 12.0 1.9 .531 .72

Thu nhập cao 5 13.4 12.2 15.3 3.1 1.5 1.22

Total 40 10.1 5.8 15.3 9.5 3.8 1.96

Cấp thu nhập

Thấp Trung bình Cao Total

N 22 13 5 40 Mean 8.655 11.162 13.400 10.063 Minimum 5.8 10.1 12.2 5.8 Maximum 9.9 12.0 15.3 15.3 Range 4.1 1.9 3.1 9.5 Variance 1.110 .531 1.505 3.864 Std. Deviation 1.0537 .7286 1.2268 1.9658

(5) Xác định các đặc trƣng thống kê của bảng phân phối tần số. Khi số liệu đã đƣợc tập hợp thành một bảng phân phối tần số, thì thủ tục tính các đặc trƣng thống kê mơ tả theo các bƣớc dƣới đây.

Bƣớc 1. Nhập số liệu vào bảng tính. Cột 1 ghi thứ tự cấp. Cột 2 ghi các trị số

giữa cấp. Cột 3 ghi tần số của mỗi cấp (Bảng 3.21).

Bƣớc 2. Gọi chƣơng trình tính tốn. Để tính các đặc trƣng thống kê mơ tả, trình tự các bƣớc thực hiện nhƣ sau:

+ Từ Menu chính, mở Data – Weight Cases - Weight Cases by (Hình 3.21a). Đến đây đƣa biến tần số (cột 3) vào ơ Frequency variable. Sau đó chọn OK.

86

+ Từ Menu chính, mở Analyze  Descriptive Statistic  Descriptives hoặc Frequencies. Khi cửa sổ Descriptives/Frequencies xuất hiện, hãy chuyển số liệu thu nhập (cột 2) vào ô Variables.

Bƣớc 3. Tính các thống kê mơ tả. Từ của sổ Descriptives/Frequencies, chọn

Options. Khi cửa sổ Options xuất hiện, chọn những thống kê mô tả cần quan tâm (Hình 3.21b). Sau cùng nhấp OK để chƣơng trình tính tốn. Đến đây chƣơng trình sẽ hiện thị những thống kê mô tả theo chỉ định của chúng ta.

Bảng 3.22. Phân phối thu nhập của xí nghiệp A.

TT Thu nhập (Triệu đồng/tháng) fi (Số ngƣời)

(1) (2) (3) 1 4 81 2 6 12 3 8 20 4 10 56 5 12 18 6 14 16 7 16 10 Tổng số 213

Hình 3.21. Xác định thống kê mô tả theo bảng tần số.

(a)

87

(6) Lập bảng phân bố tần số. Giả sử cần lập bảng phân bố số hộ gia đình

(n) theo cấp thu nhập (Y) ở Bảng 3.7. Theo số liệu này, thu nhập trung bình (XBq) của 40 hộ là 10,1 triệu đồng/tháng; thu nhập thấp nhất là XMin = 5,8 triệu đồng/tháng, thu nhập cao nhất là XMax = 15,3 triệu đồng/tháng; phạm vi biến thiên R = 15,3 – 5,8 = 9,5 triệu đồng/tháng. Để lập bảng phân bố n/Y, chúng ta cần phân chia cự ly giữa các tổ (cấp, nhóm). Số tổ (m) đƣợc xác định theo công thức (1.1) ở chƣơng 1. Cự ly mỗi cấp Y (K) đƣợc xác định theo công thức (1.2) ở chƣơng 1. Ở ví dụ này, m = 5*log(40) = 8; K = (15,3 – 5,8)/8 = 1,2 triệu đồng/tháng (lấy trịn bằng 1 triệu đồng/tháng). Bởi vì Y < 6 triệu đồng/tháng chỉ xuất hiện ở 1 hộ, nên trị số trung tâm (Midpoint) của cấp Y thứ 1 đƣợc chọn là 7 triệu đồng/tháng; giới hạn trên là 7,5 triệu đồng/tháng. Tƣơng tự, cấp Y thứ 2 = 7,5 – 8,5 triệu đồng/tháng với trị số giữa cấp là 8 triệu đồng/tháng…; còn cấp Y thứ 7 = 14 triệu đồng/tháng với giới hạn dƣới là 13,5 triệu đồng/tháng. Trị số trung tâm của 8 cấp Y này là 7, 8,…, 14 triệu đồng/tháng. Để lọc tần số của các cấp Y và xác định bảng phân bố tần số (n/Y), hãy thực hiện theo các bƣớc dƣới đây (Hình 3.22).

Bƣớc 1. Nhập số liệu thu nhập của các hộ vào bảng tính. Sau đó chọn

Transform  Recode  Into Different Variables. Đến đây chuyển biến Thunhap vào ô Numeric Variables  Output Variable. Kế đến, đặt tên biến này bằng một biến mới (Ví dụ: Capthunhap) ở ơ Name và Label; rồi chọn Change (Hình 3.22a).

Bƣớc 2. Chọn tiếp Old and New Values. Sau đó thực hiện liên tiếp những

thủ tục sau đây:

(a) Trong ô Old value, chọn Range  Lowest through. Kế đến ghi số 7,5 vào ơ trắng bên cạnh, cịn số 7 vào ô Value của khoang New Value. Tiếp theo chọn Add (Hình 3.22b). Thủ tục này u cầu chƣơng trình mã hố tất cả những hộ có Y < 7,5 triệu đồng/tháng bằng số 7, nghĩa là cấp 7 triệu đồng/tháng.

(b) Chọn Range  Through và ghi số 7,5 và 8,5 vào 2 ô bên dƣới; ghi số 8 vào ô Value của khoang New Value. Sau đó chọn Add (Hình 3.22c). Thủ tục này u cầu chƣơng trình mã hố những hộ có Y = 7,5 – 8,5 triệu đồng/tháng bằng số 8, nghĩa là cấp 8 triệu đồng/tháng.

88

(c) Lặp lại bƣớc (b) để mã hoá cho những cấp thu nhập tiếp theo (8,5 - 9,5;…, 12,5 – 13,5 triệu đồng/tháng).

(d) Để mã hoá cho cấp thu nhập > 13,5 triệu đồng/tháng, chọn Range  through highest. Kế đến ghi số 13,5 vào ô trắng bên cạnh, còn số 14 đƣa vào ô Value của khoang New Value. Sau đó chọn Add. Thao tác này yêu cầu chƣơng trình mã hố tất cả những hộ có Y > 13,5 triệu đồng/tháng vào cấp thu nhập = 14 triệu đồng/tháng.

Bƣớc 3. Sau khi hoàn thành bƣớc 2, chọn Continue rồi chọn OK. Đến đây

chƣơng trình sẽ mã hố biến Y của từng hộ vào các cấp thu nhập tƣơng ứng và ghi

Một phần của tài liệu Giáo trình lý thuyết thống kê Kinh doanh thương mại (Trang 86)

Tải bản đầy đủ (PDF)

(133 trang)