Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó Tên biến name: Là tên đại diện cho biến, tên biến này sẽ được hiễn th
Trang 11
Phân tích dữ liệu trong nghiên cứu
Kinh tế và Kinh doanh
TS Phạm Cảnh Huy Khoa Kinh tế và quản lý – ĐHBKHN
Nội dung
Giới thiệu mục tiêu học phần:
Môn học này cung cấp các kỹ thuật phân tích dữ liệu cần thiết cho thực
hiện nghiên cứu khoa học và làm luận án/ luận văn tốt nghiệp
Học viên tiếp cận kiến thức của môn học không chỉ từ góc độ kiến thức
nền tảng của các công thức toán học cần thiết, từ các tình huống gần gũi
trong thực tế, mà còn dưới dạng ‘ứng dụng’, ‘thực hành’ trên phần mềm
Eviews, SPSS…
Những kiến thức cơ bản được trang bị từ môn học:
1) Kỹ thuật phân tích thống kê mô tả với các loại dữ liệu khác nhau;
Trang 23
Tài liệu tham khảo:
Gerhard Bohm, Günter Zech, Introduction to Statistics and Data
Damodar N.Gujarati, Basic Econometrics, McGraw-Hill 2004
TS Phạm Cảnh Huy, Bài giảng kinh tế lượng, Nhà xuất bản Đại
học Bách khoa Hà Nội 2008
Hoàng Trọng- Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu
nghiên cứu với SPSS , Nhà xuất bản Hồng Đức
4 Phân tích diễn giải dữ liệu
Phân tích tương quan và hồi quy
5
6 Phân tích nhân tố và đánh độ tin cậy của thang đo
Trang 35
GIỚI THIỆU PHÂN TÍCH DỮ LIỆU
1.1 Nghiên cứu và phân tích dữ liệu
Trong kinh doanh hiện đại thì kinh nghiệm còn được gọi là "dữ
liệu"
"Dữ liệu là Kinh nghiệm"
Nếu bạn không thu thập dữ liệu bạn đang lãng phí kinh nghiệm
Trang 4 Bản thân dữ liệu thô không phải là tri thức
Trình tự đi từ dữ liệu đến tri thức:
Mức độ chính xác của mô
hình thống kê
quyết định Thông tin
Sự kiện
Hiểu biết, tri thức
Trang 59
Thống kê là tập hợp các phương pháp dùng để thu thập, phân
tích, trình bày và diễn giải dữ liệu
Phân tích dữ liệu cung cấp kinh nghiệm thực hành để đẩy mạnh
việc ứng dụng tư duy thống kê và kỹ thuật thống kê nhằm hiểu rõ
các hiện tượng nghiên cứu làm cơ sở cho việc ra các quyết định
phù hợp
Máy tính đóng một vai trò rất quan trọng trong phân tích dữ liệu
nghiên cứu
1.3 Thống kê và phân tích dữ liệu
Phương pháp phân tích theo các biến số
Phương pháp biến số đơn: trong đó chỉ có một biến số duy nhất
được phân tích
Phương pháp biến số kép: được sử dụng để tìm hiểu sự liên hệ
giữa hai biến số
Phương pháp đa biến: được sử dụng để tìm hiểu sự liên hệ giữa
các biến số với nhau
Trang 61.4 Quá trình phân tích dữ liệu
Thu thập và Chuẩn bị dữ liệu
Chuyển dữ liệu gốc sang dữ liệu được mã hóa
Tên biến (name): Là tên đại diện cho biến
Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến
Nhãn của biến (label): Tên biến được thể hiện tóm tắt bằng ký hiệu
Giá trị khuyết (Missing)
Dạng thang đo (measures): Hiển thị dạng thang đo của biến
Trực tiếp (Data view)
Từ Excel
Kiểm tra lỗi (Min, max,…)
Tìm lỗi (Sort case, Edit find)
Trang 7 One-way analysis of variance ANOVA
Two-way between groups ANOVA
Multivariate analysis of variance MANOVA
Crosstabulation/Chi Square
So sánh
các nhóm
Mối quan hệ
Trang 917
Dữ liệu nghiên cứu có thể chia thành 2 loại chính là dữ liệu định
tính và dữ liệu định lượng, các dữ liệu này thu thập bằng 4 thang
đo cơ bản như sau:
Dữ liệu
Dữ liệu định tính
Thang đo
danh nghĩa
Thang đo thứ bậc
Dữ liệu định lượng
Thang đo khoảng cách Thang đo tỷ lệ
2.1 Phân loại dữ liệu
Thang đo danh nghĩa (biểu danh)/ nominal scale
Thang đo biểu danh là thang đo đơn giản nhất để phân biệt sự vật
hay hiện tượng này với cái khác nó, nhiều khi người ta dùng các
con số để mã hoá hay chỉ (biểu danh) một sự vật, ngoài ra không
Trang 1019
Thang đo danh nghĩa (biểu danh)/ nominal scale
Ví dụ 2: Hỏi “Xin vui lòng cho biết tình trạng hôn nhân của bạn
Những con số này mang tính định danh vì rõ ràng ta
không thể cộng chúng lại hoặc tính ra giá trị trung bình của
tình trạng hôn nhân”.
2.1 Phân loại dữ liệu
Thang đo danh nghĩa (biểu danh)/ nominal scale
Những phép toán thống kê có thể sử dụng cho dạng thang biểu
Trang 1121
Là thang đo được sử dụng để xếp hạng các đồ vật hay hiện tượng
theo một thứ tự nhất định với sự so sánh định tính nào đó về thứ
bậc hay sự hơn kém, nó không cho ta biết được khoảng cách giữa
chúng
Thang đo xếp hạng theo thứ tự là thang đo biểu danh, nhưng
không phải thang đo biểu danh nào cũng đều là thang đo xếp
hạng theo thứ bậc
Đối với thang đo xếp hạng theo thứ tự, khuynh hướng trung tâm
có thể xem xét bằng trung vị; giá trị Mode
2.1 Phân loại dữ liệu
Thang đo thứ bậc/ ordinal scale
Ví dụ 1: Thu nhập của anh/chị/ông/bà hàng tháng:
1.< 3 triệu đồng
2.Từ 3-5 triệu đồng
3 >5 trđ
Ví dụ 2: Xếp hạng TOPTEN hàng tiêu dùng Việt Nam tuỳ theo số
lượng thư khách hàng bình chọn nhiều hay ít từ hạng nhất đến hạng 10
(không nói rõ hạng nào được bao nhiêu thư) Hoặc theo mức độ ưa
chuộng của khách hàng ở 3 mức:
Trang 1223
Thang đo khoảng/ interval scale
Là loại thang cung cấp định lượng về
quan hệ thứ tự giữa các sự vật và hiện
tượng;
là một dạng đặc biệt của thang đo xếp
hạng theo thứ bậc;
Trong việc đo lường thái độ hay ý
kiến thì thang đo khoảng cách cung cấp nhiều thông tin hơn so với thang
nó nói lên được khoảng cách giữa hai
cấp bậc thứ tự (đã được lượng hoá)
2.1 Phân loại dữ liệu
Thang đo khoảng/ interval scale
Ví dụ 1: Đánh giá chất lượng đào tạo của một trường
Chương trình đào tạo của trường phù hợp tốt với
yêu cầu thực tiễn
1 2 3 4 5
Nội dung các môn học được cập nhật, đổi mới,đáp
ứng tốt yêu cầu đào tạo
GV có kiến thức sâu về môn học đảm trách
Rất không đồng ý Rất đồng ý
Trang 1325
Ví dụ 2: Phát biểu ý thích về màu sắc sản phẩm nào đó bằng cách
đánh dấu vào bậc thang khoảng cách từ:
Không thích - rất thích
Khi đó, người ta xác định thái độ của mình chính xác ở vào điểm số
nào
2.1 Phân loại dữ liệu
Thang đo khoảng/ interval scale
này (so với 2 loại thang đo trên) là:
Cần chú ý là thang đo khoảng cách tự nó không có điểm 0 tuyệt đối,
do đó bạn chỉ có thể thực hiện được phép tính công hay trừ (+/-),
nếu dùng phép chia (/) thì kết quả sẽ không có ý nghĩa.
Trang 1427
Thang đo tỷ lệ/ ratio scale
Đây là những loại thang đo lường cho phép đánh giá và so sánh
các sự vật hiện tượng một cách tuyệt đối, cung cấp thông tin định
lượng một cách đầy đủ nhất và được áp dụng rộng rãi nhất
Nhiều thang đo tỉ lệ cho thấy những ý nghiã sâu sắc hơn là ba
loại thang đo trước
Đây là thang đo dùng cho tiêu thức số lượng
Ví dụ:Mức độ chi tiêu cho tiền học của con cái chiếm 30%
thu nhập của tôi
Nói chung thang đo khoảng và thang đo tỷ lệ có thể đo lường xu
hướng trung tâm bằng bảng tần số, biểu đồ tần số, trung bình số
học Còn xu hướng phân tán được đo bằng phương sai, độ lệch
chuẩn Do vậy SPSS gộp chung 2 thang đo này thành một và gọi
là Scale Measures
2.2 Đánh giá đo lường
Sai lệch trong đo lường
Sai lệch trong đo lường (measurement error- єm) được chia thành
2 nhóm: Sai lệch hệ thống (systematic error – єs); Sai lệch ngẫu
nhiên (Random error- єr) Và chúng ta có:
є m = є s + є r
Sai lệch hệ thống là các sai lệch tạo nên một “chệch” cố định
(constant bias) trong đo lường Chúng xảy ra khi ta đùng thang
đo lường không cân bằng, hay kỹ thuật phỏng vấn kém,…
Sai lệch ngẫu nhiên là do những sai sót xảy ra trong quá trình
thực hiện, do người thực hiện gây nên như: ghi nhầm; chọn sai ô
lựa chọn;… Các sai lệch ngẫu nhiên có thể do mệt mỏi, nóng
giận, buồn chán, sự hiện diện của người khác,… gây ra
Trang 1529
Một đo lường được gọi là có giá trị (Validity) nếu nó đo lường
được đúng cái cần đo lường Nói cách khác do lường được coi là
“lý tưởng” khi Sai lệch trong đo lường bằng 0 (єm = 0 Khi єs = 0;
єr = 0) Thật vậy, nếu X là số đo được của một thuộc tính nào đó
và X0 là số đo thật của nó thì:
Như vậy, nếu chúng ta có thể đo lường được đúng cái cần đo
lường thì sự khác biệt về số đo sẽ phản ánh sự khác nhau về thái
độ, ý kiến của đối tượng nghiên cứu
Khi một sự đo lường vắng mặt các sai lệch ngẫu nhiên (єr=0)thì
đo lường đó có độ tin cậy (reliability) Độ tin cậy là điều kiện cần
để cho một đo lường có giá trị
2.3 Xử lý dữ liệu
Xử lý dữ liệu
Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa”
những ghi chép quan sát hoặc các câu trả lời dưới dạng “thô”
thành các con số thống kê theo một trật tự nhất định để chuẩn bị
cho việc phân tích và diễn giải các kết quả nghiên cứu thu được
Xử lý
thủ công
Xử lý với trợ giúp
Trang 1631
Các giai đoạn xử lý dữ liệu
Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ
Giai đọan này gổm 3 bước:
Kiểm tra và hiệu chỉnh
Các giai đoạn xử lý dữ liệu/ Kiểm tra và hiệu chỉnh
Đây là bước kiểm tra chất lượng thông tin, ví dụ thông tin trong
bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu
hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết kế ban
đầu Người kiểm tra phải bảo đảm tính toàn vẹn và tính chính xác
của từng bảng câu hỏi Thông thường ở bước này các nhà nghiên
cứu sẽ tiến hành kiểm tra các đặc tính cơ bản của bảng câu hỏi
Quá trình kiểm tra, rà soát lại nhằm mục đích kiểm tra, phát hiện,
sửa chữa và thông báo kịp thời cho người thu thập dữ liệu để
tránh những sai sót tương tự Để xử lý các sai sót phát hiện được
qua kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai
sót
Trang 1733
Biến nghiên cứu là tập hợp các khái niệm có ý nghĩa mô tả (định
tính, định lượng ) cho mục tiêu nghiên cứu, được thể hiện bằng
các ký hiệu (mã hoá) theo một qui ước nào đó Biến nghiên cứu
được thể hiện và là một bộ phận không thể thiếu trong mô hình
nghiên cứu
Biến nghiên cứu có thể được phân loại theo kiểu dữ liệu (dạng
thang đo) Biến định tính là biến chứa các giá trị quan sát ở dạng
thang đo danh nghĩa và thang đo thứ bậc Biến định lượng là
biến chứa các giá trị quan sát ở dạng thang đo khoảng và thang
đo tỷ lệ Ví dụ trong bảng câu hỏi, mỗi một câu hỏi thường phải
nhằm một mục đích quan sát nào đó Do vậy, thường mỗi một
câu hỏi tương ứng với một biến quan sát
2.3 Xử lý dữ liệu
Các giai đoạn xử lý dữ liệu/ Định biến dữ liệu
Ví dụ biến nghiên cứu:
Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền nhãn hiệu
“Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị
phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn
Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính cấu thành kết luận chất
lượng sản phẩm tốt của mì ăn liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2)
Màu sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao; … Và các
yếu tố còn lại cũng có các thuộc tính xác định chúng
Trang 1835
Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu
Mã hoá giúp giảm số biểu hiện của một biến định tính chỉ còn 2 hay 3 biểu
hiện cơ bản hoặc khi biến định lượng có quá nhiều giá trị chúng ta muốn
nhóm lại giúp cho việc trình bày gọn hơn Mã hoá dữ liệu làm cơ sở cho việc
thống kê phân tích dữ liệu
Mã hoá dữ liệu (Coding) là quá trình chuyển đổi thành dạng mã số để nhập và
xử lý dữ liệu
Trong nghiên cứu Marketing, mục đích của việc mã hoá là tạo nhãn (labels)
cho các câu trả lời, thường là bằng các con số, hay ký hiệu Một trả lời khi mã
hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo)
Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua
Vinamilk?
Code: 1 2 3 4 5
Rất ghét Ghét Tạm được Thích Rất thích
2.3 Xử lý dữ liệu
Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu
TT Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời
1 Vui lòng cho biết giới tính của
2 Xin vui lòng cho biết bạn thuộc
nhóm tuổi nào dưới đây?
a2: Nhóm tuổi 1
2 3 4 5
Dưới 18 tuổi
Từ 19- 25
Từ 26-35
Từ 36-45 Trên 45 tuổi
3 Xin vui lòng cho biết sở thích
của bạn đối với sữa chua
Vinamilk?
a3: Sở thích của
khách hàng đối với sữa chua Vinamilk
1 2 3 4 5
Rất ghét Ghét Tạm được Thích Rất thích
Trang 1937
Nhập dữ liệu vào máy tính
(Inputing data into computer)
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Cột (Column): Đại diện
cho biến quan sát Là nơi lưu trữ dữ
liệu nghiên cứu với một cấu trúc
cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Trang 2039
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc
cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Hàng (Row): Đại diện
cho một trường hợp quan sát (người trả lời),
2.3 Xử lý dữ liệu
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc
cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Ô giao nhau giữa cột và hàng (cell): Chứa
đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát) Ô là sự kết hợp của đối tượng và biến Các ô chỉ chứa các trị số biến
Trang 2141
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Tên biến (name): Là tên đại diện
cho biến, tên biến này sẽ được hiễn
thị trên đầu mỗi cột trong màn hình
dữ liệu
2.3 Xử lý dữ liệu
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột
Loại biến (type): Thể hiện dạng
dữ liệu thể hiện trong biến Dạng
số, và dạng chuỗi
Trang 2243
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số hiễn thị cho giá
trị (Width): Giá trị dạng số được
phép hiễn thị bao nhiêu con số
2.3 Xử lý dữ liệu
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Decimals: Số lượng con số sau
dấu phẩy được hiễn thị
Trang 2345
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Nhãn của biến (label): Tên
biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
2.3 Xử lý dữ liệu
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột
Giá trị trong biến (Values):
Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)
Trang 2447
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Giá trị khuyết (Missing): Do thiết kế
bảng câu hỏi có một số giá trị chỉ mang
tính chất quản lý, không có ý nghĩa phân
tích, để loại bỏ các biến này ta cần khai
báo nó như là giá trị khuyết (user
missing) SPSS mặc định giá trị khuyết
(system missing) là một dấu chấm và tự
động loại bỏ các giá trị này ra khỏi các
phân tích thống kê
2.3 Xử lý dữ liệu
Giới thiệu về màn hình quản lý dữ liệu trên SPSS
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Kích thước cột
(columns): Cho
phép khai báo độ
rộng của cột
Trang 2549
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Dạng thang đo
(measures): Hiễn thị
dạng thang đo của giá trị
trong biến
Trang 2651
Mã hóa lại dữ liệu trên SPSS
Để rút gọn số biểu hiện của một biến xuống còn 3-4 biểu hiện, chúng ta có thể thực hiện mã hóa lại
Từ thanh menu chọn: Transform / Recode / Into Different Variables
Đưa vào biến muốn được
mã hóa lại
2.3 Xử lý dữ liệu
Mã hóa lại dữ liệu trên SPSS
Để rút gọn số biểu hiện của một biến xuống còn 3-4 biểu hiện, chúng ta có thể thực hiện mã hóa lại
Xác định khoảng từng biểu
hiện ở biến được mã hóa
Trang 2855
Số định tâm/ đo lường khuynh hướng hội tụ
Số trung bình (mean): là giá trị trung bình của một dãy số liệu
Nếu mẫu ngẫu nhiên w có các giá trị x = (x1, x2, …xn), thì giá trị trung
bình được tính như sau:
Nếu các giá trị x1, x2, …xk lần lượt có các tần suất n1, n2, …nk thì giá trị
trung bình được tính như sau:
Các đặc tính toán học của giá trị trung bình đóng vai trò rất quan trọng khi
các dữ liệu của mẫu được dùng để suy rộng ra tổng thể (ước lượng) hoặc
khi được dùng trong các thí nghiệm thống kê Phương pháp trung bình số
học rất thích hợp khi phân tích các dữ liệu theo khoảng cách
n
xi x
n i
xi: cá thể thứ i i: là số thứ tự của cá thể n: số lượng cá thể
k i i
3.2 Mô tả dạng thống kê
Số định tâm/ đo lường khuynh hướng hội tụ
Số trung vị (Median): Là giá trị của số đứng ở vị trí giữa dãy số
liệu Trước khi xác định giá trị trung vị, cần phải sắp xếp các dữ
liệu theo thứ tự dưới lên hoặc từ trên xuống Gọi n là số giá trị
quan sát được, thì số trung vị được xác định như sau
Nếu n là số lẻ: thì số trung vị là số có số thứ tự (n+1)/2
Nếu n là số chẵn: thì số trung vị là số trung bình cộng của 2 số có thứ tự
là n/2 và (n/2) +1
Đặc tính quan trọng của trung vị là không bị ảnh hưởng bởi các giá trị ở hai
đầu mút của dãy phân phối, vì vậy, nếu bảng phân phối có độ lệch lớn nên
chọn phép tính giá trị trung vị hơn là trung bình
Số mốt (mode): Mốt là số có tần số xuất hiện nhiều nhất trong
dãy số
Trang 3059
Số phân tán
Số phân tán (Measure of dispersion): Số phân tán dùng để thể
hiện sự khác biệt giữa các số trong dãy số đối với số định tâm
Phương sai ( Variance) và độ lệch chuẩn (Standard deviation): Phương sai và
độ lệch chuẩn dựa trên mức độ sai lệch của các quan sát với giá trị trung bình
Phương sai được định nghĩa như là số trung bình của bình phương các độ lệch
giữa giá trị quan sát với giá trị trung bình trong dãy phân phối Căn bậc hai
của phương sai gọi là độ lệch chuẩn
Độ lệch chuẩn được tính như sau:
Độ lệch chuẩn của tổng thể:
Độ lệch chuẩn của mẫu:
2 xi μ N
x xi 1 - n
1 S
S
3.2 Mô tả dạng thống kê
Số phân tán
Descriptive Measure Excel Command
Variance =VARP(Data_Range)population
=VAR(Data_Range ) sample
Standard Deviation =STDEVP( =STDEV(Data_RangeData_Range) )sample population
Coefficient of
Variation
=STDEV(Data_Range) / / AVERAGE(Data_Range )
Trang 3263
Sử dụng SPSS Analyze -> Descriptive Statistics ->
Descriptives -> Options
3.2 Mô tả dạng thống kê
Biểu đồ tần suất
Chức năng: khi có nhiều số liệu cần chia lớp để thấy rõ các nét
đặc trưng cơ bản của dãy số liệu, sau đó kiểm tra tính chuẩn của
biến nghiên cứu
Để số liệu trong một cột, một hàng hay một bảng chữ nhật
Tìm giá trị Min, Max của miền dữ liệu, tính R = Max – Min
Chọn khoảng k, thực tế k: 20-30, ít số liệu k: 6-10
Tính khoảng cách giữa các tổ: h = R/k (làm tròn)
Có Max, Min, R, k, h ta tạo miền phân tổ bắt đầu từ Min, các giá trị tiếp
theo cộng dồn với h, cho đên sát h thì dừng
Trang 3467
Biểu đồ tần suất/ sử dụng SPSS Analyze -> Descriptive Statistics -> Frequencies
• Nhắp Statistics để có các thống kê mô tả đối với biến định lượng
• Nhắp Charts để có đồ thị thanh, đồ thị tròn, và biểu đồ tần suất
• Nhắp Format để có trật tự mà các kết quả được thể hiện
Trang 3569
Sở thích về sữa chua Vinamilk theo giới tính
Thang đo Giới tính Giới tính Tổng
Pie chart
Trang 3773
Đồ thị bánh thường được sử dụng cho các câu hỏi đơn trả lời để biểu diễn tần số tương
đối – Tổng của nó bằng 100%.
Đại học 51,2%
Công nhân kỹ thuật 43,8%
Cao đẳng 2,9%
Sau đại học 2,1%
Cơ cấu lao động của Tp Cần thơ phân theo trình độ năm 2004
Tốc độ tăng trưởng GDP phân theo khu vực kinh tế của Việt Nam thời kỳ 00 – 04 (ĐVT: %)
Trang 38Ví dụ minh họa Biểu đồ phân tán
Tương quan thuận (X, Y Cùng tăng)
Trang 3977
Ước lượng điểm
Ước lượng khoảng
Ước lượng khoảng cho trung bình: trường hợp biết, và chưa biết
Ước lượng khoảng cho tỉ lệ
Kích thước mẫu
4.1 Ước lượng
Ước lượng điểm
Ước lượng tham số của
tổng thể (parameters) …
… bằng tham số mẫu (statistics)
P
Trang 4079
Ước lượng khoảng
Cung cấp một khoảng các giá trị
Có xét đến sự biến thiên (variation) về trị số giữa các
mẫu khác nhau
Dựa trên quan sát của 1 mẫu
Cung cấp thông tin gần nhất (closeness) về trị số (chưa
Xem như biết σ
Tổng thể có phân phối chuẩn
Nếu tổng thể không có phân phối chuẩn, mẫu phải lớn
Khoảng tin cậy
gọi là sai số chọn mẫu
(sampling error or margin of error)