1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy

84 1K 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 2,14 MB

Nội dung

Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó Tên biến name: Là tên đại diện cho biến, tên biến này sẽ được hiễn th

Trang 1

1

Phân tích dữ liệu trong nghiên cứu

Kinh tế và Kinh doanh

TS Phạm Cảnh Huy Khoa Kinh tế và quản lý – ĐHBKHN

Nội dung

Giới thiệu mục tiêu học phần:

 Môn học này cung cấp các kỹ thuật phân tích dữ liệu cần thiết cho thực

hiện nghiên cứu khoa học và làm luận án/ luận văn tốt nghiệp

 Học viên tiếp cận kiến thức của môn học không chỉ từ góc độ kiến thức

nền tảng của các công thức toán học cần thiết, từ các tình huống gần gũi

trong thực tế, mà còn dưới dạng ‘ứng dụng’, ‘thực hành’ trên phần mềm

Eviews, SPSS…

Những kiến thức cơ bản được trang bị từ môn học:

1) Kỹ thuật phân tích thống kê mô tả với các loại dữ liệu khác nhau;

Trang 2

3

Tài liệu tham khảo:

Gerhard Bohm, Günter Zech, Introduction to Statistics and Data

Damodar N.Gujarati, Basic Econometrics, McGraw-Hill 2004

TS Phạm Cảnh Huy, Bài giảng kinh tế lượng, Nhà xuất bản Đại

học Bách khoa Hà Nội 2008

Hoàng Trọng- Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu

nghiên cứu với SPSS , Nhà xuất bản Hồng Đức

4 Phân tích diễn giải dữ liệu

Phân tích tương quan và hồi quy

5

6 Phân tích nhân tố và đánh độ tin cậy của thang đo

Trang 3

5

GIỚI THIỆU PHÂN TÍCH DỮ LIỆU

1.1 Nghiên cứu và phân tích dữ liệu

Trong kinh doanh hiện đại thì kinh nghiệm còn được gọi là "dữ

liệu"

"Dữ liệu là Kinh nghiệm"

Nếu bạn không thu thập dữ liệu bạn đang lãng phí kinh nghiệm

Trang 4

 Bản thân dữ liệu thô không phải là tri thức

 Trình tự đi từ dữ liệu đến tri thức:

Mức độ chính xác của mô

hình thống kê

quyết định Thông tin

Sự kiện

Hiểu biết, tri thức

Trang 5

9

 Thống kê là tập hợp các phương pháp dùng để thu thập, phân

tích, trình bày và diễn giải dữ liệu

 Phân tích dữ liệu cung cấp kinh nghiệm thực hành để đẩy mạnh

việc ứng dụng tư duy thống kê và kỹ thuật thống kê nhằm hiểu rõ

các hiện tượng nghiên cứu làm cơ sở cho việc ra các quyết định

phù hợp

 Máy tính đóng một vai trò rất quan trọng trong phân tích dữ liệu

nghiên cứu

1.3 Thống kê và phân tích dữ liệu

Phương pháp phân tích theo các biến số

 Phương pháp biến số đơn: trong đó chỉ có một biến số duy nhất

được phân tích

 Phương pháp biến số kép: được sử dụng để tìm hiểu sự liên hệ

giữa hai biến số

 Phương pháp đa biến: được sử dụng để tìm hiểu sự liên hệ giữa

các biến số với nhau

Trang 6

1.4 Quá trình phân tích dữ liệu

Thu thập và Chuẩn bị dữ liệu

 Chuyển dữ liệu gốc sang dữ liệu được mã hóa

 Tên biến (name): Là tên đại diện cho biến

 Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến

 Nhãn của biến (label): Tên biến được thể hiện tóm tắt bằng ký hiệu

 Giá trị khuyết (Missing)

 Dạng thang đo (measures): Hiển thị dạng thang đo của biến

 Trực tiếp (Data view)

 Từ Excel

 Kiểm tra lỗi (Min, max,…)

 Tìm lỗi (Sort case, Edit find)

Trang 7

 One-way analysis of variance ANOVA

 Two-way between groups ANOVA

 Multivariate analysis of variance MANOVA

 Crosstabulation/Chi Square

So sánh

các nhóm

Mối quan hệ

Trang 9

17

Dữ liệu nghiên cứu có thể chia thành 2 loại chính là dữ liệu định

tính và dữ liệu định lượng, các dữ liệu này thu thập bằng 4 thang

đo cơ bản như sau:

Dữ liệu

Dữ liệu định tính

Thang đo

danh nghĩa

Thang đo thứ bậc

Dữ liệu định lượng

Thang đo khoảng cách Thang đo tỷ lệ

2.1 Phân loại dữ liệu

Thang đo danh nghĩa (biểu danh)/ nominal scale

 Thang đo biểu danh là thang đo đơn giản nhất để phân biệt sự vật

hay hiện tượng này với cái khác nó, nhiều khi người ta dùng các

con số để mã hoá hay chỉ (biểu danh) một sự vật, ngoài ra không

Trang 10

19

Thang đo danh nghĩa (biểu danh)/ nominal scale

Ví dụ 2: Hỏi “Xin vui lòng cho biết tình trạng hôn nhân của bạn

Những con số này mang tính định danh vì rõ ràng ta

không thể cộng chúng lại hoặc tính ra giá trị trung bình của

tình trạng hôn nhân”.

2.1 Phân loại dữ liệu

Thang đo danh nghĩa (biểu danh)/ nominal scale

 Những phép toán thống kê có thể sử dụng cho dạng thang biểu

Trang 11

21

 Là thang đo được sử dụng để xếp hạng các đồ vật hay hiện tượng

theo một thứ tự nhất định với sự so sánh định tính nào đó về thứ

bậc hay sự hơn kém, nó không cho ta biết được khoảng cách giữa

chúng

Thang đo xếp hạng theo thứ tự là thang đo biểu danh, nhưng

không phải thang đo biểu danh nào cũng đều là thang đo xếp

hạng theo thứ bậc

 Đối với thang đo xếp hạng theo thứ tự, khuynh hướng trung tâm

có thể xem xét bằng trung vị; giá trị Mode

2.1 Phân loại dữ liệu

Thang đo thứ bậc/ ordinal scale

 Ví dụ 1: Thu nhập của anh/chị/ông/bà hàng tháng:

1.< 3 triệu đồng

2.Từ 3-5 triệu đồng

3 >5 trđ

 Ví dụ 2: Xếp hạng TOPTEN hàng tiêu dùng Việt Nam tuỳ theo số

lượng thư khách hàng bình chọn nhiều hay ít từ hạng nhất đến hạng 10

(không nói rõ hạng nào được bao nhiêu thư) Hoặc theo mức độ ưa

chuộng của khách hàng ở 3 mức:

Trang 12

23

Thang đo khoảng/ interval scale

Là loại thang cung cấp định lượng về

quan hệ thứ tự giữa các sự vật và hiện

tượng;

là một dạng đặc biệt của thang đo xếp

hạng theo thứ bậc;

Trong việc đo lường thái độ hay ý

kiến thì thang đo khoảng cách cung cấp nhiều thông tin hơn so với thang

nó nói lên được khoảng cách giữa hai

cấp bậc thứ tự (đã được lượng hoá)

2.1 Phân loại dữ liệu

Thang đo khoảng/ interval scale

 Ví dụ 1: Đánh giá chất lượng đào tạo của một trường

Chương trình đào tạo của trường phù hợp tốt với

yêu cầu thực tiễn

1 2 3 4 5

Nội dung các môn học được cập nhật, đổi mới,đáp

ứng tốt yêu cầu đào tạo

GV có kiến thức sâu về môn học đảm trách

Rất không đồng ý Rất đồng ý

Trang 13

25

 Ví dụ 2: Phát biểu ý thích về màu sắc sản phẩm nào đó bằng cách

đánh dấu vào bậc thang khoảng cách từ:

Không thích - rất thích

Khi đó, người ta xác định thái độ của mình chính xác ở vào điểm số

nào

2.1 Phân loại dữ liệu

Thang đo khoảng/ interval scale

này (so với 2 loại thang đo trên) là:

Cần chú ý là thang đo khoảng cách tự nó không có điểm 0 tuyệt đối,

do đó bạn chỉ có thể thực hiện được phép tính công hay trừ (+/-),

nếu dùng phép chia (/) thì kết quả sẽ không có ý nghĩa.

Trang 14

27

Thang đo tỷ lệ/ ratio scale

 Đây là những loại thang đo lường cho phép đánh giá và so sánh

các sự vật hiện tượng một cách tuyệt đối, cung cấp thông tin định

lượng một cách đầy đủ nhất và được áp dụng rộng rãi nhất

Nhiều thang đo tỉ lệ cho thấy những ý nghiã sâu sắc hơn là ba

loại thang đo trước

 Đây là thang đo dùng cho tiêu thức số lượng

Ví dụ:Mức độ chi tiêu cho tiền học của con cái chiếm 30%

thu nhập của tôi

 Nói chung thang đo khoảng và thang đo tỷ lệ có thể đo lường xu

hướng trung tâm bằng bảng tần số, biểu đồ tần số, trung bình số

học Còn xu hướng phân tán được đo bằng phương sai, độ lệch

chuẩn Do vậy SPSS gộp chung 2 thang đo này thành một và gọi

là Scale Measures

2.2 Đánh giá đo lường

Sai lệch trong đo lường

 Sai lệch trong đo lường (measurement error- єm) được chia thành

2 nhóm: Sai lệch hệ thống (systematic error – єs); Sai lệch ngẫu

nhiên (Random error- єr) Và chúng ta có:

є m = є s + є r

Sai lệch hệ thống là các sai lệch tạo nên một “chệch” cố định

(constant bias) trong đo lường Chúng xảy ra khi ta đùng thang

đo lường không cân bằng, hay kỹ thuật phỏng vấn kém,…

Sai lệch ngẫu nhiên là do những sai sót xảy ra trong quá trình

thực hiện, do người thực hiện gây nên như: ghi nhầm; chọn sai ô

lựa chọn;… Các sai lệch ngẫu nhiên có thể do mệt mỏi, nóng

giận, buồn chán, sự hiện diện của người khác,… gây ra

Trang 15

29

 Một đo lường được gọi là có giá trị (Validity) nếu nó đo lường

được đúng cái cần đo lường Nói cách khác do lường được coi là

“lý tưởng” khi Sai lệch trong đo lường bằng 0 (єm = 0 Khi єs = 0;

єr = 0) Thật vậy, nếu X là số đo được của một thuộc tính nào đó

và X0 là số đo thật của nó thì:

 Như vậy, nếu chúng ta có thể đo lường được đúng cái cần đo

lường thì sự khác biệt về số đo sẽ phản ánh sự khác nhau về thái

độ, ý kiến của đối tượng nghiên cứu

 Khi một sự đo lường vắng mặt các sai lệch ngẫu nhiên (єr=0)thì

đo lường đó có độ tin cậy (reliability) Độ tin cậy là điều kiện cần

để cho một đo lường có giá trị

2.3 Xử lý dữ liệu

Xử lý dữ liệu

 Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa”

những ghi chép quan sát hoặc các câu trả lời dưới dạng “thô”

thành các con số thống kê theo một trật tự nhất định để chuẩn bị

cho việc phân tích và diễn giải các kết quả nghiên cứu thu được

Xử lý

thủ công

Xử lý với trợ giúp

Trang 16

31

Các giai đoạn xử lý dữ liệu

Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ

Giai đọan này gổm 3 bước:

Kiểm tra và hiệu chỉnh

Các giai đoạn xử lý dữ liệu/ Kiểm tra và hiệu chỉnh

 Đây là bước kiểm tra chất lượng thông tin, ví dụ thông tin trong

bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu

hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết kế ban

đầu Người kiểm tra phải bảo đảm tính toàn vẹn và tính chính xác

của từng bảng câu hỏi Thông thường ở bước này các nhà nghiên

cứu sẽ tiến hành kiểm tra các đặc tính cơ bản của bảng câu hỏi

 Quá trình kiểm tra, rà soát lại nhằm mục đích kiểm tra, phát hiện,

sửa chữa và thông báo kịp thời cho người thu thập dữ liệu để

tránh những sai sót tương tự Để xử lý các sai sót phát hiện được

qua kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai

sót

Trang 17

33

 Biến nghiên cứu là tập hợp các khái niệm có ý nghĩa mô tả (định

tính, định lượng ) cho mục tiêu nghiên cứu, được thể hiện bằng

các ký hiệu (mã hoá) theo một qui ước nào đó Biến nghiên cứu

được thể hiện và là một bộ phận không thể thiếu trong mô hình

nghiên cứu

 Biến nghiên cứu có thể được phân loại theo kiểu dữ liệu (dạng

thang đo) Biến định tính là biến chứa các giá trị quan sát ở dạng

thang đo danh nghĩa và thang đo thứ bậc Biến định lượng là

biến chứa các giá trị quan sát ở dạng thang đo khoảng và thang

đo tỷ lệ Ví dụ trong bảng câu hỏi, mỗi một câu hỏi thường phải

nhằm một mục đích quan sát nào đó Do vậy, thường mỗi một

câu hỏi tương ứng với một biến quan sát

2.3 Xử lý dữ liệu

Các giai đoạn xử lý dữ liệu/ Định biến dữ liệu

 Ví dụ biến nghiên cứu:

Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền nhãn hiệu

“Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị

phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn

Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính cấu thành kết luận chất

lượng sản phẩm tốt của mì ăn liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2)

Màu sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao; … Và các

yếu tố còn lại cũng có các thuộc tính xác định chúng

Trang 18

35

Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu

 Mã hoá giúp giảm số biểu hiện của một biến định tính chỉ còn 2 hay 3 biểu

hiện cơ bản hoặc khi biến định lượng có quá nhiều giá trị chúng ta muốn

nhóm lại giúp cho việc trình bày gọn hơn Mã hoá dữ liệu làm cơ sở cho việc

thống kê phân tích dữ liệu

 Mã hoá dữ liệu (Coding) là quá trình chuyển đổi thành dạng mã số để nhập và

xử lý dữ liệu

 Trong nghiên cứu Marketing, mục đích của việc mã hoá là tạo nhãn (labels)

cho các câu trả lời, thường là bằng các con số, hay ký hiệu Một trả lời khi mã

hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo)

Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua

Vinamilk?

Code: 1 2 3 4 5

Rất ghét Ghét Tạm được Thích Rất thích

2.3 Xử lý dữ liệu

Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu

TT Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời

1 Vui lòng cho biết giới tính của

2 Xin vui lòng cho biết bạn thuộc

nhóm tuổi nào dưới đây?

a2: Nhóm tuổi 1

2 3 4 5

Dưới 18 tuổi

Từ 19- 25

Từ 26-35

Từ 36-45 Trên 45 tuổi

3 Xin vui lòng cho biết sở thích

của bạn đối với sữa chua

Vinamilk?

a3: Sở thích của

khách hàng đối với sữa chua Vinamilk

1 2 3 4 5

Rất ghét Ghét Tạm được Thích Rất thích

Trang 19

37

Nhập dữ liệu vào máy tính

(Inputing data into computer)

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Cột (Column): Đại diện

cho biến quan sát Là nơi lưu trữ dữ

liệu nghiên cứu với một cấu trúc

cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng

Trang 20

39

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc

cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng

Hàng (Row): Đại diện

cho một trường hợp quan sát (người trả lời),

2.3 Xử lý dữ liệu

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc

cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng

Ô giao nhau giữa cột và hàng (cell): Chứa

đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát) Ô là sự kết hợp của đối tượng và biến Các ô chỉ chứa các trị số biến

Trang 21

41

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Tên biến (name): Là tên đại diện

cho biến, tên biến này sẽ được hiễn

thị trên đầu mỗi cột trong màn hình

dữ liệu

2.3 Xử lý dữ liệu

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột

Loại biến (type): Thể hiện dạng

dữ liệu thể hiện trong biến Dạng

số, và dạng chuỗi

Trang 22

43

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Số lượng con số hiễn thị cho giá

trị (Width): Giá trị dạng số được

phép hiễn thị bao nhiêu con số

2.3 Xử lý dữ liệu

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Decimals: Số lượng con số sau

dấu phẩy được hiễn thị

Trang 23

45

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Nhãn của biến (label): Tên

biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến

2.3 Xử lý dữ liệu

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột

Giá trị trong biến (Values):

Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)

Trang 24

47

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Giá trị khuyết (Missing): Do thiết kế

bảng câu hỏi có một số giá trị chỉ mang

tính chất quản lý, không có ý nghĩa phân

tích, để loại bỏ các biến này ta cần khai

báo nó như là giá trị khuyết (user

missing) SPSS mặc định giá trị khuyết

(system missing) là một dấu chấm và tự

động loại bỏ các giá trị này ra khỏi các

phân tích thống kê

2.3 Xử lý dữ liệu

Giới thiệu về màn hình quản lý dữ liệu trên SPSS

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Kích thước cột

(columns): Cho

phép khai báo độ

rộng của cột

Trang 25

49

Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Dạng thang đo

(measures): Hiễn thị

dạng thang đo của giá trị

trong biến

Trang 26

51

Mã hóa lại dữ liệu trên SPSS

Để rút gọn số biểu hiện của một biến xuống còn 3-4 biểu hiện, chúng ta có thể thực hiện mã hóa lại

Từ thanh menu chọn: Transform / Recode / Into Different Variables

Đưa vào biến muốn được

mã hóa lại

2.3 Xử lý dữ liệu

Mã hóa lại dữ liệu trên SPSS

Để rút gọn số biểu hiện của một biến xuống còn 3-4 biểu hiện, chúng ta có thể thực hiện mã hóa lại

Xác định khoảng từng biểu

hiện ở biến được mã hóa

Trang 28

55

Số định tâm/ đo lường khuynh hướng hội tụ

Số trung bình (mean): là giá trị trung bình của một dãy số liệu

 Nếu mẫu ngẫu nhiên w có các giá trị x = (x1, x2, …xn), thì giá trị trung

bình được tính như sau:

 Nếu các giá trị x1, x2, …xk lần lượt có các tần suất n1, n2, …nk thì giá trị

trung bình được tính như sau:

 Các đặc tính toán học của giá trị trung bình đóng vai trò rất quan trọng khi

các dữ liệu của mẫu được dùng để suy rộng ra tổng thể (ước lượng) hoặc

khi được dùng trong các thí nghiệm thống kê Phương pháp trung bình số

học rất thích hợp khi phân tích các dữ liệu theo khoảng cách

n

xi x

n i

xi: cá thể thứ i i: là số thứ tự của cá thể n: số lượng cá thể

k i i

3.2 Mô tả dạng thống kê

Số định tâm/ đo lường khuynh hướng hội tụ

Số trung vị (Median): Là giá trị của số đứng ở vị trí giữa dãy số

liệu Trước khi xác định giá trị trung vị, cần phải sắp xếp các dữ

liệu theo thứ tự dưới lên hoặc từ trên xuống Gọi n là số giá trị

quan sát được, thì số trung vị được xác định như sau

 Nếu n là số lẻ: thì số trung vị là số có số thứ tự (n+1)/2

 Nếu n là số chẵn: thì số trung vị là số trung bình cộng của 2 số có thứ tự

là n/2 và (n/2) +1

Đặc tính quan trọng của trung vị là không bị ảnh hưởng bởi các giá trị ở hai

đầu mút của dãy phân phối, vì vậy, nếu bảng phân phối có độ lệch lớn nên

chọn phép tính giá trị trung vị hơn là trung bình

Số mốt (mode): Mốt là số có tần số xuất hiện nhiều nhất trong

dãy số

Trang 30

59

Số phân tán

Số phân tán (Measure of dispersion): Số phân tán dùng để thể

hiện sự khác biệt giữa các số trong dãy số đối với số định tâm

Phương sai ( Variance) và độ lệch chuẩn (Standard deviation): Phương sai và

độ lệch chuẩn dựa trên mức độ sai lệch của các quan sát với giá trị trung bình

Phương sai được định nghĩa như là số trung bình của bình phương các độ lệch

giữa giá trị quan sát với giá trị trung bình trong dãy phân phối Căn bậc hai

của phương sai gọi là độ lệch chuẩn

 Độ lệch chuẩn được tính như sau:

 Độ lệch chuẩn của tổng thể:

 Độ lệch chuẩn của mẫu:

2 xi μ N

x xi 1 - n

1 S

S    

3.2 Mô tả dạng thống kê

Số phân tán

Descriptive Measure Excel Command

Variance =VARP(Data_Range)population

=VAR(Data_Range ) sample

Standard Deviation =STDEVP( =STDEV(Data_RangeData_Range) )sample population

Coefficient of

Variation

=STDEV(Data_Range) / / AVERAGE(Data_Range )

Trang 32

63

Sử dụng SPSS Analyze -> Descriptive Statistics ->

Descriptives -> Options

3.2 Mô tả dạng thống kê

Biểu đồ tần suất

Chức năng: khi có nhiều số liệu cần chia lớp để thấy rõ các nét

đặc trưng cơ bản của dãy số liệu, sau đó kiểm tra tính chuẩn của

biến nghiên cứu

 Để số liệu trong một cột, một hàng hay một bảng chữ nhật

 Tìm giá trị Min, Max của miền dữ liệu, tính R = Max – Min

 Chọn khoảng k, thực tế k: 20-30, ít số liệu k: 6-10

 Tính khoảng cách giữa các tổ: h = R/k (làm tròn)

 Có Max, Min, R, k, h ta tạo miền phân tổ bắt đầu từ Min, các giá trị tiếp

theo cộng dồn với h, cho đên sát h thì dừng

Trang 34

67

Biểu đồ tần suất/ sử dụng SPSS Analyze -> Descriptive Statistics -> Frequencies

• Nhắp Statistics để có các thống kê mô tả đối với biến định lượng

• Nhắp Charts để có đồ thị thanh, đồ thị tròn, và biểu đồ tần suất

• Nhắp Format để có trật tự mà các kết quả được thể hiện

Trang 35

69

Sở thích về sữa chua Vinamilk theo giới tính

Thang đo Giới tính Giới tính Tổng

Pie chart

Trang 37

73

Đồ thị bánh thường được sử dụng cho các câu hỏi đơn trả lời để biểu diễn tần số tương

đối – Tổng của nó bằng 100%.

Đại học 51,2%

Công nhân kỹ thuật 43,8%

Cao đẳng 2,9%

Sau đại học 2,1%

Cơ cấu lao động của Tp Cần thơ phân theo trình độ năm 2004

Tốc độ tăng trưởng GDP phân theo khu vực kinh tế của Việt Nam thời kỳ 00 – 04 (ĐVT: %)

Trang 38

Ví dụ minh họa Biểu đồ phân tán

Tương quan thuận (X, Y Cùng tăng)

Trang 39

77

 Ước lượng điểm

 Ước lượng khoảng

 Ước lượng khoảng cho trung bình: trường hợp biết, và chưa biết

 Ước lượng khoảng cho tỉ lệ

Kích thước mẫu

4.1 Ước lượng

Ước lượng điểm

Ước lượng tham số của

tổng thể (parameters) …

… bằng tham số mẫu (statistics)

P

Trang 40

79

Ước lượng khoảng

 Cung cấp một khoảng các giá trị

Có xét đến sự biến thiên (variation) về trị số giữa các

mẫu khác nhau

Dựa trên quan sát của 1 mẫu

Cung cấp thông tin gần nhất (closeness) về trị số (chưa

 Xem như biết σ

 Tổng thể có phân phối chuẩn

 Nếu tổng thể không có phân phối chuẩn, mẫu phải lớn

 Khoảng tin cậy

gọi là sai số chọn mẫu

(sampling error or margin of error)

Ngày đăng: 28/03/2014, 21:51

HÌNH ẢNH LIÊN QUAN

Hình thống kê - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
Hình th ống kê (Trang 4)
Đồ thị - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị (Trang 7)
Bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
Bảng c âu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu (Trang 16)
Bảng câu hỏi có một số giá trị chỉ mang - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
Bảng c âu hỏi có một số giá trị chỉ mang (Trang 24)
Bảng đơn (mẫu) - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
ng đơn (mẫu) (Trang 34)
Đồ thị thanh - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị thanh (Trang 36)
Đồ thị thanh thường được sử dụng để biểu diễn số tương đối, số tuyệt đối, tần số. - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị thanh thường được sử dụng để biểu diễn số tương đối, số tuyệt đối, tần số (Trang 36)
Đồ thị đường và đồ thị phân tán - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị đường và đồ thị phân tán (Trang 37)
Đồ thị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến. - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến (Trang 37)
Đồ thị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến. - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
th ị đường và Đồ thị phân tán được sử dụng để biểu diễn mối quan hệ giữa các biến (Trang 38)
Sơ đồ quy trình nghiên cứu ứng dụng EFA - bài giảng phân tích dữ liệu trong nghiên cứu kinh tế và kinh doanh - ts phạm cảnh huy
Sơ đồ quy trình nghiên cứu ứng dụng EFA (Trang 78)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w