KIEÅM ÑÒNH KOLMOGOROV-SMIRNOV Đây là 1 kiểm định phi tham số nhằm so sánh sự phân chia các quan sát trong mẫu với một phân chia chuẩn đã xác định.Ví dụ : Giả thuyết rằng một mẫu có 100 n[r]
(1)PHƯƠNG PHÁP PHÂN TÍCH DỮ LIEÄU Xuất phát từ cách nhìn nhà nghiên cứu muốn xác định caùc phöông phaùp phaân tích ñöa vaøo ứng dụng cho liệu, không phải từ cách nhìn kỹ thuật viên thống kê (có thể thấu hiểu đầy đủ chất các phương pháp thoáng keâ), (2) 3.1 Bản chất và chức phân tích thống kê Phân tích thống kê có thể hiểu là các phương pháp chắt lọc liệu để rút các suy luaän logic Các giai đoạn chủ yếu phân tích thống kê goàm coù: Sắp xếp liệu thô vào các thứ bậc đã đo lường Tóm tắt liệu Áp dụng các phương pháp phân tích để làm rõ caùc moái quan heä töông hoã vaø caùc yù nghóa ñònh lượng các liệu (3) 3.2 Quá trình phân tích liệu Xếp liệu theo thứ tự (lập dãy, lập bảng, xếp loại, tính %)Tóm tắt liệu thống kêChọn phương pháp phân tích thích hợp (chọn các tiêu chuẩn)Phân tích các sai biệtNghiên cứu các mối liên hệPhân tích liệu thực nghieäm (4) a/ Xếp liệu theo thứ tự Dữ liệu thô thu thập từ thực địa và mã hóa chưa đủ điều kiện phép phân tích, diễn giải Chúng cần trải qua giai đoạn xếp theo thứ tự và bước thống kê (lập bảng) Phân làm loại sau: (5) b/ Laäp daõy (array) Đây là hình thức đơn giản để xếp liệu Cách này xếp liệu thành chuỗi số theo hướng tăng dần, giảm dần Phương pháp này thích hợp với dãy liệu nhỏ, nó cho thấy phân bố dãy số, giá trị max và dãy số, tập trung dãy số đó (6) c/ Lập bảng đơn giản (một chiều bieán) Ta đếm tần suất xuất liệu chuỗi liệu và lập thành bảng phaân phoái taàn suaát (frequency distribution) nhö sau (7) Baûng phaân boá tuoåi cuûa caùc thí sinh Tuoåi Taàn soá tuyeät đối Tần số tương đối (%) 17 6.3 6.3 18 18.8 25.0 19 12.5 37.5 20 31.5 68.8 21 12.5 81.3 22 18.8 100.0 Toång coäng 16 100.0 Taàn soá tích luõy (%) (8) Daïng baûng naøy theå hieän khaù roõ raøng veà phaân boá dãy liệu theo các mức liệu khác Tần số quan sát tuyệt đối ứng với mức lieäu khaùc Tần số quan sát tương đối tính theo tỷ lệ % mức liệu so với toàn mẫu quan sát Taàn soá tích luõy chæ roõ tyû leä % cuûa taát caû quan saùt có giá trị nhỏ hay giá trị mức liệu ñang xem xeùt Các giá trị liệu bất thường (quá lớn hay quá nhỏ) để kiểm chứng lại vì giá trị liệu sau coù theå laøm leäch keát quaû phaân tích thoáng keâ, giá trị đúng bất thường đôi cần cách xử lý đặc biệt khác Các giá trị mã hóa bất thường sai sót vieäc nhaäp lieäu hay maõ hoùa (9) d/ Lập bảng so sánh toàn diện (Cross-tabulation) Nhiều vấn đề nghiên cứu có thể giải việc lập bảng đơn giản Tuy nhiên, bảng đơn giản cho biết phân bố biến số thời điểm nào đó, và có thể không đem lại đầy đủ thông tin cho liệu Hầu hết các liệu có thể tổ chức hình thức cao thông tin phụ thêm Bảng so sách toàn diện chính là hình thức mở rộng bảng chiều để nhà nghiên cứu có thể nghiên cứu mối liên hệ hai hay nhiều biến cách đồng thời đếm tần số xuất bảng chieàu (10) Ví dụ: Liên hệ mức lợi tức và trình độ giáo dục Giaùo duïc treân moãi đầu người Giaùo duïc phoå thoâng trở xuống Có từ 1-3 naêm trung hoïc Toát nghieäp trung hoïc Mức lợi tức (dollar) Dưới 5000 50007999 800 0999 1250 1499 40 1500 1999 46 20000 24999 Treân 25000 Toå ng soá 61 1000 1249 48 232 136 16 13 592 145 99 46 80 51 61 26 33 541 196 217 137 187 217 220 164 139 147 (11) 4- Đo lường khuynh hướng hội tụ liệu Ba cách đơn giản để đo lường khuynh hướng hội tụ dãy liệu là tính các giaù trò mode, giaù trò trung vò (median) vaø giaù trò trung bình (mean) (12) Giaù trò mode Giá trị mode là giá trị liệu có tần số quan sát lớn nhất, thuộc lớp có tần suất xuất lớn Giaù trò trung vò Giaù trò trung vò cuûa moät daõy phaân phoái laø giaù trò maø 50% giá trị quan sát dãy nhỏ nó và 50% giá trị còn lại dãy lớn nó Trước tính giá trị trung vị, ta phải xếp liệu theo thứ tự Giaù trò trung bình Giá trị trung bình hiểu là trung bình số học, tính tổng các giá trị các quan sát chia cho soá laàn quan saùt (13) 5- Đo lường độ phân tán lieäu Hai daõy phaân phoái coù theå coù cuøng giaù trò đo lường khuynh hướng hội tụ, raát khaùc veà tính chaát phaân boá cuûa các quan sát, gọi là độ phân tán liệu Các giá trị đo lường độ phân tán này raát caàn thieát, chuùng boå sung cho caùc giaù trò đo lường độ hội tụ để làm rõ đặc trưng dãy liệu nghiên cứu (14) Khoảng biến thiên (range) Khoảng biến thiên là sai biệt giá trị lớn và nhỏ dãy phân phối Giá trị này nêu bật các cực trị liệu mà không so sánh với giá trị trung bình neân coù theå laøm leäch hình aûnh daõy phaân phoái Heä soá bieán thieân (Coefficient of Variation) Nếu cần so sánh độ phân tán hai hay nhieàu daõy phaân phoái coù giaù trò trung bình khaùc hay coù caùc ñôn (15) 6- Lựa chọn phương pháp phân tích liệu thích hợp Khi cân nhắc lựa chọn phương pháp phân tích liệu thích hợp, chúng ta phải dựa trên sở sau đây: 6.1 Kỹ thuật phân tích muốn chứng minh ñieàu gì ? Nhà nghiên cứu thường phải trả lời các câu hỏi: “Những kết có ý nghĩa gì mặt thống kê ?”, “Liệu các kết coù xuaát hieän moät caùch ngaãu nhieân vieäc sử dụng mẫu không ?” (16) Dữ liệu tham số và liệu phi tham số Dữ liệu gọi là thuộc loại tham số (parametric) chúng phân phối xung quanh giá trị trung bình giá trị trung tâm chúng cách đối xứng tương tự đường cong xác suất chuẩn tắc Khi đó, chúng ta có thể dùng kiểm định xác suất để xác định ý nghĩa thống kê mẫu nghiên cứu nào lấy từ tổng thể Dữ liệu phi tham số (non parametric) không phân phối theo đường cong xác suất chuaån taéc neân yù nghóa thoáng keâ hoïc cuûa chuùng phải xem xét kiểm định khác với loại kiểm định trên xác suất (17) Phöông phaùp ñôn bieán : chæ phaân tích bieán soá nhaát Phương pháp hai biến : phân tích liên hệ biến số Phương pháp đa biến : phân tích liên hệ hay nhiều biến số với (18) Tính phuï thuoäc vaø phuï thuoäc laãn Phương pháp phân tích liên hệ các biến số chia làm nhóm: Một biến số phụ thuộc kiểm định tính phụ thuộc nó với biến số độc lập khaùc Tất các biến số nghiên cứu mối lieân heä laãn nhau, tính phuï thuoäc laãn chúng (19) Số lượng mẫu nghiên cứu cần đến Các kiểm định thống kê dùng tùy theo mục ñích: Kiểm tra sai biệt đáng kể mẫu đơn với tổng thể đặc biệt nào đó Kiểm tra sai biệt đáng kể hai mẫu độc lập hay có liên quan với Kiểm định ý nghĩa sai biệt ba hay nhiều mẫu độc lập hay có liên quan với Sự đo lường mối tương quan và kết kieåm ñònh veà yù nghóa cuûa chuùng (20) 7- Kiểm định thống kê để đánh giá caùc giaû thuyeát Nguyeân taéc kieåm ñònh giaû thuyeát Trong mục III, ta đã dùng kết mẫu để ước lượng số trị số thực còn chưa biết tổng thể và dựa vào đó làm sở mô tả tổng thể Ngoài ra, để nhận biết các tham số thị trường (tổng thể) cách đầy đủ và chi tiết hôn, ta coù theå ñöa moät soá giaû thuyeát veà caùc thông số đó và sử dụng các thông tin thu thập trên mẫu để chứng minh Công cụ chủ yếu cho quá trình đó là các kiểm định thống kê (21) Các bước tổng quát cần thực kieåm ñònh giaû thuyeát Phaùt bieåu giaû thuyeát “khoâng” vaø giaû theá thuyeát thay Chọn mức ý muoán 11 Ruùt keát luaän thoáng keâ veà giaû thuyeát “khoâng” 66 nghóa mong Choïn kieåm ñònh thoáng keâ thích hợp 22 33 Tính trò soá thoáng keâ cuûa kieåm ñònh thích hợp cho 55 phaân phoá i laáy Xaùc ñònh vuøng baùc boû hay caùc vùng tới hạn maãu 44 (22) Bước 1: Giả thuyết giá trị tổng thể nào đó cần phải kiểm định gọi là giả thuyết “không” (null hypothesis), kyù hieäu laø Moät keát luaän khaùc maø vieäc chaáp nhaän noù phuï thuoäc vaøo vieäc baùc bỏ giả thuyết “không” thì gọi là giả thuyết thay theá (alternative hypothesis), kyù hieäu laø Vieäc thieát laäp tuøy thuoäc vaøo baûn chaát vaø tính định hướng sai biệt tình Nếu tình không có định hướng sai biệt, giả thuyết kiểm định đuôi (two-tailed test) Nếu tình có định hướng sai biệt, kiểm định đuôi (one-tailed test) Tính định hướng giả thiết ảnh hưởng đến kiểm định thống kê thực và việc định (23) Bước 2: Vì ảnh hưởng sai số lấy mẫu nên thật khó đánh giá việc định chấp nhận hay bác bỏ giả thuyết là đúng Khi giả thuyết “không” bị bác bỏ mà lẽ nó phải chấp nhận thì dẫn đến sai lầm loại I Khả phạm sai lầm gọi là mức ý nghĩa và ký hiệu là Thường dùng = 0.1, = 0.05 và = 0.01 Mức càng nhỏ thì rủi ro bác bỏ lý thuyết “không” nó đúng giảm xuống Nhưng ngược lại, rủi ro chấp nhận giả thuyết “không” nó sai lại tăng lên, dẫn đến sai lầm loại II, và ký hiệu là Trong thực tế khó đạt cân loại sai số naøy (24) Bước 3: Việc chọn kiểm định thống kê thích hợp phuï thuoäc vaøo : Bản chất vấn đề: phân tích sai biệt, nghiên cứu các mối liên hệ Cấp độ đo lường Soá maãu : 1, hay nhieàu hôn Các mẫu độc lập hay có liên hệ với Và nhà nghiên cứu phải biết phân phối xác suất mà số thống kê kiểm định tính toán có liên quan đến (25) Bước 4: Khi đã chọn kiểm định thống kê và mức thích hợp, ta xác định các trị số tới hạn tương ứng từ phân phối lấy mẫu kiểm định thống kê đó Phân phối lấy maãu cuûa moät kieåm ñònh thoáng keâ bao goàm moïi giaù trò coù theå coù maø moät soá thoáng keâ cuûa kieåm ñònh coù theå laáy theo giaû thuyeát “không” Trị số tới hạn là ranh giới caùc vuøng chaáp nhaän vaø vuøng baùc boû giaû thuyeát “khoâng” (26) Bước 5: Phân tích các số liệu thật công thức thích hợp để tính trị số thống kê cuûa kieåm ñònh Bước 6: Nếu trị số thống kê kiểm định tính bước vượt quá trị số tới hạn bước 4, ta bác bỏ giả thuyết “không” Ngược lại, không có các chứng thống kê để bác bỏ giả thuyết này (27) 8- Phaân tích ñôn bieán (univariable data analysis) Phân tích đơn biến liên quan tới việc nghiên cứu số biến số mà ta đã đo lường trên mẫu phần tử Có hai vấn đề cần xem xét phân tích đơn biến : Mô tả liệu: thể góc độ xu hướng hội tụ và xu hướng phân tán liệu dạng phân phoái caùc quan saùt Diễn giải: bao gồm việc so sánh các giá trị quan sát với nhiều giá trị đã định tương ứng với mục tiêu mong muốn kết nghiên cứu trước đó Các phương pháp phân tích sử dụng tùy thuộc vào loại biến số: định danh, thứ tự, hay metric (khoảng caùch vaø tyû leä) (28) 8.1 Phaân tích moät bieán ñònh danh Biến định danh chứa đựng các giá trị toán học ít các biến Ta có thể tính số lượng quan sát tương ứng với hạng (category) hay dạng thức (modality) biến, nghĩa là lập các bảng diễn giải đơn giản so sánh toàn diện Xu hướng hội tụ thể thông qua giá trị mode phản ánh tập trung nhiều các quan sát vào dạng thức nào đó Độ phân tán biểu tần suất, nghĩa là tỷ lệ % số các quan sát xuất tương ứng dạng thức Thống kê diễn giải tương ứng với biến định danh là kiểm định Chi-bình phương dùng để so sánh phân phối quan sát mẫu với phân phối đã định trước Ngoài ra, trường hợp biến định danh có dạng lưỡng phân, ta có thể sử dụng kiểm định nhị thức để kiểm tra giả thuyết Kiểm định Chi-bình phương trình bày chi tiết phần sau Kiểm định nhị thức có thể tóm tắt sau: (29) KIỂM ĐỊNH NHỊ THỨC Giả sử ta có mẫu n phần tử lấy từ tổng thể nào đó bao gồm hạng (category) Phân phối nhị thức là phân phối các tỷ lệ hạng đó mẫu Vì vậy, giả thuyết H0 là không có khác các tỷ lệ mẫu và tổng thể mà nó đại diện.Kiểm định nhị thức bao gồm việc tính toán các xác suất Ptt nhận các giá trị quan sát mẫu So sánh các xác suất này với giá trị ngưỡng độ tin cậy đã xác định ta có thể : Baùc boû giaû thuyeát H0 Ptt < ε Chaáp nhaän giaû thuyeát H0 Ptt => ε (30) Ví dụ : Nghiên cứu hiểu biết tập hợp khách haøng moät toång theå xaùc ñònh veà caùc saûn phaåm không có nhãn hiệu, giả thuyết H0 là số đối tượng nghiên cứu, tỷ lệ người biết các sản phẩm này là 50% (không có khác số người biết và không biết các sản phẩm) Xác suất nhận k đối tượng hạng (“có biết các sản phẩm không nhãn”) và ( n-k ) đối tượng haïng (“khoâng bieát caùc saûn phaåm khoâng nhaõn”) trình bày sau : Với Pk = n! Pk qn-k k!(n-k) ) Với P(k) = xác suất nhận k đối tượng P = tỷ lệ đối tượng hạng tổng thể Q = tỷ lệ đối tượng hạng tổng thể Xác suất nhận k đối tượng hay ít là tổng số các xác suất nhận đối tượng, đối tượng, (31) Giả sử mẫu nghiên cứu có 16 phần tử Giaû thuyeát H0 seõ laø: p = q = ½ Trong mẫu có phần tử không biết các sản phaåm khoâng nhaõn ( k = 2) Nhö vaäy :Ptt ( k <= 2) =P(0)+P(1)+p(2)=0.002 So sánh P(k <= 2)=0,002 với giá trị ngưỡng ε = 0,05 vaø ε = 0,01 ta thaáy P(k <= 2) < = ε = 0,01 Do đó, có thể bác bỏ giả thuyeát taïi H0 taïi P <= 0,01 (32) Phân tích biến thứ tự Đây là biến chất lượng đó các giá trị xếp theo thứ tự Xu hướng hội tụ thể thông qua giá trò trung vò, laø giaù trò phaân chia toång theå nghieân cứu làm hai phần Độ phân tán biểu diễn các phân nhaùnh (fractiles) phaân chia toång theå laøm caùc phần theo thứ hạng Thường sử dụng nhaát laø phaân nhaùnh (quartile chia toång theå làm hạng nhau), sau đó người ta so sánh giá trị đầu tiên với giá trị cuối cùng caùc phaân nhaùnh (33) Kiểm định sử dụng để chứng minh giả thuyết biến thứ tự là kiểm định KolmogorovSmirnov KIEÅM ÑÒNH KOLMOGOROV-SMIRNOV Đây là kiểm định phi tham số nhằm so sánh phân chia các quan sát mẫu với phân chia chuẩn đã xác định.Ví dụ : Giả thuyết mẫu có 100 người tiêu dùng đã cho ý kiến loại mỹ phẩm theo thang đo có thứ hạng từ “rất đậm” đến “rất nhạt” Mục tiêu kiểm định là so sánh phân phối các câu trả lời với phân phối lý thuyết tương ứng với giả thuyết H0 (không có khác tỷ lệ các câu trả lời các thứ hạng) Nếu quy mô mẫu n>35 giải thuyết H0 bị bác bỏ mức sai số ε =0.01 (34) Phaân tích moät bieán metric Trong trường hợp biến metric (gồm biến khoảng cách và biến tỷ lệ), xu hướng hội tụ là giá trị trung bình Độ phân tán thể thông qua giá trị phương sai và độ lệch chuẩn Hai tiêu này dùng để so sánh phân phối quan sát với phân phối chuẩn là hệ số đối xứng (hay “skewness”) và hệ soá taäp trung (hay “kurtosis”) Kiểm định sử dụng là kiểm định trung bình: So sánh phân phối quan sát với phân phối chuẩn Hai tiêu đánh giá độ phân tán sử dụng để so sánh phân phối quan sát với phân phối chuẩn (hay gọi là đường cong Gauss đường cong hình chuông) là hệ số đối xứng (symmetric coefficient) và hệ số tập trung (concentrated coefficient) (35) Phân tích hai biến thứ tự – thứ tự Đo lường tương quan biến thứ tự thực chủ yếu thông qua hen số tương quan theo thứ bậc Spearman (rho ) và Kendal (tau ) Hai hệ số này dao động từ –1 đến +1 p = +1 tương ứng với tương quan thuận chiều hoàn toàn (2 xếp hạng đồng nhất) P =-1 tương ứng với tương quan ngược chiều hoàn toàn (2 xếp hạng trái ngược nhau) P =0 không có quan hệ gì xếp hạng (36) Phaân tích hai bieán ñònh danh - ñònh danh Trường hợp này thường gặp nghiên cứu Nội dung phaân tích chuû yeáu bao goàm: Laäp caùc baûng ngaãu nhieân AÙp duïng kieåm ñònh Chi – bình phöông Đo lường các tương quan Laäp caùc baûng ngaãu nhieân Caùc baûng ngaãu nhieân (baûng cheùo) nhaèm so saùnh caùc câu trả lòi câu hỏi theo câu trả lời cho trước câu hỏi khác Ví dụ ta so sánh câu trả lời có-không (câu hỏi tiêu thụ sản phẩm P với câu hỏi giới tính đối tượng nghiên cứu: nam –nữ) Ma trận thông tin trường hợp này bao gồm cột hàng với khả kết hợp có thể xảy (nam+có, nam+không, nữ+có, nữ+không) (37) Phaân tích hoài quy Phöông phaùp phaân tích hoài quy laø phương pháp lập hàm quan hệ các biến biết giá trị tương ứng cuûa chuùng (38) Hồi quy tuyến tính: Khi quan hệ các bieán laø tuyeán tính Hồi quy phi tuyến: Khi quan hệ các bieán laø phi tuyeán Phaân tích hoài quy phi tuyến phức tạp nhiều so với hồi quy tuyến tính nên ít dùng Hoài quy ñôn giaûn: Khi ta xem xeùt quan heä chæ cuûa bieán (39) Chöông THOÁNG KEÂ MOÂ TAÛ Thống kê mô tả là bước và là bước khởi đầu nhiều công trình toán thống kê Các thuật toán và đồ thị dùng thoáng keâ moâ taû khaù phong phuù vaø tùy thuộc vào mẫu nghiên cứu (định lượng, định tính hay bán định lượng) (40) I-Thoáng keâ moâ taû Baûng phaân phoái taàn soá Thực mô tả phân phối tần số treân SPSS: (taäp Diem_thi.sav) (41) (42) Hộp thoại phân phối tần số: Chọn loại biểu đồ cần veõ Choïn bieán laäp baûng phaân phoái taàn soá Tính các đại lượng thống kê moâ taû (43) Baûng phaân phoái taàn soá: Số quan sát hợp lệ Statistics Thoán g keâ ngôn ngữ học Số quan sát bị thiếu liệu N Valid Missing Xaõ hoäi ngoân ngữ học 23 23 0 Thống kê ngôn ngữ học Frequency Valid Percent Valid Percent Cumulative Percent 1.0 8.7 8.7 8.7 2.5 21.7 21.7 30.4 3.0 4.3 4.3 34.8 4.0 21.7 21.7 56.5 4.5 13.0 13.0 69.6 5.0 4.3 4.3 73.9 5.5 13.0 13.0 87.0 6.0 4.3 4.3 91.3 6.5 4.3 4.3 95.7 7.0 4.3 4.3 100.0 23 100.0 100.0 Total Xã hội ngôn ngữ học Frequency Valid Percent Valid Percent Cumulative Percent .0 4.3 4.3 4.3 1.5 8.7 8.7 13.0 2.5 4.3 4.3 17.4 3.0 4.3 4.3 21.7 3.5 26.1 26.1 47.8 4.0 13.0 13.0 60.9 4.5 8.7 8.7 69.6 5.0 8.7 8.7 78.3 5.5 4.3 4.3 82.6 6.5 4.3 4.3 87.0 7.0 8.7 8.7 95.7 8.0 4.3 4.3 100.0 23 100.0 100.0 Total 30 (44) Giải thích từ ngữ dùng thống kê mô tả Sum: Tổng Cộng, Maximum: Giá trị lớn nhất, Minimun: Giá trị nhỏ nhất, Mode: Giá trị xuất nhiều nhất, Mean: Giá trị trung bình, Median: Giá trị trung vị, Frequencies: Tân xuất, Std deviation: Độ lệnh chuẩn, S.E.Mean: Sai số chuẩn ước lượng trị trung bình, Std Error: Sai số chuẩn dùng tị trung bình mẫu để ước lượng trị trung bình tổng thể, Range: Khoảng biến thiên (45) Các đại lượng thống kê mô tả Chỉ tính trên các biến định lượng, ngược lại không có ý nghĩa Thực trên SPSS: (46) Thực trên SPSS: (47) Lập bảng tổng hợp nhiều biến Baûng hai bieán ñònh tính Coù theå duøng Basic Tables vaø General Tables.(taäp Ho_gia_dinh.sav) Thực lập bảng Basic Tables trên SPSS: (48) Thực lập bảng Basic Tables treân SPSS: (49) Caùc laäp baûng thoáng keâ Saép xeáp soá lieäu baûng Hieän toång doøng vaø coät Choïn haøm thoáng keâ Chænh daïng soá lieäu Thay đổi nhãn thống kê (50) Sắp xếp các đại lượng tính toán bảng soá lieäu: * Ô Across: Chứa biến cột, tạo lên cột bản, phù hợp chọn hàm Col% * Ô Down: Chứa biến dòng, tạo lên dòng bảng, phù hợp chọn hàm Row% * In separate tables: các đại lượng thống kê xếp theo các bảng riêng, baûng hieån thò keát quaû tính theo moät haøm thống kê Kiểu xếp này phù hợp bảng tính có quy mô lớn, nhiều dòng (51) Nuùt Statistics: choïn haøm thoáng keâ caàn thieát, sau Click vaøo haøm ta choïn nuùt Add để đưa hàm vào phân tích Ô Summaries: để chứa biến định lượng (52) Ta có các bảng tổng hợp sau: 1- Baûng bieán ñònh tính 2- Baûng bieán ñònh tính 3- Baûng bieán ñònh tính vaø moät bieán ñònh lượng 4- Baûng bieán ñònh tính, moät bieán ñònh lượng (53) Xử lý biến nhiều lựa chọn Có cách để xử lý: Duøng: Analyze -> Custom Tables -> Multiple Repose Tables Duøng: Analyze -> Custom Tables -> General Tables (54) -> Multiple Repose Tables Choïn caùc bieán lieân quan Löu laïi Tên và nhãn tập đa đáp ứng (55) Choïn Define Set … baûng taïo bieán aûo xuaát hieän: Taïi Variables in set: Ñöa caùc bieán nhoû biến nhiều lựa chọn vào ô: Layes, sau đó Taïi OÂ Name: ñaët teân bieán Taïi OÂ label: ñaët nhaõn bieán Chọn: Categories: Biến có nhiều trả lời Chọn: Dichotomies: Biến có trả lời Sau đó nhấn nút Add đưa biến vào phân tích và Save löu laïi ( choïn Statics baûng phaân phoái taàn suất Generral Tables tùy cách thực ) (56) Bieán phuï thuoäc Biến độc lập (57) Trình bày kết đồ thị Đồ thị là công cụ phân tích thống kê hữu ích, trực quan giúp cho ta có thể biểu diễn liệu cách sinh động, trực quan và dễ hình dung nhằm bổ sung hạn chế việc trình bày liệu bảng biểu Tuy nhiên: Đồ thị trên SPSS có nhiều tính mạnh, nó không có khả liên kết với các file Word, Powerpoint Excel lệnh ( Paste Special) Chúng ta có thể chuyển thông tin từ SPSS sang Excel để vẽ đồ thị trực tiếp trên SPSS (58) I Trình bày số liệu biểu đồ Trình bày số liệu biểu đồ, phải theo nguyên tắc sau: Biểu đồ phải rõ ràng, không rườm rà, bỏ qua chi tiết khoâng caàn thieát Những dẫn trên biểu đồ phải hiểu dễ dàng Chú ý đơn vị biểu đồ, cách phân biệt các thành phần khác biểu đồ màu sắc, các ký tự … Có hai loại biểu diễn dạng biểu đồ: Biểu đồ: biểu diễn số liệu biến thiên cách rời rạc, có thể là biểu đồ tần suất hay biểu đồ khối Đồ thị: số liệu biến thiên liên tục, theo hàm nào đó (59) (60) 2- Mối quan hệ các biến định lượng Mô tả mối quan hệ hai biến định lượng Biểu đồ phân tán (scatter) hữu ích việc mô tả mối quan hệ hai biến định lượng Theo quy ước, có thể đặt biến phụ thuộc trên trục tung và biến độc lập trên trục hoành Không giống quy ước cho các bảng, thường bị bỏ qua, quy ước này dùng rộng rãi các ngaønh khoa hoïc xaõ hoäi (Xem phaàn hoài quy tuyeán tính) (61) 1- Dùng dồ thị biểu diễn tập tin liệu biến: Từ Menu Graphs -> Chọn loại đồ thị (Bar) -> Simple -> Summaries for groups of cases -> Define Đưa biến định cán biểu diễn đồ thị vào Category Axis, chọn N of cases Nhấn vào Titles để đặt tên đồ thị ( dùng tiếng việt với bảng mã TCVN3) (62) 2- Dùng đồ thị biểu diễn tập tin liệu biến phân tách theo biến khác: Từ Menu Graphs -> Chọn loại đồ thị (Bar) -> Clustered -> Summaries for groups of cases -> Define Đưa biến vào Category Axis và Define Clusters by Nhấn vào Titles để đặt tên đồ thị ( dùng tiếng việt với bảng mã TCVN3) Nếu ta chọn Other summary function thì đưa biến địnnh lương vào Variable Mặc nhiên là tính trụ trung bình, muốn thay đổi khác nhấn Change Summary (63) 3- Hiệu chỉnh đồ thị Double vào đồ thị cửa sổ Chart Editor ta tiến hành hiệu chỉnh (64)