CHƯƠNG 3 : PHÂN TÍCH THỐNG KÊ MÔ TẢ
3.4. Kế hoạch phân tích của bộ số liệu mẫu thống kê mô tả
Các câu hỏi ở trên bao gồm hai loại phân tích thống kê: phân tích mơ tả cho câu hỏi 1 đến 3 và thống kê suy luận cho các câu hỏi từ 4 đến 12.
Phần còn lại của chương này sẽ nói về kế hoạch phân tích bao gồm các phân tích mơ tả cho các câu hỏi nghiên cứu từ 1 đến 3. Kế hoạch phân tích cho các giả thuyết được nêu ra trong các câu hỏi nghiên cứu từ 4 đến 16 sẽ được nói đến ở chương 4.
Việc lựa chọn tóm tắt phân tích của một biến hoặc một mối liên quan giữa hai biến bị ảnh hưởng bởi các đo lường của biến phụ thuộc và dạng so sánh trong cuốn sách này có hai bảng để đưa ra sự lựa chọn về cách làm thế nào để tóm tắt và phân tích bộ số liệu của bạn. Các bảng này tóm tắt những hướng quyết định cho hầu hết các thống kê mô tả và các kiểm định thống kê cơ bản của các biến liên tục và danh mục. bạn hãy dành
thời gian xem xét nội dung của các bảng này và cân nhắc xem chúng được sử dụng như thế nào trong các ví dụ trong chương này cũng như chương 4.
Bảng 3.1 được dùng để chọn các tóm tắt và kiểm định thống kê để phân tích biến phụ thuộc liên tục/khoảng chia.
Bảng 3.2 được dùng để chọn các tóm tắt và kiểm định thống kê để phân tích biến phụ thuộc danh mục.
Một trong những giả định cần phải được thoả mãn cho việc tóm tắt và phân tích các biến phụ thuộc liên tục bằng giá trị trung bình là phân bố tần số của biến phải là phân bố chuẩn. Trong khi còn rất nhiều giả định khác cũng thường cần phải cân nhắc cho các dạng kiểm định thống kê khác nhau, giả định này phải được xem xét trước những phần
khác trong bảng để chọn được một tóm tắt thống kê phù hợp. Các loại giả định khác sẽ cần được cân nhắc khi chọn các kiểm định thống kê cho kiểm định giả thuyết, điều này
sẽ được nói đến trong chương 4. Làm thế nào để biết phân bố có phải là phân bố chuẩn hay không được mô tả trong phần 4.8, một phần dành để giải thích tất cả các giả định bạn có thể cần phải cân nhắc.
Một kế hoạch phân tích gợi ý cho câu hỏi đầu tiên trong 3 câu hỏi mô tả được
đưa ra dưới đây:
Kế hoạch phân tích - Thống kê mô tả:
Mô tả sơ lược yếu tố xã hội-dân số (giới tính, tuổi, trình độ học vấn, nghề nghiệp) của những đối tượng bị chấn thương giao thông.
Các biến: Câu hỏi này yêu cầu tóm tắt tất cả 4 loại biến về yếu tố xã hội-dân số. Chúng là các loại khác nhau; giới tính là biến nhị phân, tuổi là biến liên tục; trình độ học vấn là biến thứ hạng và nghề nghiệp là biến danh mục.
Tóm tắt: Theo bảng 3.1 nếu một biến là biến danh mục thì số lượng và tỷ lệ nên
được dùng để đưa ra một tóm tắt biến này dưới dạng số, và biểu đồ cột sẽ thích hợp để
biểu diễn biến này. Nếu là biến liên tục thì lượng giá bằng trung bình và độ phân tán là thích hợp; giá trị trung bình và độ lệch chuẩn nếu phân bố của biến là phân bố chuẩn, nếu không trung vị và khoảng (giá trị cực tiểu, giá trị cực đại) là phù hợp. Biểu đồ, biểu đồ Box-and-Whisker sẽ phù hợp với bất kỳ một biến liên tục nào, kể cả có phân bố chuẩn hay khơng.
(i) Tính các tần số, các tỷ lệ và các biểu đồ cột cho biến giới tính, trình dộ học vấn, nghề nghiệp.
(ii) Kiểm tra xem tuổi có phân bố chuẩn hay khơng
(iii) Nếu tuổi là phân bố chuẩn, thì sử dụng giá trị trung bình, độ lệch chuẩn, biểu đồ Box-and-Whisker, nếu khơng
(iv) Nếu tuổi không là phân bố chuẩn, sử dụng gía trị trung vị, cực tiểu, cực đại và biểu đồ Box-and Whisker.
Mô tả sơ lược về giới tính và tuổi của mẫu trong vùng.
Câu hỏi này yêu cầu mô tả mối liên quan giữa hai biến, • Mơ tả giới trong các vùng nghiên cứu • Mơ tả tuổi trong các vùng nghiên cứu
Các biến: giới tính và vùng miền đều là biến danh mục vì thế yêu cầu các thống kê mô tả cho biến danh mục bằng các mối liên quan danh mục.
Tuổi là biến liên tục và vùng miền là biến danh mục, biến này yêu cầu các thống kê mơ tả.
Tóm tắt: Theo bảng 3.2, nếu nếu mối liên quan giữa hai biến danh mục thì trình bày kết quả bằng bảng có tần số và tỷ lệ. Với giới tính theo vùng, chúng ta có thể có bảng như sau:
Bảng … Phân bố giới tính theo vùng
Tần số Tỷ lệ nam giới (%) Vùng Tây Bắc Đông Bắc Đồng bằng sông Hồng Bắc trung bộ
Duyên hải ven trung bộ Tây nguyên
Đông nam bộ
Đồng bằng sông Mekong
Là một điều tốt nếu chúng ta luôn để số lượng các đối tượng trong từng loại danh mục. Bảng trên cho ta thấy số lượng các đối tượng trong từng vùng theo giới tính, yêu cầu các tỷ lệ theo hàng ngang khi chúng ta muốn có tỷ lệ của nam trong từng miền theo như bảng trên.
Bảng 3.1 gợi ý rằng các giá trị trung bình và độ lệch chuẩn, được tóm tắt trong từng vùng là một tóm tắt phù hợp bằng số cho mối liên quan giữa tuổi trong các vùng. Bảng có dạng sau:
Bảng … Phân bố giới tính theo vùng
Tần số Tỷ lệ nam giới (%) Vùng Tây Bắc Đông Bắc Đồng bằng sông Hồng Bắc trung bộ
Duyên hải ven trung bộ Tây nguyên
Đông nam bộ
Đồng bằng sông Mekong
Cách này yêu cầu các giá trị trung bình và các độ lệch chuẩn và cũng đưa ra biểu đồ box- and-whisker để giải thích.
Một mô tả về điểm chất lượng cuộc sống trước chấn thương và xem xét điểm này có bị ảnh hưởng bởi tuổi hay không.
Các biến: Câu hỏi này đề cập đến mối liên quan giữa hai biến liên tục, chất lượng cuộc sống trước chấn thương và tuổi.
Tóm tắt: Từ bảng 3.1, hầu hết các tóm tắt bằng biểu đồ phù hợp của mối liên quan này là biểu đồ chấm điểm (scatter) và nếu mối liên quan này gần như một đường thẳng thì hệ số tương quan hầu như sẽ phù hợp tóm tắt dưới dạng số. Nếu hai biến là phân bố chuẩn hệ số tương quan Pearson’s la thích hợp, nếu không nên sử dụng hệ số tương quan Spearman’s.
Thực hiện một kế hoạch phân tích
Mơ tả thống kê bộ số liệu có thể dùng dưới dạng số hoặc biểu đồ. Các phần tiếp theo sẽ mô tả cho bạn dùng SPSS như thế nào để đưa ra hầu hết các dạng thơng thường của tóm tắt thống kê. Chúng được trình bày theo cách xác định kế hoạch phân tích được liệt kê ở trên cho các câu hỏi mô tả bộ số liệu mẫu.