CHƯƠNG 4 PHÂN TÍCH DỮ LIỆU TRONG NGHIÊN CỨU KHOA HỌC 4 1 PHÂN TÍCH VÀ XỬ LÝ DỮ LIỆU ĐỊNH TÍNH (UYÊN) 4 1 1 Đặc điểm phân tích dữ liệu định tính (Nguyễn Văn Thắng p106) Phân tích dữ liệu định t.
CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU TRONG NGHIÊN CỨU KHOA HỌC 4.1 PHÂN TÍCH VÀ XỬ LÝ DỮ LIỆU ĐỊNH TÍNH (UN) 4.1.1 Đặc điểm phân tích liệu định tính (Nguyễn Văn Thắng p106) Phân tích liệu định tính bao gồm hoạt động tiến hành liên tục phân tích, phân loại giải thích ý nghĩa liệu Phân tích liệu định tính khơng có tính chuẩn mực cao nghiên cứu định lượng Nó hồn tồn quy trình mở cho phép nhà nghiên cứu sáng tạo phương pháp nhằm khám phá tầng ý nghĩa ẩn sâu bên liệu Phân tích liệu định tính có đặc điểm sau: a Phân tích liệu gắn liền với trình thu thập liệu Nếu nghiên cứu định lượng trình thu thập liệu diễn trước trình xử lý phân tích liệu nghiên cứu định tính hai q trình xảy đồng thời tương tác với Các nhà nghiên cứu thảo luận, vấn với đối tượng nghiên cứu, trình ấy, nhà nghiên cứu thực phân tích sơ phát khái niệm nghiên cứu Các khái niệm nghiên cứu dẫn để nhà nghiên cứu tiến hành lựa chọn đối tượng nghiên cứu tiếp theo, hướng nghiên cứu tiếp theo, tiêu nghiên cứu Nó giúp xác định kích thước mẫu nghiên cứu Cho đến nhà nghiên cứu khơng thu thơng tin từ đối tượng nghiên cứu tiếp lúc đó, số lượng phần tử mẫu nghiên cứu xác định trình thu thập liệu dừng lại Sau nhà nghiên cứu tiếp tục phân tích liệu, trình này, phát yếu tố mới, tri thức mà cần phải đưa nghiên cứu rẽ sang nhánh mới, nhà nghiên cứu lại tiếp tục thu thập liệu nhánh trình lại tiến hành lặp lại Điểm cần ý không nên cảm tính chủ quan nhà nghiên cứu thâm nhập sâu vào việc phân tích liệu thu thập liệu Muốn vậy, nhà nghiên cứu liên tục phải tìm liên kết liệu thu thập với khung nghiên cứu tránh tượng lạc đề, lạc lối nghiên cứu b Phân tích liệu định tính liên kết khơng giới hạn lý thuyết Đương nhiên nhà nghiên cứu cần phải dựa vào khung lý thuyết để triển khai thu thập phân tích liệu nghiên cứu Tuy vậy, nghiên cứu định tính quy trình mở sáng tạo khơng bị giới hạn lý thuyết Do đó, nhà nghiên cứu cần biết cách thiết lập cân hai yếu tố Một số kinh nghiệm đưa cho tình sau: - Phân tích định tính cần có nhạy cảm với lý thuyết Nhà nghiên cứu cần phải thiết lập khung nghiên cứu, xác định đánh giá lý thuyết liên quan đến vấn đề nghiên cứu Việc xác định khung nghiên cứu giúp nhà nghiên cứu phân loại nhóm khái niệm để thu thập liệu thực tế phát “cái lạ” tri thức so với khung nghiên cứu thiết lập Ví dụ, nghiên cứu “Sự phát triển khu vực nông thôn đối mặt với vấn đề thu hồi đất- Tiếp cận tri thức lãnh thổ” tác giả xác định lý thuyết tảng cho nghiên cứu gồm chương trình phát triển nông thôn, lý thuyết phát triển bền vững, lý thuyết sinh kế nông thôn, lý thuyết tri thức lãnh thổ Trong đó, thu thập liệu thực tế, tác giả thấy lý thuyết sinh kế nông thơn thực tế có nhiều điểm khác biệt Người dân nông thôn không quan tâm đến kinh tế, thu nhập, đất đai, nguồn sống mà họ quan tâm đến văn hóa, giáo dục, hạnh phúc (trích luận án Tiến sĩ Phạm Thị Minh Uyên) Những khái niệm so với lý thuyết tảng Và tri thức phát qua nghiên cứu - Nhà nghiên cứu cần có kỹ nghiên cứu tốt, nắm vững loại nghiên cứu kỹ thuật triển khai phương pháp nghiên cứu Ngồi ra, nhà nghiên cứu nên có cảm quan “hoài nghi” lý thuyết Nghĩa thường xuyên đặt câu hỏi xem liệu thực địa có khớp với lý thuyết không? Đâu khái niệm mới? Khái niệm có giúp ích cho việc phát triển tư tưởng mới, lý thuyết không? Từ suy nghĩ tới vấn đề nảy sinh từ liệu 4.1.2 Các loại liệu định tính (Saunder, p532-533) Dữ liệu định tính tìm thấy nhiều dạng thức Song bản, chia làm hai loại liệu định tính văn liệu định tính phi văn a Dữ liệu định tính văn Dữ liệu định tính sơ cấp văn bao gồm: hồ sơ, báo cáo, email, báo chí tổ chức, mẩu chuyện văn bản, hồi kí, tự chuyện phương pháp sử dụng bảng hỏi để thu thập liệu, hồi đáp từ câu hỏi mở dạng liệu định tính văn b Dữ liệu định tính phi văn Bên cạnh liệu định tính văn cịn có liệu định tính phi văn Dạng thức liệu tồn dạng ghi hình, ghi âm Ví dụ, nhà nghiên cứu sử dụng phương pháp vấn, thảo luận nhóm, quan sát (bao gồm có cấu trúc bán cấu trúc, có tham gia ) liệu thu video, đoạn ghi âm, liệu sử dụng làm nguyên liệu để phân tích 4.1.3 Quy trình phân tích liệu định tính (Saunder p547-566)/marshall (341-348) 4.1.3.1 Tổ chức liệu làm liệu Khi bắt đầu phân tích, điều quan trọng nhà nghiên cứu nên dành thời gian để tổ chức liệu Nhà nghiên cứu liệt kê thẻ ghi nhớ liệu thu thập được, thể chỉnh sửa nhỏ cân thiết đảm bảo ghi chép trường tái cách trung thực Yêu cầu việc tổ chức liệu phải thể trung thực khách quan chất liệu Dữ liệu định tính có đặc điểm riêng biệt, ngồi nội dung truyền tải bao gồm hành vi, thái độ, cảm xúc đối tượng quan sát hay nghiên cứu Do đó, tổ chức liệu phải ý không làm sai lệch bối cảnh thu thập liệu lúc đó, đặc biệt cần ghi lại chi tiết hành vi, thái độ, cảm xúc đối tượng nghiên cứu để nhà nghiên cứu cần xem lại hồi cố lại bối cảnh lúc Trong trình tổ chức liệu, lỗi biên soạn cần chỉnh sửa Quá trình gọi làm liệu Sau thực điều này, nhà nghiên cứu cần gửi ghi chép đến người tham dự để kiểm tra lần cuối để đảm bảo tính trung thực liệu đơi người tham dự muốn sửa lại chí ngữ pháp cách dùng ngơn ngữ riêng họ Do đó, nhà nghiên cứu cần thận trọng văn gửi lại người tham dự để kiểm tra 4.1.3.2 Mã hoá hợp liệu Hoạt động phân loại liệu thành “loại” có ý nghĩa Có thể xuất phát từ liệu từ mơ hình (khn khổ - framework) lý thuyết để đưa khái niệm từ kiểm định thực tế Những “loại” mã nhãn dùng để ghép liệu lại Quá trình phân loại liệu gọi trình mã hóa liệu Việc xác định mã liệu hướng dẫn mục đích nghiên cứu thể qua câu hỏi nghiên cứu mục tiêu nghiên cứu Ví dụ, nhà nghiên cứu khác với mục tiêu khác tạo mã liệu khác tập liệu (Dey, 1993) Điều khơng có nghĩa nhà nghiên cứu người sai mà đơn giản họ diễn giải liệu theo hướng khác Có cách để đặt tên nhãn (Straussn & Corbin; 1998): - Sử dụng thuật ngữ phát sinh từ liệu - Sử dụng thuật ngữ thực tế sử dụng người tham gia - Sử dụng thuật ngữ lý thuyết mơ hình nghiên cứu Một mã hóa tốt cần đáp ứng tiêu chí sau: (1) có mã hiệu; (2) thật đọng, để chúng mang lại cấu trúc phân tích tốt; (3) liên quan đến chủ đề nghiên cứu; (4) miêu tả thuộc tính đặc trưng chủ đề; (5) có liên kết với liệu khác (Kawulich, 2004) Khơng có quy trình mã hóa chuẩn mực, nghiên cứu định tính phụ thuộc phần lớn vào nhạy cảm sáng tạo, khả tổng hợp đúc rút vấn đề nhà nghiên cứu Tuy nhiên, phần trình bày quy trình mã hóa đơn giản giúp nhà nghiên cứu phát triển lên thành quy trình riêng cho Bước 1: Tổng hợp file liệu vào file word Thông thường liệu nghiên cứu định tính nhiều dạng thức: video, ghi âm, email, báo chí, báo cáo, hồ sơ, vấn, biên thảo luận nhóm… Dữ liệu thơ sau phải biên soạn lại ghi chép, ghi chú, dạng văn Bước 2: Xác định chủ đề nói tới liệu - Đọc lại lần toàn liệu - Đọc lại lần nữa, đọc đoạn gán cho đoạn liệu từ khóa - Liệt kê danh mục từ khóa chuẩn lại danh mục cho keyword không gần giống - Tạo khái niệm, mã sau đối chiếu danh mục từ khóa với khung lý thuyết để nhận khái niệm ý tưởng Sau mã hóa liệu thành mã với cấp độ với thuộc tính tương ứng Hoạt động hợp liệu tức gắn đơn vị liệu với nhãn/ mã tạo Một đơn vị liệu số từ, câu, vài câu, đoạn văn phù hợp với mã liệu Có nhiều cơng cụ hỗ trợ nhà nghiên cứu mã hóa hợp liệu Nvivo, Hyper reseache, Alitas….hoặc sử dụng phương pháp thủ cơng Nếu sử dụng phương pháp thủ công, bên lề ghi vấn, nhà nghiên cứu đặt tên đơn vị liệu thuộc hay nhiều mã thích hợp Tên đơn vị liệu cắt, dán vào thẻ liệu chuyển đổi lưu lại file Kết liệu hình thành hệ thống mã theo cấp độ Ví dụ khái niệm A cấp độ thuộc tính 1; khái niệm A lại có khái niệm A1; A2; A3 với cấp độ thuộc tính khác nhau… Hợp 3.1: Đoạn trích vấn gắn với loại liệu Dự án nghiên cứu Adrian liên quan đến cách thức nhà quản trị nguồn nhân lực quản lý trình cắt giảm biên chế quan, tổ chức họ Trước hết nhà nghiên cứu tạo loại liệu ban đầu từ lý thuyết quản trị nhân lực sau gắn chúng vào đơn vị ghi chép Các loại liệu ban đầu phân cấp theo thứ bậc, mã mà nhà nghiên cứu sử dụng ghi ngoặc Những mã gắn vào ghi cuộc vấn làm đơn vị liệu RED-CONS 27MM Giai đoạn để phát nhân viên muốn cho thân cách họ muốn điều RED-MGTROLE Một nhân viên thích nói chuyện với người bên nhân nói chuyện với quản lý trực tiếp – bạn biết đó, lý hiển nhiên, theo họ thấy- điều chấp nhận tổ chức RED-MGT-VOL Cuộc họp cho họ hội để lựa chọn cắt giảm tự nguyện Chúng khơng phân loại nhân viên thành người nịng cốt RED-STR-ISS hay khơng nịng cốt, chúng tơi phải nói với nhóm nhân viên RED-CONS lời “có bốn người phận chúng tơi cần có hai người thơi” Nguồn: Saunders, N.K & Philip Lewis (2015) 4.1.3.3 Nhận biết mối quan hệ phát triển mã liệu Tạo loại liệu xếp lại liệu theo mã thiết kế ma trận thích hợp đưa liệu vào ô ma trận hoạt động cụ thể phân tích liệu (Dey, 1993; Huberman, 1994) Việc phân tích tiếp diễn nhà nghiên cứu tìm kiếm chủ đề, dạng thức mối quan hệ then chốt liệu xếp lại Hoạt động dẫn đến việc điều chỉnh lại mã liệu tiếp tục xếp lại liệu nhà nghiên cứu tìm thấy ý nghĩa khái niệm tập liệu Có nhiều lý dẫn đến việc chia tách hay sáp nhập loại liệu ban đầu Chẳng hạn số loại liệu thu hút số lượng lớn đơn vị liệu q rộng để phân tích khơng chia nhỏ Hoặc có chủng loại liệu có ý nghĩa tương đồng, nhà nghiên cứu gộp chúng lại với Như việc xác định mối quan hệ mã liệu vô quan trọng Nhà nghiên cứu vẽ sơ đồ, mơ hình mơ tương tác, quan hệ nhiều chiều hay chiều mã liệu Từ đó, nhà nghiên cứu phát mã liệu so với khung nghiên cứu giúp cho việc phát triển ý tưởng mới, khái niệm Trong hoạt động này, nhà nghiên cứu thường xuyên đặt câu hỏi mối quan hệ khái niệm gì? Sự phát triển mối quan hệ mã liệu nào? Đây bước khó nghiên cứu định tính cần nhạy cảm, trí tuệ kinh nghiệm nhà nghiên cứu Hộp 3.2: Phân bố liệu phát triển loại liệu “Sau vấn, ghi chép lại nguyên văn nội dung vấn, lưu theo cách phân loại sử dụng Nội dung thường dạng đoạn văn phân loại chéo thành số loại khác Khi tơi lưu phát biểu, tơi so sánh với phát biểu trước loại ghi chép thường xuyên nội dung loại Các loại thay đổi theo thời gian, số loại biến sáp nhập vào tiêu đề khái quát Mỗi loại lên từ loại trước trở thành dị biệt Một số loại trở thành phần cặp đôi ba nhận xét thường lưu file phân loại thành phần Ví dụ nhận xét nhằm mô tả trường hợp công việc khơng ổn định trình độ tay nghề yếu thường lưu ý việc quản trị tồi.” Nguồn: Hodson (1991) trích Erlandson et al (1993) 4.1.3.4 Phát triển kiểm định lý thuyết Không phải nghiên cứu định tính đạt tới bước này, song nghiên cứu định tính tốt nên vươn tới bước Bản chất bước tìm mối quan hệ nhân tố, khái niệm với với yếu tố cũ Mối quan hệ thể dạng mơ hình (ví dụ A có quan hệ thuận chiều với B) Để làm việc này, nhà nghiên cứu quay lại file liệu để tìm kiếm so sánh xem liệu liệu có tồn mối quan hệ có A có B ngược lại tồn B phải có A hay khơng Cách làm sau: - Tạo file excel để nhập liệu Cột ghi rõ ID vấn Ví dụ PV1 Các cột ghi rõ đặc điểm người vấn để sau tiện so sánh - Các đoạn vấn có nội dung đưa vào ô excel - Cột mã ghi nhân tố khái niệm phát bước Có thể ghi nhiều cột có nhiều mã khác - Sort liệu theo mã, so sánh liệu xuất nhân tố A có kèm theo xuất nhân tố B hay khơng Quy trình lặp lặp lại, hỗ trợ tốt cho việc xây dựng mơ hình giả thuyết mối quan hệ khái niệm, nhân tố Kết luận lại, phân tích liệu định tính q trình địi hỏi sáng tạo, am hiểu trình độ kỹ thuật nhà nghiên cứu Mỗi nghiên cứu định tính mang dấu ấn cá nhân sâu sắc nhà nghiên cứu 4.1.4 Các cơng cụ hỗ trợ phân tích liệu định tính Ngày nay, nhà nghiên cứu khẳng định vai trò việc sử dụng CAQDAS nghiên cứu định tính việc sử dụng loại phần mềm chưa thực phổ biến tất trường đại học Lewins Silver (2005) tóm tắt ưu việt CAQDAS phân tích liệu định tính sau: - Quản lý dự án tổ chức liệu: biện pháp mạnh mẽ để quản lý toàn dự án nghiên cứu tổ chức liệu - Tính chặt chẽ liệu tương tác: tiếp cận với liệu đưa vào hệ thống - Khám phá liệu: cơng cụ tìm kiếm văn truy xuất từ linh hoạt khoa học - Mã hóa truy xuất: hoàn toàn tự việc sử dụng phương pháp diễn dịch hay quy nạp kết hợp - Tìm kiếm thẩm định: sở ngôn ngữ sử dụng, bao gồm liệu mã hóa tự động, quan hệ loại mã, giúp cho việc xây dựng phát triển giả thuyết - Viết ghi nhớ: để ghi chép ý tưởng cách có hệ thống liên quan với liệu - Đầu : báo cáo cho phép xem lại tài liệu dạng in kết nối tốt với chương trình ứng dụng khác Bảng 3.1: Các địa internet chương trình thuộc CAQDAS Tên Địa Internet Nhận xét chung ATLAS.Ti http://www.atlasti.de Chỉ có phiên windows, linh hoạt HyperRESEARCHE http://www.researchware.com Có phiên windows Mac, sử dụng đơn giản Nvivo http://www.qsrinternational.com Chỉ có phiên windows, phần mềm mạnh khả tìm kiếm phạm vi rộng QSR N6 http://www.qsrinternational.com Chỉ có phiên windows, nhiều cơng cụ tìm kiếm xuất sắc Nguồn: Lewins and Silver (2005) 4.2 PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG 4.2.1 Các loại liệu định lượng (THU) Trong nghiên cứu định lượng, sau bước thu thập liệu nhiều phương pháp khác (như đề cập chương 3), bước phân loại liệu a Phân loại liệu định lượng (CIRT, n.d.) https://cirt.gcu.edu/research/developmentresources/research_ready/quantresearch/data Dữ liệu định lượng liệu đếm thể số Nó thường sử dụng để hỏi "bao nhiêu” sử dụng để nghiên cứu kiện mức độ xuất Nó cho phép phân tích thống kê tính tốn tốn học, thường minh hoạ biểu đồ đồ thị Có hai loại liệu định lượng chính: rời rạc liên tục Dữ liệu rời rạc mơ tả có số hữu hạn giá trị Ví dụ: giáo viên đưa kiểm tra có 10 câu hỏi, điểm thi phản ánh số câu trả lời 10 câu hỏi Dữ liệu rời rạc định nghĩa liệu có khoảng trống giá trị dòng số, giá trị phải số nguyên Ví dụ, nghiên cứu kiểm tra số lượng xe máy hộ gia đình Việt Nam, liệu thu thập số nguyên Dữ liệu liên tục định nghĩa liệu có giá trị rơi vào liên tục phân số số thập phân Dữ liệu liên tục thường phép đo vật lý Ví dụ bao gồm phép đo chiều cao, độ tuổi khoảng cách Ưu điểm việc thu thập liệu định lượng kết số liệu phân tích thống kê, xem kết đáng tin cậy hữu ích việc định Tuy nhiên, bất lợi liệu định lượng mang tính bề mặt, khơng cung cấp cách giải vấn đề b Đặc điểm liệu định lượng (USClibraries, 2018) http://libguides.usc.edu/writingguide/quantitative • Dữ liệu thường thu thập công cụ nghiên cứu có cấu trúc • Các kết dựa kích thước mẫu lớn • Tiến hành nghiên cứu lặp lặp lại để nâng cao độ tin cậy • Nhà nghiên cứu cần đưa câu hỏi nghiên cứu xác định rõ ràng để tìm câu trả lời khách quan • Tất khía cạnh nghiên cứu thiết kế cẩn thận trước liệu thu thập • Dữ liệu thể dạng số số liệu thống kê, thường xếp theo bảng, biểu đồ, số liệu dạng khác văn • Nhà nghiên cứu sử dụng công cụ, chẳng hạn bảng câu hỏi phần mềm máy tính, để thu thập liệu số • Mục tiêu tổng quát nghiên cứu định lượng phân loại tính năng, đếm xây dựng mơ hình thống kê nhằm giải thích quan sát thấy 4.2.2 Quy trình phân tích liệu định lượng (NGHĨA) Phân tích liệu kỹ thuật giúp ta hiểu liệu a Chuẩn bị liệu Sau thu thập liệu cần trình bày theo cách thức phù hợp với phần mềm (ứng dụng) xử lý số liệu mà ta sử dụng • Mã hóa liệu Mã hóa liệu trình chuyển đổi kết khảo sát thành dạng mã số để chuẩn bị cho trình xử lý Việc mã hóa thực trước (precoding) sau trình vấn (postcoding) Đối với câu hỏi mở thường phải mã hóa lần: tạo mã vấn thơng qua dự đốn trước câu trả lời xuất điều chỉnh mã có sai lệch sau vấn (Thọ 273) Mã hóa giúp việc phân tích trở nên đơn giản hơn, đặc biệt hiệu với hỗ trợ phần mềm thống kê Sau mã hóa ta thực việc ghép nhóm, tổ hợp, phân tích thống kê tạo biến - Mã hóa liệu định lượng - Mã hóa liệu phân loại • Ma trận liệu Nếu liệu xếp theo dạng bảng ta có ma trận liệu (data matrix) Trong ma trận liệu cột ứng với giá trị biến số Mỗi hàng chứa tất biến số cho tình huống, đơn vị thu thập liệu Số hàng ma trận kích thước mẫu ta thu thập Như phần tử ma trận liệu xác định hai thông số, thông số cột biến số, thông số hàng giá trị Ví dụ: Ma trận liệu nhân cơng ty ST T Tuổi Giới tính Thâm niên 25 2 30 3 28 1 42 • Làm liệu 10 Dữ liệu trước xử lý cần làm (data cleaning) Làm có nghĩa tìm xử lý sai sót có liệu, trống câu trả lời không hợp lý - Các ô trống ô ma trận không chứa liệu Các trống hình thành ngun nhân: sai sót q trình thu thập liệu sai sót nhập liệu - Câu trả lời không hợp lý nghĩa xuất câu trả lời khơng nằm thang đo thiết kế • Nhập liệu Sau thực bước ta có nhập liệu vào phần mềm thống kê Các phần mềm giúp ta kiểm tra sai sót liệu đặt tên hay gán nhãn cho biến điều giúp thuận tiện cho việc xử lý b Phân tích liệu Khi hồn thành q trình nhập liệu tùy thuộc vào mục đích nghiên cứu ta thực xử lý số liệu khác từ đơn giản (như tính giá trị thống kê) đến phức tạp (như phân tích tương quan) • Trình bày biến số - Thể giá trị cụ thể Cách đơn giản để mơ tả liệu thu thập lập bảng phân phối tần số (hoặc tần suất) Kỹ thuật hình dung tốt sử dụng linh hoạt dạng biểu đồ, qua giúp ta thể được: - Các giá trị min, max Đối với việc mô tả giá trị mẫu ta sử dụng đồ thị dạng cột (đối với số liệu rời rạc) biểu đồ tần số (đối với liệu liên tục) Ví dụ: 11 Ngồi ta cịn sử dụng biểu đồ hình ảnh - Thể xu hướng Đặc tính miêu tả liệu định lượng theo thời gian Loại biểu đồ thích hợp biểu đồ dạng đường (line graph) Ngoài ta cịn sử dụng biểu đồ tần số để thể xu khoảng thời gian rời rạc Ví dụ: - Thể tỉ lệ Để thể yếu tố xuất liệu loại biểu đồ thường dùng biểu đồ dạng quạt (pie chart) dạng cột Biểu đồ chia dựa vào phần trăm biến chiếm tổng giá trị Tuy nhiên cần lưu ý thường biểu đồ khó thể có phần, ta cần ghép liệu trước vẽ Ví dụ: 12 - Thể phân bố Nếu cần xác định phân bố giá trị biến định lượng ta vẽ đồ thị đa giác tần số biểu đồ tần số liệu liên tục biểu đồ đa giác tần số biểu đồ cột liệu rời rạc • So sánh biến - Các giá trị cụ thể phụ thuộc Cách tốt để xác định giá trị biến lập bảng Khi có nhiều biến ta có bảng liệu chéo từ giúp phụ thuộc có biến - So sánh giá trị min, max Phương pháp tốt sử dụng biểu đồ nhiểu cột, liệu liên tục hay liệu chứa nhiều giá trị ta cần ghép nhóm trước vẽ đồ thị - So sánh tỉ lệ - So sánh xu hướng - So sánh phân bố giá trị - Quan hệ phần tử biến • Mơ tả liệu thống kê 13 Thống kê mô tả (descriptive statistics) giúp mô tả, so sánh biến số liệu (Saunders 489) Thống kê mô tả biến số tập trung thể hai yếu tố: vị trí độ phân tán Yếu tố vị trí giá trị biến số thể thông qua giá trị đặc trưng, bao gồm: - Kỳ vọng toán hay giá trị trung bình: Là giá trị phản ánh xu hướng nhận giá trị xoay quanh mộ biến số Giá trị trung bình tảng nhiều khái niệm thống kê khác Tuy nhiên giá trị nghiên hướng giá trị liệu phía dài, cần hình dung với giá trị trung vị - Mode: Là giá trị có số lần xuất nhiều liệu Có thể có nhiều Mode Ví dụ: Điểm số Tần số 12 10 14 20 15 Khi Mode = - Số trung vị (median): hay giá trị Ta tính trung vị cách xếp liệu theo trật tự tăng dần tìm giá trị Đối với trường hợp có số chẵn liệu trung vị tính cách xác định điểm số liệu Yếu tố phân tán liệu Yếu tố phân tán liệu thể phân bố giá trị quanh giá trị trung bình Điều mơ tả thơng qua thông số: Tứ phân vị phương sai - Tứ phân vị Nếu < p < 1, phân vị mẫu mức (100p) có xấp xỉ np quan sát mẫu nhỏ n(1-p) quan sát mẫu lớn nó.Một vài phân vị mẫu đặc biệt đặt tên sau Tứ phân vị đại lượng mô tả phân tán giá trị liệu Có ba giá trị tứ phân vị thứ nhất, thứ nhì, thứ ba Ba giá trị chia tập hợp liệu (đã xếp liệu theo trật từ từ bé đến lớn) thành phần có số lượng quan sát Khoảng cách điểm tứ phân vị tới điểm tứ phân vị gọi khoảng tứ phân vị (nó cho biết ¼ giá trị quan sát) 14 Ngồi ta chia liệu thành điểm bách phân (percentiles), ta chia liệu thành 100 phần Khi tứ phân vị thứ bách phân vị thứ 25, trung vị bách phân vị thứ 50 tứ phân thứ bách phân vị thứ 75 Ví dụ: Giả sử ta có mẫu với kích thước n Ta xác định tứ phân vị theo cách sau - Sắp xếp giá trị theo chiều tăng dần x1 ≤ x2 ≤ … ≤ xn - Nếu (n+1)p số nguyên phân vị mức (100p) giá trị thứ (n+1)p thống kê thứ tự - Nếu (n+1)p số nguyên, tách thành phân nguyên r cộng với phân số a/b , ta tính trung bình có trọng số giá trị thứ r (r+1) thống kê thứ tự Điều có nghĩa phân vị mẫu mức (100p)th xác định công thức: - - Phương sai Phương sai giá trị phản ánh độ phân tán liệu quanh giá trị trung bình Căn bậc hai phương sai gọi độ lệch chuẩn hàm ý cho ta biết giá trị biến thường giá trị trung bình bao xa Điều có nghĩa độ lệch chuẩn lớn giá trị có xu hướng xa giá trị trung bình Nếu độ lệch chuẩn nhỏ các giá trị gần giá trị trung bình giá trị trung bình có nghĩa Trong trường hợp cần so sánh độ phân tán tương đối liệu biến có đơn vị đo khác (…) ta cần tính giá trị hệ số biến thiên (coeficient of variation) cách chia độ lệch chuẩn cho giá trị trung bình nhân với 100 Khái niệm có hạn chế tình giá trị trung bình gần thay đổi nhỏ giá trị trung bình làm cho hệ số biến thiên thay đổi lớn Một quy tắc dựa thực nghiệm (rule of thumb) áp dụng đánh giá mức độ biến động riêng tập liệu hệ số biến thiên nhỏ 100 tập dao động nhỏ, lớn 100 tập dao động lớn • Xem xét quan hệ thống kê Một nhiệm vụ quan trọng phân tích thống kê tìm hiểu mối liên hệ biến Tuy nhiên ta biết liệu mẫu ta cần rút kết luận thông qua việc kiểm định giả thuyết (significant of hypothesis testing) hay gọi kiểm định mức ý nghĩa thống kê Bản chất kiểm định so sánh liệu mẫu với giả thuyết đặt Kiểm định gắn liền với mức ý nghĩa α (mặc định α = 5%) 15 Kiểm định giả thuyết thống kê chia thành : kiểm định tham số kiểm định phi tham số Kiểm định phi tham số dùng liệu phân bố chuẩn ngược lại Đối với thơng kê tham số ta cần có giả thiết sau: - Các phần tử liệu độc lập - Dữ liệu phải lẫy từ đám đơng có phân bố chuẩn - Các đám đơng chọn có phương sai - Dữ liệu phải định lượng a Các loại sai lầm kiểm định b Kiểm định mối liên hệ c Kiểm định khác biệt có nhóm liệu d Đánh giá mức độ phụ thuộc e Dự báo f Đánh giá xu hướng 4.2.3 Các công cụ hỗ trợ phân tích liệu định lượng (THÀNH) Có nhiều cơng cụ, phần mềm phục vụ phân tích liệu Đối với liệu định lượng có số công cụ phổ biến dùng để xử lý liệu Excel, SPSS, Eviews, Stata hay R,…Trong phạm vi giảng nhóm tác giả tập trung vào giới thiệu chức công cụ (excel SPSS) phân tích liệu định lượng a Excel Bảng tính Excel phần mềm tập đoàn Microsoft, phần mềm phổ biến nghiên cứu khoa học Excel có nhiều tính năng, phạm vi giảng tập trung vào chức dùng thu thập phân tích liệu Dùng Excel để nhập liệu Do Excel thiết kế dạng dòng cột dễ dàng nhập liệu sơ cấp vào bảng tính này, khơng gian lưu trữ excel có giới hạn với số lượng lớn phù hợp với dự án nghiên cứu vừa nhỏ Đặc biệt sau 16 nhập liệu phát sửa chữa nhanh Excel với việc sử dụng lệnh Auto Filter vẽ biểu đồ nhanh Excel Dùng Excel để phân tích liệu Trong Excel có tiện ích Data analysis dùng để phân tích liệu Cách sử dụng: File/option/Add-ins/Manage: excel Add-ins/go/ Tại hội thoại Add-ín đánh dấu vào lựa chọn Analysis ToolPak, analysis Toolpak-VBA/OK Trong tiện ích Data analysis có nhiều tính phân tích, xin giới thiệu số tính sau: - Phân tích thống kê mơ tả, vẽ biểu đồ - Phân tích phương sai, Phân tích tương quan, hồi qui tuyến tính - Kiểm định trung bình tổng thể b SPSS SPSS viết tắt statistics package for social science, gói phần mềm thống kế cho khoa học xã hội hãng IBM SPSS phần mềm thống kê sử dụng phổ biến rộng rãi giới phần mềm mã nguồn mở phát triển SPSS có nhiều tính phân tích liệu Trong khn khổ giảng tập trung vào số chức phần mềm sau: - Phân tích thống kê mơ tả - Phân tích nhân tố ảnh hưởng - Phân tích độ tin cậy thang đo nghiên cứu - Phân tích tương quan, hồi quy tuyến tính - Phân tích hồi qui logistics - Kiểm định mối liên hệ biến số - Phân tích cụm c Một số công cụ khác 17 Bên cạnh công cụ phổ biến đề cập có nhiều cơng cụ khác hỗ trợ Epidata (dùng để nhập liệu), Eviews, Stata hay R - Epidata công cụ phát triển tài trợ WHO, dùng mạnh đặc biệt lĩnh vực y – xã hội học - Eviews: phần mềm kinh tế lượng tiếng mạnh phân tích hồi quy, phân tích số liệu thời gian (time series) dự báo - Stata phần mềm mạnh phân tích liệu mảng (panel data) - R phần mềm mã nguồn mở, tương lai thống kê đại, có đầy đủ tính năng, cơng dụng phân tích liệu hay hoàn toàn miễn phí (free) phần mềm phần mềm thương mại (phải có licence) với chi phí quyền cao 18 References – Thu References CIRT, n.d cirt.gcu.edu [Online] Available at: https://cirt.gcu.edu/research/developmentresources/research_ready/quantresearch/data Martz, E., 2017 Understanding Qualitative, Quantitative, Attribute, Discrete, and Continuous Available Data at: Types [Online] http://blog.minitab.com/blog/understanding-statistics/understanding- qualitative-quantitative-attribute-discrete-and-continuous-data-types Thọ, N Đ., 2013 Phương pháp nghiên cứu khoa học kinh doanh Hồ Chí Minh: NXB Tài Chính USClibraries, 2018 Available at: http://libguides.usc.edu [Online] http://libguides.usc.edu/writingguide/quantitative [Accessed 10 2018] 19 ... 4.2 PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG 4.2.1 Các loại liệu định lượng (THU) Trong nghiên cứu định lượng, sau bước thu thập liệu nhiều phương pháp khác (như đề cập chương 3), bước phân loại liệu a Phân. .. loại liệu gọi q trình mã hóa liệu Việc xác định mã liệu hướng dẫn mục đích nghiên cứu thể qua câu hỏi nghiên cứu mục tiêu nghiên cứu Ví dụ, nhà nghiên cứu khác với mục tiêu khác tạo mã liệu khác... tảng Và tri thức phát qua nghiên cứu - Nhà nghiên cứu cần có kỹ nghiên cứu tốt, nắm vững loại nghiên cứu kỹ thuật triển khai phương pháp nghiên cứu Ngoài ra, nhà nghiên cứu nên có cảm quan “hồi