Phương pháp phân tích dữ liệu thứ cấp

Một phần của tài liệu (LUẬN văn THẠC sĩ) những yếu tố ảnh hưởng đến kết quả khoa học của học sinh việt nam nghiên cứu từ dữ liệu học sinh trong chương trình đánh giá học sinh quốc tế (PISA) chu kỳ 2015 (Trang 40 - 42)

CHƯƠNG 2 PHƯƠNG PHÁP VÀ TỔ CHỨC NGHIÊN CỨU

2.1. Phương pháp phân tích dữ liệu thứ cấp

Nghiên cứu dữ liệu thứ cấp đang ngày càng được sử dụng rộng rãi trong các lĩnh vực như giáo dục, đánh giá, thị trường, khoa học hành vi (McArt & McDougal, 1985). Rà sốt tám tạp chí về giáo dục và xã hội học trong khoảng 7 năm có khoảng một phần tư các bài báo sử dụng phương pháp định lượng và trong số đó 41% sử dụng phân tích dữ liệu thứ cấp. Tương tự, các bài báo trong lĩnh vực giáo dục có sử dụng dữ liệu thứ cấp là khoảng 42% (Smith, 2008).

Có nhiều định nghĩa khác nhau về dữ liệu thứ cấp. Nhưng hầu hết các định nghĩa đều có cách hiểu chung là: Phân tích dữ liệu thứ cấp (secondary data analysis) là phân tích dữ liệu được thu thập bởi người khác. Dưới đây, chúng tôi sẽ xem xét lại định nghĩa của dữ liệu thứ cấp, làm thế nào nó có thể được sử dụng bởi các nhà nghiên cứu và những ưu và nhược điểm của loại nghiên cứu này. Dữ liệu chính đề cập đến dữ liệu mà các nhà nghiên cứu đã tự thu thập, trong khi dữ liệu thứ cấp đề cập đến dữ liệu được thu thập bởi người khác. Dữ liệu thứ cấp có sẵn từ nhiều nguồn khác nhau, chẳng hạn như chính phủ và các tổ chức nghiên cứu.

2.1.1. Ưu điểm của phân tích dữ liệu thứ cấp

Một trong những ưu điểm đáng chú ý nhất của việc sử dụng phân tích dữ liệu thứ cấp là hiệu quả chi phí. Bởi vì đây là dữ liệu đã được thu thập, nhà nghiên cứu không cần đầu tư bất kỳ khoản tiền, thời gian hoặc công sức nào vào các giai đoạn thu thập dữ liệu trong nghiên cứu của mình.

Ngoài ra, dữ liệu từ bộ dữ liệu thứ cấp thường được làm sạch và lưu trữ ở định dạng điện tử, vì vậy nhà nghiên cứu có thể bắt tay vào phân tích dữ liệu thay vì mất thời gian chuẩn bị dữ liệu để phân tích.

Một lợi ích khác của việc phân tích dữ liệu thứ cấp là thay vì thu thập và phân tích dữ liệu sơ cấp là khối lượng và độ rộng của dữ liệu được cơng khai. Ví dụ, tận dụng những phát hiện từ các nghiên cứu mà chính phủ đã tiến hành cung cấp cho các nhà nghiên cứu quyền truy cập vào một khối lượng dữ liệu mà nhà nghiên

liệu cơng khai của chính phủ để thực hiện phân tích dữ liệu thứ cấp, nhà nghiên cứu đã tránh được nhiều năm lao động.

2.1.2. Nhược điểm của phân tích dữ liệu thứ cấp

Nhược điểm lớn nhất của việc thực hiện phân tích một bộ dữ liệu thứ cấp là tập dữ liệu có thể khơng trả lời được câu hỏi nghiên cứu cụ thể của nhà nghiên cứu ở mức độ mà nhà nghiên cứu sẽ hy vọng. Nếu một nhà nghiên cứu bắt đầu thực hiện một nghiên cứu với một câu hỏi rất đặc biệt, một bộ dữ liệu thứ cấp có thể khơng chứa thơng tin cụ thể chính xác cho phép nhà nghiên cứu trả lời câu hỏi của mình. Tương tự, khi một nhà nghiên cứu có một câu hỏi hoặc đặt mục tiêu cụ thể, đôi khi rất khó xác định dữ liệu thứ cấp có giá trị sử dụng, vì dữ liệu có thể khơng được thu thập trong khung thời gian mà nhà nghiên cứu hy vọng, hoặc mức độ chính xác về khu vực địa lý, .v.v.

Một nhược điểm khác là cho dù nhà nghiên cứu làm gì để kiểm tra bộ dữ liệu thứ cấp, họ sẽ khơng bao giờ có thể biết chính xác dữ liệu được thu thập như thế nào và q trình đó được thực hiện tốt như thế nào. Khơng phải là người thực hiện các cuộc khảo sát và phân phối chúng cho các quần thể thích hợp, khơng thể biết mức độ mà các nhà nghiên cứu thu thập dữ liệu đã đi để đảm bảo tính hợp lệ hoặc chất lượng hoặc nếu họ gặp phải các vấn đề như tỷ lệ phản hồi hoặc phản hồi thấp hiểu lầm những gì một câu hỏi đã thực sự hỏi. Nói một cách đơn giản, vì nhà nghiên cứu tiến hành nghiên cứu không thu thập dữ liệu mà họ sẽ sử dụng, nhà nghiên cứu khơng kiểm sốt được bộ dữ liệu thứ cấp của họ chứa gì.

Như vậy, phân tích dữ liệu thứ cấp là một cơng cụ thuận tiện và mạnh mẽ cho các nhà nghiên cứu muốn đặt câu hỏi rộng ở quy mô lớn. Mặc dù nó có những lợi ích của nó, chẳng hạn như hiệu quả chi phí và độ rộng và độ sâu của dữ liệu mà nó cung cấp quyền truy cập, phân tích dữ liệu thứ cấp cũng có thể buộc các nhà nghiên cứu thay đổi câu hỏi ban đầu của họ hoặc làm việc với một bộ dữ liệu không phù hợp với họ những mục tiêu.

PISA là dữ liệu thứ cấp. Đó là nguồn dữ liệu khổng lồ, đáng tin cậy của một tổ chức có uy tín trên thế giới có lịch sử triển khai đánh giá gần 2 thập kỷ và với

quy mơ lớn nhất thế giới. Vì vậy, việc sử dụng dữ liệu thứ cấp để phân tích PISA có ý nghĩa quan trọng và hữu ích cho nghiên cứu này.

Về cơ sở dữ liệu, để phục vụ cho mục đích nghiên cứu của đề tài, tác giả sử dụng dữ liệu download từ website

http://www.oecd.org/pisa/data/2015database/.

Từ cơ sở dữ liệu này, tác giả đã trích xuất phần dữ liệu của Việt Nam để tiến hành phân tích dữ liệu.

Một phần của tài liệu (LUẬN văn THẠC sĩ) những yếu tố ảnh hưởng đến kết quả khoa học của học sinh việt nam nghiên cứu từ dữ liệu học sinh trong chương trình đánh giá học sinh quốc tế (PISA) chu kỳ 2015 (Trang 40 - 42)

Tải bản đầy đủ (PDF)

(165 trang)