LỜI MỞ ĐẦUTrong nghiên cứu khoa học cũng như trong giải quyết công việc nói chung, phương pháp là yếu tố vô cùng quan trọng. Xác định đúng phương pháp là con đường dẫn tới thành công và cũng là cơ sở, là chuẩn mực để đánh giá một công trình nghiên cứu. Phương pháp, trong đó bao gồm phương pháp luận, hệ phương pháp nghiên cứu, phương pháp tiếp cận, lý thuyết nghiên cứu và kỹ thuật nghiên cứu, có thể nói là chìa khóa để mở lối cho công trình khoa học, đồng thời cũng là cơ sở đảm bảo tính chất khoa học của kết quả nghiên cứu. Chính vì vai trò quan trọng của phương pháp như vậy nên trong quá trình học môn: Phương pháp nghiên cứu khoa học, nhóm chúng tôi đã được tiếp cận chuyên đề “Phương pháp phân tích định lượng trong nghiên cứu khoa học”. Thiết nghĩ chuyên đề này sẽ đem lại cho chúng ta những gợi mở bổ ích cho quá trình nghiên cứu khoa học sau này, mà trước mắt là luận văn cao học.Trong thời đại ngày nay, khi mà chúng ta có thể tiếp cận thông tin, số liệu từ nhiều nguồn khác nhau: Từ sách vở, báo chí, từ mạng Internet, thì việc thu thập và xử lí số liệu như thế nào sẽ có vai trò rất quan trọng. Vì vậy, khi chúng ta tiếp cận và hiểu được phương pháp phân tích định lượng rồi thì sẽ không còn lúng túng, căng thẳng khi đứng trước một “mớ hỗn độn” những tài liệu từ nhiều nguồn thông tin khác nhau và tập hợp tài liệu đó làm nổi bật lên bản chất của vấn đề cần nghiên cứu. Một công trình nghiên cứu khoa học sẽ có sức thuyết phục hơn khi được dẫn chứng bằng những con số, số lượng cụ thể. Sự vật, hiện tượng bao giờ cũng biểu hiện bản chất của nó qua tính chất và số lượng. Trong đó, số lượng giúp cho nhận thức của chúng ta được chính xác, cụ thể, đồng thời hạn chế đặc tính chủ quan của người nghiên cứu. Tuy nhiên, vấn đề là người nghiên cứu phải biết xử lí những số liệu, những con số thu thập được như thế nào cho chính xác và khoa học. Với vấn đề này, phương pháp phân tích định lượng có nhiều ưu điểm hơn hẳn so với các phương pháp nghiên cứu khác. Với phương pháp phân tích định lượng, chúng ta có thể xử lí các số liệu đám đông; có thể khắc phục tình trạng thiếu hụt số liệu, kiểm chứng các nhận định và có khả năng ứng dụng các công cụ, thiết bị tin học hiện đại và nhu cầu nhận thức của thời đại thông tin. Do tập thể các thành viên trong nhóm là những học viên đang trong quá trình học tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế. Vì vậy, sự sai sót không thể tránh khỏi. Tập thể nhóm rất mong nhận được sự đóng góp ý kiến của các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiện chuyên đề này tốt hơn.Tập thể thành viên nhómCHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁPNGHIÊN CỨU ĐỊNH LƯỢNG1.1 Định nghĩa: Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyết quan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch. Hay nói cách khác nghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụng những công cụ đo lường, tính toán với những con số cụ thể. Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào.1.2 Lý thuyết: Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hình Khoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứng minh được trong thực tế và theo chủ nghĩa khách quan.1.3 Phương pháp thực hiện Nghiên cứu thực nghiệm thông qua các biến. Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữ liệu được thu thập trong cùng một thời điểm.Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn. Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệu được so sánh theo thời gian. Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụ thể. Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay qua nhiều thời điểm.
Trang 1LỜI MỞ ĐẦU
Trong nghiên cứu khoa học cũng như trong giải quyết công việc nói chung,phương pháp là yếu tố vô cùng quan trọng Xác định đúng phương pháp là con đườngdẫn tới thành công và cũng là cơ sở, là chuẩn mực để đánh giá một công trình nghiêncứu Phương pháp, trong đó bao gồm phương pháp luận, hệ phương pháp nghiên cứu,phương pháp tiếp cận, lý thuyết nghiên cứu và kỹ thuật nghiên cứu, có thể nói là chìakhóa để mở lối cho công trình khoa học, đồng thời cũng là cơ sở đảm bảo tính chấtkhoa học của kết quả nghiên cứu Chính vì vai trò quan trọng của phương pháp nhưvậy nên trong quá trình học môn: Phương pháp nghiên cứu khoa học, nhóm chúng tôi
đã được tiếp cận chuyên đề “Phương pháp phân tích định lượng trong nghiên cứukhoa học” Thiết nghĩ chuyên đề này sẽ đem lại cho chúng ta những gợi mở bổ íchcho quá trình nghiên cứu khoa học sau này, mà trước mắt là luận văn cao học
Trong thời đại ngày nay, khi mà chúng ta có thể tiếp cận thông tin, số liệu từnhiều nguồn khác nhau: Từ sách vở, báo chí, từ mạng Internet, thì việc thu thập và xử
lí số liệu như thế nào sẽ có vai trò rất quan trọng Vì vậy, khi chúng ta tiếp cận và hiểuđược phương pháp phân tích định lượng rồi thì sẽ không còn lúng túng, căng thẳngkhi đứng trước một “mớ hỗn độn” những tài liệu từ nhiều nguồn thông tin khác nhau
và tập hợp tài liệu đó làm nổi bật lên bản chất của vấn đề cần nghiên cứu
Một công trình nghiên cứu khoa học sẽ có sức thuyết phục hơn khi được dẫnchứng bằng những con số, số lượng cụ thể Sự vật, hiện tượng bao giờ cũng biểu hiệnbản chất của nó qua tính chất và số lượng Trong đó, số lượng giúp cho nhận thức củachúng ta được chính xác, cụ thể, đồng thời hạn chế đặc tính chủ quan của ngườinghiên cứu Tuy nhiên, vấn đề là người nghiên cứu phải biết xử lí những số liệu,những con số thu thập được như thế nào cho chính xác và khoa học Với vấn đề này,phương pháp phân tích định lượng có nhiều ưu điểm hơn hẳn so với các phương phápnghiên cứu khác Với phương pháp phân tích định lượng, chúng ta có thể xử lí các sốliệu đám đông; có thể khắc phục tình trạng thiếu hụt số liệu, kiểm chứng các nhậnđịnh và có khả năng ứng dụng các công cụ, thiết bị tin học hiện đại và nhu cầu nhậnthức của thời đại thông tin
Do tập thể các thành viên trong nhóm là những học viên đang trong quá trìnhhọc tập, nên khả năng tìm hiểu, nghiên cứu và thu thập thông tin bị hạn chế Vì vậy,
sự sai sót không thể tránh khỏi Tập thể nhóm rất mong nhận được sự đóng góp ý kiếncủa các anh chị trong lớp và đặc biệt là sự hướng dẫn của Thầy để nhóm hoàn thiệnchuyên đề này tốt hơn
Tập thể thành viên nhóm
Trang 2CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP
NGHIÊN CỨU ĐỊNH LƯỢNG1.1 Định nghĩa:
Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyếtquan hệ trong lý thuyết và nghiên cứu theo quan điểm diễn dịch Hay nói cách khácnghiên cứu định lượng là những nghiên cứu thu được các kết quả bằng việc sử dụngnhững công cụ đo lường, tính toán với những con số cụ thể
Nghiên cứu định lượng là đi tìm câu trả lời cho câu hỏi bao nhiêu, mức nào
1.2 Lý thuyết:
Nghiên cứu định lượng chủ yếu là kiểm định lý thuyết, sử dụng mô hìnhKhoa học tự nhiên thực chứng luận, phương pháp nghiên cứu định lượng có thể chứngminh được trong thực tế và theo chủ nghĩa khách quan
1.3 Phương pháp thực hiện
- Nghiên cứu thực nghiệm thông qua các biến
- Nghiên cứu đồng đại chéo có nghĩa là thiết kế nghiên cứu trong đó các dữliệu được thu thập trong cùng một thời điểm
Ví dụ: nghiên cứu việc học của con gái ở thành thị và nông thôn.
Nghiên cứu lịch đại thì dữ liệu thu thập theo thời gian trong đó các dữ liệuđược so sánh theo thời gian
Nghiên cứu trường hợp là thiết kế nghiên cứu tập trung vào một trường hợp cụthể
Nghiên cứu so sánh là thiết kế nghiên cứu trong cùng một thời điểm hay quanhiều thời điểm
Trang 31.5 Cách lập bảng câu hỏi:
- Theo thứ tự
- Câu hỏi đóng: Là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàngphân tích, mã hóa nhưng nó giới hạn sự trả lời Thí dụ, sinh viên các khóa học đượcđưa ra các câu hỏi nhận xét về giáo trình, bài giảng, sách, … và được chỉ định trả lờitheo thang đánh giá 5 mức độ (rất hài lòng: +2; hài lòng: +1; trung bình: 0; không hàilòng: -1; rất không hài lòng: -2) để biết sinh viên thỏa mãn hay không thỏa mãn Đây
là các câu hỏi đóng thể hiện sự mã hóa số liệu
- Câu hỏi mở: Là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệukhó được mã hóa Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khácnhau hơn là ép hoặc định hướng cho người trả lời
- Câu hỏi được soạn sẵn
- Câu hỏi ngắn gọn, xúc tích
- Câu hỏi không gây tranh luận
1.6 Sử dụng các phương pháp toán học để để ứng dụng trong phân tích định lượng.
- Thống kê kế toán: Là một bộ phận của toán học ứng dụng dành cho các
phương pháp xử lý và phân tích số liệu thống kê, mà các ứng dụng chủ yếu của nótrong quản lý là các phương pháp xử lý kiểm tra và dự đoán (dự đoán, điều tra chọnmẫu,…)
- Mô hình toán: Là sự phản ánh những thuộc tính cơ bản nhất định của các đối
tượng nghiên cứu kinh tế, là công cụ quan trọng cho việc trừu tượng hoá một cáchkhoa học các quá trình và hiện tượng kinh tế Khoa học kinh tế từ lâu đã biết sử dụngcác mô hình kinh tế lượng như mô hình hàm sản suất Cobb – Douglas, mô hình cungcầu, giá cả v.v
- Vận trù học: Là khoa học có mục đích nghiên cứu các phương pháp phân tích
nhằm chuẩn bị căn cứ chính xác cho các quyết định, đối tượng của nó là hệ thống, tức
là tập hợp các phần tử và hệ thống có tác động qua lại với nhau nhằm đạt tới một mụctiêu nhất định
Trang 4CHƯƠNG 2: PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG
Chương này trình bày một số phương pháp tiếp cận thường được áp dụng đểphân tích dữ liệu trong nghiên cứu kinh doanh cũng như các nghiên cứu khác Đầutiên chúng tôi giới thiệu các thử nghiệm của những giả thuyết về sự khác nhau Sau đóchúng tôi kiểm tra các biến khác nhau và dự đoán các mối liên hệ Thêm vào đó,chúng tôi còn thảo luận các phương pháp để giảm dữ liệu và rút ra phạm vi cơ bản
2.1 Kiểm tra sự khác nhau.
Câu hỏi bạn đang hỏi là liệu rằng kết quả nghiên cứu khoa học trong kinhdoanh có thể được hỏi bằng cách thống kê hay bằng những phương pháp nghiên cứukhác Ví dụ nếu 81% trong 100 khách hàng hài lòng với cửa hàng A và 71% hài lòngvới cửa hàng B thì cửa hàng A có tốt hơn không?
2.1.1 Những giả thiết về một giá trị trung bình.
Trong nghiên cứu chúng ta thường phải làm những báo cáo về giá trị trungbình Chúng ta phải giải thích độ lệch chuẩn và hệ số Z có nghĩa là gì Khi mà phươngsai mẫu chưa được biết và sai số chuẩn của giá trị trung bình thì cũng chưa được biết.Sai số chuẩn của giá trị trung bình phải được ước tính từ các số liệu mẫu
N
Giả thiết kiểm tra là phân phối t với bậc tự do N-1 và tiến đến phân phối
thường khi số lần quan sát tăng lên
Trang 5Ví dụ: Tại một chuỗi siêu thị cung ứng sản phẩm mới, có ít nhất 100 đơn vị
sản phẩm được bán mỗi tuần Sản phẩm mới được kiểm tra trong 10 sản phẩm ngẫunhiên được lựa chọn với một giới hạn thời gian nhất định Kiểm định một đầu,ví dụkhi hướng tìm giả thuyết là thích hợp khi mà doanh số ở mỗi cửa hàng ít nhất là 100,sản phẩm sẽ được giới thiệu trên quy mô toàn quốc Giả thuyết không (giả thuyết đơn
H0) và giả thuyết thay thế (HA)
H0 : X < 100
HA : X > 100Giả sử mức ý nghĩa α = 0.05, nghĩa là chúng ta bác bỏ giả thiết không (H0), khi
mà xác xuất cho giả thiết không chính xác là 5% Vì vậy mức ý nghĩa cho chúng tathấy rằng xác xuất mà chúng ta chờ đợi để xem xét là một quyết định sai, điều đónghĩa là chấp nhận giả thuyết thay thế (HA) khi thực tế giả thuyết không là đúng
Bằng việc tính toán chúng ta thấy rằng mức trung bình X = 109.4 và độ lệchchuẩn SD =14.90
Chúng ta cũng có thể thấy rằng sai số chuẩn của giá trị trung bình:
SDx = = = 4.55
Chúng ta tìm t bằng cách tính :
07 2 55
4
100 4 109
Ở đây giá trị kiểm tra t được cho sẵn Giá trị kiểm tra t giả sử là biến phân phối
nhưng không tìm ra được giá trị nào thiết thực hơn Khi N trở nên lớn (ví dụ N > 30),
phân phối t tiến gần đến phân phối thường.
Trang 6thiết có thể được quy định (về nguyên tắc cơ bản) Để làm như vậy chúng ta phải đốichiếu với giả thiết.
V
í dụ: Với giả thiết không (H0), sự hài lòng của khách hàng ở cửa hàng A tốthơn ở cửa hàng B thì sẽ không có sự khác biệt giữa cửa hàng A và cửa hàng B Đểlàm điều đó chúng ta cần số liệu về việc thực hiện giữa cửa hàng A và cửa hàng B.Nếu có đủ sự khác biệt để tồn tại chúng ta bác bỏ giả thiết không (H0) và chấp nhậngiả thiết thay thế (HA) Vì vậy, thông qua việc giả định, chúng ta có được những hiểubiết, nghĩa là chúng ta đã kiểm nghiệm giả định hoặc kỳ vọng của chúng ta
2.1.2 Những giả thiết về hai giá trị trung bình
Những người nghiên cứu thường đối mặt với những câu hỏi như: Thị hiếutrong khu vực A khác với thị hiếu trong khu vực B không? Phân khúc khách hàng 1với phân khúc khách hàng 2 không? Có 1 chiến dịch quảng cáo hiệu quả hơn cái kháckhông? Công thức để kiểm tra sự khác biệt giữa các nghiệm là được phân bổ bìnhthường, và do đó những sự khác biệt của chúng cũng tạo ra sự phân bổ bình thường,
cụ thể theo công thức sau :
Z = (X1 – X2) - (µ1 - µ2)
Trong đó:
X1 = Nghiệm 1
X2 = Nghiệm = Sai số của hai nghiệm
µ1 và µ2 là nghiệm kỳ vọng chưa biết
Sai số của hai nghiệm được tính theo công thức sau:
=
Giả định rằng 2 phương sai tổng thể bằng nhau, phương sai tổng thể chung cóthể được tạo ra bằng cách tổng hợp các mẫu Khi phương sai không rõ và sai số chuẩn
của các mẫu phải được ước lượng, sau đó t đại diện cho một số liệu thống kê kiểm tra
phân bổ phù hợp với v = N1 + N2 – 2 bậc tự do
Ví dụ :
Trang 7Một nhà phân phối đang phát triển 1 sản phẩm mới và tự hỏi liệu nhãn hiệu củasản phẩm nên có màu đỏ hay màu xanh dương Những sản phẩm mới với hai nhãnhiệu khác nhau được thử nghiệm trong 10 cửa hàng được lựa chọn ngẫu nhiên Doanhthu trung bình đạt được với nhãn màu đỏ là 403.0 và với màu xanh dương là 390.3.Sai số chuẩn của việc ước lượng cho sự khác biệt giữa các mẫu là 8.15
Giá trị này được chuyển đến bảng t cho v = n1 + n2 -2 = 10 + 10 - 2 = 18 bậc tự
do Kiểm nghiệm là hai phía vì giả thuyết là hai màu sắc phù hợp như nhau Với α =
0.05, và 18 bậc tự do, tới hạn t = 2.101 Điều này có nghĩa giả thuyết không được chấp
nhận Ở ví dụ trên chúng ta thấy rằng ( µ1 - µ2 ) = 0 Vì hai nghiệm kỳ vọng chưa biết
và được giả định là như nhau
NB : Lưu ý rằng trong ví dụ trên hai mẫu được giả định là không liên quan, đó
là được rút ra độc lập với nhau
2.1.3 Các mẫu liên quan
Giả sử chúng ta muốn tìm hiểu xem thu nhập đã tăng lên từ năm ngoái đếnnay trên cơ sở dữ liệu thu nhập của năm ngoái và thu nhập của năm nay trong mộtmẫu sau:
Người Thu nhập
năm trước
Thu nhậpnăm nay Chênh lệch
Trang 8Điều này thường được gọi là vấn đề hai mẫu với sự quan sát theo cặp Chúngtheo cặp bởi vì sự quan sát xảy ra trong một cặp thu nhập năm trước và năm nay củamỗi cá nhân Để giải quyết vấn đề này chúng ta có thể lấy giá trị thu nhập của nămnay (cột 3) trừ đi giá trị thu nhập của năm trước (cột 2), và bây giờ, chúng ta có giá trịkhác biệt ở cột chênh lệch (cột 4).
Cần chú ý rằng sự khác biệt biệt được so sánh từ một mẫu quan sát đã thảo luậntrước đó, vì vậy các phương pháp áp dụng là tương tự
Giả thuyết vô hiệu H0 là trung bình của tập hợp chính khác nhau, 30 mẫu khácnhau trong cột 4 , khi giá tri này bằng 0 Giả thuyết thay thế HA là giá trị trung bìnhdãy số lớn hơn 0
Từ kết quả kiểm mẫu của sinh viên cho thấy:
Nhưng nếu giả định cần thiết cho việc sử dụng t kiểm tra là hợp lý thì nó rấthữu ích vì thử nghiệm này thường có độ chính xác cao hơn Ví dụ cho khoảng cách tincậy hẹp hơn so với phương pháp phi tham số tương ứng Chú ý phương pháp dựa trênphân phối t có liên quan tới phương sai, trong khi các phương pháp phi tham sốthường quan tâm tới giá trị trung bình Nhưng nếu phân phối là đối xứng thì hai giá trịtrên bằng nhau
Một thử nghiệm phi tham số đơn giản áp dụng cho các vấn đề thu nhập cao hơn
là kiểm tra dấu hiệu Giả sử trong trường hợp trên 30 mẫu kiểm 7 là dưới trung bình
Trang 9và 23 là trên trung bình Dấu hiệu trung bình p = 0,0026, P giá trị chỉ ra sự khác biệtđáng kể giữa thu nhập năm trước và thu nhập năm nay Kiểm tra dấu hiệu trong ví dụtrên là dựa trên thực tế là 7 sự khác biệt tiêu cực và 23 khác biệt tích cực Không cóthông tin khác được sử dụng Kiểm tra dấu hiệu, hay nói cách khác là thông tin chứatrong dữ liệu đó vì mốc dao động xung quanh giá trị trung bình Một thử nghiệm tham
số, ví dụ t kiểm tra cũng có sự khác biệt rõ ràng với giá trị trung bình
2.1.4 Sự so sánh từ hai nhóm trở lên
Trong nghiên cứu chúng ta thường gặp sự so sánh từ hai nhóm trở lên xảy racùng một lúc Để nghiên cứu các tình huống như vậy thì phân tích phương sai(ANOVA) thường được sử dụng Trước khi giải thích phương pháp nghiên cứu này,
chúng ta sẽ đề cập rằng tại sao cần phải tiến hành một vài kiểm nghiệm t để so sánh tất
cả sự kết hợp của các nhóm thì thật sự không thích hợp
Giả sử chúng ta quan tâm đến sự khác nhau giữa ba nhóm Nếu chúng ta tiến
hành kiểm nghiệm t tại mỗi nhóm, chúng ta phải so sánh giữa nhóm 1 và nhóm 2, giữa
nhóm 1 và nhóm 3, và giữa nhóm 2 và nhóm 3 Nếu mỗi kiểm nghiệm t này sử dụngmức ý nghĩa là 0.05, sau đó xác xuất nhầm lẫn của sự bác bỏ giả thiết không (H0) là5% Do đó xác xuất không có lỗi loại I là 95% cho mỗi kiểm nghiệm Khi giả sử rằngcác cuộc kiểm nghiệm là độc lập với nhau, thì xác xuất không có lỗi loại I là (0.95)3 =0.95 x 0.95 x 0.95 = 0.857 Bây giờ xác xuất chắc chắn không có lỗi loại I là 1 - 0.857
= 0.143, hay 14.3% (thí nghiệm thống kê qua tỷ lệ sai số này được tính trên dữ liệuthực nghiệm giống nhau được biết đến như tỷ lệ sai số thực nghiệm)
Phân tích phương sai dựa trên so sánh chỉ số của phương sai hệ thống vớiphương sai không có hệ thống Giả sử một nghiên cứu thực nghiệm bao gồm khảo sátcủa ba phương pháp thiết kế Nếu các phương pháp thay đổi hiệu lực, thì một khảnăng kỳ vọng sẽ thay đổi ít hơn trong một nhóm được bộc lộ đến một loại thiết kế đặcthù hơn qua các nhóm Phân tích phương sai được tính theo công thức như sau:
1 Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân
2 Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lý với tổngbình quân;
Trang 103 Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trong nhóm vớibình quân nhóm.
Ước lượng riêng lẻ của biến tổng thể trên trung bình bình phương:
MST = =
MSB = =
MSW = =
Trong đó:
1 MST = Biến phân toàn phần bằng so sánh mỗi quan sát với số tổng bình quân
2 MSB = Phương sai giữa các nhóm, được tính bằng so sánh phương pháp xử lývới tổng bình quân; và
3 MSW = Phương sai trong nhóm, được tính bằng so sánh mỗi kết quả trongnhóm với bình quân nhóm
Trong các nhóm
Tổng cộng
49.087.5136.5
22123
24.14.17
Trang 11trung bình bình phương và bình phương phương sai trong nhóm, đó là 24,5/4,17 Khitra bảng phân phối F, chúng ta tìm thấy đơn vị tử số (là 2) và mẫu số (là 21) và tìmthấy giá trị là 3.47 Bởi vì 5.88 lớn hơn 3.47 chúng ta sẽ loại bỏ giả thiết không (H0),kết quả là, mức ý nghĩa của nhóm bằng nhau, và chấp nhận giả thiết thay thế, như vậy,
sự thay đổi chiến dịch quảng cáo là có hiệu quả Nếu chúng ta đánh giá mức hiệu quảtrung bình của một trong ba chiến dịch quảng cáo trên chúng ta cũng nhận thấy rằng
có một chiến dịch là có hiệu quả nhất
NB: Trong phân tích dung sai, biến thiên phụ thuộc, hiệu quả của quảng cáo,được thừa nhận theo hệ mét, đó là khoảng cách hoặc chỉ số tỷ lệ Biến độc lập (chiếndịch quảng cáo khác nhau) là xác thực
Ở trên là một ví dụ về phân tích dung sai đơn giản Chỉ một hệ số, ảnh hưởngcủa thay đổi chiến dịch quảng cáo được phân tích như thế nào Phân tích dung sai cóthể được mở rộng bao gồm nhiều hơn hai biến độc lập một cách rõ ràng hơn; ví dụ,thành tích của sinh viên (biến phụ thuộc) có thể được nghiên cứu như đầu ra củanhững phương pháp khác nhau của thiết kế và người thiết kế chương trình giáo dục(biến độc lập) Phân tích phương sai cũng có thể được mở rộng để kiểm tra sự tácđộng đồng thời trên hai biến phụ thuộc, giới hạn của sự đa dạng phân tích dung sai
2.2 Mối quan hệ (sự biến thiên đồng thời) giữa các biến
Trong nghiên cứu, chúng ta thường quan tâm, chú ý đến có 1, 2 hay nhiều mốiquan hệ giữa các biến số Có nhiều phép đo về những mối quan hệ này, hãy xem ví dụcủa Frankfort –Nachmias và Nachmias (1996) về tổng quan một số phép đo phổ biếncủa sự liên hệ
2.2.1 Hệ số tương quan
Một phép đo quan trọng là sự tương quan hay nói cách khác là hệ số tươngquan tức thời: r đã được đề cập ở những chương trước Hệ số tương quan tức thời giớihạn bời khoảng cách của biến số hay qui mô của biến số Giống như những phép đokhác về mối quan hệ, hệ số tương quan được xem là biến số chung của 2 phép đo Hệ
số tương quan tức thời dùng để kiểm tra mối quan hệ tuyến tính giữa 2 biến số X vàY
Về lý thuyết, hệ số tương quan có giá trị từ [-1,1] ( -1 ≤ r ≤ 1)
r = +1, cho biết 2 biến số là biến số có thực;
Trang 12 r = -1, cho biết 2 biến số có mối quan hệ hoản toàn ngược nhau;
r dần tới 0, chỉ ra rằng những biến số không có mối liên hệ với nhau.Công thức tính hệ số tương quan tức thời:
rxy =
Trong đó X ,Y đại diện cho mẫu X, Y tương ứng
Ta có công thức tương đương:
rxy =
Trong đó: là phương sai của X
là phương sai của Y
là phương sai hợp của X và Y
Hệ số tương quan diển tả mối quan hệ giữa hai biến số và hệ quả của mối liên
Sự tương quan thường được dùng để kiểm tra 2 chiều các mệnh đề giả thuyết,
có nghĩa là kiểm tra giả thuyết về mối quan hệ giữa hai biến số Từ vấn đề này, chúng
ta thấy rằng, hệ số tương quan là số thống kê có ý nghĩa Nó phụ thuộc vào cả độ lớncủa hệ số tương quan và số lượng quan sát
Trang 13Độ lệch tiêu chuẩn của hệ số tương quan là:
Ví dụ: Một bản thử nghiệm nghiên cứu, trong số 2 nhóm khảo sát về sự cảm
nhận quảng cáo chịu tác động, ảnh hưởng bởi sự thu hút quảng cáo (1= tích cực; 0=tiêu cực) , sự tin chắc vào sản phẩm quảng cáo và giới tính (1= nữ; 0= nam) Số lượngkhảo sát là 60, kết quả được ghi nhận ở bảng 11.1 Qua bảng trên, chỉ ra rằng phụ nữthì ít có khuynh hướng cảm nhận quảng cáo và phụ nữ cũng có thể ít tin vào sản phẩmquảng cáo Chúng ta cũng thấy rằng, những khảo sát này có ý nghĩa quan trọng trongphân tích hai chiều (phân tích 2 biến số) Thêm vào đó, chúng ta chú ý rằng: sự thuhút tích cực có thể được cảm nhận hơn là sự thu hút tiêu cực (mức ý nghĩa 0.05)
2.2.2 Tương quan một phần
Trong chương 10 ( cũng như chứng minh trong chương 5) chúng ta thảo luậnlàm cách nào mà chúng ta có thể đưa ra kiểm soát việc liên quan đến mối quan hệ giữacác biến bằng cách kiểm soát biến thứ ba ( hoặc nhiều hơn) Điều này cũng có thểthực hiện trong tương quan
Bảng 11.1 Sự chồng chéo giữa cảm nhận quảng cáo, giới tính, tin tưởng vàonhà sản xuất và sự hấp dẫn
Cảm nhậnquảng cáo Giới tính
Phân tích, nghĩa là tương quan một phần Công thức cho hệ số tương quan một
phần r12.3 ( đọc giữa tương quan một phần ( biến ) 1 và 2 chấm 3 ) là:
Trang 14Công thức được lặp đi lặp lại, và do đó sau khi kiểm soát cho biến 3 biến tiếptheo có thể được kiểm soát.
2.3 Giải thích và dự báo những mỗi quan hệ giữa các biến
Mô tả, giải thích và dự báo mối quan hệ giữa các biến là công việc quan trọngtrong nghiên cứu kinh doanh Chẳng hạn, một người quản lý có thể quan tâm đến mốiqua hệ giữa lượng tiền phải trả cho quảng cáo và bán hàng hoặc là mối quan hệ giữa
số lượng hàng bán và lượng khách đến tham quan Như vậy thông tin rất quan trọngtrong kinh doanh bởi vì nó cho phép giải quyết một cách hoàn thiện hơn, chẳng hạnlàm thế nào biết chi trả cho quảng cáo bao nhiêu là tốt
Một trong các phương pháp tiếp cận ứng dụng và hữu ích nhất để kiểm tra mốiquan hệ giữa các biến là phân tích hồi quy Trong phân tích hồi quy chúng ta có mộtbiến phụ thuộc (nghĩa là biến được giải thích) va một hoặc nhiều hơn biến không phụthuộc Cả biến phụ thuộc lẫn biến không phụ thuộc thường giả định là tham số (nghĩa
là khoảng cáchhoặc là thước đo tỷ lệ) Như thảo luận ở dưới đây, cái gọi là biến giảcòn có thể sử dụng như biến không phụ thuộc Trong phân tích hồi quy ( như phântích nhiều loại khác) chúng ta muốn có một mô hình phù hợp nhất là miêu tả dữ liệu,
cái có thể làm trong phân tích hồi quy bằng cách áp dụng phương pháp bình phương
nhỏ nhất Chính xác hơn, điều này được thực hiện bằng một đường thẳng phù hợp mà
giảm thiểu các độ lệch bình phương từ đó đường thẳng hiển thị như trong hình 11.1
2.3.1 Hồi quy tuyến tính đơn giản.
Nó được biết rằng có thể vẽ bất kỳ đường thẳng nếu bạn biết hai điều: (1) độdốc (hoặc độ nghiêng) của đường thẳng, và (2) điểm mà tại đó đường thẳng băng qua
Trang 15trục thẳng đứng của đồ thị ( được biết như là phần mặt phẳng bị chặn của đườngthẳng).
hl
Bảng 11.2 Ma trận dữ liệu
Trang 161 0 1 2 1
2 1 0 0 1
3 2 2 4 2
4 2 3 6 3
5 3 3 3 4
6 4 3 0 4
Bảng 11.3 Trung bình hồi quy giản đơn:
S= 0.5916 R-sp=0.85.3% R-sq(adj)=81.6%
Sự cân bằng của hồi quy
CarSale = 0.7000 + 0.9000 TV-Ads
Đầu tiên, chúng ta giải thích sự hữu ích của phương trình hồi quy tuyến tính bằng việc dự kiến chỉ có quảng cáo trên T.V và Carsales là được theo dõi Chúng ta xem Carsales như là biến phụ thuộc và quảng cáo T.V là biến độc lập Tiếp theo, chúng ta ước tính hàm số theo phương pháp quy hồi tuyến tính giản đơn của Caresales trên quảng cáo T.V Được thể hiện như bảng 11.3 được in ra từ máy tính
Thời kỳ liên tục 0.7000 chỉ rằng, nếu người kinh doanh không sử dụng hình thức quảng cáo nào trên truyền hình ( nghĩa là chi phí quảng cáo = 0) thì giá trị dự kiến của Carsale là 0.7 đơn vị, đó chính là 7 chiếc xe Hệ số hồi quy ước tính ước tính của doanh số trên quảng cáo T.V là 0.9000 Hệ số này chỉ rằng nếu biến quảng cáo T.V được tăng lên 1 đơn vị thì giá trị dự kiến của Carsales tăng lên 0.9 đơn vị, điều đó
là 9 chiếc xe Đây là những thông tin hữu ích đối với những nhà kinh doanh xe Nhưng người kinh doanh miễn cưỡng với việc tăng “polate”: điều này có nghĩa là người kinh doanh không được sử dụng những thông tin có giá trị ngoài chương trình quảng cáo trong khoảng từ 0 cho đến 4 mà nó đã thể hiện ở mẫu ( nhìn vào bảng 11.3)
Kết quả, hệ số tương quan ( R-sp) R2 85,3% ( bình phương hệ số tương quan là 85,3%) hệ số này chỉ ra rằng việc xác định mẫu có hệ số tương quan R2 ngang với giá
Trang 17trị là 0.853 Nói một cách cụ thể, điều này có nghĩa mức độ biến đổi trong các biến ởchương trình quảng cáo T.V được giải thích là 85,3 % của Carsales có thể biến đổitrong mẫu của chúng tôi Bình phương của mẫu là hệ số tương quan r Giá trị P:0.0009 là hệ số hồi quy, β là doanh số trên chương trình quảng cáo T.V nhỏ hơn anpha 0.05, chúng tôi thừa nhận điều này theo quy ước chọn lựa của chúng tôi với mức ýnghĩa Có nghĩa là chúng tôi có thể loại bỏ giả thiết không có hiệu lực H0, tương ứngvới hệ số tương quan β là ngang bằng với 0, là sử dụng được hai mặt A2 : β # 0 (sửdụng hai mặt là sự mặc định của chương trình máy tính).
Tóm lại: Quảng cáo T V và doanh số bán hàng có mối quan hệ ý nghĩa vớinhau Từ đó nó có mối quan hệ là mật thiết không thể nào có chuyện gia tăng chí phíquảng cáo mà dẫn đến kết quả là giảm doanh số bán ra, nó thật sự thích hợp cho việc
sử dụng một chiều, A1 : β > 0 Điều đó có nghĩa là giá trị p được hệ thống sử lý củamáy tính chia làm 2 phần Như thế giá trị có liên quan của p là (0.009/2) = 0.0045.Đây là bằng chứng thiết thực cho kết quả là có mối quan hệ giữa quảng cáo T.V vàCarsales Những trường hợp thiết thực này chúng ta chắc sẽ thấy sau này, một hệ số
có lẽ không tập hợp khi có sự khác biệt đáng kể từ 0 (zero) khi chúng ta sử dụng mốiliên hệ hai mặt, mặc dù nó đã được xác minh là có dấu hiệu khác biệt từ 0 ( zero) nếu
đã được trình bày là có mối liên hệ một mặt Như vậy nó thật sự quan trọng trong việclực chọn một mặt trong điều kiện thích hợp ( xem phần 10.5 ) Biểu đồ ở bảng số 11.4
là mối liên hệ khác biệt cho vấn đề này
012234
0.77033-1.18431-0.925820.925821.18431-0.77033
0.71.62.52.53.44.3
0.3-0.6-0.50.50.6-0.3
Trang 18Một biến là hữu ích nếu giá trị p của nó nhỏ hơn Sử dụng thay thế một chiềuthay vì cách thức hai mặt là giá trị p thực tế sẽ giảm một nữa.
Sự phù hợp là ước tính dự kiến bán xe hơi hoặc doanh số bán xe hơi tương ứngvới các giá trị của biến độc lập quảng cáo truyền hình được tìm thấy trong mẫu Phầncòn dư là độ lệch tương ứng từ ước lượng hồi quy đường thẳng Chú ý rằng phươngtrình thích hợp + giá trị thặng dư = Doanh số bán xe hơi là giá trị cho mỗi tháng ( mỗi
sự quan sát) Chúng ta thích sự để được gần gũi với doanh số bán hàng và gần gũiquen thuộc với giá trị thặng dư để được gần với 0 Sau đó R2 sẽ gần đến 1
Giả định trong phân tích hồi quy.
Phân tích hồi quy là dựa trên một số giả định, bao gồm:
1 Giá trị kỳ vọng của sai số là không, E( = 0)
2 Phương sai của sai số cho mỗi xi là hằng số Đây là được gọi là scedasticity Nếu phương sai thay đổi theo xi được gọi là heteroscedasticity
homo-3 Sai sót cho các quan sát là không tương quan
4 thường phân bổ cho mỗi xi.
5 Các sai số không tương quan với xi, Corr( xi) = 0
6 Nó cũng là một giả định phổ biến mà các mô hình hồi quy phải là tuyến tínhtrong các tham số của nó
Đó là thực hành các logic để kiểm tra các giả định Kết quả của bạn của bạn cóthể hữu ích ngay cả khi tất cả các giải định tiêu chuẩn không đáp ứng, nhưng sau đókết quả thường không chắc chắn hơn so với số liệu thống kê cho thấy Điều quantrọng là bạn sử dụng logic phán đoán tất cả các giai đoạn mà bạn biết những gì bạnđang làm
Trong một thời gian ngắn chúng ta sẽ cho thấy kiểm tra một số giả định như thếnào trong ví dụ của chúng ta Nó nên được nhớ tới, tuy nhiên, chúng ta có quá ít quansát để có được một tình huống thực tế Giả định của một mô hình tuyến tính có thểkiểm tra bề ngoài bằng cách nhìn vào biểu đồ được cung cấp từ máy tính Vài giả định
có thể có liên quan đến sự xáo lộn khó nhìn thấy được ước tính bằng giá trị thặng dư
Trang 19Giá trị thặng dư có thể biểu diễn theo nhiều cách – ví dụ tùy vào các biến độc lập.Chúng ta có thể kiểm tra bề ngoài giả định của homo- scedasticity: nghĩa là, chúng takiểm tra sự khác nhau của giới hạn xáo trộn không thay đổi khi giá trị của biến độclập thay đổi Chúng ta thích nhìn thấy một bức tranh nơi mà biến thiên lên và xuốngtrong biểu đồ là gần như nhau, nói, bên trái, ở giữa và một phần bên phải của biểu đồ.
Để có một vài ý tưởng cho sự phù hợp của các giả định của sự xáo lộn phân bổbình thường, nếu bạn có nhiều quan sát hơn chúng tôi, kết quả kiểm tra biểu đồ tần sốcủa giá trị thặng dư có một số trùng với mật độ bình thường, bạn cũng có thể sử dụngbiểu đồ sác xuất thông thường Nếu kết quả các điểm trong biểu đồ của điểm bìnhthường rơi khoảng trong một đường thẳng, giá trị thặng dư (và hy vọng cũng như sựxáo trộn) dường như đến từ mật độ bình thường Hệ số tương quan nói như thế nào vềmột đường thẳng Nếu cũng như dữ liệu ở đây là dữ liệu chuỗi thời gian, có thể tựquan tự động trong các xáo trộn Kiểm tra một sự thích hợp cho sự tự tương quan là 1.Nếu số liệu thống kê D-W gần đến 2, cũng như ở đây, không có nguy cơ cho sự tươngquan tự động Nếu như nó gần tới 0, có thể có sự tự tương quan tự động Nếu như nógần tới 4, có thể có tương quan tiêu cực xảy ra (hiếm khi xảy ra) Một cuộc thảo luậnxuất sắc của kiểm tra phân tích hồi quy, xem Field 2000
Lựa chọn của các biến
Nếu chúng ta muốn sử dụng hồi quy tuyến tính đơn giản, nhìn vào ví dụ, tuyến
tính Y trên x 1, cũng như đã thực hiện Nhưng chúng ta cũng có thể có hồi quy Y trên
x 2 hoặc hồi quy Y trên x 3 Trong sự lựa chọn giữa hàm hồi quy khác nhau trong tìnhhuống như thế này nó rất hữu ích để xem xét các hệ số tương quan Hệ số tương quanđược biểu diễn trong bảng 11.5
Chúng ta chú ý rằng giữa ba biến độc lập, quảng cáo T.V là một trong nhữngcái mà trong đó sự tương quan mẫu là cao nhất với các biến bán hàng độc lập Trướcđây chúng ta thấy hàm hồi quy tương ứng có vẻ là thỏa đáng trong tất cả các khíacạnh Vì vậy, nếu chúng ta quyết định chỉ sử dụng một biến độc lập, quảng cáo T.V làđược chọn Xem xét kỹ lưỡng trên sự tương quan, chúng ta cũng nhìn thấy rằng quảngcáo T.V tương quan mạnh với quảng cáo chữ in và quảng cáo chữ in tương quan mạnhvới kinh doanh Hệ số tương quan cao giữa quảng cáo T.V và quảng cáo chữ in cho