Giáo trình nghiên cứu Marketing - Chương 8.
131 CHƯƠNG TÁM 8 PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆU TRONG NGHIÊN CỨU MARKETING NỘI DUNG CHÍNH Nội dung chương này bàn đến bao gồm: - Thế nào là giả thuyết nghiên cứu - Các loại sai lầm khi thực hiện kiểm định giả thuyết - Các bước giải quyết một bài toán kiểm định - Các phương pháp kiểm định tham số - Các phương pháp kiểm định phi tham số MÔ HÌNH LỰA CHỌN PHƯƠNG PHÁP KIỂM ĐỊNH Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau: (1) Tính độc lập hay phụ thuộc của đại lượng ngẫu nhiên cần nghiên cứu. (2) Dạng của qui luật phân phối xác suất của đại lượng ngẫu nhiên. (3) Giá trị của tham số của qui luật phân phối xác suất đã biết dạng. (1) & (2) là giả thiết phi tham số và (3) là giả thiết về tham số. Trong phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình x trong qui luật phân phối chuẩn N(µ,σ2), tham số tỷ lệ p trong qui luật phân phối A(P), tham số chi bình phương, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giới thiệu cách thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể tham khảo thêm trong các giáo trình chuyên môn về thống kê toán. Các khái niệm cơ bản Giả thiết cần kiểm định Giả sử đại lượng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biết dạng, nhưng chưa biết giá trị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu được, ta có thể giả định rằng θ = θ0, trong đó θ0 là số thực. Tất nhiên điều giả định θ = θ0 này có thể đúng hoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là {H0: θ = θ0}. Các giả thiết đối (đối thiết) Vì giả thiết H0 cũng có thể đúng và cũng có thể sai với một độ tin cậy nào đó, khi giả thiết H0 sai thì ta phải bác bỏ nó. Khi đó phải chấp nhận một trong ba giả thiết đối (ký hiệu: H1) sau đây: - Trong trường hợp kiểm định dạng "hai đuôi" (Two-tail test): ⎩⎨⎧≠=0100 : H:θθθθH - Trong trường hợp kiểm định dạng "một đuôi" (One-tail test): ⎩⎨⎧>=0100: H:θθθθH hoặc ⎩⎨⎧<=0100: H:θθθθHDo vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H0, ta cần phát biểu kèm một giả thiết đối H1 để khẳng định rằng nếu như giả thiết H0 bị bác bỏ thì ta chấp nhận giả thiết đối kèm theo với một mức ý nghĩa α nào đấy (1- α được gọi là độ tin cậy). Các loại sai lầm Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều chứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp phải hai loại sai lầm sau: - Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng. - Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai. 132 Trong khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1. Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá bé, α = 0,05, α = 0,1). Giả thiết H0 đúng Giả thiết H0 sai Chấp nhận Quyết định đúng Sai lầm loại 2 (xác suất β) Bác bỏ Sai lầm loại 1 (xác suất α) Quyết định đúng Tiêu chuẩn kiểm định và miền bác bỏ Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý nghĩa α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Với một mức ý nghĩa α xác định, ta luôn tìm được mọi miền Wα, thỏa mãn điều kiện ( )αα=∈0HWKP (xác suất để K thuộc miền miền bác bỏ Wα với điều kiện H0 đúng bằng α). Do α khá bé, nên ta có thể coi biến cố (K∈Wα) là biến cố không thể có (với điều kiện giả thiết H0 đúng). Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị kqs của thống kê K mà lại thấy giá trị kqs∈Wα, thì điều này sẽ mâu thuẫn với điều kiện nói trên. Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H0 đúng. Để tránh mâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα được gọi là miền bác bỏ và kqs được gọi là tiêu chuẩn kiểm định. Chú ý: - Khi giả thiết H0 đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá trị kqs∈Wα với xác suất xảy ra là α. Vì vậy trong trường hợp kqs∈Wα mà ta bác bỏ giả thiết H0 thì ta có thể mắc sai lầm loại 1, với xác suất mắc sai lầm loại 1 chính là α. - Nếu ta ký hiệu ( )βα=∈1HWkPqs thì β là xác suất bác bỏ một giả thiết sai. Do đó, xác suất không bác bỏ một giả thiết sai ( )βα−=∈ 11HWKPqs là xác suất mắc sai lầm loại 2 và β sẽ được gọi là xác suất không mắc sai lầm loại 2, người ta gọi β là hiệu lực của kiểm định. - Với kích thước mẫu n xác định thì với mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ Wα thỏa mãn điều kiện: ( )αα=∈0HWKPqs. Nếu tồn tại một tiêu chuẩn kiểm định kqs với miền bác bỏ Wα sao cho (1-β) là nhỏ nhất và β lớn nhất. Khi đó kqs được gọi là tiêu chuẩn kiểm định mạnh nhất. Một tiêu chuẩn được coi là mạnh nhất thì nó đảm bảo 3 yêu cầu: - Xác suất mắc sai lầm loại 1 là α qui định trước. - Xác suất mắc sai lầm loại 2 là nhỏ nhất. - Khi bác bỏ giả thiết H0 thì ta có thể thừa nhận giả thiết đối H1. Như vậy chúng ta có thể xác định miền bác bỏ và miền chấp nhận trong các trường hợp kiểm định một đuôi và hai đuôi là: - Trong kiểm định hai đuôi: 133 134 - Trong kiểm định một đuôi: Các bước chung để giải bài toán kiểm định Bước 1: Phát biểu giả thiết và đối thiết ⎩⎨⎧≠=0100 : H:θθθθH hoặc hoặc ⎩⎨⎧>=0100: H:θθθθH⎩⎨⎧<=0100 : H:θθθθHBước 2: Xác định mức ý nghĩa và xây dựng miền bác bỏ + Mức ý nghĩa α + Miền bác bỏ (tùy thuộc vào phương pháp kiểm định, loại phân phối và mức ý nghĩa). Bước 2: Lựa chọn phương pháp kiểm định và loại phân phối của nó. Bước 4: Tính giá trị quan sát của tiêu chuẩn kiểm định kqs Bước 5: So sánh với miền bác bỏ để kết luận: Miền bác bỏ Miền chấp nhận W1-αMiền bác bỏ Miền chấp nhận -W1-αMiền bác bỏ Miền bác bỏ Miền chấp nhận W1-α/2-W1-α/2 - Nếu kqs∈ Wα ta sẽ bác bỏ giả thiết H0 và thừa nhận giả thiết H1. - Nếu kqs∉ Wα : Ta kết luận rằng chưa có cơ sở để thừa nhận giả thiết H1. Có thể tóm tắt các bước để giải bài toán kiểm định theo sơ đồ sau: B1: Phát biểu giả thiết và đối thiết B2: Xác định mức ý nghĩa B3: Lựa chọn phương pháp kiểm định và loại phân phối của nó B4: Tính giá trị kiểm định (giá trị quan sát) kqs B5: Tìm miền bác bỏ và kết luận CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ Kiểm định giả thiết về tham số trung bình µ của tổng thể Điều kiện: Biến định lượng và phân phối của biến phải tuân theo quy luật phân phối chuẩn. Trường hợp đã biết phương sai (σ2) hoặc độ lệch chuẩn của tổng thể Đối với trường hợp kiểm định giả thiết về tham số trung bình của tổng thể, chúng ta có thể thực hiện thông qua các bước sau: B1: Phát biểu giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µ = µ0H0: µ ≤µ0H0: µ ≥ µ0Đối thiết H1: µ ≠ µ0 H1: µ > µ0H1: µ < µ0B2: Xác định mức ý nghĩa α B3: Xác định phương pháp kiểm định: Phương pháp kiểm định tham số trung bình với σ đã biết. B 4: Tính tiêu chuẩn kiểm định ( )σµnxUKqs0−=≡, trong đó x là trung bình mẫu. Bước 3: Xác định miền bác bỏ Miền bác bỏ Wα là tập hợp những điểm thoả mãn điều kiện: ()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎟⎟⎠⎞⎜⎜⎝⎛−==−αασµ10,UnxUW hay 21α−≥ UU kiểm định đối xứng - bác bỏ H0, chấp nhận H1 với µ ≠ µ0. 135 α−≥1UU kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ > µ0. kiểm định phía phải - bác bỏ Hα−−≤1UU0, chấp nhận H1 với µ < µ0. Chúng ta so sánh kqs với Wα để đưa ra kết luận Để tiện cho việc theo dõi, có thể tóm lược những bước của bài toán kiểm định tham số trung bình ở trên như bảng sau: KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ (khi σ đã biết) 1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µ = µ0H0: µ ≤ µ0H0: µ ≥ µ0Đối thiết H1: µ ≠ µ0H1: µ > µ0H1: µ < µ0 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm: Tham số trung bình tổng thể 4. Tiểu chuẩn kiểm định: (khi chưa biết σ thay bằng s’) 5. Điểm tới hạn và miền bác bỏ: Đối xứng Phải Trái Điểm tới hạn - U1-α/2 và U1-α/2U1-α- U1-αMiền bác bỏ U<- U1-α/2 và U>U1-α/2U>U1-αU<-U1-αBiểu hiện qua hình vẽ BB CN BB-U1-α/2 U1-α/2BB -U1-αBB U1-ασµnxUkqs)(0−=≡ Ví dụ: Trọng lượng một loại sản phẩm do nhà máy sản xuất là đại lượng ngẫu nhiên tuân theo qui luật phân phối chuẩn, có trọng lượng qui định là 20kg và độ lệch chuẩn là 2kg. Có ý kiến cho rằng: Do thiết bị hoạt động không ổn định nên trọng lượng sản phẩm đã thay đổi, người ta tiến hành kiểm tra 100 sản phẩm và đo được trọng lượng trung bình là 20,35kg. Với mức ý nghĩa α = 0,05. Hãy kết luận xem trọng lượng của sản phẩm đã thay đổi chưa? Cho biết U0,975=1,96. Giải: Gọi X là trọng lượng sản phẩm do nhà máy sản xuất. Theo giả thiết X là đại lượng ngẫu nhiên tuân theo qui luật phân phối chuẩn, trong đó σ = 2(kg), M(X) = 20(kg). Ta có bài toán kiểm định giả thiết về giá trị tham số µ của qui luật phân phối chuẩn. B1. Phát biểu giả thiết: H0 : µ = µ0= 20(kg) H1: µ ≠ µ0B2. Mức ý nghĩa α=0,05 136B3. Phương pháp kiểm định: Đây là bài toán kiểm định tham số trung bình với độ lệch chuẩn σ đã biết. B4. Xỏc nh tiờu chun kim nh: Tiờu chun kim nh c chn l: ( )()75,125,321002035,200===ànxUkqs B5. Xỏc nh min bỏc b v kt lun: Vi mc ý ngha = 0,05, min bỏc b tng ng trong trng hp ny cú dng: ()====96,1,975,0210UUUnxUWà Minh ha bng hỡnh v: 1,75Min bỏc b 1,96Min bỏc b Kt lun: Vỡ kqs W nờn cha cú c s bỏc b gi thit H0, tc l ý kin cho rng trng lng trung bỡnh ca sn phm b thay i l cha cú c s. Trng hp cha bit phng sai (2): i vi trng hp cha bit phng sai tng th, cn phi xem xột hai trng hp sau: a. Trng hp mu nh n<30 Trong trng hp cha bit phng sai, cỏc gi thit v i thit cng ging nh trng hp ó bit phng sai. Tuy nhiờn, tớnh toỏn giỏ tr kim nh, cn phi tỡm lch chun iu chnh (s) ca mu tin hnh phõn tớch. Vỡ mu khỏ nh (n<30), cú th gi nh hm phõn phi tuõn theo hm T-student. Khi ú, tiờu chun kim nh c chn l: ( )'0snxTkqsà= Vi x l trung bỡnh mu v s l chờnh lch chun iu chnh ca mu. Vi mc ý ngha , min bỏc b: ()()==1'0,nTsnxTWà Khi ú: ()12nTT hoc P(T)< ặ bỏc b H0, chp nhn H1 (hay à à0). ()1nTT hoc P(T)<2 ặ bỏc b H0, chp nhn H1 (hay à > à0). ()1nTT hoc P(T)<2 ặ bỏc b H0, chp nhn H1 (hay à < à0). Vớ d : Mt nh sn xut mt loi búng ốn cho bit tui th trung bỡnh thp nht ca cỏc búng ốn l 150 gi. Kim tra mt cỏch ngu nhiờn 25 búng ốn, ngi ta o c tui th trung bỡnh ca chỳng l 145 gi. Vi tin cy 99%, cú th kt lun gỡ v li tuyờn b trờn. Cho bit, 137 độ lệch chuẩn hiệu chỉnh mẫu là 6 giờ và tuổi thọ trung bình của loại bóng đèn trên là đại lượng ngẫu nhiên phân phối chuẩn. Giải: Gọi µ là tuổi thọ trung bình của loại bóng đèn trên, theo giả thiết µ là đại lượng ngẫu nhiên phân phối chuẩn. Ta có bài toán kiểm định giả thiết tham số µ với n ≤ 30. B1. Phát biểu giả thiết: H0 : µ ≥ µ0 = 150 H1 : µ <µ0 B2. Xác định mức ý nghĩa α=0,05 B3. Phương pháp kiểm định: Đây là trường hợp kiểm định một đuôi bên trái với mẫu nhỏ, σ chưa biết. B4. Tính tiêu chuẩn kiểm định: Tiêu chuẩn kiểm định là : 167,4625)150145()('−=−=−=≡snxTkqsµVới mức ý nghĩa α = 0,01, miền bác bỏ: ()()⎭⎬⎫⎩⎨⎧−=−=−<′µ−==−αα49,2TT,SnXTWT)24(01,01n0 Minh họa bằng hình vẽ Miền bác bỏ -2,49 -4,167 Kết luận: Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là lời tuyên bố rằng tuổi thọ trung bình của loại bóng đèn trên thấp nhất là 150 giờ là sai. b. Trường hợp mẫu nhỏ n≥30 Nếu kích thước mẫu n ≥ 30, khi đó giá trị( )1n2T−α sẽ tiến đến giá trị Uα/2, khi đó tiêu chuẩn kiểm định trong trường hợp này là: ( )'0snxUkqsµ−=≡ Ví dụ: Công ty thiết bị viễn thông ATC đã tiến hành một cuộc nghiên cứu để tìm hiểu mức độ hài lòng của khách hàng sau khi thay đổi, cải tiến một số dịch vụ nhằm nâng cao khả năng đáp ứng yêu cầu khách hàng của họ. Trước khi cải tiến các dịch vụ, mức độ hài lòng của khách hàng trung bình là 75 (theo thang điểm từ 0 đến 100). Chọn ngẫu nhiên 350 khách hàng để tham khảo ý kiến của họ sau khi các dịch vụ được cải tiến, mức độ hài lòng trung bình tính được là 82 với độ lệch điều chỉnh mẫu là 8. Với độ tin cậy 95%, có thể kết luận rằng khách hàng đã được hài lòng ở mức độ cao hơn không? Giải: B1. Phát biểu giả thiết và đối thiết: 138 Vì công ty quan tâm đến việc cải tiến các dịch vụ của công ty thiết bị viễn thông có làm thỏa mãn khách hàng ở mức độ cao hơn so với trước hay không. Do đó ta đặt giải thiết: H0: µ ≤ µ0 = 75 H1: µ >µ0 = 75 B2. Chọn mức ý nghĩa α=0,05 B3. Xác định phương pháp kiểm đinh: Đây là bài toán kiểm định tham số trung bình, σ chưa biết, mẫu lớn hơn 30 B4. Tính giá trị kiểm định ( )2363,68350)7582(,0=−=−=≡snxUkqsµ B4. Tính giá trị kiểm định Với mức ý nghĩa α = 0,05 và đây là bài toán kiểm định một đuôi nên miền bác bỏ tương ứng trong trường hợp này có dạng: ()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧==>−==−645,1,95,01'0UUUsnxUWααµ Với mức ý nghĩa 5%,vì U1-α=1,645 1,645 6,2363 Miền bác bỏ Kết luận: Vì kqs∈Wα nên giả thiết H0 bị bác bỏ, ta kết luận rằng với việc cải tiến các dịch vụ, công ty thiết bị viễn thông ATC đã làm cho thỏa mãn khách hàng ở mức độ cao hơn trước Kiểm định giả thiết tham số tỷ lệ Trong một số trường hợp, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại A (loại phần tử mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi fn là tỷ lệ của phần tử loại A có trong mẫu và P0 là một tỷ lệ đã được xác định trước. Quy trình kiểm định như sau: B1. Phát biểu giả thiết và đối thiết Đối xứng Phải Trái Giả thiết H0: P = P0H0: P ≤ P0H0: P ≥ P0Đối thiết H1: P ≠ P0 H1: P > P0H1: P < P0B2. Lựa chọn mức ý nghĩa α=0,05 B3. Phương pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể. B4. Tính giá trị kiểm định: ()()0001 PPnPfUknqs−−=≡ B5. Miền bác bỏ và kết luận: 139 Với α cho trước, ta có miền bác bỏ Wα là: ()()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧−−==−αα1000;1UPPnPfUWn Khi đó: kiểm định phía phải - bác bỏ Hα−≥1UU0 và chấp nhập H1 (hay P > P0). α−−≤1UU kiểm định phía trái - bác bỏ H0 và chấp nhận H1 (hay P < P0). 21α−≥ UU kiểm định đối xứng – bác bỏ H0 và chấp nhận H1 (hay P ≠ P0). Chúng ta so sánh kqs với Wα để đưa ra kết luận Các bước của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể được thể hiện trong bảng sau: KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ 1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: P = P0H0: P ≤ P0H0: P ≥ P0Đối thiết H1: P ≠ P0H1: P > P0H1: P < P02. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm tham số tỷ lệ tổng thể 4. Tiểu chuẩn kiểm định: 5. Điểm tới hạn và miền bác bỏ: Đối xứng Phải Trái Điểm tới hạn - U1-α/2 và U1-α/2U1-α- U1-αMiền bác bỏ P<- U1-α/2 và P>U1-α/2P>U1-αP<-U1-αMô hình BB CN BB-U1-α/2 U1-α/2BB -U1-αBB U1-α)1()(000PPnPfPn−−= Ví dụ: Giả sử một sản phẩm của công ty sản xuất vỏ xe ô tô đã chiếm được 42% thị trường. Hiện tại, trước sự cạnh tranh của đối thủ và những điều kiện thay dổi của môi trường, ban lãnh đạo công ty muốn kiểm tra lại xem thị phần của công ty có còn là 42% hay không. Chọn ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy 219 xe sử dụng vỏ xe của công ty. Có kết luận gì ở mức ý nghĩa 5%. Giải: Trường hợp này ta chỉ quan tâm đến thị phần của công ty có còn là 42% hay không. Khi đó: B1. Phát biểu giả thiết và đối thiết: Ho: P = P0 = 0,42 H1: P ≠ P0 = 0,42 B2. Chọn mức ý nghĩa α=0,01 B3. Chọn phương pháp kiểm định: Phương pháp điểm định đối xứng tham số tỉ lệ trong tổng thể. 140 [...]... trong bng sau: Ca hng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Doanh s trong tun (triu ng) Trc khuyn mói 57 61 12 38 12 69 5 69 88 9 92 26 14 70 22 Sau khuyn mói 60 54 20 35 21 70 1 65 79 10 90 32 19 77 29 di=(xi-yi) -3 7 -8 3 -9 -1 4 4 9 -1 2 -6 -5 -7 -7 -1 8 x =-1 .2 (di- x )2 3,24 67,24 46,24 17,64 60 ,84 0,04 27,04 27,04 104,04 0,04 10,24 23,04 14,44 33,64 33,64 4 68, 40 sd=5, 78 146 Vi mc ý ngha =0,05, cú th... sd l trung bỡnh v lch chun iu chnh ca n khỏc bit 5 im ti hn v min bỏc b: i xng Phi Trỏi im ti hn T(n-1); 1- - T(n-1); 1- - T(n-1); 1-/ 2 v T(n-1);1/2 D T(n-1); 1-/ 2 Min bỏc b Mụ hỡnh BB CN -T(n-1); 1-/ 2 D>T(n-1); 1- D D0 H1: àx - ày < D0 2 Xỏc nh mc ý ngha 3 Phng phỏp kim nghim s khỏc nhau ca hai trung bỡnh tng th - Bng phõn phi chun hoc T-student (nu n D0, khi ú W: T = ( x D0 ) n > U 1- (hoc -T(n-1); nu n . tới hạn - T(n-1); 1- /2 và T(n-1); 1- /2T(n-1); 1- - T(n-1); 1- Miền bác bỏ D< ;- T(n-1); 1- /2 và D>T(n-1); 1- /2D>T(n-1); 1- D<-T(n-1); 1- Mô hình. Điểm tới hạn - U 1- /2 và U 1- /2U 1- - U 1- Miền bác bỏ P< ;- U 1- /2 và P>U 1- /2P>U 1- P<-U 1- Mô hình BB CN BB-U 1- /2