Nghiên cứu marketing - Chương 8: Phân tích và diễn giải dữ liệu trong nghiên cứu marketing

Nghiên cứu marketing - Chương 8: Phân tích và diễn giải dữ liệu trong nghiên cứu marketing

Thể loại: Marketing Bán hàng
Lượt xem: 143,800Lượt tải: 4Số trang: 57

Mô tả tài liệu

Nội dung chương này bàn đến bao gồm: Thế nào là giả thuyết nghiên cứu Các loại sai lầm khi thực hiện kiểm định giả thuyết Các bước giải quyết một bài toán kiểm định Các phương pháp kiểm định tham số Các phương pháp kiểm định phi tham số

Tóm tắt nội dung

- Các loại sai lầm khi thực hiện kiểm định giả thuyết - Các phương pháp kiểm định tham số - Các phương pháp kiểm định phi tham số Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau: (3) Giá trị của tham số của qui luật phân phối xác suất đã biết phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể có thể giả định rằng θ = θ0, trong đó θ0 là số có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là Vì giả thiết H0 cũng có thể đúng và cũng có thể sai với một độ tin cậy nào đó, khi giả thiết H0 sai Khi đó phải chấp nhận một trong ba giả thiết đối (ký hiệu: H1) sau đây: - Trong trường hợp kiểm định dạng "hai đuôi" (Two-tail test): - Trong trường hợp kiểm định dạng "một đuôi" (One-tail test): Do vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H0, ta cần phát biểu kèm một giả thiết đối H1 để khẳng định rằng nếu như giả thiết H0 bị bác bỏ thì ta chấp nhận giả thiết đối kèm theo với một mức ý nghĩa α nào đấy (1- α được gọi là độ tin cậy). Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp - Sai lầm loại 1: Khi ta bác bỏ một giả thiết khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1. Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá Tiêu chuẩn kiểm định và miền bác bỏ Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý nghĩa α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Do α khá bé, nên ta có thể coi biến cố (K∈Wα) là biến cố không thể có (với điều kiện giả thiết H0 Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị kqs Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H0 đúng. mâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα được gọi là miền bác bỏ và kqs được gọi là tiêu - Khi giả thiết H0 đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá trị kqs∈Wα với xác suất Vì vậy trong trường hợp kqs∈Wα mà ta bác bỏ giả thiết H0 thì ta có thể mắc sai - Nếu ta ký hiệu ( ) βα =∈ 1HWkP qs thì β là xác suất bác bỏ một giả thiết bác bỏ một giả thiết sai ( ) βα −=∈ 11HWKP qs là xác suất mắc sai lầm loại 2 và β sẽ được gọi là xác suất không mắc sai lầm loại 2, người ta gọi β là hiệu lực của kiểm định. - Với kích thước mẫu n xác định thì với mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ Wα thỏa Nếu tồn tại một tiêu chuẩn kiểm định kqs với miền bác bỏ Wα sao cho (1-β) là nhỏ nhất và β lớn Khi đó kqs được gọi là tiêu chuẩn kiểm định mạnh nhất. - Khi bác bỏ giả thiết H0 thì ta có thể thừa nhận giả thiết đối H1. Như vậy chúng ta có thể xác định miền bác bỏ và miền chấp nhận trong các trường hợp kiểm định một đuôi và hai đuôi là: Bước 2: Xác định mức ý nghĩa và xây dựng miền bác bỏ + Miền bác bỏ (tùy thuộc vào phương pháp kiểm định, loại phân phối và mức ý 2: Lựa chọn phương pháp kiểm định và loại phân phối của nó. Bước 4: Tính giá trị quan sát của tiêu chuẩn kiểm định kqs - Nếu kqs∈ Wα ta sẽ bác bỏ giả thiết H0 và thừa nhận giả thiết H1. - Nếu kqs∉ Wα : Ta kết luận rằng chưa có cơ sở để thừa nhận giả thiết H1. Có thể tóm tắt các bước để giải bài toán kiểm định theo sơ đồ sau: Kiểm định giả thiết về tham Đối với trường hợp kiểm định B3: Lựa chọn phương pháp kiểm định và loại phân phối của nó thiết về tham số trung bình của tổng thể, chúng ta có thể thực ịnh: Phương pháp kiểm định tham số trung bình với σ đã biết. α−≥ 1UU kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ > µ0. kiểm định phía phải - bác bỏ Hα−−≤ 1UU 0, chấp nhận H1 với µ < µ0. Để tiện cho việc theo dõi, có thể tóm lược những bước của bài toán kiểm định tham số trung bình KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ 3. Phương pháp kiểm nghiệm: Tham số trung bình tổng thể qui luật phân phối chuẩn, có trọng lượng qui định là 20kg và độ lệch chuẩn là Do thiết bị hoạt động không ổn định nên trọng lượng sản phẩm đã thay đổi, người ta tiến hành kiểm tra 100 sản phẩm và đo được trọng lượng trung bình là có bài toán kiểm định giả thiết về giá trị tham số µ của qui luật phân phối pháp kiểm định: Đây là bài toán kiểm định tham số trung bình với độ lệch chuẩn σ Xác định tiêu chuẩn kiểm định: Tiêu chuẩn kiểm định được chọn là: Với mức ý nghĩa α = 0,05, miền bác bỏ tương ứng trong trường hợp này có dạng: Kết luận: Vì kqs∉ Wα nên chưa có cơ sở để bác bỏ giả thiết H0, tức là ý kiến cho rằng trọng lượng trung bình của sản phẩm bị thay đổi là chưa có cơ sở. Đối với trường hợp chưa biết phương sai tổng thể, cần phải xem xét hai trường hợp sau: Trong trường hợp chưa biết phương sai, các giả thiết và đối thiết cũng giống như trường hợp đã Tuy nhiên, để tính toán giá trị kiểm định, cần phải tìm độ lệch chuẩn điều chỉnh Vì mẫu khá nhỏ (n<30), có thể giả định hàm phân phối tuân Khi đó, tiêu chuẩn kiểm định được chọn là: Với x là trung bình mẫu và s’ là độ chênh lệch chuẩn điều chỉnh của mẫu. Ví dụ : Một nhà sản xuất một loại bóng đèn cho biết tuổi thọ trung bình thấp nhất của các độ lệch chuẩn hiệu chỉnh mẫu là 6 giờ và tuổi thọ trung bình của loại bóng đèn trên là đại lượng Gọi µ là tuổi thọ trung bình của loại bóng đèn trên, theo giả thiết µ là đại lượng ngẫu nhiên phân Ta có bài toán kiểm định giả thiết tham số µ với n ≤ pháp kiểm định: Đây là trường hợp kiểm định một đuôi bên trái với mẫu nhỏ, σ Tiêu chuẩn kiểm định là : Kết luận: Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là lời ý kiến của họ sau khi các dịch vụ được cải tiến, mức độ hài lòng trung bình tính được là 82 với Xác định phương pháp kiểm đinh: Đây là bài toán kiểm định tham số trung bình, σ chưa biết, Với mức ý nghĩa α = 0,05 và đây là bài toán kiểm định một đuôi nên miền bác bỏ tương ứng Kết luận: Vì kqs∈Wα nên giả thiết H0 bị bác bỏ, ta kết luận rằng với việc cải tiến các dịch vụ, Kiểm định giả thiết tham số tỷ lệ Trong một số trường hợp, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại A (loại phần tử mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi fn là tỷ lệ của phần tử loại A có trong mẫu và P0 là một tỷ lệ đã được xác định pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể. Với α cho trước, ta có miền bác bỏ Wα là: Khi đó: kiểm định phía phải - bác bỏ Hα−≥ 1UU 0 và chấp nhập H1 (hay P > P0). α−−≤ 1UU kiểm định phía trái - bác bỏ H0 và chấp nhận H1 (hay P < P0). ≥UU kiểm định đối xứng – bác bỏ H0 và chấp nhận H1 (hay P ≠ P0). Các bước của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể được thể hiện KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ đạo công ty muốn kiểm tra lại xem thị phần của công ty có còn là 42% hay Trường hợp này ta chỉ quan tâm đến thị phần của công ty có còn là 42% hay phương pháp kiểm định: Phương pháp điểm định đối xứng tham số tỉ lệ trong tổng thể. Với mức ý nghĩa 5%, ta có thể xác định miền bác bỏ như sau: Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhập H1 có nghĩa thị phần của công ty Kiểm định sự khác nhau giữa trung bình của hai tổng thể Điều kiện ứng dụng: Hai biến nghiên cứu (đại diện đo lường hai mẫu) phải là biến định lượng, Kiểm định tham số trung bình dựa trên hai biến (mẫu) độc lập Điều kiện để thực hiện phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình Tính hệ số quan sát, so sánh với miền bác bỏ và kết luận. Ví dụ: Người ta tiến hành nghiên cứu về thời gian sử dụng trung bình của hai nhãn hiệu pin X pin kết quả ghi nhận được như sau: Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch chuẩn 84 phút, các chỉ số tương tứng của pin Y lần lượt là 254 phút và 67 phút. α = 0,10 ,có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút Biết thời gian sử dụng trung bình của hai nhãn hiệu pin trên là các đại lượng ngẫu Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân Gọi thời gian sử dụng trung bình của pin X và Y lần lượt là µx ,µy; khi đó µx ,µy là các đại lượng trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút hay pháp kiểm định : Phương pháp kiểm định sự khác biệt giữa hai tham số trung bình Kết luận: vì kqs ∉ Wα nên ta chưa thể bác bỏ H0 và chấp nhận H1, tức là chưa có cơ sở để kết luận thời gian sử dụng trung bình của pin X có lớn hơn pin Y ít nhất là 45 hợp kích thước mẫu lớn (nx, ny ≥30) với giả định cả hai tổng thể X và Y phân phối chuẩn, ta có thể dùng công thức và quy tắc trên để kiểm định và với phương sai hiệu chỉnh mẫu s’2x, s’2y Phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên mẫu ngẫu nhiên độc nhưng khi đó tiêu chuẩn kiểm định sẽ theo phân phối Student với số bậc tự do được xác định theo Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình Ví dụ: Kiểm tra chiều dài trung bình của một chi tiết được chế tạo từ hai thiết bị khác nhau một cách ngẫu nhiên, ta có : mẫu ngẫu nhiên 15 chi tiết của thiết bị thứ nhất có chiều dài trung bình là 100 cm và độ lệch chuẩn hiệu chỉnh là 5 cm ; mẫu ngẫu nhiên 10 chi tiết của thiết bị thứ hai có chiều daì trung bình là 110 cm và độ lệch chuẩn hiệu chỉnh là hãy kết luận xem kích thước trung bình của chi tiết trên được chế tạo ở hai thiết bị trên có Biết chiều dài trung bình của chi tiết trên là đại lượng ngẫu nhiên phân Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân Gọi chiều dài trung bình của chi tiết được chế tạo trên hai thiết bị lần lượt là µx ,µy với µx, µy là thước của chi tiết được chế tạo trên hai thiết bị có như nhau hay định phương pháp kiểm định: Phương pháp kiểm định sự khác biệt tham số trung bình Kết luận: kqs ∈ Wα, ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là chiều dài trung bình của chi tiết được chế tạo ở hai thiết bị trên là khác kiện áp dụng: Khi tiến hình so sánh sự khác nhau giữa trung bình hai tổng thể, hai mẫu cần thỏa mãn điều kiện là dữ liệu phải tuân theo quy luật phân phối chuẩn và phương sai của hai mẫu Lựa chọn phương pháp kiểm định: Phương pháp kiểm định sự khác nhau trung bình của hai tổng thể (mẫu phối hợp từng cặp), chúng ta dùng bảng phân phối chuẩn (nếu mẫu lớn hơn hoặc )( 0−=≡ với x và s’d là trung bình và độ lệch chuẩn của n khác hệ số quan sát kqs để so sánh với miền bác bỏ và kết luận. Mô hình của bài toán kiểm định sự khác biệt giữa hai tham số trung bình có thể tóm lược ở biểu Để đánh giá xem việc khuyến mãi có thực sự làm tăng doanh số hay không, công ty đã chọn ngẫu nhiên 15 cửa hàng trong hệ thống phân phối sản phẩm của mình và khảo sát sự khác KIỂM ĐỊNH THAM SỰ KHÁC NHAU HAI TRUNG BÌNH TỔNG THỂ 3. Phương pháp kiểm nghiệm sự khác nhau của hai trung bình tổng thể - Bảng phân x và s’d là trung bình và độ lệch chuẩn điều chỉnh của n khác biệt Với mức ý nghĩa α=0,05, có thể kết luận chiến dịch khuyến mãi đã làm tăng doanh số hay Gọi µx , µy lần lượt là doanh số trung bình sau và trước khi thực hiện chiến dịch khuyến mãi, µx , Phương pháp kiểm định: Kiểm định sự khác nhau giữa hai trung bình của tổng thể (hai mẫu )( 0−=≡ với x và s’d là trung bình và độ lệch chuẩn của n khác biệt. Kết luận: vì kqs không thuộc Wα nên chưa có cơ sở để bác bỏ giả thiết H0 và chấp nhận giả thuyết đối H1 ở mức ý nghĩa α=0,05, hay chiến dịch khuyến mãi của công ty vẫn chưa làm Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên – Phân tích ANOVA (Gồm một biến định lượng và một biến phân loại (biến định tính)) Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu, đây là hình thức mở rộng của kiểm định sao vây?, bởi vì khi sử dụng kiểm định t đối với hai mẫu độc lập, trong trường hợp biến phân đôi một, điều này dẫn đến một tình trạng là sai số của kiểm định sẽ lớn hơn rất nhiều so với mong Ví dụ, mỗi một kiểm định Z hay t (kiểm định sự khác nhau tham số trung bình giữa hai mẫu độc lập) chứa đựng một sai số dạng I, tổng sai số của dạng I đối với k đôi giá trị Trong một trường hợp cụ thể, giả sử chúng ta có một biến phân loại với 5 giá trị lựa chọn và α = 0,05, khi đó chúng ta sẽ có 10 so sánh nếu chúng ta dùng phương Sai số dạng I của kiểm định t khi đó sẽ là: Trong trường hợp này, sai số để chúng ta bác bỏ giả thuyết H0 về bằng nhau của các giá trị trung Các điều kiện sử dụng: Các mẫu được rút ra theo cách ngẫu nhiên và độc lập (điều kiện này phải được đảm bảo), các tổng thể có phân phối chuẩn (hoặc gần phân phối chuẩn) và các tổng thể có Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố định lượng đến Giả sử từ một biến phân loại, chúng ta có thể chia tổng thể thành k nhóm tuân theo quy luật phân phối chuẩn và có phương sai bằng nhau dựa trên k mẫu ngẫu nhiên độc lập gồm n1, n2,..., nk quan Gọi xij là giá trị của biến định lượng đang nghiên cứu tại quan sát thứ j của nhóm thứ I, khi đó, 1x , 2x ,…, kx là giá trị trung bình của các nhóm, x là trung bình chung của tất cả các nhóm theo Gọi giá trị trung bình của các nhóm trong tổng thể là µ1, µ2,…, µk thì phương pháp phân tích phương sai sẽ cho phép chúng ta so sánh sự khác nhau giữa tham số trung bình của 2 hay nhiều Giả thiết và đối thiết trong phân tích phương sai một chiều được phát biểu như sau: H1: Tồn tại ít nhất một giá trị trung bình của nhóm thứ I (µi) khác với ít nhất một giá trị trung Để tính tiêu chuẩn kiểm định trong phân tích phương sai (ANOVA), chúng ta cần tiến hành tính - Tổng các độ lệch bình phương toàn bộ (Total sum of squares): phản ánh toàn bộ biến thiên của Lúc đó tiêu chuẩn kiểm định F (Fisher) được tính bằng: Với α cho trước, chúng ta bác bỏ H0 nếu với k-1 là bậc tự do của tử số và n-k là quyết định marketing phù hợp, công ty muốn xem xét có sự khác nhau trong doanh số bán của các cửa hàng hay không, số liệu thu thập trong một năm tại các cửa hàng được thể hiện ở bảng H0: Doanh số bán trung bình hàng tháng của các cửa hàng là bằng nhau pháp kiểm định : Thực hiện phương pháp phân tích phương sai một chiều. - Doanh số trung bình của hàng tháng của công ty là 180,56 triệu - Vì F = 15,01 > 2,816 nên chúng ta bác bỏ H0, chấp nhận H1 có nghĩa là tồn tại ít nhất một của hàng có doanh số bán khác với doanh số bán của ít nhất một của hàng còn lại. Khi nghiên cứu mối quan hệ giữa hai hay nhiều biến định lượng, chúng ta có thể sử dụng phương pháp hồi quy, trong đói có một biến nguyên nhân (biến độc lập) và một biến kết quả (biến phụ Trong phương pháp này người ta có thể tìm ra được mối quan hệ và mức độ tác động của - Giá trị của biến X là hoàn toàn độc lập so với biến Y - Trung bình các sai số của mô hình phải bằng không - Phương sai của sai số là một hằng số và độc lập với giá trị X giữa hai biến số để chúng ta có thể dự đoán hàm số thích hợp để mô tả mối quan hệ. Trong đó: Xi là số năm làm việc của người thứ i Một mô hình tuyến tính được xây dựng khi nó tồn tại mối quan hệ giữa biến độc lập và biến phụ thuộc, phân tích phương sai sẽ cho phép kiểm định mối quan hệ tuyến tính giữa hai biến. - Gọi SST là tổng bình phương các biến động (giữa giá trị thực tế và giá trị trung bình của biến - Gọi SSR là tổng bình phương hồi quy, là đại lượng biến động của giá trị thực tế yi được giải - Gọi SSE là tổng bình phương biến động giữa giá trị thực tế và giá trị hồi quy, khi đó ta có thể =MSR với k là số biến (trong trường hợp này MSR có phân phối F (Phân phối Fisherr) dùng để kiểm định ý nghĩa của Hệ số R2 dùng để đo lường sự phù hợp của mô hình tuyến tính và nó thường gọi là hệ số xác định Tuy nhiên, R2 của mẫu có khuynh hướng là ước lượng lạc quan của thước đo sự phù hợp của mô Ở phương trình (1) chúng ta quan tâm chú ý đến hai hệ số β0 và β1, yêu cầu của mô hình hồi quy là làm nhu thế nào để tìm được các hệ số này, chúng ta có thể thể tính toán các giá trị tương ứng của β0 và β1 là b0 và b1 trên mẫu để ứng lượng lên tổng thể. Theo phương pháp bình phơng bé nhất, ta có thể ước lượng các hệ số β0 và β1 từ các hệ số b0 và tham số b1 của mẫu sao cho tổng bình phương sai số của phương trình sau đây là bé nhất: Khi đó các giá trị b0 và b1 được tính như sau: Hệ số hồi quy chuẩn hóa, kí hiệu là Beta biểu hiện độ dốc của đường thẳng (tìm được theo phương pháp bình phương bé nhất) khi cả hai biến X và Y được biểu diễn bằng thang đo chuẩn sBeta 1β= với sx và sy là độ lệch chuẩn của biến X và biến Y. Ước lượng các tham số của tổng thể - Với bất kì một giá trị X nào thì phân phối chuẩn của biến Y phải là phân phối chuẩn - Các giá trị Y độc lập đối với nhau tức là quan sát này không bị ảnh hưởng bởi các quan sát - Tất cả các trị trung bình µy khi X xảy ra đều nằm trên một đường thẳng – đó là đường hồi quy Khi chúng ta biết các giá trị b0 và b1 trên mẫu, chúng ta sẽ suy rộng giá trị này lên tổng thể cho Nếu đặt σ2e và s2e là phương sai của sai số của mẫu (e) và tổng thể (ε), ta có: Nếu đặt β1 là giá trị ước lượng của b1 trên tổng thể thì phương sai của b1 sẽ là: Khi đó độ lệch chuẩn của sai số sẽ là: Giả sử t sai số hồi quy (ei) tuân theo quy luật phân phối chuẩn thì biến ngẫu nhiên (t) là giá trị Gọi α là mức ý nghĩa thì ta luôn luôn tìm được một khoảng tin cậy của β1, khi đó: Kiểm định các tham số của tổng thể Phương pháp kiểm định: Kiểm định t-student đối với mối quan hệ giữa hai bác bỏ và kết luận: Giả thiết H0 được bác bỏ khi: Khi chúng ta có các hệ số b0 và b1, chúng ta có thể thành lập được mô hình, thay các giá trị xn+1 vào thì ta có thể tính được giá trị dự đoán của mô hình. Với mỗi giá trị của xi chúng ta sẽ tìm được các giá trị dự đoán của yi tương ứng luôn này trong KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH PHỤ THUỘC HAY ĐỘC LẬP CỦA CÁC Kiểm định giả thiết về quy luật phân phối của tổng thể Kiểm định giả thiết về sự phân phối của tổng thể hay có thể gọi là kiểm định sự phù hợp là kiểm định nhằm xem xét dữ liệu thu thập được phù hợp (thích hợp) đến mức nào với giả định về phân Giả sử có mẫu ngẫu nhiên n quan sát được chia thành k nhóm khác nhau, mỗi quan sát phải và Khi đó Oi là số lượng quan sát ở nhóm thứ i, vấn đề đặt ra là ta sẽ dùng mẫu quan sát này để kiểm định giả thiết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i. Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp giả thiết H0 đúng, nghĩa là tính các df = k-1: mức độ tự do trong phép kiểm ĐỊNH CHI BÌNH PHƯƠNG (kiểm định về sự phân phối tổng thể) Là kiểm định một đuôi (df=k-1) với: Chọn phương pháp kiểm định luận: Vì 4,69 > 3,843 nên bác bỏ H0 ở mức ý nghĩa 0,05 và kết quả thi trái với tin tưởng ta phải kiểm tra xem tỉ lệ các đoàn viên bỏ phiếu cho mỗi ứng viên có khác nhau hay giả thiết H0 đúng thì số cử tri theo lí thuyết bầu cho các ứng viên đều là 50. Kết luận: Vì nên chúng ta có thể bác bỏ H0 tức là các đaòn viên đã bỏ phiểu Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay kiểm định mối quan hệ giữa hai biến biểu danh) chúng ta xem xét trường hợp dữ liệu được xếp theo hai tiêu chí, nghĩa là được phân theo hai yếu Gọi Oij là số lượng quan sát ứng với hàng thứ i và cột thứ j và Eij là số lý thuyết ứng với hàng thứ KIỂM ĐỊNH CHI BÌNH PHƯƠNG Là kiểm định một đuôi dụ 1: Một nhà nghiên cứu thị trường muốn xác định mối tương quan có thể có giữa kích cỡ xe húng ta dùng phép kiểm định chi bình phương để so sánh giá trị qua sát được và giá trị lí thuyết Đối thiết H1: Hai yếu tố dùng phân loại phụ thuộc nhau trong tổng th y ta bác bỏ giả thiết H0 tức là kích c CÁC PHƯƠNG PHÁP KIỂM ĐỊNH PHI THAM SỐ Kiểm định phim tham số là các loại kiểm định ít đòi hỏi các giả thiết về phân phối của dữ thường, kiểm định phí tham số phù hợp nhất trong các trường hợp chúng ta không thể dùng các kiểm định tham số ví dụ dữ liệu mà chúng ta thu thập là loại dữ liệu định tính (biểu kiểm định phân phối chuẩn không phương pháp kiểm định phi tham số. Ở phần kiểm định tham số ta đã đề cập đến việc so sánh trung bình của hai tổng thể với giải định tổng thể phân phối chuẩn và có phương sai bằng nhau. Ứng dụng: Dữ liệu mẫu từng cặp phối hợp, tổng thể không phân phối chuẩn và có thể phương sai Việc kiểm định dấu thường được dùng khi phân tích dự liệu từ mẫu phối người ta ít dùng kiểm định dấu do nói không làm sáng tỏ được giá trị của khác biệt, kết quả không thuyết phục lắm nên người ta thường thực hiện kiểm định thức thực hiện kiểm định Wilcoxon trong trường hợp mẫu nhỏ như sau: Giá trị W của kiểm định là: W= min [Σ(+), Σ(-)] Tham chiếu với giá trị ở bảng Wilconxon trong bảng phân phối, so sánh với giá trị kiểm định Ví dụ: Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở thích của họ về hai Đánh giá xem có hay không mức độ ưa chuộng giữa hai loại kem đánh răng A, B với mức ý H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể Tính tiêu chuẩn kiểm định: Đây là loại kiểm định dạng hai đuôi (đối bảng phân phối của kiểm định Wilcoxon với mức ý nghĩa 5% ta có Vì W<W2α nên ta chưa có cơ sở để bác bỏ H0 tức là chưa có cơ sở để chứng minh có sự khác Trong trường hợp mẫu lớn, dùng phân phối chuẩn thay thế cho phân phối của kiểm định Giá trị trung bình và phương sai của hai mẫu được tính: có tạo ra được nhận biết về nhãn hiệu nới khách hàng hay không, trước và sau khi thực hiện trước và sau khi quảng cáo được tính toán, xếp hạng theo giá trị tuyệt đối của chúng (không có Tổng cộng hạng của các chênh lệch dương có giá trị nhỏ hơn và bằng 625. hiện kiểm định Wilcoxon, ta sẽ xem xét xem sau chiến dịch quảng cáo, dầu gội đầu nhãn hiệu P có được khách hàng biết đến nhiều hơn trước hay không với mức ý nghĩa 5%? H0: Sự nhận biết nhãn hiệu dầu gội đầu P trước và sau chiến dịch quảng cáo là giống nhau Lựa chọn phương pháp kiểm định : Kiểm định Wilcoxon với tham chiếu là tham chiếu phân Ta có Z=-0,1206 < U0,95= 1,65 nên chúng ta chưa có cơ sử để bác bỏ giả thiết H0 tức là Kiểm định không yêu cầu các giả định về hình dạng của phân phối, nó được dùng để các giả thiêt về hai mẫu độc lập có xuất phát từ hai tổng thể có phân phối có thể không giống nhau. này gần giống như kiểm định wilconxon vì các biến phải có thể xếp hạng (trong kiểm định wilcoxon ta phải xét cả dấu và hạng còn trong kiểm định U ta chỉ xét thứ hạng mà Kiểm định nhiều hơn hai mẫu độc lập H) Giả sử rằng chúng ta có các mẫu ngẫu nhiên độc lập gồm k quan sát, nếu ta sắp xếp các quan sát này thành từng nhóm mà mỗi nhóm có phân phối tuân theo quy luật phân phối chuẩn và phương sai của chúng bằng nhau thì chúng ta có thể dùng phương pháp kiểm định tham số (ANOVA) để Tuy nhiên, có một số trường hợp, mẫu không thoải mãn những điều kiện để sử dụng ANOVA thì chúng ta sử dụng phương pháp kiểm định phi tham số với phương pháp tổng thể n quan sát ta sắp xếp các hạng một cách liên tục từ nhỏ đến lớn, nếu giá trị quan sát trùng nhau thì hạng xếp giống nhau bằng cách dùng số trung bình cộng các hạng của R1, R2,..., Rk là tổng của các hạng được xếp theo thứ tự, khi đó từ n quan sát ta có của k H1: Tồn tại ít nhất một tham số trung bình của nhóm i khác với ít nhất một tham số trung bình Tiêu chuẩn kiểm định W được tính bằng Trong trường hợp này chúng ta dùng phân phối Chi bình phương với bậc tự do là k-1, khi đó Kiểm định t đối với tham số trung bình mẫu Như chúng ta đã biết, thu nhập trung bình của các đối tượng phỏng vấn là 33,224 có giả thiết cho rằng thu nhập của đối tượng mà chúng ta phỏng vấn trên tổng thể là 32 chúng ta cần kết luận nhận định đó có đúng các biểu trên, ta có thể biết giá trị trung bình, độ lệch chuẩn của nên chúng ta chưa có cơ sở để bác bỏ H0 hay chưa có cơ sở để chấp nhận H1. Kiểm định tham số trung bình hai mẫu (hai mẫu độc lập) Giả sử ta muốn so sánh thu nhập trung bình giữa những người có giới tính nam và nữ trên tổng thể có khác nhau hay không, ta có giả thiết: H0: Thu nhập trung bình của người nam và người nữ bằng nhau trên tổng thể H1: Thu nhập trung bình của người nam và người nữ không bằng nhau trên tổng thể trong kiểm định phương sai<0,05 thì ta sẽ dùng kết quả kiểm định t ở dòng thứ 2 Kiểm định Leneve’s (giả thiết H0: phương sai của hai mẫu (biến) bằng nhau, H1: phương sai của hai mẫu (biến) không bằng nhau) sẽ cho phép kiểm định phương sai hai mẫu có bằng nhau chấp nhận H1 nghĩa là phương sai của hai mẫu không bằng nhau, do vậy giá trị t mà ta phải tham >0,05 thì phương sai của hai mẫu bằng nhau, ta Đối với kiểm định t, ta nhận thấy rằng t=6,55 và p-value = năm ta có thể bác bỏ H0 và chấp nhận H1, có nghĩa là thu nhập trung bình giữa người nam và nữ sẽ khác định tham số trung bình hai mẫu (hai mẫu phụ thuộc) Vì giá trị t=-0,803 và p-value = nên chúng ta chưa có cơ sở để bác bỏ H0 tức là Giả sử chúng ta muốn so sánh thu nhập trung bình của các đối tượng làm trong những lĩnh vực H1: Thu nhập trung bình của người làm trong lĩnh vực dịch vụ - thương mại, xây dựng và công nghiệp không bằng nhau (có nghĩa là tồn tại ít nhất một thu nhập trung bình của một ngành khác với ít nhất một thu nhập trung bình của hai ngành còn lại) Nhấn Post Hoc để chọn loại kiểm định nhằm xác định cụ thể sự khác biệt giữa các nhóm Nếu phương sai giữa các nhóm cần so sánh không bằng nhau, chúng ta chọn Tamhane’s T2 (ứng dụng cho kiểm định t từng cặp nếu phương sai của chúng không bằng đó để kiểm định sự bằng nhau phương sai các nhóm, Means >0,05 nên ta có thể khẳng định là phương sai của các nhóm là bằng nhau, thỏa mãn Với F=0,259 và p-value = nên chưa có cơ sở để bác bỏ H0 hay chưa có cơ sở để Trong các trường hợp khác, nếu ta bác bỏ H0 và chấp nhận H1, với thống kê ta có thể biết được sự khác nhau từng cặp của các tham số trung bình. Giả sử chúng ta mong muốn tìm mối tương quan giữa hai biến năm làm việc (biến độc lập) và thu Chúng ta có thể xem đường hồi quy lí thuyết của dãy dữ liệu bằng cách click hai lần vào Vì F=71,115 và nên chúng ta có thể khẳng định tồn tạo mô hình hay tồn tại mối quan hệ giữa hai biến năm làm việc và thu nhập trên tổng thể. Ta có R2 = 0,264 có nghĩa là biến số năm làm việc sẽ giải thích 26,4% thu nhập/ năm của nhân Ta có R2a =0,261, ta có thể kết luận mối quah hệ giữa hai biến này rất yếu vì R2a cho phép chúng ta kiểm định các hệ số góc trong mô hình, ta có t1 = 8,433 và p- value = nên ta khẳng định tồn tại mối quan hệ giữa hai biến với hệ số góc Ta có thể thành lập được phương trình hồi quy như sau: KIỆM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH ĐỘC LẬP HAY PHỤ THUỘC GIỮA HAI Tình huống: Trong một nghiên cứu ước tính của bộ Y tế, người ta mong muốn kiểm tra giả thuyết rằng tần suất sử dụng dịch vụ bệnh viện của các ngày trong tuần là như nhau và giảm 25% vào H0: Nhu cầu khám chữa bệnh là như nhau ở tất cả các ngày trong tuần và giảm 25% vào cuối Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay kiểm định mối quan hệ giữa hai biến biểu danh) Người ta dùng kiểm định Chi bình phương để kiểm định sự kết hợp giữa bai biến (biểu danh hoặc - χ2 được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ - Với kiểm định Chi bình phương, ta thành lập được các bảng cho tất cả các loại bảng chéo với k là chiều bé nhất của bảng chéo. Giả sử ta chọn phân tích tính độc lập giữa hai biến định tính quy mô doanh nghiệp (quymo) và H0: Hai biến quy mô doanh nghiệp và loại hình doanh kinh độc lập với nhau trên tổng thể H1: Hai biến quy mô doanh nghiệp và loại hình doanh kinh phụ thuộc với nhau trên tổng thể Trong kiểm này, ta thấy giá trị Chi bình phương = 38,665 và nên ta bác bỏ H0 và chấp nhận H1 tức hai biến phụ thuộc lẫn nhau trên tổng thể. Với giả thiết và đối thiết là: H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể Nhìn vào bảng trên ta có thể dễ dàng diễn giải dữ liệu, với Z = -1,876 và định có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể. Chú ý: Kiểm địn dấu và Nemar có thể thực hiện tương tự Trong trường hợp giống như ví dụ ở trường hợp kiểm định wilcoxon, nhung bây giờ ta có 3 sản Với Chi bình phương = 9,308 và nên ta bác bỏ H0 tức chấp nhận H1 hay đã có sự khác biệt trong mức độ ưa chuộng giữa A, B, C trong tổng thể. Tình huống: Có hai loại máy nổ Toshiba và Yamaha đang tiêu thụ tại Việt Nam, một nhà phân phối muốn kiểm tra mức độ tiêu hao nguyên vật liệu của hai loại sản phẩm vật liệu, tổng số khách hàng điều tra là 18 người trong đó 10 người sử dụng sản phẩm Toshiba và 10 người sử dụng sản phẩm Yamaha, kết quả thu được như sau: Ta thấy giá trị U = 13,5, giá trị Z = -2,363 và nên ta bác bỏ H0, chấp nhận H1 tức là có sự khác nhau về mức tiêu hao nhiên liệu trung bình của hai loại sản phẩm là Kiểm định nhiều hơn hai mẫu độc lập H) Giả sử như chúng ta có 3 nhóm sản phẩm (thêm một sản phẩm của hãng Sonix), cách thức thực Vào Grouping Variable để định nghĩa biến, hiện tại chúng ta có 3 biến, chúng ta đặt giá trị ở maximum là 3, nếu chúng ta so sánh 2 biến thì chúng ta định số 2 (giá trị 1, 2, hay 3 phụ thuộc vào các định nghĩa value label của biến thấy giá trị Chi bình phương = 7,318 và nên ta bác bỏ H0, chấp nhận H1 tức là có sự khác nhau về mức tiêu hao nhiên liệu trung bình của ba loại sản phẩm là khác nghiên cứu phân tích dữ liệu luôn bao hàm kiểm định giả kiểm định người ta phải trình bày hai giả thuyết là giả thuyết không ( thường ký hiệu H0) - giả thuyết cần kiểm định; và giả thuyết đối ( thường ký hiệu H1) - giả thuyết thay thế cho giả thống kê cho phép chúng ta đi đến quyết định là các giả thuyết đó có được kiểm chứng bằng số Khi dựa vào mẫu để kiểm định giả thuyết có thể mắc hai loại sai lầm. Thực hiện một bài toán kiểm định bao gồm các bước: phát biểu giả thuyết không giả thuyết đối; xác định mức ý nghĩa; lựa chọn phương pháp kiểm định; tính giá trị kiểm định; xác định miền Thủ tục kiểm định giả thuyết có thể được sắp xếp theo hai loại chủ yếu: kiểm định tham số và kiểm định phi tham số- tuỳ thuộc vào thang đo lường của biến liên quan. Các kiểm định tham số đòi sử dụng các thang đo lường là khoảng hoặc tỷ lệ, trong khi các kiểm định phi tham số phù hợp với các thang đo lường là định danh và thứ tự. Kiểm định tham số được nghiên cứu bao gồm kiểm định tham số trung bình của tổng thể, kiểm định tham số tỷ lệ, kiểm định sự khác nhau giữa hai trung bình hai tổng thể, kiểm định sự khác nhau trung bình của nhiều tổng thể và hồi quy Kiểm định phi tham số chúng ta sẽ nghiên cứu là kiểm định về quy luật phân phói của tổng thể, kiểm định về tính độc lập hay phụ thuộc, kiểm định dấu, kiểm định Wilcoxon, kiểm Các thủ tục kiểm định đều dễ dàng và đơn giản nhờ vào sự trợ giúp của phân mềm SPSS. 2. Trong kiểm định giả thuyết thống kê có thể vấp những loại sai lầm nào? 4. Sự khác nhau cơ bản phân biệt giữa kiểm định tham số và phi tham số. Theo nhận định của nhà máy thời gian hoàn thành một sản phẩm là 44 phút, như vậy nhìn nhận đo và thu được kết quả như sau chiều dài trung bình 20,5 cm và độ lệch tiêu chuẩn điều chỉnh là 7.Trong lượng sản phẩm do nhà máy sản xuất ra (X) là một đại lượng ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là σ=2 kg và trọng lượng trung bình là 20 kg. không bình thường làm thay đổi trọng lượng trung bình của sản phẩm, người ta cân thử 100 sản 8. Tỉ lệ phế phẩm của một nhà máy theo dự toán là 0,1 và có người cho rằng tỉ lệ đó là tỉ lệ thật Định mức thời gian lắp đặt một máy vi tính cá nhân là một đại lượng ngẫu nhiên tuân theo qui luật phân phối chuẩn có thời gian quy định là 30 máy vi tính này, người ta nghĩ rằng điều này có thể dẫn đến việc phải thay đổi định mức thời Tiến hành kiểm tra thử 5o máy vi tính và thu được kết quả sau: Với mức ý nghĩa α=0,05, hãy kết luận xem có cần thay đổi định mức thời gian lắp đặt máy hay người ta lẫy ngẫu nhiên những mẫu giấy sản xuất, xác định chiều dài trung bình xem có bằng cho việc ước lượng chiều dài trung bình là 95% thì nhà sản xuất có thể kết luận gì về giấy đã sản Một doanh nghiệp có số liệu thống kê về doanh thu bán hàng của mình qua ba năm theo các b. Ước lượng trọng lượng trung bình của các bao thức ăn trên với độ tin cậy 95%? Công ty nước giả khát X có 3 loại sản phẩm là A, B, C với mong muốn số lượng chai tiêu thụ Trong một lần kiểm tra sơ bộ về tình hình học tập của sinh viên một trường đại học với một Với mức ý nghĩa 5%, hãy xác định xem giả thuyết trên có đúng thử giả thiết Ho về tính chất độc lập của hai yếu tố phân loại A và B bằng cách dùng phép kiểm định chi (χ) cho trong bảng sau với mức ý nghĩa 5%? Với độ tin cậy 95% hãy xét xem mối quan hệ người dân giữa các vùng trong thành phố và mức Người ta muốn điều tra xem giữa loại tai nạn lao động có liên quan đến độ tuổi của người lái Từ kết quả trên, nhân viên điều tra kết luận có mối tương quan giữa độ tuổi và loại thương tật của hồ sơ thuế giữa ba nhóm doanh nghiệp khác nhau hay không và đã thu thập được số liệu sau: Trong mỗi tình huống sau, cho biết phân tích thống kê nào bạn sẽ thực hiện và các kiểm định b. Ý kiến khách hàng đối với xà phòng Camay có tuân theo qui luật phân phối chuẩn thụ của họ về kem (đáng kể, trung bình, yếu hoặc không) và mức thu nhập của họ Trong khuôn khổ một thực nghiệm nhằm đo lường ảnh hưởng của giới tính và mức độ thường xuyên đi du lịch đối với sở thích du lịch ra nước ngoài, người ta đã thu được kết quả của 30 a. Nam và nữ có sở thích khác nhau đối với đi du lịch ra nước ngoài hay không? b. Những người ít đi du lịch, đi du lịch ở mức trung bình và hay đi du lịch có sở thích khác c. Mức độ thường xuyên đi du lịch có khác nhau giữa nam và nữ hàng về không gian, thái độ của nhân viên phục vụ, chất lượng các món ăn và giá cả các lượng cao của các món ăn và giá cả các món ăn hợp lý của nhà hàng được đánh giá bởi một thang b. Lập một bảng chéo giữa hai biến: mức độ thường xuyên đến nhà hàng và giới tính ? Để biết được chất lượng, giá cả các mặt hàng đã ảnh hưởng như thế nào đến mức độ ưa thích của cả các đánh giá được đo lường bởi một thang điểm 11 trong đó điểm số càng cao biểu thị mức đánh giá a. Phân tích thống kê nào là thích hợp để xem xét mối quan hệ giữa biến mức độ ưa thích và chất lượng b. Phân tích thống kê nào là thích hợp để xem xét mối quan hệ giữa biến mức độ ưa thích với biến chất CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ Kiểm định giả thiết tham số tỷ lệ Với mức ý nghĩa 5%, ta có thể xác định miền bác bỏ như sau: Kiểm định sự khác nhau giữa trung bình của hai tổng thể Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên – KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH PHỤ THUỘC HAY ĐỘC LẬP CỦA Kiểm định giả thiết về quy luật phân phối của tổng thể Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc CÁC PHƯƠNG PHÁP KIỂM ĐỊNH PHI THAM SỐ Kiểm định nhiều hơn hai mẫu độc lập H) Kiểm định t đối với tham số trung bình mẫu Kiểm định tham số trung bình hai mẫu (hai mẫu độc lập) Kiểm định tham số trung bình hai mẫu (hai mẫu phụ định chi bình phương về tính chất độc lập hay phụ định nhiều hơn hai mẫu độc lập H)