THỐNG KÊ KINH DOANH VÀ SPSS :: Bài 4
Chia sẻ bởi Trương Minh Chiến |
Ngày 19/03/2024 |
13
Chia sẻ tài liệu: THỐNG KÊ KINH DOANH VÀ SPSS :: Bài 4 thuộc Công nghệ thông tin
Nội dung tài liệu:
Bài 4
KIỂM ĐỊNH THỐNG KÊ
1. Kiểm định trung bình
2. Kiểm định phi tham số
3. Kiểm định Khi bình phương
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
1.1. Kiểm định t-một mẫu
Phương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu cho rằng giá trị trung bình cần kiểm nghiệm thì bằng với một con số cụ thể nào đó.
Phương pháp kiểm nghiệm này dùng cho biến dạng thang đo khoảng cách hay tỉ lệ. Ta sẽ loại bỏ giả thuyết ban đầu khi kiểm nghiệm chó ta chỉ số Sig. nhỏ hơn mức tinh cậy (0.05).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Compare MeanOne-Sample T Test…
Lựa chọn biến cần so sánh bằng cách di chuyển vệt đen và chuyển đến vào hộp thoại Test Variable(s), nhập giá trị cần so sánh vào hộp thoại Test Value
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là 95% và cách xữ lý đối với các giá trị khuyết
Exclude cases analysis by analysis. Mỗi kiểm nghiệm T sử dụng toàn bộ các trường hợp (cases) chứa đựng giá trị có ý nghĩa đối với biến được kiểm nghiệm. Đặc điểm là kích thước mẫu luôn thay đổi.
Exclude cases listwise. Mỗi kiểm nghiệm T sử dụng chỉ những trường hợp có giá trị đối với toàn bộ tất cả các biến được sử dụng trong bất kỳ kiểm nghiệm T test nào. Kích thước mẫu luôn không đổi
1.2. Kiểm định t hai mẫu độc lập
Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng thang đo khoảng cách hoặc tỷ lệ
Đối với dạng kiểm định này, các chủ thể cần kiểm định phải được ấn định một cách ngẫu nhiên cho hai nhóm dữ liệu cần nghiên cứu sao cho bất kỳ một khác biệt nào từ kết quả nghiên cứu là do sự tác động của chính nhóm thử đó, chứ không phải do các yếu tố khác
Các dữ liệu cần so sánh nằm trong cùng một biến định lượng. Để so sánh ta tiến hành nhóm các giá trị thành hai nhóm để tiến hành so sánh. Giả thuyết ban đầu cần kiểm định là giá trị trung bình của một biến nào đó thì bằng nhau giữa hai nhóm mẫu và chúng ta sẽ từ chối giả thuyết này khi mà chỉ số Sig. nhỏ hơn mức ý nghĩa (thường là 0.05)
Compare meansIndependent sample t-test….
Chuyển biến định lượng cần so sánh trung bình vào hộp thoại Test variable(s). Ta có thể chọn nhiều biến định lượng để so sánh.
Định ra các nhóm cần so sánh với nhau (thường là biến định danh) di chuyển vào hộp thoại Gouping variable.
Công cụ Define Groups… cho phép ta định ra hai nhóm cần so sánh với nhau
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Independent sample t-test
Có hai cánh định nhóm so sánh:
Sử dụng con số cụ thể, nhập hai giá trị đại diện cho hai nhóm cần so sánh trong biến vào ô group 1 và group 2
Cách thứ hai sử dụng Cut point, nhập giá tri phân cách các giá trị trong biến thành hai nhóm. Toàn bộ các trường hợp có giá trị (con số mã hóa) nhỏ hơn giá trị được nhập vào trong cut point sẽ định ra một nhóm, và toàn bộ các trường hợp có giá trị mã hóa lớn hơn hoặc bằng giá trị trong Cut point sẽ tạo ra một nhóm khác.
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là 95% và cách xữ lý đối với các giá trị khuyết
1.3. Kiểm định t theo từng cặp mẫu
Đây là dạng kiểm định dùng cho hai biến trong cùng một mẫu có liên hệ với nhau, dữ liệu dạng thang đó khoảng cách hoặc tỷ lệ. Nó tính toán sự khác biệt giữa các giá trị của hai biến cho mỗi trường hợp và kiểm định xem giá trị trung bình các khác biệt có khác 0 hay không. Giả thuyết ban đầu được đưa ra là giá trị trung bình của các khác biệt là bằng 0. Và ta sẽ loại bỏ giả thuyết này trong trường hợp kiểm định cho kết quả Sig. nhỏ hơn mức ý nghĩa (0.05)
Điều kiện yêu cầu cho loại kiểm định này là kích cở hai mẫu so sánh phải bằng nhau. Các quan sát cho mỗi bên so sánh phải được thực hiện trong cùng những điều kiện giống nhau. Các khác biệt từ giá trị trung bình của hai mẫu phải là phân phối chuẩn hoặc số lượng mẫu đủ lớn để xấp xỉ là phân phối chuẩn
Bài toán tổng quát
Bài toán tổng quát như sau: Giả sử có hai tổng thể chung: Tổng thể chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy luật chuẩn N (1, ) và tổng thể chung thứ hai có các lượng biến của tiêu thức X2 phân phối theo quy luật chuẩn N (2, ). Muốn so sánh sự khác nhau giữa 1 và 2 ta xét độ lệch trung bình d . Ta chưa biết d nhưng nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 , ta đua ra giả thiết thống kê H0 : d = 0.
Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút ra hai mẫu phụ thuộc được hình thành bởi các cặp n quan sát độc lập của hai mẫu, từ đó tính là trung bình của các độ lệch giữa các cặp giá trị của hai mẫu di. Như vậy ta đưa bài toán so sánh về bài toán kiểm định giả thiết về giá trị trung bình đã xét ở phần I. Tuy nhiên ở đây thường không biết phương sai của các độ lệch của tổng thể chung nên thay bằng phương sai của các độ lệch của tổng thể mẫu , và dùng tiêu chuẩn kiểm định t :
Nhận xét
Phương pháp so sánh từng cặp như trên có ưu điểm hơn phương pháp so sánh hai mẫu độc lập ở chỗ:
- Nó không cần giả thiết gì về phương sai của hai tổng thể chung
- Nó thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai ảnh hưởng đến giá trị trung bình. Tuy nhiên nhược điểm của nó là việc bố trí thí nghiệm (điều tra) phức tạp hơn, chẳng hạn trong ví dụ trên phương pháp so sánh từng cặp đòi hỏi phải trồng lúa thí nghiệm trên hai mảnh của cùng một thửa ruộng với hai loại giống khác nhau.
Compare meansPaired-samples t-test
Chọn hai biến ta cần so sánh di chuyển vào hộp thoại Paired Variables bằng nút mũi tên. Paired-samples t test còn cho ta kết quả về mối tương quan giữa hai biến đang quan sát. Cho biết liệu hai biến này có tương quan với nhau hay không, độ tương quan và chiều tương quan (thể hiện ở bảng Paired samples correlation).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
1.4. Phân tích phương sai một chiều (One way ANOVA)
Phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung bình của nhiều tổng thể được xây dựng trên việc xem xét các biến thiên (phương sai) của các giá trị quan sát trong nội bộ từng nhóm (mẫu) và giữa các nhóm (mẫu) với nhau. Ở đây đề cập đến phân tích phương sai một yếu tố là trường hợp chỉ có một yếu tố (biến kiểm soát) được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác. Yếu tố được xem xét ảnh hưởng được dùng để phân loại các quan sát thành các nhóm nhỏ khác nhau.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Bài toán tổng quát
Giả sử ta có k tổng thể chung X1, X2, ..., Xk có phân phối chuẩn, trong đó Xi ~ N( i , ). Các giá trị trung bình i chưa biết song có cơ sở giả thiết rằng là chúng bằng nhau, ta có giả thiết cần kiểm định là H0: 1 = 2 = ... = k .
Trong thống kê vấn đề trên thường được xem xét dưới góc độ sau đây: Giả sử chúng ta quan tâm tới một nhân tố X nào đó. Nhân tố X có thể xem xét ở k mức độ khác nhau. Ký hiệu Xi là hiệu quả của việc tác động của nhân tố X ở mức i . Như vậy i là hiệu quả trung bình của nhân tố X ở mức i. Chúng ta muốn biết khi cho nhân tố X thay đổi ở các mức khác nhau thì điều đó có ảnh hương hay không tới hiệu quả trung bình. Chẳng hạn, chúng ta muốn nghiên cứu ảnh hưởng của giống tới năng suất cây trồng. Nhân tố ở đây là giống, các loại giống khác nhau là các mức của nhân tố. Hiệu quả của giống lên năng suất cây trồng được đo bằng sản lượng của cây trồng. Như vậy Xi chính là sản lượng của giống i và i là sản lượng trung bình của giống i.
Trình bày số liệu tổng quát
...
Các bước kiểm định
Bước 1: Tính các trung bình.
+ Trung bình của các mẫu:
+ Trung bình chung:
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Các bước kiểm định
Bước 2: Tính các tổng bình phương độ lệch.
+ Tổng bình phương chung, ký hiệu là SST (Total Sum of Squares):
+ Tổng bình phương do ảnh hưởng của nhân tố, ký hiệu là SSF (Sum of Squares for Factor):
+ Tổng bình phương do sai số, ký hiệu là SSE (Sum of Squares for Error):
Từ các công thức trên, ta thấy:
SST = SSF + SSE
Các bước kiểm định
Bước 3: Tính các phương sai tương ứng.
+ Phương sai do ảnh hưởng của nhân tố (hay phương sai giữa các mẫu), ký hiệu là MSF (Mean Square for Factor):
trong đó (k - 1) được gọi là bậc tự do của nhân tố.
+ Phương sai do sai số (hay phương sai trong các mẫu), ký hiệu là MSE (Mean Square for Error):
trong đó (n - k) được gọi là bậc tự do của sai số.
Các bước kiểm định
Bước 4: Kiểm định giả thiết.
Giả thiết H0: 1 = 2 = ... = k .
H1: Tồn tại ít nhất 1 cặp j j với j j’ .
Các kết quả nói trên được trình bày trong bảng sau đây và được gọi là bảng ANOVA (Analysis of Variance : Phân tích phương sai).
Người ta chứng minh được rằng nếu giả thiết H0 đúng thì tỷ số sẽ có phân phối Fisher với bậc tự do là (k - 1, n - k). Giả thiết H0 sẽ bị bác bỏ ở mức ý nghĩa , nếu F > F, (k-1),( n-k) .
Comapre meansOne-Way ANOVA
Chuyển các biến định lượng cần so sánh sang hộp thoại Dependent List. Lựa biến kiểm soát tức là biến độc lập (yêu cầu phải có ba giá trị trở lên trong biến kiểm soát này) chuyển biến kiểm soát vào hộp thoại Factor, Biến kiểm soát này cho phép ta phân các giá trị trung bình theo từng nhóm để kiểm định. Thao tác đến đây cho phép ta đưa ra kết luận liệu các trung bình của các nhóm có bằng nhau hay không.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Để tiến hành kiểm định so sánh sự khác biệt giữa các nhóm với nhau ta lựa chọn công cụ Post Hoc và lựa chọn các phương pháp kiểm định thích hợp
Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu không được chấp nhận ta sẽ sử dụng các phương pháp kiểm định sau để tiến hành so sánh giá trị trung bình giữa các nhóm:Tamhane’s T2, Dunnett’s T3, Games-Howell, Dunnett’s C
phương pháp kiểm định thống kê so sánh các trung bình mẫu
The least significant difference (LSD) là phép kiểm định tương đương với việc sử dụng phương pháp kiểm định t riêng biệt cho toàn bộ các cặp trong biến. Yếu điểm của phương pháp này là nó không chỉnh lý độ tin cậy cho tương thich với việc kiểm định cho nhiều so sánh cùng một lúc. Do đó dẫn đến độ tin cậy không cao.
Phương pháp kiểm định Bonferroni và Tukey’s honestly significant difference thì được sử dụng cho hầu hết các kiểm định so sánh đa bội. Kiểm định Sidak’s t test cũng được sử dụng tương tư như phương pháp Bonferroni tuy nhiên nó cung cấp những giới hạn chặt chẻ hơn. Khi tiến hành kiểm định một số lượng lớn các cặp trung bình Tukey’s honestly significant difference test sẽ có tác động mạnh hơn là Bonferroni test. Và ngược lại Bonferroni thì thích hợp hơn cho các kiểm định có số lượng cặp so sánh ít.
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Hochberg’s GT2 thì giống như Tukey’s honestly significant difference test nhưng thông thường Tukey’s test có tác dụng tốt hơn. Gabriel’s pairwise comparisons test thì giống như Hochberg’s GT2 nhưng nó thường được sử dụng hơn khi kích cở giữa các mẫu kiểm định có sự sai biệt lớn
Phương pháp kiểm định Dunnett’s pairwise được dùng để so sánh các giá trị trung bình của các mẫu với một gía trị trung bình cụ thể được lấy từ trong tập các mẫu so sánh.
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai bước kiểm định. Đầu tiên tiến hành kiểm định có hay không toàn bộ các giá trị trung bình là ngang bằng nhau hay không. Nếu toàn bộ các giá trị trung bình là không ngang bằng nhau sau đó bước thứ hai sẽ kiểm định sự khác biệt giữa các nhóm nhỏ với nhau, để tìm ra những nhóm nào thật sự khác biệt và không khác biệt về giá trị trung bình. Tuy nhiên việc kiểm định này không nên thực hiện đối với trường hợp kích cở mẫu trong các nhóm không ngang bằng nhau
Thông thường khi kích thước mẫu không ngang bằng giữa các nhóm. Bonferroni và Scheffé là hai phương pháp kiểm định được lựa chọn hơn là phương pháp Tukey
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b cũng tương tự tuy nhiên nó ít khi được sử dụng như các phương pháp trên.
Kiểm định Waller-Duncan t được sử dụng khi kích thước mẫu là không bằng nhau
Phương pháp kiểm định Scheffé cho phép sự kết hợp tuyến tính của những giá trị trung bình sẽ được kiểm định, không chỉ là so sánh giữa các cặp. Chính vì vậy kết quả của kiểm định Scheffé thì thường thận trọng hơn các phương pháp kiểm định khác, nó đòi hỏi một sự khác biệt lớn giữa các giá trị trung bình quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm định
One-Way ANOVA: Option
công cụ Options để xác định loại loại thông kê mô tả (Descriptive) và tính đồng nhất của phương sai, công cụ để tính hệ số thống kê Levene để kiểm định sự ngang bằng về phương sai giữa các nhóm (việc tính toán này quyết định đến sự lưa chon phương pháp kiểm định trong phần Post Hoc.
Công cụ Means Plot dùng để hiển thị đồ thị về giá tri trung bình của các nhóm. Công cụ Missing Values dùng để kiểm soát giá trị khuyết.
Exclude cases analysis by analysis: Những trường hợp có giá trị khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa vào trong kiểm định. Ngoài ra những trường hợp có giá trị quan sát nằm bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử dụng
Exclude cases listwise. Những trường hợp có giá trị khuyết Cases trong biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích .
2. Kiểm định phi tham số
Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có tham số. Khi tiến hành các kiểm định này thường phải dựa trên giả thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và hoặc kích thước mẫu khá lớn. Nếu một trong các điều kiện trên bị vi phạm thì các tiêu chuẩn đó không thể thực hiện được. Trong tình huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số. Tiêu chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối của tổng thể chung và dùng trong các phương pháp kiểm định tự do (đối với dạng phân phối), đó là các phương pháp kiểm định phi tham số.
Kiểm định 2 mẫu độc lập (Mann-Whitney U)
Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên cứu. Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Bài toán tổng quát
Giả sử có hai tổng thể chung X và Y. Phân phối của hai tổng thể này chưa biết và không nhất thiết là phân phối chuẩn. Ta muốn biết liệu hai tổng thể chung này có khác nhau không, giả thiết cần kiểm định là:
H0: 1 = 2 (không có sự khác nhau giữa hai tổng thể chung và do đó có cùng số trung bình)
H1: 1 2 (có sự khác nhau giữa hai tổng thể chung và chúng có số trung bình khác nhau)
Để kiểm định giả thiết này, từ tổng thể chung lấy ra 2 mẫu: Mẫu thứ nhất, gồm n1 đơn vị có các lượng biến (x1, x2 ...xn1) lấy ra từ tổng thể chung X. Mẫu thứ hai, gồm n2 đơn vị có các lượng biến (y1, y2 ...yn2) lấy ra từ tổng thể chung Y.
Tiêu chuẩn kiểm định
Mann - Whitney
Gộp 2 mẫu trên thành 1 mẫu với cỡ mẫu là (n1 + n2)
Sắp xếp (n1 + n2) lượng biến của 2 mẫu theo thứ tự tăng dần và xác định hạng của mỗi lượng biến đó.
Tính tổng hạng của các lượng biến thuộc mẫu thứ nhất là R1 và của mẫu thứ hai là R2.
Như vậy tổng hạng chung R = R1 + R2 = 1 +2 + ... + (n1 + n2).
Người ta đã chứng minh được rằng: nếu H0 đúng và n1, n2 10 thì R1 có phân phối xấp xỉ chuẩn với trung bình là:
và phương sai là
Tiêu chuẩn kiểm định
Mann - Whitney
( Tương tự, ta có R2 có phân phối xấp xỉ chuẩn với giá trị trung bình là:
và phương sai là
Thông thường chúng ta chọn số nhỏ nhất giữa R1 và R2 để tính tiêu chuẩn kiểm định. Giả sử R1 < R2 , khi đó tiêu chuẩn kiểm định được chọn là :
nếu ta bác bỏ giả thiết H0 .
(Nếu thay R1 bằng R2 cũng sẽ cho ta cùng một kết luận)
Analyze - Nonparametric Test - 2 Independent Samples
Nhấn Grouping Define để định nghĩa các biến
chọn các biến vào phân tích
Kiểm định 2 mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar)
Đây là phương pháp kiểm định phi tham số dùng trong trường hợp 2 mẫu phụ thuộc. Ở phần trên, chúng ta dùng phương pháp so sánh từng cặp, nhưng phương pháp này đòi hỏi một giả thiết quan trọng là các chênh lệch của từng cặp quan sát (di) phải có phân phối chuẩn hay xấp xỉ chuẩn. Nếu giả thiết này không được thoả mãn cần sử dụng đến các kiểm định phi tham số. Trong phần này chúng ta sẽ đề cập đến 2 phương pháp kiểm định thông dụng nhất là kiểm định dấu và kiểm định hạng có dấu của Wilcoxon.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Kiểm định dấu
Phương pháp này kiểm định dựa trên cơ sở các dấu âm hoặc dương của các chênh lệch trong từng cặp quan sát chứ không dựa vào giá trị của chúng.
Giả sử có hai tổng thể: chẳng hạn X là hiệu quả của phương pháp thứ nhất và Y là hiệu quả của phương pháp thứ hai tác động lên cùng một đối tượng (hay X và Y phụ thuộc). Ta muốn kiểm định giả thiết H0 : “Hiệu quả của phương pháp thứ nhất và của phương pháp thứ hai là như nhau”.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Để kiểm định giả thiết trên, người ta quan sát n cặp giá trị (x1, y1); (x2, y2) ... (xn, yn). Đặt di = xi - yi . Ta loại bỏ các di có giá trị bằng 0 vì chúng không mang lại thông tin gì. Gọi n’ là số các di có giá trị khác 0 và n+ là số các di mang dấu + . Nếu giả thiết H0 đúng thì n+ sẽ có phân phối nhị thức với tham số p = 0,5 và n’. Ta biết rằng nếu (n’. 0,5) >5 tức n’ > 10 thì tần suất f = n+/n’ sẽ có phân phối xấp xỉ chuẩn với kỳ vọng 0,5 và độ lệch tiêu chuẩn là:
Như vậy tiêu chuẩn kiểm định được chọn là:
Đại lượng Z trên sẽ có phân phối chuẩn.
Với mức ý nghĩa cho trước, tuỳ thuộc giả thiết đối mà ta có các trường hợp:
Kiểm định 2 phía: H1- “Có sự khác nhau”, ta bác bỏ H0 khi
- Kiểm định 1 phía: H1 - “phương pháp thứ nhất hiệu quả hơn phương pháp thứ hai”, ta sẽ bác bỏ H0 khi Z > Z0,5 - .
Kiểm định hạng có dấu của Wilcoxon
Trong khi kiểm định dấu chỉ quan tâm tới dấu của các hiệu số di thì kiểm định hạng có dấu của Wilcoxon còn tính đến độ lớn của . Như vậy kiểm định này sẽ có hiệu quả hơn kiểm định dấu. Các bước thực hiện như sau:
Xuất phát từ 2 mẫu ta tính các di
Bỏ qua các giá trị di = 0
Tính hạng của (di 0)
Gọi: n’ là số các giá trị di = 0
R+ là tổng các hạng của ứng với di > 0
R- là tổng các hạng của ứng với di < 0
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Người ta đã chứng minh được rằng nếu H0 đúng thì R+ và R- đều có cùng phân phối với kỳ vọng là và phương sai là
Nếu n’ 8 thì R+ và R- có phân phối xấp xỉ chuẩn. Như vậy tiêu chuẩn kiểm định được chọn là:
Đại lượng Z sẽ có phân phối N(0, 1). Trong đó R là R+ hoặc R- (thường lấy số nhỏ nhất trong 2 số đó). Giả thiết H0 sẽ bị bác bỏ ở mức ý nghĩa nếu > Z0,5 - /2 .
Analyze - Nonparametric Tests - 2 Related Samples
chọn các biến vào phân tích
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Kiểm định nhiều hơn 2 mẫu độc lập (Kruskal-Wallis H)
Analyze - Nonparametric Test - K Independent Samples
Vào Grouping Variable để định nghĩa biến
chọn các biến vào phân tích
Kiểm định nhiều hơn 2 mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
Analyze - Nonparametric Test - K Related Samples
chọn các biến vào phân tích
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Nhận xét về phương pháp phi tham số
Ưu điểm :
- Chúng không đòi hỏi phải có giả thiết là tổng thể chung có phân phối chuẩn hoặc tuân theo một dạng phânphối cụ thể nào đó.
- Nói chung các phương pháp này dễ hiểu và dễ thực hiện. Kiểm định phi tham số có thể được dùng thay thế cho kiểm định tham số bằng cách thay thế các giá trị số bằng các thứ hạng của chúng như đã làm ở trên.
- Đôi khi ngay cả việc sắp xếp theo thứ tự hạng cũng không cần thiết. Thông thường cái cần làm chỉ là mô tả 1 kết quả là “tốt hơn” so với một kết quả khác. Gặp trường hợp đó hoặc khi việc đo lường không được chính xác, không đáp ứng được yêu cầu của kiểm định tham số thì ta có thể sử dụng các phương pháp phi tham số.
Nhược điểm:
- Kiểm định phi tham số bỏ qua một lượng thông tin nhất định chẳng hạn như việc thay giá trị số bằng thứ hạng.
- Kiểm định phi tham số không hiệu quả hay “sắc bén” (nói cách khác là không mạnh) bằng kiểm định tham số. Cần nhớ rằng: Nếu điều kiện cho phép dùng kiểm định tham số được thoả mãn thì ta nên dùng kiểm định có tham số
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
3. Kiểm định Khi bình phương - Kiểm định tính độc lập hay phụ thuộc giữa các tiêu thức
Để kiểm định hai (hay nhiều hơn) tỷ lệ người ta sử dụng tiêu chuẩn kiểm định là phân phối Khi bình phương.
Chúng ta xuất phát từ thí dụ sau: Để nghiên cứu tỷ lệ phụ nữ có từ 3 con trở lên ở 3 địa phương A, B, C xem có khác nhau không, từ mỗi địa phương người ta chọn ngẫu nhiên một số phụ nữ, kết quả như sau:
Bảng trên gọi là bảng ngẫu nhiên 2 dòng (i = 1, 2) và 3 cột (j = 1, 2, 3). Gọi tỷ lệ phụ nữ có hơn 2 con của A, B, C lần lượt là p1, p2, p3.
Ta cần kiểm định giả thiết
H0 : p1 = p2 = p3 (tỷ lệ ở 3 địa phương là như nhau)
H1 : p1 p2 p3 (tỷ lệ ở 3 địa phương khác nhau)
Các bước được tiến hành như sau:
+ Gọi là số phụ nữ có số con i ở địa phương j (ví dụ: số phụ nữ có từ 2 con trở xuống của địa phương A là n11 = 140 ...). là tần số thực nghiệm (do điều tra)
+ Từ bảng ngẫu nhiên, tính tần số lý thuyết như sau:
với n =
+ Tính tiêu chuẩn 2 :
2 là một đại lượng ngẫu nhiên (vì giá trị của nó thay đổi từ mẫu này qua mẫu khác) và có số bậc tự do (df) = (số dòng - 1).(số cột - 1 ).
Ta có nhận xét rằng nếu giả thiết H0 đúng thì càng gần với và do đó giá trị 2 nhỏ và ngược lại.
Với mức ý nghĩa cho trước, tra bảng tìm , nếu 2 > ta bác bỏ giả thiết H0 .
Những điểm cần chú ý khi sử dụng tiêu chuẩn 2
+ Sử dụng cỡ mẫu lớn: Nếu cỡ mẫu nhỏ thì giá trị 2 quá lớn dẫn đến loại bỏ quá nhiều giả thiết cần kiểm định. Cần tuân theo một nguyên tắc chung là không nên sử dụng tần số lý thuyết nhỏ hơn 5 đơn vị trong 1 ô của bảng phân phối ngẫu nhiên.
+ Sử dụng cẩn thận số liệu thu thập: Số liệu thu thập được phải đúng, nếu có nghi ngờ phải kiểm tra lại cách thu thập hoặc phương pháp tính toán, đo lường hoặc cả hai. Khi giá trị 2 = 0, phải thận trọng đặt câu hỏi không có sự chênh lệch tuyệt đói giữa tần số thực nghiệm và tần số lý thuyết? Và kiểm tra lại số liệu.
Descriptives statistics - Crosstab
Bấm Statistics để thiết lập các thống kê
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
KIỂM ĐỊNH THỐNG KÊ
1. Kiểm định trung bình
2. Kiểm định phi tham số
3. Kiểm định Khi bình phương
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
1.1. Kiểm định t-một mẫu
Phương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu cho rằng giá trị trung bình cần kiểm nghiệm thì bằng với một con số cụ thể nào đó.
Phương pháp kiểm nghiệm này dùng cho biến dạng thang đo khoảng cách hay tỉ lệ. Ta sẽ loại bỏ giả thuyết ban đầu khi kiểm nghiệm chó ta chỉ số Sig. nhỏ hơn mức tinh cậy (0.05).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Compare MeanOne-Sample T Test…
Lựa chọn biến cần so sánh bằng cách di chuyển vệt đen và chuyển đến vào hộp thoại Test Variable(s), nhập giá trị cần so sánh vào hộp thoại Test Value
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là 95% và cách xữ lý đối với các giá trị khuyết
Exclude cases analysis by analysis. Mỗi kiểm nghiệm T sử dụng toàn bộ các trường hợp (cases) chứa đựng giá trị có ý nghĩa đối với biến được kiểm nghiệm. Đặc điểm là kích thước mẫu luôn thay đổi.
Exclude cases listwise. Mỗi kiểm nghiệm T sử dụng chỉ những trường hợp có giá trị đối với toàn bộ tất cả các biến được sử dụng trong bất kỳ kiểm nghiệm T test nào. Kích thước mẫu luôn không đổi
1.2. Kiểm định t hai mẫu độc lập
Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng thang đo khoảng cách hoặc tỷ lệ
Đối với dạng kiểm định này, các chủ thể cần kiểm định phải được ấn định một cách ngẫu nhiên cho hai nhóm dữ liệu cần nghiên cứu sao cho bất kỳ một khác biệt nào từ kết quả nghiên cứu là do sự tác động của chính nhóm thử đó, chứ không phải do các yếu tố khác
Các dữ liệu cần so sánh nằm trong cùng một biến định lượng. Để so sánh ta tiến hành nhóm các giá trị thành hai nhóm để tiến hành so sánh. Giả thuyết ban đầu cần kiểm định là giá trị trung bình của một biến nào đó thì bằng nhau giữa hai nhóm mẫu và chúng ta sẽ từ chối giả thuyết này khi mà chỉ số Sig. nhỏ hơn mức ý nghĩa (thường là 0.05)
Compare meansIndependent sample t-test….
Chuyển biến định lượng cần so sánh trung bình vào hộp thoại Test variable(s). Ta có thể chọn nhiều biến định lượng để so sánh.
Định ra các nhóm cần so sánh với nhau (thường là biến định danh) di chuyển vào hộp thoại Gouping variable.
Công cụ Define Groups… cho phép ta định ra hai nhóm cần so sánh với nhau
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Independent sample t-test
Có hai cánh định nhóm so sánh:
Sử dụng con số cụ thể, nhập hai giá trị đại diện cho hai nhóm cần so sánh trong biến vào ô group 1 và group 2
Cách thứ hai sử dụng Cut point, nhập giá tri phân cách các giá trị trong biến thành hai nhóm. Toàn bộ các trường hợp có giá trị (con số mã hóa) nhỏ hơn giá trị được nhập vào trong cut point sẽ định ra một nhóm, và toàn bộ các trường hợp có giá trị mã hóa lớn hơn hoặc bằng giá trị trong Cut point sẽ tạo ra một nhóm khác.
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là 95% và cách xữ lý đối với các giá trị khuyết
1.3. Kiểm định t theo từng cặp mẫu
Đây là dạng kiểm định dùng cho hai biến trong cùng một mẫu có liên hệ với nhau, dữ liệu dạng thang đó khoảng cách hoặc tỷ lệ. Nó tính toán sự khác biệt giữa các giá trị của hai biến cho mỗi trường hợp và kiểm định xem giá trị trung bình các khác biệt có khác 0 hay không. Giả thuyết ban đầu được đưa ra là giá trị trung bình của các khác biệt là bằng 0. Và ta sẽ loại bỏ giả thuyết này trong trường hợp kiểm định cho kết quả Sig. nhỏ hơn mức ý nghĩa (0.05)
Điều kiện yêu cầu cho loại kiểm định này là kích cở hai mẫu so sánh phải bằng nhau. Các quan sát cho mỗi bên so sánh phải được thực hiện trong cùng những điều kiện giống nhau. Các khác biệt từ giá trị trung bình của hai mẫu phải là phân phối chuẩn hoặc số lượng mẫu đủ lớn để xấp xỉ là phân phối chuẩn
Bài toán tổng quát
Bài toán tổng quát như sau: Giả sử có hai tổng thể chung: Tổng thể chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy luật chuẩn N (1, ) và tổng thể chung thứ hai có các lượng biến của tiêu thức X2 phân phối theo quy luật chuẩn N (2, ). Muốn so sánh sự khác nhau giữa 1 và 2 ta xét độ lệch trung bình d . Ta chưa biết d nhưng nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 , ta đua ra giả thiết thống kê H0 : d = 0.
Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút ra hai mẫu phụ thuộc được hình thành bởi các cặp n quan sát độc lập của hai mẫu, từ đó tính là trung bình của các độ lệch giữa các cặp giá trị của hai mẫu di. Như vậy ta đưa bài toán so sánh về bài toán kiểm định giả thiết về giá trị trung bình đã xét ở phần I. Tuy nhiên ở đây thường không biết phương sai của các độ lệch của tổng thể chung nên thay bằng phương sai của các độ lệch của tổng thể mẫu , và dùng tiêu chuẩn kiểm định t :
Nhận xét
Phương pháp so sánh từng cặp như trên có ưu điểm hơn phương pháp so sánh hai mẫu độc lập ở chỗ:
- Nó không cần giả thiết gì về phương sai của hai tổng thể chung
- Nó thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai ảnh hưởng đến giá trị trung bình. Tuy nhiên nhược điểm của nó là việc bố trí thí nghiệm (điều tra) phức tạp hơn, chẳng hạn trong ví dụ trên phương pháp so sánh từng cặp đòi hỏi phải trồng lúa thí nghiệm trên hai mảnh của cùng một thửa ruộng với hai loại giống khác nhau.
Compare meansPaired-samples t-test
Chọn hai biến ta cần so sánh di chuyển vào hộp thoại Paired Variables bằng nút mũi tên. Paired-samples t test còn cho ta kết quả về mối tương quan giữa hai biến đang quan sát. Cho biết liệu hai biến này có tương quan với nhau hay không, độ tương quan và chiều tương quan (thể hiện ở bảng Paired samples correlation).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
1.4. Phân tích phương sai một chiều (One way ANOVA)
Phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung bình của nhiều tổng thể được xây dựng trên việc xem xét các biến thiên (phương sai) của các giá trị quan sát trong nội bộ từng nhóm (mẫu) và giữa các nhóm (mẫu) với nhau. Ở đây đề cập đến phân tích phương sai một yếu tố là trường hợp chỉ có một yếu tố (biến kiểm soát) được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác. Yếu tố được xem xét ảnh hưởng được dùng để phân loại các quan sát thành các nhóm nhỏ khác nhau.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Bài toán tổng quát
Giả sử ta có k tổng thể chung X1, X2, ..., Xk có phân phối chuẩn, trong đó Xi ~ N( i , ). Các giá trị trung bình i chưa biết song có cơ sở giả thiết rằng là chúng bằng nhau, ta có giả thiết cần kiểm định là H0: 1 = 2 = ... = k .
Trong thống kê vấn đề trên thường được xem xét dưới góc độ sau đây: Giả sử chúng ta quan tâm tới một nhân tố X nào đó. Nhân tố X có thể xem xét ở k mức độ khác nhau. Ký hiệu Xi là hiệu quả của việc tác động của nhân tố X ở mức i . Như vậy i là hiệu quả trung bình của nhân tố X ở mức i. Chúng ta muốn biết khi cho nhân tố X thay đổi ở các mức khác nhau thì điều đó có ảnh hương hay không tới hiệu quả trung bình. Chẳng hạn, chúng ta muốn nghiên cứu ảnh hưởng của giống tới năng suất cây trồng. Nhân tố ở đây là giống, các loại giống khác nhau là các mức của nhân tố. Hiệu quả của giống lên năng suất cây trồng được đo bằng sản lượng của cây trồng. Như vậy Xi chính là sản lượng của giống i và i là sản lượng trung bình của giống i.
Trình bày số liệu tổng quát
...
Các bước kiểm định
Bước 1: Tính các trung bình.
+ Trung bình của các mẫu:
+ Trung bình chung:
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Các bước kiểm định
Bước 2: Tính các tổng bình phương độ lệch.
+ Tổng bình phương chung, ký hiệu là SST (Total Sum of Squares):
+ Tổng bình phương do ảnh hưởng của nhân tố, ký hiệu là SSF (Sum of Squares for Factor):
+ Tổng bình phương do sai số, ký hiệu là SSE (Sum of Squares for Error):
Từ các công thức trên, ta thấy:
SST = SSF + SSE
Các bước kiểm định
Bước 3: Tính các phương sai tương ứng.
+ Phương sai do ảnh hưởng của nhân tố (hay phương sai giữa các mẫu), ký hiệu là MSF (Mean Square for Factor):
trong đó (k - 1) được gọi là bậc tự do của nhân tố.
+ Phương sai do sai số (hay phương sai trong các mẫu), ký hiệu là MSE (Mean Square for Error):
trong đó (n - k) được gọi là bậc tự do của sai số.
Các bước kiểm định
Bước 4: Kiểm định giả thiết.
Giả thiết H0: 1 = 2 = ... = k .
H1: Tồn tại ít nhất 1 cặp j j với j j’ .
Các kết quả nói trên được trình bày trong bảng sau đây và được gọi là bảng ANOVA (Analysis of Variance : Phân tích phương sai).
Người ta chứng minh được rằng nếu giả thiết H0 đúng thì tỷ số sẽ có phân phối Fisher với bậc tự do là (k - 1, n - k). Giả thiết H0 sẽ bị bác bỏ ở mức ý nghĩa , nếu F > F, (k-1),( n-k) .
Comapre meansOne-Way ANOVA
Chuyển các biến định lượng cần so sánh sang hộp thoại Dependent List. Lựa biến kiểm soát tức là biến độc lập (yêu cầu phải có ba giá trị trở lên trong biến kiểm soát này) chuyển biến kiểm soát vào hộp thoại Factor, Biến kiểm soát này cho phép ta phân các giá trị trung bình theo từng nhóm để kiểm định. Thao tác đến đây cho phép ta đưa ra kết luận liệu các trung bình của các nhóm có bằng nhau hay không.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Để tiến hành kiểm định so sánh sự khác biệt giữa các nhóm với nhau ta lựa chọn công cụ Post Hoc và lựa chọn các phương pháp kiểm định thích hợp
Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu không được chấp nhận ta sẽ sử dụng các phương pháp kiểm định sau để tiến hành so sánh giá trị trung bình giữa các nhóm:Tamhane’s T2, Dunnett’s T3, Games-Howell, Dunnett’s C
phương pháp kiểm định thống kê so sánh các trung bình mẫu
The least significant difference (LSD) là phép kiểm định tương đương với việc sử dụng phương pháp kiểm định t riêng biệt cho toàn bộ các cặp trong biến. Yếu điểm của phương pháp này là nó không chỉnh lý độ tin cậy cho tương thich với việc kiểm định cho nhiều so sánh cùng một lúc. Do đó dẫn đến độ tin cậy không cao.
Phương pháp kiểm định Bonferroni và Tukey’s honestly significant difference thì được sử dụng cho hầu hết các kiểm định so sánh đa bội. Kiểm định Sidak’s t test cũng được sử dụng tương tư như phương pháp Bonferroni tuy nhiên nó cung cấp những giới hạn chặt chẻ hơn. Khi tiến hành kiểm định một số lượng lớn các cặp trung bình Tukey’s honestly significant difference test sẽ có tác động mạnh hơn là Bonferroni test. Và ngược lại Bonferroni thì thích hợp hơn cho các kiểm định có số lượng cặp so sánh ít.
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Hochberg’s GT2 thì giống như Tukey’s honestly significant difference test nhưng thông thường Tukey’s test có tác dụng tốt hơn. Gabriel’s pairwise comparisons test thì giống như Hochberg’s GT2 nhưng nó thường được sử dụng hơn khi kích cở giữa các mẫu kiểm định có sự sai biệt lớn
Phương pháp kiểm định Dunnett’s pairwise được dùng để so sánh các giá trị trung bình của các mẫu với một gía trị trung bình cụ thể được lấy từ trong tập các mẫu so sánh.
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai bước kiểm định. Đầu tiên tiến hành kiểm định có hay không toàn bộ các giá trị trung bình là ngang bằng nhau hay không. Nếu toàn bộ các giá trị trung bình là không ngang bằng nhau sau đó bước thứ hai sẽ kiểm định sự khác biệt giữa các nhóm nhỏ với nhau, để tìm ra những nhóm nào thật sự khác biệt và không khác biệt về giá trị trung bình. Tuy nhiên việc kiểm định này không nên thực hiện đối với trường hợp kích cở mẫu trong các nhóm không ngang bằng nhau
Thông thường khi kích thước mẫu không ngang bằng giữa các nhóm. Bonferroni và Scheffé là hai phương pháp kiểm định được lựa chọn hơn là phương pháp Tukey
phương pháp kiểm định thống kê so sánh các trung bình mẫu
Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b cũng tương tự tuy nhiên nó ít khi được sử dụng như các phương pháp trên.
Kiểm định Waller-Duncan t được sử dụng khi kích thước mẫu là không bằng nhau
Phương pháp kiểm định Scheffé cho phép sự kết hợp tuyến tính của những giá trị trung bình sẽ được kiểm định, không chỉ là so sánh giữa các cặp. Chính vì vậy kết quả của kiểm định Scheffé thì thường thận trọng hơn các phương pháp kiểm định khác, nó đòi hỏi một sự khác biệt lớn giữa các giá trị trung bình quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm định
One-Way ANOVA: Option
công cụ Options để xác định loại loại thông kê mô tả (Descriptive) và tính đồng nhất của phương sai, công cụ để tính hệ số thống kê Levene để kiểm định sự ngang bằng về phương sai giữa các nhóm (việc tính toán này quyết định đến sự lưa chon phương pháp kiểm định trong phần Post Hoc.
Công cụ Means Plot dùng để hiển thị đồ thị về giá tri trung bình của các nhóm. Công cụ Missing Values dùng để kiểm soát giá trị khuyết.
Exclude cases analysis by analysis: Những trường hợp có giá trị khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa vào trong kiểm định. Ngoài ra những trường hợp có giá trị quan sát nằm bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử dụng
Exclude cases listwise. Những trường hợp có giá trị khuyết Cases trong biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích .
2. Kiểm định phi tham số
Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có tham số. Khi tiến hành các kiểm định này thường phải dựa trên giả thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và hoặc kích thước mẫu khá lớn. Nếu một trong các điều kiện trên bị vi phạm thì các tiêu chuẩn đó không thể thực hiện được. Trong tình huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số. Tiêu chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối của tổng thể chung và dùng trong các phương pháp kiểm định tự do (đối với dạng phân phối), đó là các phương pháp kiểm định phi tham số.
Kiểm định 2 mẫu độc lập (Mann-Whitney U)
Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên cứu. Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Bài toán tổng quát
Giả sử có hai tổng thể chung X và Y. Phân phối của hai tổng thể này chưa biết và không nhất thiết là phân phối chuẩn. Ta muốn biết liệu hai tổng thể chung này có khác nhau không, giả thiết cần kiểm định là:
H0: 1 = 2 (không có sự khác nhau giữa hai tổng thể chung và do đó có cùng số trung bình)
H1: 1 2 (có sự khác nhau giữa hai tổng thể chung và chúng có số trung bình khác nhau)
Để kiểm định giả thiết này, từ tổng thể chung lấy ra 2 mẫu: Mẫu thứ nhất, gồm n1 đơn vị có các lượng biến (x1, x2 ...xn1) lấy ra từ tổng thể chung X. Mẫu thứ hai, gồm n2 đơn vị có các lượng biến (y1, y2 ...yn2) lấy ra từ tổng thể chung Y.
Tiêu chuẩn kiểm định
Mann - Whitney
Gộp 2 mẫu trên thành 1 mẫu với cỡ mẫu là (n1 + n2)
Sắp xếp (n1 + n2) lượng biến của 2 mẫu theo thứ tự tăng dần và xác định hạng của mỗi lượng biến đó.
Tính tổng hạng của các lượng biến thuộc mẫu thứ nhất là R1 và của mẫu thứ hai là R2.
Như vậy tổng hạng chung R = R1 + R2 = 1 +2 + ... + (n1 + n2).
Người ta đã chứng minh được rằng: nếu H0 đúng và n1, n2 10 thì R1 có phân phối xấp xỉ chuẩn với trung bình là:
và phương sai là
Tiêu chuẩn kiểm định
Mann - Whitney
( Tương tự, ta có R2 có phân phối xấp xỉ chuẩn với giá trị trung bình là:
và phương sai là
Thông thường chúng ta chọn số nhỏ nhất giữa R1 và R2 để tính tiêu chuẩn kiểm định. Giả sử R1 < R2 , khi đó tiêu chuẩn kiểm định được chọn là :
nếu ta bác bỏ giả thiết H0 .
(Nếu thay R1 bằng R2 cũng sẽ cho ta cùng một kết luận)
Analyze - Nonparametric Test - 2 Independent Samples
Nhấn Grouping Define để định nghĩa các biến
chọn các biến vào phân tích
Kiểm định 2 mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar)
Đây là phương pháp kiểm định phi tham số dùng trong trường hợp 2 mẫu phụ thuộc. Ở phần trên, chúng ta dùng phương pháp so sánh từng cặp, nhưng phương pháp này đòi hỏi một giả thiết quan trọng là các chênh lệch của từng cặp quan sát (di) phải có phân phối chuẩn hay xấp xỉ chuẩn. Nếu giả thiết này không được thoả mãn cần sử dụng đến các kiểm định phi tham số. Trong phần này chúng ta sẽ đề cập đến 2 phương pháp kiểm định thông dụng nhất là kiểm định dấu và kiểm định hạng có dấu của Wilcoxon.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Kiểm định dấu
Phương pháp này kiểm định dựa trên cơ sở các dấu âm hoặc dương của các chênh lệch trong từng cặp quan sát chứ không dựa vào giá trị của chúng.
Giả sử có hai tổng thể: chẳng hạn X là hiệu quả của phương pháp thứ nhất và Y là hiệu quả của phương pháp thứ hai tác động lên cùng một đối tượng (hay X và Y phụ thuộc). Ta muốn kiểm định giả thiết H0 : “Hiệu quả của phương pháp thứ nhất và của phương pháp thứ hai là như nhau”.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Để kiểm định giả thiết trên, người ta quan sát n cặp giá trị (x1, y1); (x2, y2) ... (xn, yn). Đặt di = xi - yi . Ta loại bỏ các di có giá trị bằng 0 vì chúng không mang lại thông tin gì. Gọi n’ là số các di có giá trị khác 0 và n+ là số các di mang dấu + . Nếu giả thiết H0 đúng thì n+ sẽ có phân phối nhị thức với tham số p = 0,5 và n’. Ta biết rằng nếu (n’. 0,5) >5 tức n’ > 10 thì tần suất f = n+/n’ sẽ có phân phối xấp xỉ chuẩn với kỳ vọng 0,5 và độ lệch tiêu chuẩn là:
Như vậy tiêu chuẩn kiểm định được chọn là:
Đại lượng Z trên sẽ có phân phối chuẩn.
Với mức ý nghĩa cho trước, tuỳ thuộc giả thiết đối mà ta có các trường hợp:
Kiểm định 2 phía: H1- “Có sự khác nhau”, ta bác bỏ H0 khi
- Kiểm định 1 phía: H1 - “phương pháp thứ nhất hiệu quả hơn phương pháp thứ hai”, ta sẽ bác bỏ H0 khi Z > Z0,5 - .
Kiểm định hạng có dấu của Wilcoxon
Trong khi kiểm định dấu chỉ quan tâm tới dấu của các hiệu số di thì kiểm định hạng có dấu của Wilcoxon còn tính đến độ lớn của . Như vậy kiểm định này sẽ có hiệu quả hơn kiểm định dấu. Các bước thực hiện như sau:
Xuất phát từ 2 mẫu ta tính các di
Bỏ qua các giá trị di = 0
Tính hạng của (di 0)
Gọi: n’ là số các giá trị di = 0
R+ là tổng các hạng của ứng với di > 0
R- là tổng các hạng của ứng với di < 0
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Người ta đã chứng minh được rằng nếu H0 đúng thì R+ và R- đều có cùng phân phối với kỳ vọng là và phương sai là
Nếu n’ 8 thì R+ và R- có phân phối xấp xỉ chuẩn. Như vậy tiêu chuẩn kiểm định được chọn là:
Đại lượng Z sẽ có phân phối N(0, 1). Trong đó R là R+ hoặc R- (thường lấy số nhỏ nhất trong 2 số đó). Giả thiết H0 sẽ bị bác bỏ ở mức ý nghĩa nếu > Z0,5 - /2 .
Analyze - Nonparametric Tests - 2 Related Samples
chọn các biến vào phân tích
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Kiểm định nhiều hơn 2 mẫu độc lập (Kruskal-Wallis H)
Analyze - Nonparametric Test - K Independent Samples
Vào Grouping Variable để định nghĩa biến
chọn các biến vào phân tích
Kiểm định nhiều hơn 2 mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
Analyze - Nonparametric Test - K Related Samples
chọn các biến vào phân tích
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
Nhận xét về phương pháp phi tham số
Ưu điểm :
- Chúng không đòi hỏi phải có giả thiết là tổng thể chung có phân phối chuẩn hoặc tuân theo một dạng phânphối cụ thể nào đó.
- Nói chung các phương pháp này dễ hiểu và dễ thực hiện. Kiểm định phi tham số có thể được dùng thay thế cho kiểm định tham số bằng cách thay thế các giá trị số bằng các thứ hạng của chúng như đã làm ở trên.
- Đôi khi ngay cả việc sắp xếp theo thứ tự hạng cũng không cần thiết. Thông thường cái cần làm chỉ là mô tả 1 kết quả là “tốt hơn” so với một kết quả khác. Gặp trường hợp đó hoặc khi việc đo lường không được chính xác, không đáp ứng được yêu cầu của kiểm định tham số thì ta có thể sử dụng các phương pháp phi tham số.
Nhược điểm:
- Kiểm định phi tham số bỏ qua một lượng thông tin nhất định chẳng hạn như việc thay giá trị số bằng thứ hạng.
- Kiểm định phi tham số không hiệu quả hay “sắc bén” (nói cách khác là không mạnh) bằng kiểm định tham số. Cần nhớ rằng: Nếu điều kiện cho phép dùng kiểm định tham số được thoả mãn thì ta nên dùng kiểm định có tham số
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
3. Kiểm định Khi bình phương - Kiểm định tính độc lập hay phụ thuộc giữa các tiêu thức
Để kiểm định hai (hay nhiều hơn) tỷ lệ người ta sử dụng tiêu chuẩn kiểm định là phân phối Khi bình phương.
Chúng ta xuất phát từ thí dụ sau: Để nghiên cứu tỷ lệ phụ nữ có từ 3 con trở lên ở 3 địa phương A, B, C xem có khác nhau không, từ mỗi địa phương người ta chọn ngẫu nhiên một số phụ nữ, kết quả như sau:
Bảng trên gọi là bảng ngẫu nhiên 2 dòng (i = 1, 2) và 3 cột (j = 1, 2, 3). Gọi tỷ lệ phụ nữ có hơn 2 con của A, B, C lần lượt là p1, p2, p3.
Ta cần kiểm định giả thiết
H0 : p1 = p2 = p3 (tỷ lệ ở 3 địa phương là như nhau)
H1 : p1 p2 p3 (tỷ lệ ở 3 địa phương khác nhau)
Các bước được tiến hành như sau:
+ Gọi là số phụ nữ có số con i ở địa phương j (ví dụ: số phụ nữ có từ 2 con trở xuống của địa phương A là n11 = 140 ...). là tần số thực nghiệm (do điều tra)
+ Từ bảng ngẫu nhiên, tính tần số lý thuyết như sau:
với n =
+ Tính tiêu chuẩn 2 :
2 là một đại lượng ngẫu nhiên (vì giá trị của nó thay đổi từ mẫu này qua mẫu khác) và có số bậc tự do (df) = (số dòng - 1).(số cột - 1 ).
Ta có nhận xét rằng nếu giả thiết H0 đúng thì càng gần với và do đó giá trị 2 nhỏ và ngược lại.
Với mức ý nghĩa cho trước, tra bảng tìm , nếu 2 > ta bác bỏ giả thiết H0 .
Những điểm cần chú ý khi sử dụng tiêu chuẩn 2
+ Sử dụng cỡ mẫu lớn: Nếu cỡ mẫu nhỏ thì giá trị 2 quá lớn dẫn đến loại bỏ quá nhiều giả thiết cần kiểm định. Cần tuân theo một nguyên tắc chung là không nên sử dụng tần số lý thuyết nhỏ hơn 5 đơn vị trong 1 ô của bảng phân phối ngẫu nhiên.
+ Sử dụng cẩn thận số liệu thu thập: Số liệu thu thập được phải đúng, nếu có nghi ngờ phải kiểm tra lại cách thu thập hoặc phương pháp tính toán, đo lường hoặc cả hai. Khi giá trị 2 = 0, phải thận trọng đặt câu hỏi không có sự chênh lệch tuyệt đói giữa tần số thực nghiệm và tần số lý thuyết? Và kiểm tra lại số liệu.
Descriptives statistics - Crosstab
Bấm Statistics để thiết lập các thống kê
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại http://www.mediafire.com/?1j5bcyb3asc8n
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Trương Minh Chiến
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)