Kiểm định giả thiết thống kê

Chia sẻ bởi Mạch Nha | Ngày 02/05/2019 | 44

Chia sẻ tài liệu: kiểm định giả thiết thống kê thuộc Bài giảng khác

Nội dung tài liệu:

4/17/2012
kiểm định giả thiết thống kê
1
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
4/17/2012
2
kiểm định giả thiết thống kê
Kiểm định giả thiết là một bài toán quan trọng trong đời sống cũng như trong thống kê, kiểm toán. Ta thường gặp 1 cặp giả thiết đối nghịch nhau, bằng khả năng của mình, ta phải xác định xem giả thiết nào đúng.
I.NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
1 Giả thuyết thống kê
Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một hay nhiều tập hợp chính.
.2 Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết)

Giả thuyết không: là sự giả sử mà ta muốn kiếm định thường được ký hiệu là Ho.
Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H1.
4/17/2012
3
kiểm định giả thiết thống kê
Ví dụ
Kiếm định giả thuyết Ho: θ ≥ θo có thể θ= θo
Với H1: θ < θo
Kiếm định giả thuyết Ho: θ ≤ θo có thể θ= θo
Với H1: θ > θo
Kiếm định giả thuyết Ho: θ = θo
Với H1: θ ≠ θo
4/17/2012
4
kiểm định giả thiết thống kê
4/17/2012
kiểm định giả thiết thống kê
5
Nội dung của bài toán kiểm định:
Dựa vào các số liệu thu được, ta phải quyết định xem giả thiết H0 đúng hay sai. Giả thiết H1 đối nghịch với giả thiết H0 gọi là đối thiết của H0 . Việc đưa ra quyết định chấp nhận hay bác bỏ một giả thiết thống kê gọi là làm kiểm định (hay kiểm định thống kê).
4/17/2012
kiểm định giả thiết thống kê
6
Sự đúng hay sai của một giả thuyết thống kê không thể biết được một cách chắc chắn, trừ khi ta khảo sát được toàn bộ tập hợp. Điều này tất nhiên là không khả thi trong đa số các trường hợp.
Thay vào đó, ta lấy một mẫu ngẫu nhiên từ tập hợp được quan tâm và sử dụng dữ liệu có trong mẫu để đưa ra bằng chứng mà theo đó ta chấp nhận hoặc không chấp nhận giả thuyết. Bằng chứng từ mẫu mà mâu thuẫn với giả thuyết sẽ đưa đến việc bác bỏ giả thuyết; ngược lại, bằng chứng phù hợp với giả thuyết sẽ đưa đến việc chấp nhận nó
Ví dụ. Nghiên cứu tuổi thọ trung bình của một số loài, gọi X là tuổi thọ trung bình của loài Khủng long, Y là tuổi thọ trung bình của loài Rùa. Một nhà Khoa học đưa ra nhận định sau: EX( )=70, EY( )=200, đó là các giả thiết thống kê.
Vì dấu hiệu nghiên cứu có thể xem là các BNN gốc, do đó giả thiết thống kê là giả thiết về dạng phân bố xác suất. Nếu phân bố của BNN gốc được đặc trưng bởi các tham số (như trung bình, phương sai,…) thì giả thiết thống kê là giả thiết về tham số của phân bố đó.
Đối với bài toán có hai dấu hiệu nghiên cứu thì giả thiết thống kê có thể là giả thiết về sự độc lập của chúng hoặc so sánh các tham sốđặc trưng của chúng.
3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê
Việc kiểm định giả thuyết thống kê có thể phạm phải 2 loại sai lầm
a) Sai lầm loại I (type I error)
Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết Ho khi Ho đúng.
Xác suất của việc bác bỏ Ho khi Ho đúng là xác suất của sai lầm loại I và được ký hiệu
là α
α = P ( bác bỏ Ho / Ho đúng) = P
α : còn được gọi là mức ý nghĩa ( level of significance)
α = 0,05; 0,01 ; 0,001 …
4/17/2012
7
kiểm định giả thiết thống kê
3 Các loại sai lầm trong việc kiểm định giả thuyết thống kê
Sai lầm II (type II error)

Là loai sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết Ho khi Ho sai.
Xác suất của việc không bác bỏ Ho khi Ho sai là xác suất của sai lầm loại II và được ký
hiệu là β.
β = P (không bác bỏ Ho /Ho sai) = P(type II error)
4/17/2012
8
kiểm định giả thiết thống kê
4 Miền bác bỏ và miền chấp nhận
Tất cả các giá trị có thể có của các đại lượng thống kê trong kiểm định có thể chia làm 2 miền: miền bác bỏ và miền chấp nhận.
™ Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết Ho bị bác bỏ.
™ Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết Ho không bị bác bỏ.
Trong thực tế khi Ho không bị bác bỏ cùng nghĩa là nó được chấp nhận.
Giá trị chia đôi hai miền được gọi là giá trị giới hạn (Critical value)
4/17/2012
9
kiểm định giả thiết thống kê
5 Kiểm định một đầu và kiểm định 2 đầu
a) Kiểm định một đầu
Khi giả thuyết ngược lại H1 có tính chất 1 phía (one – sided) thì việc kiểm định được gọi là kiểm định 1 đầu.
Ho: θ ≤ θo hay Ho: θ ≥ θo
H1: θ > θo H1: θ < θo
b) Kiểm định hai đầu:
Khi giả thuyết ngược lại H1 có tính chất 2 phía (two – sided) thì việc kiểm định được gọi là kiểm định 2 đầu.
Ho: θ = θo
H1: θ ≠ θo
4/17/2012
10
kiểm định giả thiết thống kê
4/17/2012
kiểm định giả thiết thống kê
11
4/17/2012
kiểm định giả thiết thống kê
12
Ví dụ: Khi ta cảm thấy mệt mỏi, ta nghi rằng “mình bị bệnh” – đây là giả thiết H0, (H1 là “mình không mắc bệnh”) và việc đi khám bệnh để xác định xem mình có bệnh hay không, chính là xác định xem giả thiết H0 có đúng hay không. Việc này chính là kiểm định giả thiết.
4/17/2012
kiểm định giả thiết thống kê
13
Khi giả thiết H0 có dạng: H0 : a = a0 (a là 1 tham số nào đó của đại lượng ngẫu nhiên ta đang nghiên cứu; a0 là giá trị đã biết)
Khi đó: H1 có thể là: H1 : a ≠ a0 . Việc kiểm định giả thiết với đối thiết dạng này được gọi là kiểm định hai phía (vì miền bác bỏ nằm về hai phía của miền chấp nhận).
Giả thiết đối dạng H1 : a ≠ a0 thường được áp dụng khi ta chưa biết rõ trong thực tế a > a0 hay a< a0 .
Nhưng nếu qua quan sát, phân tích ta biết được xu hướng là a > a0 thì ta có thể đặt đối thiết H1 : a > a0 . Hoặc ta biết được khả năng a Nếu kiểm định giả thiết với giả thiết đối dạng H1 : a > a0 thì được gọi là kiểm định giả thiết về phía bên phải.
Nếu kiểm định giả thiết với giả thiết đối dạng H1 : a < a0 thì được gọi là kiểm định giả thiết về phía bên trái
II.CÁC BƯỚC CỦA VIỆC KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ:
Gồm 6 bước:

Bước 1: Thành lập giả thuyết Ho
Ví dụ:
Ho: θ = θo
Ho: θ ≤ θo
Ho: θ ≥ θo
Bước 2: Thành lập giả thuyết H1
Ví dụ:
H1: θ < θo
H1: θ > θo
H1: θ ≠ θo
Bước 3: Xác định mức ý nghĩa α
Bước 4: Chọn các tham số thống kê thích hợp cho việc kiếm định và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn.
Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số hiệu của mẫu ngẫu nhiên.
Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ Ho thì ra quyết định bác bỏ Ho. Ngược lại sẽ chấp nhận Ho.
4/17/2012
14
kiểm định giả thiết thống kê
4/17/2012
kiểm định giả thiết thống kê
15
Kiểm định giả thiết về giá trị trung bình
TRƯỜNG HỢP 1: biết phương sai σ2 và n≥30 (nếu n<30 thì x phải có p.phối chuẩn n(x;µ,σ 2)
+ Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n: W=(X1,X2,...,Xn)


+ Xét thống kê: : là tiêu chuẩn kiểm định giả thiết. Ta biết rằng, với giả

thuyết H0 là :


µ=µ, thì có phân phối chuẩn tắc N(z;0,1).



+ Từ đối thuyết H1 chọn miền bác bỏ hai phía: (−∞;− Z α/2]∪[z α/2;+∞) trong đó:

4/17/2012
kiểm định giả thiết thống kê
16
Tìm Z α/2


Tính : rồi đưa ra kết luận:
4/17/2012
kiểm định giả thiết thống kê
17
Ví dụ 5. Một nhà sản xuất dụng cụ thể thao đưa ra một loại dây câu mới, họ khẳng định trọng lượng trung bình dây có thể chịu là 8 kg, với độ lệch chuẩn là 0,5 kg. Để kiểm định giả thuyết µ=8 kg với đối thuyết µ≠8 kg, 50 dây ngẫu nhiên được kiểm tra và trọng lượng trung bình dây có thể chịu là 7,8 kg. Hãy kiểm định khẳng định của nhà sản xuất với mức ý nghĩa 0,01.
4/17/2012
kiểm định giả thiết thống kê
18
4/17/2012
kiểm định giả thiết thống kê
19
Chú ý: Trong trường hợp này, đối với bài toán kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên khi xác định miền bác bỏ cần lưu ý như sau


●Đối với bài toán kiểm định một phía: , ta bác bỏ H0 nếu z > zα .

●Còn đối với bài toán kiểm định một phía ta bác bỏ H nếu z < −zα .

4/17/2012
kiểm định giả thiết thống kê
20
Ví dụ 6. Một mẫu ngẫu nhiên gồm 100 giấy báo tuổi Mỹ cho thấy tuổi thọ trung bình là 71,8 năm. Giả sử độ lệch chuẩn là 8,9 năm; có thể cho rằng tuổi thọ trung bình hiện nay là hơn 70 năm không? Cho biết mức ý nghĩa là 0,05.
4/17/2012
kiểm định giả thiết thống kê
21
4/17/2012
kiểm định giả thiết thống kê
22
4/17/2012
kiểm định giả thiết thống kê
23
b. Trường hợp 2: chưa biết σ2 và cỡ mẫu n≥30.

Ta vẫn xét tiêu chuẩn kiểm định tương tự trường hợp 1, chỉ cần thay σ bởi s và khi

đó

c. Trường hợp 3: Chưa biết σ2, cỡ mẫu n<30, tổng thể có phân phối chuẩn.
4/17/2012
kiểm định giả thiết thống kê
24
Ta xác định miền từ bỏ
4/17/2012
kiểm định giả thiết thống kê
25
Chú ý. Trong trường hợp này, đối với kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên miền bác bỏ cần lưu ý như sau:


●Đối với bài toán kiểm định một phía , ta bác bỏ H0 nếu .


● Còn đối với bài toán kiểm định một phía , ta bác bỏ H0 nếu

4/17/2012
kiểm định giả thiết thống kê
26

Giả sử trong 1 đám đông Ω , tỉ lệ các phần tử mang dấu hiệu  A nào đó là p chưa biết. Từ mẫu
Cần kiểm định giả thiết:
Với mức ý nghĩa α
, chọn miền bác bỏ giả thiết H0
:
, với
Hoàn toàn tương tự cho các phép kiểm định trung bình 1 phía, ta có thể tóm tắt bởi bảng sau:
ta có tỉ lệ quan sát được là
Kiểm định tỉ lệ:
4/17/2012
kiểm định giả thiết thống kê
27
4/17/2012
kiểm định giả thiết thống kê
28
Ví dụ 2. Một loại thuốc an thần thường được dùng được tin là chỉ có tác dụng 60% người sử dụng.
Kết quả thí nghiệm loại thuốc mới trên 100 người trưởng thành cho thấy 70 người nhận đựợc tác dụng.
Có thể tin được hay không rằng loàii thuốc mới tốt hơn loại thường dùng? Sử dụng mức ý nghĩa 0,05.
4/17/2012
kiểm định giả thiết thống kê
29
4/17/2012
kiểm định giả thiết thống kê
30
4/17/2012
kiểm định giả thiết thống kê
31
Kiểm định so sánh 2 giá trị trung bình
Khi đó tiêu chuẩn kiểm định :
Với giả thiết H0 là đúng thì Z có phân phối chuẩn tắc, kết hợp với mức ý nghĩa α ta sẽ xác định được

miền bác bỏ: (−∞−; Z α/2 ]∪[Z α/2 ;+∞), trong đó z α/2 được xác định từ Bảng A3.
4/17/2012
kiểm định giả thiết thống kê
32
Khi đó tiêu chuẩn kiểm định:

Với



Với giả thiết Ho là đúng thì T có phân phối Student v=n1 +n2 −2 bậc tự do.

Giả thuyết 2 phía không bị bác bỏ khi:



hay miền bác bỏ là (−∞−; tα/2;n+n−2]∪[tα/2;n+n−2;+∞).
4/17/2012
kiểm định giả thiết thống kê
33
4/17/2012
kiểm định giả thiết thống kê
34
Ví dụ . Một thí nghiệm được thực hiện nhằm so sánh mức độ mài mòn của hai loại kim loại khác nhau: 12 miếng kim loại A được kiểm tra bằng cách đưa vào máy đo độ mài mòn còn 10 miếng kim loại B được kiểm tra tương tự. Trong mỗi trường hợp, độ sâu của sự mài mòn được ghi lại. Mẫu ứng với kim loại A có trung bình mài mòn là 85 đơn vị, với độ lệch mẫu bằng 4; trong khi mẫu ứng với kim loại B có trung bình là 81 và độ lệch mẫu là 5. Có thể kết luận, với mức ý nghĩa 0,05, r ằng mức độ mài mòn của kim loại A hơn kim loại B là khác 2 đơn vị được không? Giả sử các mật độ đều xấp xỉ chuẩn với phương sai bằng nhau.
4/17/2012
kiểm định giả thiết thống kê
35
4/17/2012
kiểm định giả thiết thống kê
36
Kết luận: Không bác bỏ H0. Ta không thể kết luận rằng mức độ mài mòn của kim loại A hơn kim loại B là khác 2 đơn vị.
Chú ý. Ta cũng có thủ tục tương tự đối với bài toán kiểm định một phía, nhưng với lưu ý khi xác định miền bác bỏ
4/17/2012
kiểm định giả thiết thống kê
37
Kiểm định so sánh 2 xác suất (tỷ lệ)

Xét bài toán kiểm định giả thuyết rằng: hai tỷ lệ hoặc hai tham số nhị thức là

bằng nhau. Tức là ta muốn kiểm định giả thuyết H0 : P1 =P2

với một trong các đối thuyết hoặc P1 ≠P2 .

Điều này tương đương với giả thuyết

và các đối thuyết hoặc .

Thống kê mà ta dựa vào để kiểm định là biến ngẫu nhiên

Các mẫu độc lập cỡ được chọn ngẫu nhiên từ hai phân phối nhị

thức và tỷ lệ thành công cho hai mẫu được tính toán.

:
4/17/2012
kiểm định giả thiết thống kê
38
Trong xây dựng khoảng tin cậy cho ta chú ý rằng, với đủ

lớn, ước lượng điểm

Do đó, miền chấp nhận và tiêu chuẩn có thể được thành lập dựa vào biến ngẫu nhiên chuẩn chuẩn hóa:
4/17/2012
kiểm định giả thiết thống kê
39
4/17/2012
kiểm định giả thiết thống kê
40
4/17/2012
kiểm định giả thiết thống kê
41
Ví dụ
Một cuộc bỏ phiếu được đưa ra để xác định vị trí xây dựng một nhà máy hóa chất trong thị trấn hay ngoại vi thị trấn. Có 120 trên 200 cử tri tr`ong thị trấn đồng ý xây dựng nhà máy trong thị trấn và 240 trên 500 cử tri ngoại vi đồng ý với đề xuất này. Liệu có thể cho rằng tỉ lệ cử tri trong
thị trấn đồng ý với đề xuất lớn hơn tỉ lệ cử
tri ngoại vi đồng ý hay không? Sử dụng
mức ý nghĩa 0,025.
4/17/2012
kiểm định giả thiết thống kê
42
4/17/2012
kiểm định giả thiết thống kê
43
Do đó
Kết luận
4/17/2012
kiểm định giả thiết thống kê
44
Kiểm định so sánh 2 phương sai
4/17/2012
kiểm định giả thiết thống kê
45
4/17/2012
kiểm định giả thiết thống kê
46
4/17/2012
kiểm định giả thiết thống kê
47

Thí dụ
Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng là phương sai của hàm lượng chất bẩn trong các lò hàng hoá chất không được vượt quá 4%. Lấy ngẫu nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là 5,62%.
Kiểm định giả thuyết phương sai của hàm lượng chất bẩn trong tất cả các lô hàng không quá 4% với α =10%. Giả sử rằng tập hợp chính tuân theo phân phối chuẩn.
4/17/2012
kiểm định giả thiết thống kê
48
4/17/2012
kiểm định giả thiết thống kê
49
Tiêu chuẩn phù hợp χ 2
Cách làm bài toán
4/17/2012
kiểm định giả thiết thống kê
50
4/17/2012
kiểm định giả thiết thống kê
51
4/17/2012
kiểm định giả thiết thống kê
52
4/17/2012
kiểm định giả thiết thống kê
53
4/17/2012
kiểm định giả thiết thống kê
54
4/17/2012
kiểm định giả thiết thống kê
55
4/17/2012
kiểm định giả thiết thống kê
56
4/17/2012
kiểm định giả thiết thống kê
57
Kiểm tra tính độc lập
4/17/2012
kiểm định giả thiết thống kê
58
4/17/2012
kiểm định giả thiết thống kê
59
4/17/2012
kiểm định giả thiết thống kê
60
Giải
4/17/2012
kiểm định giả thiết thống kê
61
4/17/2012
kiểm định giả thiết thống kê
62
4/17/2012
kiểm định giả thiết thống kê
63
So sánh nhiều tỉ lệ
Từ so sánh 2 tỉ lệ, giả sử có s đô tượng, mỗi đối tượng phân chia 2 dấu hiệu , chẳng hạn tốt xấu, khỏi không khỏi, có tác dụng hay không….
gọi H :s tỷ lệ như nhau : p1 = p2 =…=ps
K: tỷ lệ khác nhau
Áp dụng bài toán kiểm định tính độc lập của 2 dấu hiệu đối với s đối tượng.
Nếu hai dấu hiệu độc lập với các đối tượng thì điều đó có nghĩa là tỷ lệ đang xét ở s đối tượng là như nhau,
Nếu 2 dấu hiệu phụ thuộc vào đối tượng tức là tỷ lệ đang xét sẽ thay đổi theo các đối tượng

Vậy bài giải hoàn toàn như bài kiểm tra tình độc lập
4/17/2012
64
kiểm định giả thiết thống kê
The end
4/17/2012
kiểm định giả thiết thống kê
65
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Mạch Nha
Dung lượng: | Lượt tài: 0
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)