SPSS
Chia sẻ bởi Võ Tuấn |
Ngày 19/03/2024 |
9
Chia sẻ tài liệu: SPSS thuộc Công nghệ thông tin
Nội dung tài liệu:
NHẬP, LỌC VÀ MÃ HÓA
SỐ LIỆU
TIN HỌC ỨNG DỤNG
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
1
Mục tiêu
1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế.
2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản
3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh.
2
Lỗi bỏ trống dữ liệu.
Lỗi logic.
Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ nhưng số liệu lại có 3,4,5…).
Một số lỗi thông thường
3
Phương pháp kiểm tra số liệu
Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending/ descending) hiển thị các giá trị missing hay outline.
Chạy các bảng tần suất hoặc trung bình xác định giá trị missing/ lớn nhất , nhỏ nhất.
Chạy bảng chéo các lỗi logic đơn giản.
4
Biến cần sắp xếp
Tăng dần
Giảm dần
5
Giá trị bổ trống thường xuất hiện trên cùng bộ số liệu ( ascending)
Giá trị bỏ trống thường xuát hiện cuối cùng bộ số liệu
(Descending)
6
Lệnh lọc số liệu cơ bản
Select case (Lựa chọn các trường hợp theo điều kiện )
Split file (chia tách dữ liệu)
2 lệnh này sẽ chỉ hiển thị kết quả khi chạy phân tích số liệu trên của số hiên thị kết quả ( out put)
7
Thông thường sẽ có 2 dạng
Mã hóa mớithực hiện ngay trên biến ban đầu ( lưu ý số liệu gốc sẽ thay đổi theo) Recode into same variable
Mã hóa tạo thành biến Recode into different variable)
Mã hóa số liệu ( Recode)
8
Recode into same variables
TransVí dụ: Chia tuổi của bệnh nhân thành 3 nhóm : (60 – 70); (71- 80); và >80.
form / Recode into same variables
Đưa biến cần mã hõa vào
9
Giá trị cũ
Giá trị mỡi cần mã hóa
Lưu ý: Sau khi code cần nhấn add để việc mã hóa thực hiện
Và continue để hoàn tất
Khoảng
Thấp hơn từ …
Cao hơn từ
Giá trị khác ngoài khoãng đa mã hóa
10
Ví dụ chia nhóm tuổi
11
Lệnh sẽ được thực hiện ngay trên biến tuổi ban đầu Lưu ý khi sử dụng lệnh này
12
Về nguyên tắc thực hiện giống với recode into same variables.
Tuy nhiên lệnh này sẽ tạo ra một biến mới và nằm cuối cùng của bộ số liệu (không thay đổi số liệu gốc ban đầu)
Chú ý thay đổi tên biến mới khi thực hiện
Recode into different variables
13
Transform/ recode into different variables
Thực hiện tương tự như mã hóa same into variables
Gõ tên biến mới
14
Kết quả tạo một biến mới nằm sau cùng của bộ số liệu
15
Kiểm tra kết quả sau mã hóa số liệu
Để xem kết quả sau khi mã hóa dữ liệu có thể sử dụng lệnh Analyze/ Descriptive statistics / Frequencies xem tần số, tỷ lệ ( cửa số output)
Ví dụ trường hợp biến tuổi
16
Dùng lệnh Sort cases phát hiện số liệu sai của biến số cân nặng.
Dùng lệnh Find phát hiện số liệu sai của biến số tuổi mẹ (tuổi mẹ có giá trị 8 hoặc 9 tuổi là sai).
Frequency để tìm số liệu sai của biến số Gan to
BÀI TẬP 1
17
4. Frequency tìm số liệu sai của biến số lách to
5. Crosstabs: Tìm mối liên quan giữa tuổi và cân nặng , phát hiện số liệu bất hợp lý
6. Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho nữ giới
18
BÀI TẬP 2
Chia tuổi thành 8 nhóm tuổi:
nhóm 1: 15-19 nhóm 2 : 20-24
nhóm 3: 25-29 nhóm 4: 30-34
nhóm 5: 35-39 nhóm 6 : 40-44
nhóm 7: 45-49 nhóm 8 : > 49 tuổi
1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
19
BÀI TẬP 3
Chia 5 nhóm thể lực theo cân nặng (cannang)
nhóm 1: < 40 kg nhóm 2 : 40-50 kg
nhóm 3: 51-60 nhóm 4: 61-70
nhóm 5: > 70
Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
Tỷ lệ cao nhất thuộc nhóm nào?
Tỷ lệ người nặng trên 60kg là bao nhiêu?
Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
20
BÀI TẬP 4
Chia trình độ học vấn (tdhv) thành 3 nhóm:
HV thấp : mù chữ + cấp 1
HV trung bình : cấp 2 + cấp 3
HV cao : > cấp 3
1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
21
SỐ LIỆU
TIN HỌC ỨNG DỤNG
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
1
Mục tiêu
1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế.
2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản
3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh.
2
Lỗi bỏ trống dữ liệu.
Lỗi logic.
Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ nhưng số liệu lại có 3,4,5…).
Một số lỗi thông thường
3
Phương pháp kiểm tra số liệu
Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending/ descending) hiển thị các giá trị missing hay outline.
Chạy các bảng tần suất hoặc trung bình xác định giá trị missing/ lớn nhất , nhỏ nhất.
Chạy bảng chéo các lỗi logic đơn giản.
4
Biến cần sắp xếp
Tăng dần
Giảm dần
5
Giá trị bổ trống thường xuất hiện trên cùng bộ số liệu ( ascending)
Giá trị bỏ trống thường xuát hiện cuối cùng bộ số liệu
(Descending)
6
Lệnh lọc số liệu cơ bản
Select case (Lựa chọn các trường hợp theo điều kiện )
Split file (chia tách dữ liệu)
2 lệnh này sẽ chỉ hiển thị kết quả khi chạy phân tích số liệu trên của số hiên thị kết quả ( out put)
7
Thông thường sẽ có 2 dạng
Mã hóa mớithực hiện ngay trên biến ban đầu ( lưu ý số liệu gốc sẽ thay đổi theo) Recode into same variable
Mã hóa tạo thành biến Recode into different variable)
Mã hóa số liệu ( Recode)
8
Recode into same variables
TransVí dụ: Chia tuổi của bệnh nhân thành 3 nhóm : (60 – 70); (71- 80); và >80.
form / Recode into same variables
Đưa biến cần mã hõa vào
9
Giá trị cũ
Giá trị mỡi cần mã hóa
Lưu ý: Sau khi code cần nhấn add để việc mã hóa thực hiện
Và continue để hoàn tất
Khoảng
Thấp hơn từ …
Cao hơn từ
Giá trị khác ngoài khoãng đa mã hóa
10
Ví dụ chia nhóm tuổi
11
Lệnh sẽ được thực hiện ngay trên biến tuổi ban đầu Lưu ý khi sử dụng lệnh này
12
Về nguyên tắc thực hiện giống với recode into same variables.
Tuy nhiên lệnh này sẽ tạo ra một biến mới và nằm cuối cùng của bộ số liệu (không thay đổi số liệu gốc ban đầu)
Chú ý thay đổi tên biến mới khi thực hiện
Recode into different variables
13
Transform/ recode into different variables
Thực hiện tương tự như mã hóa same into variables
Gõ tên biến mới
14
Kết quả tạo một biến mới nằm sau cùng của bộ số liệu
15
Kiểm tra kết quả sau mã hóa số liệu
Để xem kết quả sau khi mã hóa dữ liệu có thể sử dụng lệnh Analyze/ Descriptive statistics / Frequencies xem tần số, tỷ lệ ( cửa số output)
Ví dụ trường hợp biến tuổi
16
Dùng lệnh Sort cases phát hiện số liệu sai của biến số cân nặng.
Dùng lệnh Find phát hiện số liệu sai của biến số tuổi mẹ (tuổi mẹ có giá trị 8 hoặc 9 tuổi là sai).
Frequency để tìm số liệu sai của biến số Gan to
BÀI TẬP 1
17
4. Frequency tìm số liệu sai của biến số lách to
5. Crosstabs: Tìm mối liên quan giữa tuổi và cân nặng , phát hiện số liệu bất hợp lý
6. Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho nữ giới
18
BÀI TẬP 2
Chia tuổi thành 8 nhóm tuổi:
nhóm 1: 15-19 nhóm 2 : 20-24
nhóm 3: 25-29 nhóm 4: 30-34
nhóm 5: 35-39 nhóm 6 : 40-44
nhóm 7: 45-49 nhóm 8 : > 49 tuổi
1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
19
BÀI TẬP 3
Chia 5 nhóm thể lực theo cân nặng (cannang)
nhóm 1: < 40 kg nhóm 2 : 40-50 kg
nhóm 3: 51-60 nhóm 4: 61-70
nhóm 5: > 70
Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
Tỷ lệ cao nhất thuộc nhóm nào?
Tỷ lệ người nặng trên 60kg là bao nhiêu?
Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
20
BÀI TẬP 4
Chia trình độ học vấn (tdhv) thành 3 nhóm:
HV thấp : mù chữ + cấp 1
HV trung bình : cấp 2 + cấp 3
HV cao : > cấp 3
1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
21
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Võ Tuấn
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)