THỐNG KÊ KINH DOANH VÀ SPSS :: Bài 1
Chia sẻ bởi Trương Minh Chiến |
Ngày 19/03/2024 |
14
Chia sẻ tài liệu: THỐNG KÊ KINH DOANH VÀ SPSS :: Bài 1 thuộc Công nghệ thông tin
Nội dung tài liệu:
THỐNG KÊ KINH DOANH VÀ SPSS
Trương Minh Chiến
Sưu tập và biên soạn
Bài 1
GIỚI THIỆU CHUNG VỀ SPSS
1. Giới thiệu chung về SPSS
Là phần mềm chuyên dụng xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua một bảng câu hỏi được thiết kế sẵn
1.1 Cài đặc SPSS 19
Trước tiên, các bạn có thể tải SPSS 19 (còn gọi là IBM SPSS PASW v19) tại website chính (http://www.spss.com/downloads/) rồi download crack riêng hoặc download trọn bộ SPSS 19+crack tại http://www.mediafire.com/?1j5bcyb3asc8n
hay mua đỉa CD trực tuyến tại http://chodientu.vn/nko/
Kế đến, các bạn có thể download Python plug-in và R integrated plug-in tại http://www.spss.com/devcentral/index.cfm?pg=plugins hay http://www.mediafire.com/?1j5bcyb3asc8n
1.1 Cài đặc SPSS 19 (tt)
Sau khi download và giãi nén SPSS 19 thì nhấp đúp chuột vào tệp tin Setup.exe để tiến hành cài đặc.
1.1 Cài đặc SPSS 19 (tt)
1.1 Cài đặc SPSS 19 (tt)
Nhấp chuột và chọn nút [Next >] để tiếp tục
Bạn phải chú ý chọn lựa các mục tùy chọn sao cho khéo léo và hợp lý để chuyển tiếp đến bước kế tiếp.
1.1 Cài đặc SPSS 19 (tt)
Theo tôi nên cài SPSS 19 vào một thư mục độc lập
và còn nhiều chổ trống trên ổ cứng vì sau đó chúng
ta còn có thể cài đặc thêm các plugin
1.1 Cài đặc SPSS 19 (tt)
Sau khi cài đặc xong thì phải nhập mã số đăng ký bảng quyền
1.1 Cài đặc SPSS 19 (tt)
Mở file “lservrc” bằng Notepad hay Editplus rồi copy trực tiếp
mã số đăng ký vào ô “Enter code”
1.1 Cài đặc SPSS 19 (tt)
Sau đó hoàng tất các bước
cài đặc kế tiếp trong phần
đăng ký mã số bảng quyền
1.1 Cài đặc SPSS 19 (tt)
Copy và thay thế (Replace) 4 files dll trong thư mục crack
Vào thư mục cài đặc SPSS 19 để hoàng tất quá trình đăng ký
bản quyền sử dụng
1.2 Hướng dẫn sử dụng
Bài giảng được sử dụng kèm với giáo trình Video trực tuyến bằng tiếng Anh về SPSS của thư viện trực tuyến Violet.
(http://lophoc.violet.vn >> Cao Đẳng-Đại Học >> Tin Học)
Bên cạnh đó, các bạn có thể đọc và tìm hiểu thêm các tài liệu hay ebook đã được nén thành dạng rar và có thể download tại : http://www.mediafire.com/?1j5bcyb3asc8n
1.3 Chú ý
Bài giảng và tất cả những tài liệu liên quan chỉ mang tính tham khảo là chính.
Bộ tài liệu và bài giảng này được tổng hợp từ giáo trình và bài giảng của các thầy cô trường ĐH Kinh Tế TP HCM và ĐH Quốc Gia TP HCM. Tôi chỉ bổ sung và điều chỉnh một số ít các slide mà thôi.
Bên cạnh đó tôi cũng có bổ sung thêm 2 phần mới là áp dụng R language và Python cho IBM SPSS 19
1.4 Các links cần quan tâm
http://www.idr.edu.vn/diendannghiencuu/showthread.php?t=3942
http://cran.r-project.org/doc/contrib/Intro_to_R_Vietnamese.pdf
http://en.wikipedia.org/wiki/R_(programming_language)
http://en.wikipedia.org/wiki/R_(programming_language)
1.5 Cài đặc các Plugin
Chương trình SPSS có hổ trợ 3 plugin chính là : Python Plug-in, R essential plug-in và VB .Net plug-in (dùng cho SPSS Script riêng của IBM PASW).
Các bạn có thể download tại http://www.spss.com/devcentral/index.cfm?pg=plugins (nhớ phải đăng ký người dùng bằng email còn hiệu lực) hoặc download tại http://www.mediafire.com/?1j5bcyb3asc8n
1.5 Cài đặc các Plugin
IBM SPSS v19 chỉ hổ trợ R-integrated package 2.10 trong khi đó nếu các bạn dùng quen thì hiện nay đã có R laguage recompiler v2.12 (ổn định) và v2.13 phiên bản thử nghiệm.
Các plugin khác như Python và VB .Net cũng vậy, các version của phiên bản chính (install alone) luôn mới hơn phiên bản plugin.
Do đó nếu chúng ta cần những package mới như Financial Modeler, Risk Uncertain analyzer … thì các bạn có thể download các phiên bản mới nhất rồi tích hợp các package độc lập đó vào.
2. Các màn hình quản lý
Màn hình quản lý dữ liệu
Màn hình quản lý biến
Màn hình hiển thị kết quả
Màn hình cú pháp
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Cột (Column): Đại diện cho biến quan sát.
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Hàng (Row): Đại diện cho một trường hợp quan sát (người trả lời),
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát). Ô là sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến.
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số lượng các đối tượng và số lượng các biến. Không có các ô “trống rỗng” trong các đường biên của file dữ liệu. Đối với các biến dạng số, các ô rỗng được chuyển thành trị số khuyết thiếu hệ thống. Đối với các biến dạng chuỗi, một dấu cách vẫn được coi là một trị số.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ được hiễn thị trên đầu mỗi cột trong màn hình dữ liệu
Màn hình quản lý biến
(variables view)
Các qui tắc dưới đây được áp dụng cho tên biến:
Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
Tên biến không được kết thúc bằng một dấu chấm.
Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung đột với các biến được tự động lập bởi một vài thủ tục)
Độ dài của tên biến không vượt quá 8 ký tự.
Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng
Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp. Không được dùng chữ hoa để đặt tên biến. Các tên NEWVAR, NewVar, và newvar được xem là giống nhau.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng số được phép hiễn thị bao nhiêu con số
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số sau dấu phẩy được hiễn thị (Decimals
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏ các biến này ta cần khai báo nó như là giá trị khuyết (user missing). SPSS mặc định giá trị khuyết (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Kích thướt cột (columns): Cho phép khai báo độ rộng của cột
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Ví trí (align): Vị trí hiễn thị các giá trị trong cột (phải, trái, giữa)
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trị trong biến
Màn hình hiện thị kết quả
(output)
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm định…., các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là .SPO). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích
Màn hình cú pháp (syntax)
Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác các lệnh phân tích lại
3. Khái quát về phân tích dữ liệu
Kiểm tra dữ liệu
Thống kê mô tả
Kiểm định thống kê
Kiểm soát quá trình sản xuất
Phân tích hồi quy
Dãy số thời gian
3.1. Kiểm tra dữ liệu (Data Screening)
Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi (Roque values)
Sử dụng công cụ bảng phân bổ tần xuất ngoài việc để đếm số lần xuất hiện của từng giá trị riêng biệt, nó còn giúp ta tìm ra các giá trị lỗi hoặc các giá trị mã hóa sai sót hoặc không mong đợi
Khảo sát hai hay nhiều biến cùng một lúc. Đối với các biến dạng định danh (nominal) hoặc thứ bậc (ordinal) sử dụng công cụ bảng chéo ta có thế xác định được những sự kết hợp phi lý giữa hai hoặc nhiều biến
3.2 Thống kê mô tả
(Descriptive Statistics)
Mô tả dữ liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ giữa các biến,…).
Cần phải nắm được loại biến (loại thang đo của biến)
3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means)
Kiểm định t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập
Sử dụng kiểm định t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) so sánh giá trị trung bình của một biến riêng biệt theo một nhóm có khác biệt hay không đối với giá trị trung bình của biến riêng biệt đó theo một nhóm khác.
Công cụ kiểm định t cho cặp mẫu (Paired-Samples T Test) kiểm định có hay không giá trị trung bình của các khác biệt giữa các cặp quan sát là khác giá trị 0.
Công cụ kiểm định t một mẫu (One-Sample T Test) kiểm định có hay không giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước.
3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means)
Phân tích phương sai một chiều (One-Way ANOVA)
Là một dạng mở rộng của phương pháp kiểm định t hai mẫu ngẫu nhiên độc lập được sử dụng để kiểm định cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm.
3.4 Kiểm định các mối quan hệ (Testing Relationships)
Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát không có tương quan với nhau (hệ số tương quan R = 0)
3.4 Kiểm định các mối quan hệ (Testing Relationships)
Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát không có tương quan với nhau (hệ số tương quan R = 0)
3.5 Kiểm soát quá trình sản xuất bằng thống kê
Ghi nhận sự thay đổi của quá trình dựa trên cơ sở mối quan hệ giữa các tham số đo xu hướng trung tâm và độ biến thiên của quá trình
3.6 Phân tích hồi quy tương quan (Regression)
Phân tích sự phụ thuộc của biến nghiên cứu với 1 hoặc nhiều biến độc lập.
3.7 Phân tích dãy số thời gian
(Time series)
Phân tích xu hướng (quy luật) biến động của hiện tượng qua thời gian.
Trương Minh Chiến
Sưu tập và biên soạn
Bài 1
GIỚI THIỆU CHUNG VỀ SPSS
1. Giới thiệu chung về SPSS
Là phần mềm chuyên dụng xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua một bảng câu hỏi được thiết kế sẵn
1.1 Cài đặc SPSS 19
Trước tiên, các bạn có thể tải SPSS 19 (còn gọi là IBM SPSS PASW v19) tại website chính (http://www.spss.com/downloads/) rồi download crack riêng hoặc download trọn bộ SPSS 19+crack tại http://www.mediafire.com/?1j5bcyb3asc8n
hay mua đỉa CD trực tuyến tại http://chodientu.vn/nko/
Kế đến, các bạn có thể download Python plug-in và R integrated plug-in tại http://www.spss.com/devcentral/index.cfm?pg=plugins hay http://www.mediafire.com/?1j5bcyb3asc8n
1.1 Cài đặc SPSS 19 (tt)
Sau khi download và giãi nén SPSS 19 thì nhấp đúp chuột vào tệp tin Setup.exe để tiến hành cài đặc.
1.1 Cài đặc SPSS 19 (tt)
1.1 Cài đặc SPSS 19 (tt)
Nhấp chuột và chọn nút [Next >] để tiếp tục
Bạn phải chú ý chọn lựa các mục tùy chọn sao cho khéo léo và hợp lý để chuyển tiếp đến bước kế tiếp.
1.1 Cài đặc SPSS 19 (tt)
Theo tôi nên cài SPSS 19 vào một thư mục độc lập
và còn nhiều chổ trống trên ổ cứng vì sau đó chúng
ta còn có thể cài đặc thêm các plugin
1.1 Cài đặc SPSS 19 (tt)
Sau khi cài đặc xong thì phải nhập mã số đăng ký bảng quyền
1.1 Cài đặc SPSS 19 (tt)
Mở file “lservrc” bằng Notepad hay Editplus rồi copy trực tiếp
mã số đăng ký vào ô “Enter code”
1.1 Cài đặc SPSS 19 (tt)
Sau đó hoàng tất các bước
cài đặc kế tiếp trong phần
đăng ký mã số bảng quyền
1.1 Cài đặc SPSS 19 (tt)
Copy và thay thế (Replace) 4 files dll trong thư mục crack
Vào thư mục cài đặc SPSS 19 để hoàng tất quá trình đăng ký
bản quyền sử dụng
1.2 Hướng dẫn sử dụng
Bài giảng được sử dụng kèm với giáo trình Video trực tuyến bằng tiếng Anh về SPSS của thư viện trực tuyến Violet.
(http://lophoc.violet.vn >> Cao Đẳng-Đại Học >> Tin Học)
Bên cạnh đó, các bạn có thể đọc và tìm hiểu thêm các tài liệu hay ebook đã được nén thành dạng rar và có thể download tại : http://www.mediafire.com/?1j5bcyb3asc8n
1.3 Chú ý
Bài giảng và tất cả những tài liệu liên quan chỉ mang tính tham khảo là chính.
Bộ tài liệu và bài giảng này được tổng hợp từ giáo trình và bài giảng của các thầy cô trường ĐH Kinh Tế TP HCM và ĐH Quốc Gia TP HCM. Tôi chỉ bổ sung và điều chỉnh một số ít các slide mà thôi.
Bên cạnh đó tôi cũng có bổ sung thêm 2 phần mới là áp dụng R language và Python cho IBM SPSS 19
1.4 Các links cần quan tâm
http://www.idr.edu.vn/diendannghiencuu/showthread.php?t=3942
http://cran.r-project.org/doc/contrib/Intro_to_R_Vietnamese.pdf
http://en.wikipedia.org/wiki/R_(programming_language)
http://en.wikipedia.org/wiki/R_(programming_language)
1.5 Cài đặc các Plugin
Chương trình SPSS có hổ trợ 3 plugin chính là : Python Plug-in, R essential plug-in và VB .Net plug-in (dùng cho SPSS Script riêng của IBM PASW).
Các bạn có thể download tại http://www.spss.com/devcentral/index.cfm?pg=plugins (nhớ phải đăng ký người dùng bằng email còn hiệu lực) hoặc download tại http://www.mediafire.com/?1j5bcyb3asc8n
1.5 Cài đặc các Plugin
IBM SPSS v19 chỉ hổ trợ R-integrated package 2.10 trong khi đó nếu các bạn dùng quen thì hiện nay đã có R laguage recompiler v2.12 (ổn định) và v2.13 phiên bản thử nghiệm.
Các plugin khác như Python và VB .Net cũng vậy, các version của phiên bản chính (install alone) luôn mới hơn phiên bản plugin.
Do đó nếu chúng ta cần những package mới như Financial Modeler, Risk Uncertain analyzer … thì các bạn có thể download các phiên bản mới nhất rồi tích hợp các package độc lập đó vào.
2. Các màn hình quản lý
Màn hình quản lý dữ liệu
Màn hình quản lý biến
Màn hình hiển thị kết quả
Màn hình cú pháp
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Cột (Column): Đại diện cho biến quan sát.
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Hàng (Row): Đại diện cho một trường hợp quan sát (người trả lời),
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát). Ô là sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến.
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số lượng các đối tượng và số lượng các biến. Không có các ô “trống rỗng” trong các đường biên của file dữ liệu. Đối với các biến dạng số, các ô rỗng được chuyển thành trị số khuyết thiếu hệ thống. Đối với các biến dạng chuỗi, một dấu cách vẫn được coi là một trị số.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ được hiễn thị trên đầu mỗi cột trong màn hình dữ liệu
Màn hình quản lý biến
(variables view)
Các qui tắc dưới đây được áp dụng cho tên biến:
Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
Tên biến không được kết thúc bằng một dấu chấm.
Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung đột với các biến được tự động lập bởi một vài thủ tục)
Độ dài của tên biến không vượt quá 8 ký tự.
Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng
Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp. Không được dùng chữ hoa để đặt tên biến. Các tên NEWVAR, NewVar, và newvar được xem là giống nhau.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng số được phép hiễn thị bao nhiêu con số
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số sau dấu phẩy được hiễn thị (Decimals
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏ các biến này ta cần khai báo nó như là giá trị khuyết (user missing). SPSS mặc định giá trị khuyết (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê.
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Kích thướt cột (columns): Cho phép khai báo độ rộng của cột
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Ví trí (align): Vị trí hiễn thị các giá trị trong cột (phải, trái, giữa)
Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trị trong biến
Màn hình hiện thị kết quả
(output)
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm định…., các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là .SPO). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích
Màn hình cú pháp (syntax)
Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác các lệnh phân tích lại
3. Khái quát về phân tích dữ liệu
Kiểm tra dữ liệu
Thống kê mô tả
Kiểm định thống kê
Kiểm soát quá trình sản xuất
Phân tích hồi quy
Dãy số thời gian
3.1. Kiểm tra dữ liệu (Data Screening)
Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi (Roque values)
Sử dụng công cụ bảng phân bổ tần xuất ngoài việc để đếm số lần xuất hiện của từng giá trị riêng biệt, nó còn giúp ta tìm ra các giá trị lỗi hoặc các giá trị mã hóa sai sót hoặc không mong đợi
Khảo sát hai hay nhiều biến cùng một lúc. Đối với các biến dạng định danh (nominal) hoặc thứ bậc (ordinal) sử dụng công cụ bảng chéo ta có thế xác định được những sự kết hợp phi lý giữa hai hoặc nhiều biến
3.2 Thống kê mô tả
(Descriptive Statistics)
Mô tả dữ liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ giữa các biến,…).
Cần phải nắm được loại biến (loại thang đo của biến)
3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means)
Kiểm định t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập
Sử dụng kiểm định t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) so sánh giá trị trung bình của một biến riêng biệt theo một nhóm có khác biệt hay không đối với giá trị trung bình của biến riêng biệt đó theo một nhóm khác.
Công cụ kiểm định t cho cặp mẫu (Paired-Samples T Test) kiểm định có hay không giá trị trung bình của các khác biệt giữa các cặp quan sát là khác giá trị 0.
Công cụ kiểm định t một mẫu (One-Sample T Test) kiểm định có hay không giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước.
3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means)
Phân tích phương sai một chiều (One-Way ANOVA)
Là một dạng mở rộng của phương pháp kiểm định t hai mẫu ngẫu nhiên độc lập được sử dụng để kiểm định cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm.
3.4 Kiểm định các mối quan hệ (Testing Relationships)
Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát không có tương quan với nhau (hệ số tương quan R = 0)
3.4 Kiểm định các mối quan hệ (Testing Relationships)
Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát không có tương quan với nhau (hệ số tương quan R = 0)
3.5 Kiểm soát quá trình sản xuất bằng thống kê
Ghi nhận sự thay đổi của quá trình dựa trên cơ sở mối quan hệ giữa các tham số đo xu hướng trung tâm và độ biến thiên của quá trình
3.6 Phân tích hồi quy tương quan (Regression)
Phân tích sự phụ thuộc của biến nghiên cứu với 1 hoặc nhiều biến độc lập.
3.7 Phân tích dãy số thời gian
(Time series)
Phân tích xu hướng (quy luật) biến động của hiện tượng qua thời gian.
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Trương Minh Chiến
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)