Bài giảng dạy SPSS


(Bài giảng chưa được thẩm định)
Nguồn:
Người gửi: Phạm Mạnh Hà
Ngày gửi: 10h:32' 12-06-2009
Dung lượng: 388.5 KB
Số lượt tải: 577
Số lượt thích: 0 người

Sử dụng phần mềm SPSS trong nghiên cứu tâm lý học
Tài liệu tham khảo
1. Dương thiệu Tống, Thống kê ứng dụng trong nghiên cứu khoa học giáo dục, NXB Đại học Quốc Gia HN 2000
2. Nguyễn Công Khanh, Ứng dụng phần mềm thống kê SPSS để xử lý và phân tích dữ liệu trong khoa học xã hội (Tài liệu dùng cho học viên cao học TL - GDH), Hà Nội 2004
3. Nguyễn Văn Liệu, Nguyễn Đình Cử, Nguyễn Quốc Anh, SPSS - Ứng dụng phân tích dữ liệu trong quản trị kinh doanh và khoa học tự nhiên - xã hội. NXB Giao thông vận tải 2000
4. Võ Văn Huy, Võ Thị Lan, Hoàng Trọng. Ứng dụng SPSS for windows để xử lý và phân tích dữ kiện nghiên cứu marketing, quản trị, kinh tế, tâm lý, xã hội. NXB Khoa học Kỹ thuật 1997
Bài 1: Giới thiệu khái quát về phần mềm SPSS
1. SPSS là gì?
SPSS là một sản phẩm phần mềm chuyên ngành thống kê. Lúc đầu được sử dụng cho các máy chủ (máy trung tâm -mainframes) vào những năm 1960s, sau này được sử dụng cho các máy tính cá nhân.
Sản phẩm SPSS được viết tắt từ Statistical Products for the Social Services, có nghĩa là Các sản phẩm Thống kê cho các dịch vụ xã hội. Phiên bản mới nhất là SPSS 13.0.
SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế để thực hiện tất cả các bước trong các phân tích thống kê từ những thông kê mô tả (liệt kê dữ liệu, lập đồ thị) đến thống kê suy luận (tương quan, hồi quy…)
2. Các bộ phận của hệ thống SPSS
SPSS Professional Statistisc: Cung cấp các kỹ thuật để phân tích dữ liệu dạng không thích hợp với mô hình tuyến tính truyền thống.
SPSS Ađvance Statistisc: Tập trung vào các kỹ thuật được dùng trong các thí nghiệm sinh học và phức tạp.
SPSS Tables: Xây dựng một loạt các báo cáo dạng bảng biểu có chất lượng trình bày cao, và phức tạp.
SPSS Trends: Thực hiện các phép dự đoán và phân tích dãy số thời gian phức tạp bao gồm xây dựng các mô hình cho dữ liệu đa biến phi tuyến tính, các mô hình san bằng, và các phương pháp để ước lưọng các hàm tự hồi quy.
3. Một số thuật ngữ quan trọng của SPSS.
3.1. Case (trường hợp/chủ thể)
Các quan sát là các trường hợp/chủ thế (case).
Một chủ thể bao gồm các thông tin cho một đơn vị của phép phân tích.
Ví dụ: 1 người với tư cách là 1 chủ thể (case) bao gồm các thông tin mà nhà nghiên cứu cần quan tâm như: tuổi, giới tính, trình độ văn hoá, những thái độ ứng xử, quan niệm, hành động…
3.2. Biến (variables)
Mỗi chủ thể được thể hiện qua các biến. Biến (variable) là thông tin hoặc thuộc tính được thu thập cho từng chủ thể.
Ví dụ: tuổi, giới tính, học vấn, nhận thức,thái độ...
3.3. Variable name (tên biến)
Mỗi biến được đặt tên và không có 2 biến có tên giống hệt nhau trong mỗi tệp tin.
Mỗi tên biến có tối đa là 8 ký tự
Ví dụ: Cau1; Cau2; gioi, tuoi, thunhap...
3.4.Variable label (nhãn biến)
Dùng để mô tả cho tên đầy đủ của biến
3.5. Value label (Nhãn của giá trị biến)
Dùng để mô tả những biểu hiện riêng biệt của từng biến định tính.
3.4. Các case (chủ thể/trường hợp) tập hợp với nhau lại tạo nên tệp dữ liệu hiện hành SPSS (working data file).
Trong hệ thống tệp tin của windows, các tệp tin có đuôi mở rộng là *.sav, các kết quả đầu ra có phần đuôi mở rộng là *.spo…
3.5. Measurement (Thang đo)
Các biểu hiện của các giá trị biến được xác định bằng các thang đo khác nhau tùy tính chất của việc đo lường. Từng phương pháp phân tích dữ liệu do vậy cũng tuỳ thuộc vào loại thang đo được sử dụng.
Có 4 loại thang đo thường gặp là: Định danh, thứ bậc, khoảng và tỷ lệ.
3.5.1. Thang đo định danh (nominal)
là đánh số hoặc gán chuỗi dạng ngắn cho các biểu hiện của một biến (được gọi là biến định danh [nominal variable]).
Các trị số của biến định danh chỉ thể hiện các nhóm không có thứ bậc hơn kém (unordered categories).
Nếu biến định danh được đo bằng các con số thì giữa các con số ở đây không có quan hệ hơn kém. Do đó mọi phép tính đại số giữa chúng đều vô nghĩa.
Thang đo định danh chủ yếu để đếm tần số biểu hiện của biến nghiên cứu.
3.5.2. Thang đo thứ bậc (ordinal)
Là thang đo định danh những các trị số của biến lại có quan hệ thứ bậc hơn kém:
Các biến được đo đạc bằng thang đo thứ bậc gọi là các biến định danh có thứ bậc (ordinal variable). Trong nhiều phép phân tích của SPSS, các biến định danh có thứ bậc thường được gọi là các biến lập nhóm có thứ bậc (ordered categorical variable)
3.5.3. Thang đo khoảng (Interval scale)
Là một kiểu đánh giá phân loại sự vật, hiện tượng hay đặc tính theo nhữnng đơn vị đều nhau ở bất kỳ khoảng nào trên thanh đo.
Ví dụ như, phép đo chiều cao là một kiểu của thang định khoảng: sự khác biệt giữa người cao 160 - 165 với người cao 150 - 155; đều ở một khoảng là 5 cm. Với thang đo thứ bậc, chúng ta có thể dùng các phép tính số học như cộng, trừ, tính trung bình, phương sai…
3.5.4. Thang đo tỷ lệ (Ratio)
Là thang đo khoảng với một điểm không (0) tuyệt đối/điểm gốc để có thể so sánh được tỷ lệ giữa các số đo.
Sự có mặt của số 0 giúp ta thiết lập được tỷ lệ giữa các điểm số thu được. Ví dụ, chúng ta có thể xác định chính xác vận tốc 10 km/h lớn gấp 2 lần vận tốc 5 km/h.
3.6. Các loại biến số
Các hiện tượng mà ta muốn quan sát được gọi là các biến số (variables). Một biến là những đại lượng có thể mang các giá trị khác nhau như học vấn, thu nhập, tính cách, khí chất… Các biến này có thể thuộc loại định tính (qualitative) hay định lượng (quantitative).
Trong nghiên cứu người ta thường phân biệt 2 loại biến số chính yếu khác nữa: Biến độc lập (independent variables) và biến phụ thuộc (dependent variables).
3.6.1. Biến định tính (quatitative variables)
Là những biến mà người ta gán cho các giá trị để phân biệt hay phân loại các quan sát. Đây là biến lập nhóm (categorical variables), trị số của chúng được xác định bằng các thang đo định danh hoặc thang đo thứ bậc dưới dạng mã số hoặc chuỗi ngắn
Ví dụ: Giới tính (nam, nữ); Trình độ học vấn (Mù chữ, tiểu học, trung học, cao đẳng, đại học, trên đại học)…; Thu nhập (thấp, trung bình, khá, cao…)
3.6.2. Biến định lượng (quantitative variables)
Là những biến mà các giá trị của chúng được xác định bằng các thang đo khoảng nên trị số của chúng luôn để dưới dạng số:
Ví dụ: Thu nhập ( 200.000đ; 220.000đ; 211.000đ…), tuổi (15; 17; 19; 18; 16…), số lượng tài sản có trong gia đình: Tivi; tủ lạnh, xe máy…
3.6.3. Biến độc lập (independent variable)
Biến độc lập là một đặc tính được lựa chọn để nghiên cứu. Biến độc lập được giả thuyết là một biến mà sự biến đổi của nó có ảnh hưởng chi phối hoặc gây ra những biến đổi khéo theo ở một biến khác.
3.6.4. Biến phụ thuộc (dependent variable)
Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối (đáp ứng) của 1 biến khác. Một biến được gọi là biến phụ thuộc khi giá trị của nó tuỳ thuộc vào giá trị của biến độc lập. Nó chính là hiệu quả giả định của biến độc lập.
Lưu ý: Việc xác định một biến là độc lập và phụ thuộc thường có tính chất tương đối. Một biến có thể được xem là phụ thuộc trong phạm vi phân tích này lại là độc lập trong phạm vi phân tích khác.
Trong nghiên cứu còn có những yếu tố ảnh hưởng không được kiểm soát (hay không được quan sát một cách có hệ thống) được gọi là các biến bổ trợ.
4. Các khái niệm đặc trưng trong thống kê
4.1. Yếu vị (mode)
Yếu vị của một tập hợp các đo lường là trung điểm của khoảng đẳng loại chứa đựng tần số tối đa hay trong trường hợp các biến định tính, nó là tên của loại đo lường có tần số lớn nhất.
4.2. Trung vị (median)
Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng
Công thức tính trung vị = 1/2 (N+1)
Nếu trung vị là số lẻ thì lấy giá trị trung bình của thứ hạng đứng trường và sau.
4.3. Trung bình cộng (mean)
Trung bình cộng của một tập hợp các số đo lượng là tổng số cộng các đo lường chia cho N (tổng số) của đo lường ấy.
4.4. Độ lệch chuẩn (standar deviation)
Độ lệch chuẩn là một phép đo đánh giá mức độ phân tán hoặc thay đổi của một phân bố điểm (tức là mức độ phân tán hay tập trung của điểm số xoay quanh giá trị trung bình). Độ lệch chuẩn chính là độ lệch trung bình của điểm số tính từ giá trị trung bình của mẫu.
4.5. Phương sai (varian)
Phương sai cũng là một phép đo đánh giá mức độ phân tán hoặc thay đổi của mộ phân bố điểm.
Phương sai chính là bình phương độ lệch chuẩn.
4.6. Tương quan
Tương quan (correlation) là một số đo lường về mối liên hệ giữa hai biến số. Nó có thể là dương (+) hoặc (-) hay = 0.