Có nhiều người thắc mắc về spss là gì, chức năng của phần mềm spss và hướng dẫn xử lý số liệu spss đầy đủ là như thế nào? Bài viết sau đây chúng tôi giới thiệu tới bạn cách sử dụng phần mềm SPSS đầy đủ và chi tiết nhất.
Contents
- 1 1. Phần mềm SPSS là gì?
- 2 2. Chức năng của SPSS
- 3 3. Quy trình làm việc của phần mềm SPSS
- 4 4. Cách khởi động phần mềm SPSS
- 5 5. Hướng dẫn xử lý số liệu SPSS chi tiết
1. Phần mềm SPSS là gì?
- SPSS (Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê.
- Phần mềm SPSS giúp xử lý và phân tích dữ liệu sơ cấp – là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các các nghiên cứu điều tra xã hội học và kinh tế lượng.
2. Chức năng của SPSS
Phần mềm SPSS có các chức năng chính bao gồm:
- Phân tích thống kê
- Thống kê mô tả: Lập bảng chéo, Tần suất, Mô tả, Khám phá, Thống kê Tỷ lệ Mô tả
- Thống kê đơn biến: Phương tiện, t-test, ANOVA, tương quan (hai biến, một phần, khoảng cách), kiểm tra không giới
- Dự đoán cho kết quả số: Hồi quy tuyến tính
- Dự đoán để xác định các nhóm: Phân tích các yếu tố, phân tích cụm (hai bước, K-phương tiện, phân cấp), phân biệt. ( Tham khảo tại: dịch vụ spss)
- Quản lý dữ liệu: bao gồm lựa chọn trường hợp, chỉnh sửa lại tập tin, tạo ra dữ liệu gốc
- Vẽ đồ thị: Được sử dụng để vẽ nhiều loại đồ thị khác nhau với chất lượng cao..
3. Quy trình làm việc của phần mềm SPSS
Bạn đã có một một chút hiểu biết về SPSS làm việc như thế nào, chúng ta hãy nhìn vào những gì nó có thể làm. Sau đây là một quy trình làm việc của một dự án điển hình mà SPSS có thể thực hiện
- Bước 1: Mở các files dữ liệu – theo định dạng file của SPSS hoặc bất kỳ định dạng nào;
- Bước 2: Sử dữ liệu – như tính tổng và trung bình các cột hoặc các hàng dữ liệu;
- Bước 3: Tạo các bảng và các biểu đồ – bao gồm đếm các phổ biến hay các thống kê tổng hơn (nhóm) thông qua các trường hợp;
- Bước 4: Chạy các thống kê suy diễn như ANOVA, hồi quy và phân tích hệ số;
- Bước 5: Lưu dữ liệu và đầu ra theo nhiều định dạng file.
- Bước 6: Bây giờ chúng ta cùng tìm hiểu kỹ hơn về những bước sử dụng SPSS.
4. Cách khởi động phần mềm SPSS
- Mở ứng dụng SPSS làm quen với giao diện phần mềm SPSS
- Data editor (Cửa sổ hiệu chỉnh dữ liệu): Gồm bảng tính (worksheet) để nhập dữ liệu vào và điều chỉnh
- Viewer (Cửa sổ xem): Giúp người dùng xem trước và điều chỉnh dễ dàng, thay đổi thứ tự, di chuyển và bảng biểu hiển thị
- Database access (Truy cập dữ liệu): Dùng trình chỉ dẫn Database Wizard thay vì bộ truy vấn SQL phức tạp, người dùng thuận tiện hơn khi truy cập dữ liệu.
- Data Transformation (Biến đổi dữ liệu): Tùy chỉnh chuẩn bị dữ liệu cho các bước phân tích
- Mở phần mềm SPSS
- Trên màn hình desktop của Windows nhấp vào biểu tượng SPSS. Nhấn đúp chuột vào biểu tượng và cửa sổ sẽ mở ra.
- Hoặc bạn mở phím Start >>> All program>>> SPSS for Windows >>>SPSS (phiên bản hiện tại bạn đang cài)
- Sau đó tùy vào mục đích của bạn, bạn cần thống kê suy diễn, vẽ biểu đồ hay các phân tích hồi quy tuyến tính,…để lựa chọn phù hợp.
- Đây là một nguồn tài liệu chúng tôi tổng hợp được, bạn có thể tham khảo tài liệu hướng dẫn sử dụng SPSS phiên bản 20, 21, 22, 23 và download Spss 20, 21, 22, 23.
5. Hướng dẫn xử lý số liệu SPSS chi tiết
5.1. Đề tài nghiên cứu
5.1.1. Tên đề tài
Nghiên cứu các yếu tố ảnh hưởng đến sự hài lòng của nhân viên trong công việc tại công ty TNHH Nhãn Xanh.
5.1.2. Mô hình nghiên cứu
Ở đây, tác giả xem xét trên thực tế và kỳ vọng các biến độc lập đều tác động thuận chiều với biến phụ thuộc nên sẽ ký hiệu dấu
- Trường hợp có biến độc lập tác động nghịch chiều với biến phụ thuộc, chúng ta sẽ ký hiệu dấu (-) và ngược lại là (+)
- Thuận chiều có nghĩa là khi biến độc lập tăng thì biến phụ thuộc cũng tăng
- Ví dụ 1: yếu tố lương, thưởng, phúc lợi tăng lên, tốt hơn thì sự hài lòng của nhân viên trong công việc cũng sẽ tăng lên.
- Ví dụ 2: Giá cả sản phẩm và biến phụ thuộc vào động lực mua hàng của người tiêu dùng.
- Trên thực tế, ta thấy rằng khi giá món hàng càng tăng thì chúng ta sẽ e dè và ít có động lực để mua món hàng đó, hoặc có thể thay vì mua nó với giá cao, chúng ta có thể mua sản phẩm thay thế khác có giá thấp hơn nhưng cùng tính năng.
- Như vậy, giá càng tăng, động lực mua hàng của người tiêu dùng càng giảm. Chúng ta sẽ kỳ vọng rằng, biến “giá cả sản phẩm” tác động nghịch với biến phụ thuộc “động lực mua hàng của người tiêu dùng”.
5.1.3. Giả thuyết nghiên cứu
- Giả thuyết này chúng ta sẽ khẳng định nó là đúng hay sai sau bước phân tích hồi quy tuyến tính.
- Nếu sau bước hồi quy tuyến tính, kết quả xuất ra giống với kỳ vọng thì chúng ta chấp nhận giả thuyết, ngược lại, ta bác bỏ giả thuyết.
- Chúng ta đừng bị sai lầm khi nhận định bác bỏ là tiêu cực, là xấu; còn chấp nhận là tích cực, là tốt.
- H1: Lương, thưởng, phúc lợi tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
- H2: Cơ hội đào tạo và thăng tiến tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
- H3: Lãnh đạo và cấp trên tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
- H4: Đồng nghiệp tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
- H5: Bản chất công việc tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
- H6: Điều kiện làm việc tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.
5.1.4 Bảng câu hỏi khảo sát
5.1.5. Kích thước mẫu
- Đa phần chúng ta lấy mẫu trên cơ sở tiêu chuẩn 5:1 của Bollen (1989)1, tức là để đảm bảo phân tích dữ liệu (phân tích nhân tố khám phá EFA) tốt thì cần ít nhất 5 quan sát cho 1 biến đo lường và số quan sát không nên dưới 100.
- Bảng câu hỏi khảo sát tác giả trích dẫn có tổng cộng 30 biến quan sát (các câu hỏi sử dụng thang đo Likert), do vậy mẫu tối thiểu sẽ là 30 x 5 = 150.
- Chúng ta lưu ý, mẫu này là mẫu tối thiểu chứ không bắt buộc chúng ta lúc nào cũng lấy mẫu này, mẫu càng lớn thì nghiên cứu càng có giá trị. Cụ thể trong nghiên cứu này, tác giả lấy mẫu là 220.
5.2. Kiểm định độ tin cậy thang đo Conbach’s Alpha
5.2.1. Lý thuyết về giá trị và độ tin cậy của đo lường
- Một đo lường được coi là có giá trị (validity) nếu nó đo lường đúng được cái cần đo lường (theo Campbell & Fiske 1959).
- Hay nói cách khác, đo lường đó sẽ không có hiện tượng sai số hệ thống và sai số ngẫu nhiên.
- Sai số hệ thống: sử dụng thang đo không cân bằng, kỹ thuật phỏng vấn kém…
- Sai số ngẫu nhiên: phỏng vấn viên ghi nhầm số đó của người trả lời, người trả lời thay đổi tính cách nhất thời như do mệt mỏi, đau yếu, nóng giận… làm ảnh hưởng đến câu trả lời của họ.
5.2.2. Đo lường độ tin cậy bằng hệ số Cronbach’s Alpha
- Hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo (bao gồm từ 3 biến quan sát trở lên) chứ không tính được độ tin cậy cho từng biến quan sát.
- Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]. Về lý thuyết, hệ số này càng cao càng tốt (thang đo càng có độ tin cậy cao). Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt gì nhau, hiện tượng này gọi là trùng lắp trong thang đo.
5.2.3. Tính hệ số tin cậy Cronbach’s Alpha bằng SPSS
- Nếu một biến đo lường có hệ số tương quan biến tổng Corrected Item – Total Correlation ≥ 0.3 thì biến đó đạt yêu cầu.
- Mức giá trị hệ số Cronbach’s Alpha:
- Từ 0.8 đến gần bằng 1: thang đo lường rất tốt.
- Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt.
- Từ 0.6 trở lên: thang đo lường đủ điều kiện.
- Thông thường chúng ta sẽ đánh giá cùng với hệ số tương quan biến tổng Corrected Item – Total Correlation,
- Nếu giá trị Cronbach’s Alpha if Item Deleted lớn hơn hệ số Cronbach Alpha và Corrected Item – Total Correlation nhỏ hơn 0.3 thì sẽ loại biến quan sát đang xem xét để tăng độ tin cậy của thang đo.
5.3. Phân tích nhân tố khám phá EFA
5.3.1. EFA và đánh giá giá trị thang đo
- Ở phần trước, chúng ta đã tìm hiểu về độ tin cậy thang đo, vấn đề tiếp theo là thang đo phải được đánh giá giá trị của nó.
- Hai giá trị quan trọng được xem xét trong phần này là giá trị hội tụ và giá trị phân biệt. Hiểu một cách đơn giản:
- Giá trị hội tụ: Các biến quan sát hội tụ về cùng một nhân tố.
- Giá trị phân biệt: Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.
- Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn.
Lưu ý: Trong nghiên cứu, chúng ta thường thu thập được một số lượng biến khá lớn. Thay vì đi nghiên cứu 20 đặc điểm nhỏ của một đối tượng, chúng ta có thể chỉ nghiên cứu 4 đặc điểm lớn, gồm nhiều đặc điểm nhỏ có sự tương quan với nhau. Điều này giúp tiết kiệm thời gian và kinh phí nhiều hơn cho người nghiên cứu.
5.3.2. Phân tích nhân tố khám phá EFA bằng SPSS
- Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố.
- Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp.
- Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu.
- Kiểm định Bartlett (Bartlett’s test of sphericity) dùng để xem xét các biến quan sát trong nhân tố có tương quan với nhau hay không.
- Chúng ta cần lưu ý, điều kiện cần để áp dụng phân tích nhân tố là các biến quan sát phản ánh những khía cạnh khác nhau của cùng một nhân tố phải có mối tương quan với nhau.
- Điểm này liên quan đến giá trị hội tụ trong phân tích EFA được nhắc ở trên. Do đó, nếu kiểm định cho thấy không có ý nghĩa thống kê thì không nên áp dụng phân tích nhân tố cho các biến đang xem xét.
- Kiểm định Bartlett có ý nghĩa thống kê (sig Bartlett’s Test < 0.05), chứng tỏ các biến quan sát có tương quan với nhau trong nhân tố.1
- Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố trong phân tích EFA.
- Nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích 2.
- Ví dụ: bảng phía dưới cho thấy có 3 nhân tố trích được tại eigenvalue là 1.537. Nếu chúng ta trích thêm một nhân tố nữa (nhân tố thứ tư) thì eigenvalue lúc này là 0.900 < 1. Vì vậy, nếu dựa vào tiêu chí eigenvalue từ 1 trở lên, chúng ta dừng ở nhân tố thứ ba
- Tổng phương sai trích (Total Variance Explained) ≥ 50% cho thấy mô hình EFA là phù hợp.
- Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.
- Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố.
- Factor Loading ở mức 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
- Factor Loading ở mức 0.5: Biến quan sát có ý nghĩa thống kê tốt.
- Factor Loading ở mức 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.
- Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
- Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu.
- Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Cụ thể, chúng ta sẽ xem bảng dưới đây:
Trên thực tế, việc nhớ từng mức hệ số tải với từng khoảng kích thước mẫu là khá khó khăn, do vậy người ta thường lấy hệ số tải 0.45 hoặc 0.5 làm mức tiêu chuẩn với cỡ mẫu từ 120 đến dưới 350; lấy tiêu chuẩn hệ số tải là 0.3 với cỡ mẫu từ 350 trở lên.
5.4. Tương quan Pearson
Sau khi đã có được các biến đại diện độc lập và phụ thuộc ở phần phân tích nhân tố EFA, chúng ta sẽ tiến hành phân tích tương quan Pearson để kiểm tra mối quan hệ tuyến tính giữa các biến này.
5.4.1 Lý thuyết về tương quan và tương quan Pearson
- Giữa 2 biến định lượng có nhiều dạng liên hệ, có thể là tuyến tính hoặc phi tuyến hoặc không có bất kỳ một mối liên hệ nào.
- Người ta sử dụng một số thống kê là hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng (lưu ý rằng Pearson chỉ xét mối liên hệ tuyến tính, không đánh giá các mối liên hệ phi tuyến).
- Trong tương quan Pearson không có sự phân biệt vai trò giữa 2 biến, tương quan giữa biến độc lập với biến độc lập cũng như giữa biến độc lập với biến phụ thuộc.
5.4.2. Phân tích tương quan Pearson bằng SPSS
5.4.2.1. Một số tiêu chí cần biết Tương quan Pearson r có giá trị dao động từ -1 đến 1:
- Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.
- Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
- Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.
- Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.
Bảng trên đây minh họa cho kết quả tương quan Pearson của nhiều biến đưa vào cùng lúc trong SPSS. Trong bảng kết quả tương quan Pearson ở trên:
- Hàng Pearson Correlation là giá trị r để xem xét sự tương thuận hay nghịch, mạnh hay yếu giữa 2 biến
- Hàng Sig. (2-tailed) là sig kiểm định xem mối tương quan giữa 2 biến là có ý nghĩa hay không.
- Sig < 0.05, tương quan có ý nghĩa;
- sig ≥ 0.05, tương quan không có ý nghĩa.
- Cần xem xét sig trước, nếu sig < 0.05 mới nhận xét tới giá trị tương quan Pearson r.
- Hàng N hiển thị cỡ mẫu của tập dữ liệu. Cụ thể trong bảng trên là 220.
5.4.2.2. Thực hành trên SPSS 20 với tập dữ liệu mẫu
Để thực hiện phân tích tương quan Pearson trong SPSS 20, chúng ta vào Analyze > Correlate > Bivariate…
Tại đây, chúng ta đưa hết tất cả các biến muốn chạy tương quan Pearson vào mục Variables. Cụ thể là các biến đại diện được tạo ra sau bước phân tích EFA. Để tiện cho việc đọc số liệu, chúng ta nên đưa biến phụ thuộc lên trên cùng, tiếp theo là các biến độc lập. Sau đó, nhấp vào OK để xuất kết quả ra Output.
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
- Sig tương quan Pearson các biến độc lập TN, CV, LD, MT, DT với biến phụ thuộc HL nhỏ hơn 0.05. Như vậy, có mối liên hệ tuyến tính giữa các biến độc lập này với biến HL. Giữa DT và HL có mối tương quan mạnh nhất với hệ số r là 0.611, giữa MT và HL có mối tương quan yếu nhất với hệ số r là 0.172.
- Sig tương quan Pearson giữa HL và DN lớn hơn 0.05, do vậy, không có mối tương quan tuyến tính giữa 2 biến này. Biến DN sẽ được loại bỏ khi thực hiện phân tích hồi quy tuyến tính bội.
- Các cặp biến độc lập đều có mức tương quan khá yếu với nhau, như vậy, khả năng cao sẽ không có hiện tượng đa cộng tuyến xảy ra.
5.5. Hồi quy đa biến
5.5.1 Lý thuyết về hồi quy tuyến tính
- Khác với tương quan Pearson, trong hồi quy các biến không có tính chất đối xứng như phân tích tương quan.
- Vai trò giữa biến độc lập và biến phụ thuộc là khác nhau. X và Y hay Y và X có tương quan với nhau đều mang cùng một ý nghĩa, trong khi đó với hồi quy, ta chỉ có thể nhận xét: X tác động lên Y hoặc Y chịu tác động bởi X.
- Đối với phân tích hồi quy tuyến tính bội, chúng ta giả định các biến độc lập X1, X2, X3 sẽ tác động đến biến phụ thuộc Y. Ngoài X1, X2, X3… còn có rất nhiều những nhân tố khác ngoài mô hình hồi quy tác động đến Y mà chúng ta không liệt kê được.
5.5.2 Phân tích hồi quy đa biến bằng SPSS
5.5.2.1 Các tiêu chí trong phân tích hồi quy đa biến
- Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square): phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy.
- R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù mô hình đó tốt đến nhường nào. Giá trị này thường nằm trong bảng Model Summary.
- Cần chú ý, không có sự giới hạn giá trị R2, R2 hiệu chỉnh ở mức bao nhiêu thì mô hình mới đạt yêu cầu, 2 chỉ số này nếu càng tiến về 1 thì mô hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mô hình càng yếu.
- Thường chúng ta chọn mức tương đối là 0.5 để làm giá trị phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu, từ 0.5 đến 1 thì mô hình là tốt, bé hơn 0.5 là mô hình chưa tốt.
- Giá trị sig của kiểm định F: được sử dụng để kiểm định độ phù hợp của mô hình hồi quy.
- Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được. Giá trị này thường nằm trong bảng ANOVA.
- Trị số Durbin – Watson (DW): dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau).
- DW có giá trị biến thiên trong khoảng từ 0 đến 4
- Nếu giá trị càng gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch.
- Để đảm bảo chính xác, chúng ta sẽ tra ở bảng thống kê Durbin-Watson (có thể tìm bảng thống kê DW trên Internet). Giá trị này thường nằm trong bảng Model Summary.
- Hệ số k’: là số biến độc lập đưa vào chạy hồi quy, N là kích thước mẫu. Nếu N của bạn là một con số lẻ như 175, 214, 256, 311 thì bạn có thể làm tròn kích thước mẫu với giá trị gần nhất trong bảng tra.
- Giá trị sig của kiểm định t: được sử dụng để kiểm định ý nghĩa của hệ số hồi quy.
- Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập <0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc.
- Hệ số phóng đại phương sai VIF: dùng để kiểm tra hiện tượng đa cộng tuyến.
- Thông thường, nếu VIF>10 nghĩa là đang có đa cộng tuyến xảy ra với biến độc lập đó. Khi đó, biến này sẽ không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy.
- Thực tế nếu VIF > 2 thì khả năng rất cao đang xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập. Giá trị này thường nằm trong bảng Coefficients.
- Kiểm tra giả định hồi quy, bao gồm phần dư chuẩn hóa và liên hệ tuyến tính:
- Đối với biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn gần bằng 1, ta có thể khẳng định phân phối là xấp xỉ chuẩn.
- Đối với biểu đồ Normal P-P Plot, nếu các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.
- Nếu phần dư chuẩn hóa phân bổ tập trung xung quanh đường hoành độ 0, chúng ta có thể kết luận giả định quan hệ tuyến tính không bị vi phạm.
- Kiểm tra vi phạm giả định phần dư chuẩn hóa: Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích…
- Kiểm tra vi phạm giả định liên hệ tuyến tính: Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không.
5.5.2.2 Thực hành trên SPSS 20 với tập dữ liệu mẫu
Sau tương quan Pearson, chúng ta còn 5 biến độc lập là TN, CV, LD, MT, DT. Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này đến biến phụ thuộc HL. Để thực hiện phân tích hồi quy đa biến trong SPSS 20, chúng ta vào Analyze > Regression > Linear…
Bước 4
Xem thêm:
+ Kiểm định T – test, kiểm định sự khác biệt trong spss
+ Tổng quan về phân tích nhân tố khám phá EFA
Các tìm kiếm liên quan khác: hướng dẫn sử dụng spss, dịch vụ chạy spss phần mềm spss là gì, nhận chạy stata, hướng dẫn sử dụng phần mềm spss, cách sử dụng phần mềm spss, hướng dẫn sử dụng spss 20, nhận xử lý số liệu spss, phần mềm thống kê spss, phần mềm spss cách sử dụng, cách sử dụng spss cho người mới bắt đầu, chạy eview, phần mềm xử lý số liệu spss, …