Máy Tính Hệ Số Tương Quan Mẫu
Nhập dữ liệu mẫu của bạn để tính toán hệ số tương quan Pearson, Spearman và phân tích mối quan hệ thống kê giữa các biến.
Kết Quả Phân Tích
Hướng Dẫn Chi Tiết: Cách Bấm Máy Tính Hệ Số Tương Quan Mẫu
Hệ số tương quan mẫu (sample correlation coefficient) là một thước đo thống kê quan trọng để đánh giá mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng. Trong bài viết này, chúng ta sẽ khám phá cách tính toán hệ số tương quan bằng máy tính cầm tay và thông qua công cụ trực tuyến của chúng tôi.
1. Khái Niệm Cơ Bản Về Hệ Số Tương Quan
Hệ số tương quan Pearson (r) đo lường cường độ và hướng của mối quan hệ tuyến tính giữa hai biến liên tục. Giá trị của r dao động từ -1 đến 1:
- r = 1: Tương quan hoàn hảo dương
- r = -1: Tương quan hoàn hảo âm
- r = 0: Không có tương quan tuyến tính
- 0 < |r| < 0.3: Tương quan yếu
- 0.3 ≤ |r| < 0.7: Tương quan trung bình
- |r| ≥ 0.7: Tương quan mạnh
2. Công Thức Tính Hệ Số Tương Quan Pearson
Công thức tính hệ số tương quan mẫu r:
r = [n(ΣXY) – (ΣX)(ΣY)] / √[nΣX² – (ΣX)²][nΣY² – (ΣY)²]
Trong đó:
- n: Số cặp dữ liệu
- ΣXY: Tổng tích của X và Y
- ΣX: Tổng của X
- ΣY: Tổng của Y
- ΣX²: Tổng bình phương của X
- ΣY²: Tổng bình phương của Y
3. Hướng Dẫn Bấm Máy Tính Hệ Số Tương Quan
Đối với máy tính cầm tay Casio fx-570VN Plus:
- Bước 1: Nhập dữ liệu
- Ấn phím MODE → chọn 3:STAT
- Chọn 1:1-VAR nếu chỉ có 1 biến, hoặc 2:2-VAR nếu có 2 biến
- Nhập dữ liệu cho biến X và Y
- Bước 2: Tính toán các thông số
- Ấn SHIFT → 1 → 4:Σx để tính tổng X
- Ấn SHIFT → 1 → 5:Σy để tính tổng Y
- Ấn SHIFT → 1 → 6:Σx² và 7:Σy² cho tổng bình phương
- Ấn SHIFT → 1 → 8:Σxy cho tổng tích
- Bước 3: Tính hệ số tương quan
- Ấn SHIFT → 1 → 3:REG → 3:r để lấy hệ số tương quan
4. Ví Dụ Minh Họa
Giả sử chúng ta có dữ liệu sau về chiều cao (X) và cân nặng (Y) của 5 người:
| Chiều cao (cm) | Cân nặng (kg) |
|---|---|
| 160 | 55 |
| 165 | 60 |
| 170 | 65 |
| 175 | 70 |
| 180 | 75 |
Các bước tính toán:
- Tính các tổng cần thiết:
- ΣX = 160 + 165 + 170 + 175 + 180 = 850
- ΣY = 55 + 60 + 65 + 70 + 75 = 325
- ΣXY = (160×55) + (165×60) + … + (180×75) = 55,125
- ΣX² = 160² + 165² + … + 180² = 147,250
- ΣY² = 55² + 60² + … + 75² = 21,875
- Áp dụng công thức:
r = [5(55,125) – (850)(325)] / √[5(147,250) – 850²][5(21,875) – 325²]
r = (275,625 – 276,250) / √(736,250 – 722,500)(109,375 – 105,625)
r = -625 / √(13,750)(3,750) = -625 / √51,562,500 ≈ -625 / 7,180.7 ≈ 0.999
5. Kiểm Định Ý Nghĩa Thống Kê
Để kiểm tra xem hệ số tương quan có ý nghĩa thống kê hay không, chúng ta sử dụng kiểm định t:
t = r√[(n-2)/(1-r²)]
So sánh giá trị t tính được với giá trị t bảng (t-critical) với bậc tự do df = n-2 và mức ý nghĩa α.
| Bậc tự do (df) | α = 0.10 | α = 0.05 | α = 0.01 |
|---|---|---|---|
| 1 | 6.314 | 12.706 | 63.657 |
| 2 | 2.920 | 4.303 | 9.925 |
| 3 | 2.353 | 3.182 | 5.841 |
| 4 | 2.132 | 2.776 | 4.604 |
| 5 | 2.015 | 2.571 | 4.032 |
| 10 | 1.812 | 2.228 | 3.169 |
| 20 | 1.725 | 2.086 | 2.845 |
| 30 | 1.697 | 2.042 | 2.750 |
6. Hệ Số Tương Quan Spearman
Khi dữ liệu không tuân theo phân phối chuẩn hoặc có quan hệ phi tuyến, chúng ta sử dụng hệ số tương quan hạng Spearman (ρ):
ρ = 1 – [6Σd² / n(n²-1)]
Trong đó d là hiệu giữa các hạng của X và Y.
7. Ứng Dụng Thực Tế
Hệ số tương quan được ứng dụng rộng rãi trong:
- Kinh tế học: Phân tích mối quan hệ giữa GDP và thất nghiệp
- Y học: Nghiên cứu mối liên hệ giữa huyết áp và tuổi tác
- Tài chính: Đánh giá rủi ro danh mục đầu tư
- Giáo dục: Nghiên cứu mối quan hệ giữa thời gian học và điểm số
- Khoa học môi trường: Phân tích ô nhiễm và sức khỏe cộng đồng
8. Những Lưu Ý Khi Sử Dụng Hệ Số Tương Quan
- Tương quan không hàm ý nhân quả (correlation ≠ causation)
- Chỉ đo lường mối quan hệ tuyến tính
- Nhạy cảm với giá trị ngoại lai (outliers)
- Cần kiểm tra giả định về tính tuyến tính và phân phối chuẩn
- Kích thước mẫu nhỏ có thể dẫn đến kết quả không ổn định
9. So Sánh Pearson và Spearman
| Tiêu chí | Pearson | Spearman |
|---|---|---|
| Loại dữ liệu | Dữ liệu liên tục, phân phối chuẩn | Dữ liệu hạng hoặc không chuẩn |
| Quan hệ đo lường | Tuyến tính | Đơn điệu (tăng/giảm) |
| Độ nhạy với ngoại lai | Nhạy cảm cao | Ít nhạy cảm hơn |
| Công thức | Dựa trên covariance và độ lệch chuẩn | Dựa trên hạng của dữ liệu |
| Ứng dụng phổ biến | Phân tích thống kê tham số | Phân tích thống kê phi tham số |