R Kwadraat (R²) Calculator
Bereken de coefficient of determinatie (R²) om de verklarende kracht van je model te bepalen
Complete Gids voor R Kwadraat (R²) op de Rekenmachine
De coefficient of determinatie, beter bekend als R kwadraat (R²), is een statistische maat die aangeeft in welke mate de variatie in de afhankelijke variabele (Y) verklaard wordt door de onafhankelijke variabele(n) (X) in een regressiemodel. Deze gids legt uit hoe je R² kunt berekenen, interpreteren en toepassen in praktische situaties.
Wat is R Kwadraat (R²) precies?
R kwadraat (R²) is een proportie die varieert tussen 0 en 1 en aangeeft:
- 0: Het model verklaart geen enkele variatie in de afhankelijke variabele
- 1: Het model verklaart alle variatie in de afhankelijke variabele
- Tussen 0 en 1: Het percentage variatie dat verklaard wordt door het model
Formule voor R²:
R² = 1 – (SSR/SST)
Waarbij:
- SSR: Som van de gekwadrateerde residuen (Sum of Squared Residuals)
- SST: Totale som van kwadraten (Total Sum of Squares)
Hoe bereken je R² handmatig?
Volg deze stappen om R² handmatig te berekenen:
- Bereken het gemiddelde van de waargenomen Y-waarden (Ȳ)
- Bereken SST: Σ(Yi – Ȳ)²
- Bereken SSR: Σ(Yi – Ŷi)² (waar Ŷi de voorspelde waarde is)
- Bereken R² met de formule: R² = 1 – (SSR/SST)
Interpretatie van R² Waarden
De interpretatie van R² is contextafhankelijk, maar hier zijn algemene richtlijnen:
| R² Bereik | Interpretatie | Model Fit |
|---|---|---|
| 0.00 – 0.30 | Zeer zwakke verklarende kracht | Slecht |
| 0.30 – 0.50 | Matige verklarende kracht | Gemiddeld |
| 0.50 – 0.70 | Redelijke verklarende kracht | Goed |
| 0.70 – 0.90 | Sterke verklarende kracht | Zeer goed |
| 0.90 – 1.00 | Zeer sterke verklarende kracht | Uitstekend |
Veelgemaakte Fouten bij het Gebruik van R²
- Overinterpretatie: Een hoog R² betekent niet automatisch causaliteit
- Sample size negeren: R² kan misleidend zijn bij kleine steekproeven
- Verkeerde modelselectie: R² alleen is geen goede modelselectiecriteria
- Extrapolatie: Voorspellingen buiten het bereik van je data zijn onbetrouwbaar
Praktische Toepassingen van R²
R kwadraat wordt breed toegepast in verschillende disciplines:
| Discipline | Toepassing | Typisch R² Bereik |
|---|---|---|
| Economie | Voorspellen van economische groei | 0.60 – 0.85 |
| Geneeskunde | Voorspellen van behandelresultaten | 0.30 – 0.60 |
| Marketing | Voorspellen van consumentengedrag | 0.40 – 0.70 |
| Milieuwetenschappen | Modelleren van klimaatverandering | 0.70 – 0.95 |
Alternatieven en Aanvullingen voor R²
Hoewel R² waardevol is, zijn er situaties waarin andere statistieken beter passen:
- Gecorrigeerd R²: Gecorrigeerd voor het aantal voorspellers in het model
- RMSE: Root Mean Square Error voor voorspellingsnauwkeurigheid
- MAE: Mean Absolute Error voor interpretatie van fouten
- AIC/BIC: Voor modelselectie bij meerdere modellen
Hoe R² te Verbeteren
Als je R² waarde te laag is, overweeg dan:
- Meer relevante voorspellers toevoegen aan je model
- Nicht-lineaire relaties modelleren (bijv. kwadratische termen)
- Interactietermen opnemen tussen voorspellers
- Outliers identificeren en behandelen
- Meer data verzamelen voor betere schattingen
Limitaties van R²
Het is belangrijk om de beperkingen van R² te erkennen:
- R² neemt altijd toe als je meer voorspellers toevoegt, zelfs als ze niet relevant zijn
- R² meet alleen lineaire relaties (niet-lineaire relaties worden mogelijk gemist)
- R² is gevoelig voor outliers in de data
- R² zegt niets over de causaliteit tussen variabelen
Veelgestelde Vragen over R Kwadraat
Kan R² negatief zijn?
Nee, R² kan theoretisch niet negatief zijn omdat het een kwadraat is van de correlatiecoëfficiënt. Als je een negatieve waarde krijgt, is er waarschijnlijk een berekeningsfout gemaakt in SSR of SST.
Wat is het verschil tussen R en R²?
R (de correlatiecoëfficiënt) meet de sterkte en richting van de lineaire relatie tussen twee variabelen (-1 tot 1). R² is het kwadraat hiervan en geeft het percentage verklaarde variantie (0 tot 1).
Hoe bereken ik gecorrigeerd R²?
Gecorrigeerd R² = 1 – [(1-R²)*(n-1)/(n-k-1)] waarbij n = aantal observaties en k = aantal voorspellers. Dit corrigeert voor de neiging van R² om te stijgen met meer voorspellers.
Is een R² van 0.5 goed?
Dat hangt af van het vakgebied. In sociale wetenschappen is 0.5 vaak als goed beschouwd, terwijl in natuurwetenschappen vaak hogere waarden verwacht worden (0.8+).
Kan ik R² gebruiken voor niet-lineaire modellen?
Ja, maar de interpretatie verandert. Voor niet-lineaire modellen wordt vaak pseudo-R² gebruikt, wat een soortgelijk concept is maar anders berekend wordt.