Lineaire Regressie Calculator

Bereken eenvoudig de lineaire regressielijn, correlatiecoëfficiënt en voorspellingswaarden met deze professionele tool.

Aantal datapunten (2-20)

Decimalen

Regressie Resultaten

Complete Gids: Lineaire Regressie op de Rekenmachine

Lineaire regressie is een fundamentele statistische techniek die wordt gebruikt om de relatie tussen een afhankelijke variabele (Y) en één of meer onafhankelijke variabelen (X) te modelleren. Deze gids legt uit hoe u lineaire regressie kunt uitvoeren op verschillende soorten rekenmachines, inclusief grafische rekenmachines en softwaretools.

Wat is Lineaire Regressie?

Lineaire regressie is een methode om de beste rechte lijn (de “least squares line”) te vinden die door een set datapunten gaat. De algemene formule voor eenvoudige lineaire regressie is:

Ŷ = a + bX

waarbij:

Ŷ = de voorspelde waarde van de afhankelijke variabele
X = de waarde van de onafhankelijke variabele
a = het snijpunt met de Y-as (intercept)
b = de richtingscoëfficiënt (slope)

Belangrijke Formules voor Handmatige Berekening

Voor het handmatig berekenen van lineaire regressie heeft u de volgende formules nodig:

Richtingscoëfficiënt (b)

b = nΣ(XY) – ΣXΣY
nΣ(X²) – (ΣX)²

Intercept (a)

a = Ȳ – bX̄

waarbij n = aantal datapunten, Σ = sommatie, X̄ = gemiddelde van X, Ȳ = gemiddelde van Y

Correlatiecoëfficiënt (r)

De correlatiecoëfficiënt meet de sterkte en richting van de lineaire relatie tussen twee variabelen. De formule is:

r = nΣ(XY) – ΣXΣY
√[nΣ(X²) – (ΣX)²][nΣ(Y²) – (ΣY)²]

Interpretatie van Correlatiecoëfficiënt
Waarde van r	Interpretatie
0.9 tot 1.0	Zeer sterke positieve correlatie
0.7 tot 0.9	Sterke positieve correlatie
0.5 tot 0.7	Matige positieve correlatie
0.3 tot 0.5	Zwakke positieve correlatie
0 tot 0.3	Geen of verwaarloosbare correlatie
-0.3 tot 0	Zwakke negatieve correlatie
-0.5 tot -0.3	Matige negatieve correlatie
-0.7 tot -0.5	Sterke negatieve correlatie
-1.0 tot -0.7	Zeer sterke negatieve correlatie

Lineaire Regressie op Grafische Rekenmachines

Texas Instruments (TI-84 Plus)

Druk op [STAT] en selecteer [Edit]
Voer uw X-waarden in in L1 en Y-waarden in L2
Druk op [STAT] → [CALC] → [LinReg(ax+b)]
Druk op [ENTER] om de regressie uit te voeren
De resultaten worden weergegeven als:
- a = intercept
- b = slope
- r² = coefficient of determination
- r = correlatiecoëfficiënt

Casio (fx-9750GII)

Druk op [MENU] → [STAT] → [EXE]
Selecteer “List 1” voor X en “List 2” voor Y
Voer uw gegevens in en druk op [EXIT]
Druk op [F2] (CALC) → [F3] (REG) → [F1] (X)
Selecteer “Linear” en druk op [EXE]
De regressievergelijking wordt weergegeven als y = ax + b

Praktische Toepassingen van Lineaire Regressie

Economie

Voorspellen van vraag op basis van prijs
Analyse van inflatie trends
BBP voorspellingen

Geneeskunde

Dosering-respons relaties
Voorspellen van ziekteprogressie
Analyse van klinische trial data

Techniek

Kalibratie van meetinstrumenten
Voorspellen van materiaalvermoeidheid
Optimalisatie van productieprocessen

Veelgemaakte Fouten bij Lineaire Regressie

Extrapolatie: Het gebruik van de regressielijn om voorspellingen te doen buiten het bereik van uw gegevens. Dit kan leiden tot zeer onnauwkeurige resultaten omdat de lineaire relatie mogelijk niet geldt buiten het waargenomen bereik.
Verwaarlozen van niet-lineaire patronen: Als uw gegevens een duidelijk niet-lineair patroon vertonen, is lineaire regressie mogelijk niet de juiste techniek.
Outliers negeren: Extreme waarden kunnen de regressielijn sterk beïnvloeden. Het is belangrijk om outliers te identificeren en te evalueren of ze moeten worden opgenomen of verwijderd.
Correlatie ≠ causaliteit: Een sterke correlatie tussen twee variabelen betekent niet automatisch dat de ene variabele de andere veroorzaakt.
Multicollineariteit: Bij meervoudige regressie (met meerdere onafhankelijke variabelen) kan een sterke correlatie tussen de onafhankelijke variabelen de resultaten verstoren.

Geavanceerde Concepten

Meervoudige Lineaire Regressie

Wanneer er meer dan één onafhankelijke variabele is, spreken we van meervoudige lineaire regressie. De algemene formule wordt:

Ŷ = a + b₁X₁ + b₂X₂ + … + bₙXₙ

Deze techniek wordt veel gebruikt in complexe analyses waar meerdere factoren de afhankelijke variabele beïnvloeden.

Residual Analysis

Na het uitvoeren van een lineaire regressie is het belangrijk om de residuen (de verschillen tussen de waargenomen en voorspelde waarden) te analyseren:

Residuenplot: Een plot van residuen tegen voorspelde waarden moet willekeurig verspreid zijn. Patronen duiden op problemen met het model.
Normaliteit: Residuen moeten normaal verdeeld zijn (te controleren met een Q-Q plot).
Homoscedasticiteit: De variantie van residuen moet constant zijn over alle waarden van X.

Coëfficiënt van Bepaling (R²)

De R²-waarde (R-squared) geeft aan welk percentage van de variantie in de afhankelijke variabele wordt verklaard door het model. Het bereik is 0 tot 1, waarbij:

0 = het model verklaart geen variantie
1 = het model verklaart alle variantie

Een hoge R² duidt op een goed passend model, maar let op: het toevoegen van meer variabelen zal R² altijd verhogen, zelfs als die variabelen niet relevant zijn.

Vergelijking van Regressiemodellen
Model	Voordelen	Beperkingen	Toepassingen
Enkelvoudige Lineaire Regressie	Eenvoudig te begrijpen en uit te voeren Snel te berekenen Goed voor eerste exploratie	Kan alleen lineaire relaties modelleren Beperkt tot één onafhankelijke variabele Gevoelig voor outliers	Eenvoudige voorspellingsmodellen Trendanalyse Educatieve doeleinden
Meervoudige Lineaire Regressie	Kan meerdere onafhankelijke variabelen verwerken Meer nauwkeurige voorspellingen Kan complexe relaties modelleren	Complexer model Risico op multicollineariteit Moet meer aannames controleren	Econometrische modellen Medisch onderzoek Marktanalyse
Logistische Regressie	Geschikt voor binaire uitkomsten Geeft probabiliteiten Robuuster voor niet-lineaire relaties	Vereist grote steekproeven Interpretatie is minder intuïtief Gevoelig voor complete separatie	Classificatieproblemen Risicoanalyse Medische diagnostiek

Softwaretools voor Lineaire Regressie

Microsoft Excel

Voer uw gegevens in in twee kolommen (X en Y)
Ga naar het tabblad “Invoegen” en selecteer “Scatter” (spreidingsdiagram)
Klik met de rechtermuisknop op een datapunt en selecteer “Trendlijn toevoegen”
Selecteer “Lineair” en vink “Vergelijking in diagram weergeven” aan
Voor gedetailleerde statistieken: ga naar “Gegevens” → “Gegevensanalyse” → “Regressie”

Python (met scikit-learn)

Voor geavanceerde analyses kunt u Python gebruiken:

from sklearn.linear_model import LinearRegression
import numpy as np

# Voorbeeldgegevens
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([2, 4, 5, 4, 5])

# Model aanmaken en fitten
model = LinearRegression()
model.fit(X, y)

# Resultaten
print("Intercept:", model.intercept_)
print("Slope:", model.coef_[0])
print("R²:", model.score(X, y))

R (statistische software)

R is speciaal ontworpen voor statistische analyses:

# Voorbeeldgegevens
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)

# Lineaire regressie uitvoeren
model <- lm(y ~ x)

# Samenvatting tonen
summary(model)

Bronnen voor Verdere Studie

Voor diepgaandere kennis over lineaire regressie en gerelateerde onderwerpen, raadpleeg deze autoritatieve bronnen:

NIST/SEMATECH e-Handbook of Statistical Methods – Simple Linear Regression (U.S. Department of Commerce)
Brigham Young University Statistics Department – Online Resources (Comprehensive statistics tutorials)
Seeing Theory – Interactive Statistics Visualizations (Brown University)

Veelgestelde Vragen

Wat is het verschil tussen correlatie en regressie?

Correlatie meet de sterkte en richting van de relatie tussen twee variabelen, terwijl regressie wordt gebruikt om de waarde van een variabele te voorspellen op basis van een andere variabele. Correlatie is symmetrisch (de correlatie tussen X en Y is hetzelfde als tussen Y en X), terwijl regressie asymmetrisch is (voorspellen van Y op basis van X is anders dan X voorspellen op basis van Y).

Hoe weet ik of lineaire regressie geschikt is voor mijn gegevens?

U kunt dit controleren door:

Een spreidingsdiagram van uw gegevens te maken – als het patroon ongeveer lineair lijkt, is lineaire regressie geschikt
De residuen te analyseren – deze moeten willekeurig verspreid zijn rond nul
De R²-waarde te bekijken – hoe hoger, hoe beter het model past (maar let op overfitting)
De aannames van lineaire regressie te controleren (lineariteit, onafhankelijkheid, normaliteit, homoscedasticiteit)

Wat als mijn gegevens niet lineair zijn?

Als uw gegevens een niet-lineair patroon vertonen, kunt u:

Een niet-lineaire transformatie toepassen (bijv. logaritmische, kwadratische)
Polynomiale regressie gebruiken
Andere modellen overwegen zoals logistische regressie (voor binaire uitkomsten) of niet-parametrische methoden
De gegevens segmenteren in gebieden waar wel lineaire relaties gelden

Regressie Op Rekenmachine