Voorspellingsfout
De regressiecurve van Y op x wordt gedefinieerd als Y = Α + Β⋅x + ε. Als we
een verzameling van n gegevenspunten (x
= Α + Β⋅x
schrijven Y
i
normale
willekeurige
gemeenschappelijke variantie σ
willekeurige variabelen met gemiddelde nul en de gemeenschappelijke
variantie σ
2
.
Stel dat y
= werkelijke gegevenswaarde,
i
kwadraatvoorspelling van de gegevens. Dan is de voorspellingsfout: e
^
y
= y
- (a + b⋅x
).
i
i
i
Een schatting van σ
2
is de zogenaamde standaard schattingsfout
1
n
2
s
[
y
(
a
e
i
n
2
i
=
1
Betrouwbaarheidsintervallen en hypothesetoetsing in lineaire
regressie
Hier volgen enkele concepten en vergelijkingen met betrekking tot statistische
inferentie voor lineaire regressie:
•
Betrouwbaarheidsgrenzen voor regressiecoëfficiënten:
Voor de richtingscoëffiënt (Β):
)⋅s
/√S
,
α
2,
/2
e
xx
Voor het snijpunt (Α):
a − (t
⋅[(1/n)+x
)⋅s
α
n-2,
/2
e
waarbij t de Student-t-verdeling volgt met ν = n – 2, vrijheidsgraden, en n
staat voor het aantal punten in de steekproef.
S
xy
a
=
y
−
x b
b
=
,
S
xx
, y
i
+ ε
, (i = 1,2,...,n), waarbij Y
i
I
variabelen
met
gemiddelde
2
; ε
= onafhankelijke, normaal verdeelde
i
S
(
S
)
yy
xy
2
bx
)]
i
n
2
b − (t
2
1/2
< Α < a + (t
/S
]
xx
s
xy
=
2
s
x
) hebben, dan kunnen we
i
= onafhankelijke,
i
(Α + Β⋅x
)
en
i
^
y
= a + b⋅x
= kleinste-
i
i
2
/
S
n
1
xx
2
s
1 (
y
n
2
< Β < b + (t
)⋅s
/√S
α
n-2,
/2
e
xx
⋅[(1/n)+x
2
)⋅s
/S
α
n-2,
/2
e
xx
Blz. 18-56
de
= y
-
i
i
2
r
)
xy
n-
1/2
]
,