@@xx@@ @@yy@@ 5 @POLY, Resultaat: [19.08 0.18 –2.94 6.36 3.48 0.00 ]
dus
@@xx@@ @@yy@@ 6 @POLY, Resultaat: [-16.73 67.17 –48.69 21.11 1.07 0.19 0.00]
dus y = -16.72+67.17x-48.69x
De beste aanpassing selecteren
Zoals u ziet aan de bovenstaande resultaten, kunt u elke polynoom aanpassen
aan een verzameling gegevens. De vraag is dan, welke aanpassing is het
beste voor de gegevens? Er zijn een paar criteria voor het bepalen van de
beste aanpassing:
•
De correlatiecoëfficiënt, r. Deze waarde wordt beperkt door het bereik
–1 < r < 1. Hoe dichter r bij +1 of –1 ligt, hoe beter de
gegevensaanpassing.
•
De SSE-fouten. Dit is de hoeveelheid die moet worden geminimaliseerd
door de benadering voor het kleinste kwadraat.
•
Een diagram van resttermen. Dit is een diagram van de fouten van alle
originele gegevenspunten. Als deze fouten volledig willekeurig zijn,
moeten de restdiagrammen geen bepaalde trend laten zien.
Voordat u gaat proberen deze criteria te programmeren, geven we u enkele
definities:
Met de vectoren x en y van de gegevens die moeten worden aangepast aan
de polynomiale vergelijking, vormen we de matrix X en gebruiken we deze om
een vector van polynomiale coëfficiënten b te berekenen. We kunnen een
vector van aangepaste gegevens, y' berekenen met y' = X⋅b.
Een foutvector wordt berekend met e = y – y'.
De SS-fouten (SSE) zijn gelijk aan het kwadraat van de grootte van de
foutvector, dus SSE = |e|
Om de correlatiecoëfficiënt te berekenen, moeten we eerst berekenen wat we
de som van kwadraattotalen (SST- Sum of Squared Totals) noemen,
gedefinieerd als SST = Σ (y
originele y-waarden is,dus ⎯y = (Σy
Met betrekking tot SSE en SST wordt de correlatiecoëfficiënt gedefinieerd als
y = 19.08+0.18x-2.94x
2
+21.11x
2
e = Σ e
= e
•
2
, waarbij ⎯y de gemiddelde waarde van de
-⎯y)
i
)/n.
i
2
3
+6.36x
+3.48x
3
4
+1.07x
+0.19x
2
2
= Σ (y
-y'
)
.
i
i
i
4
5
+0.0011x
5
6
-0.0058x
Blz. 18-62