________________________________________________________________________________
Inhalt....: Einführung Ausgleichsrechnung
Kategorie.: Unterrichtsmaterial
Mathematik: Statistik
MuPAD.....: 3.1.0
Datum.....: 2003-03-04
Autoren...: Alessandro Dell'Aere <dellaere@mupad.de>
Funktionen: |, plot, plot::Point2d, plot::Function2d, solve, assign
Funktionen: is, delete, sum, plotfunc2d, PointSize, YRange
________________________________________________________________________________
Eine Einführung in die Ausgleichsrechnung
Das folgende Arbeitsblatt basiert auf der Unterrichtseinheit "Ausgleichsrechnung im Grundkurs
Mathematik" von Jürgen Rau und Wolfgang Riemer.
Gegenstand des Arbeitsblattes ist eine Einführung in die Technik der Ausgleichsrechnung. In
diesem Rahmen werden lineare und quadratische Funktionen gewinnbringend miteinander
verkoppelt. Im neuen Lehrplan der Sekundarstufe II NRW wird Ausgleichsrechnung (Regression
und Korrelation) im Rahmen beschreibender Statistik verbindlich vorgeschrieben. Es wird eine
erprobte Sequenz zur Erarbeitung der Thematik vorgestellt.
Unterrichtliche Voraussetzungen
Eine Unterrichtsreihe mit dem in diesem Notebook beschriebenen Inhalt
setzt folgende Vorbereitung voraus:
- den Begriff der linearen Funktion
- den Begriff der quadratischen Funktion
- die Berechnung von Nullstellen und Minimalstellen
- evtl. Grundkenntnisse des Differenzierens
Mögliche Durchführung der Unterrichtseinheit und didaktische Vorbemerkungen
Es werden beide Ausgleichsgeraden-Typen (von x auf y einerseits und von y auf x andererseits)
parallel betrachtet, um deutlich zu machen, dass die Optimalität von den verwendeten Kriterien
abhängt.
Durch den Einsatz von MuPAD lassen sich die verschiedenen Abweichungsmaße funktional deuten
(positive Funktionen mit linksgekrümmten Graphen, die sich im ersten Fall als Parabeln entpuppen).
Erst durch den Einsatz von MuPAD wird die experimentelle Untersuchung verschiedener
Punktwolken praktikabel ("Handlungsorientierung"), ebenso die Untersuchung verschiedener
Streuungsmaße.
Teilweise ist der Einsatz von MuPAD prinzipiell nicht notwendig. Man kann aber methodisch so
vorgehen, dass man die komplizierten Ergebnisse der Termumformungen des CAS präsentiert
und dann nach den abgelaufenen Rechenschritten fragt.
Wirklich sinnvoll ist der Einsatz von MuPAD bei Verarbeitung realer Meßdaten, insbesondere
beim Erstellen von Prognosen.
Die experimentelle Variation des vorgegebenen Punktes in (5) ist ohne MuPAD nur schwer
praktikabel. Das gilt ebenso für die Auswertung der experimentellen Daten in (6).
Die Teilbereiche (1) bis (6) sollten in chronologischer Reihenfolge abgearbeitet werden.
(1) Die experimentelle Untersuchung von
Ursprungs-Regressions-Geraden:
Es seien die drei Punkte



gegeben. Diese liegen nicht alle auf einer Geraden, denn konstruiert man die
Gleichung der eindeutig bestimmten Geraden
___y = mx + b
durch zwei dieser Punkte, so
wird der dritte Punkt diese Gleichung nicht erfüllen:
x := [3,6,9]:
y := [1,6,12]:
S := solve({y[1] = m*x[1] + b, y[2] = m*x[2] + b}, [m, b]):
assign(S[1]);
is(m*x[3] + b = y[3])
![]()
![]()
Es soll nun eine Ursprungsgerade y = mx gezeichnet werden, die nach
Augenmaß möglichst genau an den genannten Punkten vorbeigeht.
Wir wählen hierfür m = 1:
plot1 := plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2 * unit::mm)
$ i = 1..3:
plot2 := plot::Function2d(1*z, z = 0..10):
plot(plot1,plot2);

Die Streuung der Punkte in vertikaler Richtung um diese Gerade misst man
durch

und die Streuung der Punkte in horizentaler Richtung um diese Gerade misst
man durch

Es sind also v und h als Funktionen der Steigung m einer Geraden
aufzufassen. Wir wollen nun v und h für unsere obige Schätzung m = 1
berechnen:
delete m:
v := m -> sum((m*x[i] - y[i])^2, i = 1..3):
h := m -> sum((1/m*y[i] - x[i])^2, i = 1..3):
v(1);
h(1);
![]()
![]()
Mit Hilfe der Funktionsgraphen von v und h schätzen wir, für welche m die
Streuungen minimal werden. Dazu verkleinern wir schrittweise den
Zeichenbereich, so dass wir die Minima recht genau ablesen können:
plotfunc2d(v(m), h(m), m = 0.5..2)

plotfunc2d(v(m), h(m), m = 1..1.5)

plotfunc2d(v(m), h(m), m = 1.1..1.3)

Wir lesen für v ein Minimum bei m = 1.17 und für h ein Minimum bei m = 1.23 ab.
m1 := 1.17:
plot2 := plot::Function2d(m1*z, z = 0..10,
Color = RGB::Red):
m2 := 1.23:
plot3 := plot::Function2d(m2*z, z = 0..10,
Color = RGB::Blue):
plot(plot1, plot2, plot3)

Die Gerade, für welche die vertikale Streuung minimal wird, heißt
"Regressionsgerade von y auf x".
Die Gerade, für welche die horizentale Streuung minimal wird, heißt
"Regressionsgerade von x auf y".
Den Quotienten der Steigungen

nennt man
"Bestimmtheitsmaß".
Er ist das Quadrat des sog.
"Korrelationskoeffizienten".
Wenn nichts anderes gesagt wird,
meinen wir mit Regressionsgerade die Regressionsgerade von y auf x.
Als nächstes wollen wir einsehen, dass die Steigungen der beiden
Regressionsgeraden umso mehr voneinander abweichen,
je mehr die Punkte streuen. Zu diesem Zweck definieren wir neue
Punktwolken:
x := [1, 2, 3]:
y := [1, 2, 3]:
plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm),
plot::Point2d([x[i], y[i]], Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 1..3):
plotfunc2d(v(m), h(m), m = 0.5..2,
ViewingBox = [0.5..2, 0..15])


Hierbei liegen alle Punkte auf einer Ursprungsgeraden.
Die Funktionen v und h haben beide bei m = 0 ihr Minimum.
Nun lassen wir die Punkte von diesem Sonderfall abweichen,
d.h. sie werden gestreut:
x := [1, 2, 3]:
y := [0, 2, 4]:
plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm),
plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 1..3):
plotfunc2d(v(m), h(m), m = 0.5..2,
ViewingBox=[0.5..2,0..15])


Wir sehen, dass die Minima der Funktionen v und h nun voneinander
abweichen. Wir werden nun die Punkte nun noch weiter auseinander streuen:
x := [1, 2, 3]:
y := [-2, 2, 4]:
plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm ),
plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 1..3);
plotfunc2d(v(m), h(m), m = 0.5..2,
ViewingBox=[0.5..2,0..15])


Nun sind die Minima der Funktionen v und h noch weiter voneinander
abgewichen.
(2) Experimentelle Erforschung weiterer Abweichungsmaße:
Wir betrachten wieder die folgende Punktwolke:
x := [3,6,9]:
y := [1,6,12]:
Ein Abweichungsmaß kann auch alternativ definiert werden,
indem man die Differenzen

auf andere Art und Weise verarbeitet. Einige wichtige Abweichungsmaße
ergeben sich zum Beispiel, wenn man zur Berechnung von v
a) die Differenzen nicht quadriert
b) die Beträge der Differenzen verwendet
c) die dritte Potenz der Differenzen verwendet
d) die vierte Potenz der Differenzen verwendet
v1 := m -> sum((m*x[i] - y[i]), i=1..3):
v2 := m -> sum(abs(m*x[i] - y[i]), i=1..3):
v3 := m -> sum((m*x[i] - y[i])^3, i = 1..3):
v4 := m -> sum((m*x[i] - y[i])^4, i = 1..3):
plot(plot::Function2d(v1(m), m = 0.9..1.4)):
plot(plot::Function2d(v2(m), m = 0.9..1.4)):
plot(plot::Function2d(v3(m), m = 0.9..1.4)):
plot(plot::Function2d(v4(m), m = 0.9..1.4)):




Wie aus den Zeichnungen zu erkennen ist, ist der Optimalwert für m vom
jeweiligen Abweichungsmaß abhängig.
(3) Herleitung der Formel für die Ursprungs-Regressionsgerade:
Wenn man die quadratische vertikale Abweichung

in Abhängigkeit von der Steigung m graphisch darstellt,
vermutet man eine Parabel. Wir wollen nun analytisch vorgehen und so
den Scheitelpunkt dieser Parabel exakt bestimmen:
expand(v(m));
msv := solve(v'(m), m)[1]:
Scheitel := plot::Point2d(msv, v(msv),
Color = RGB::Blue,
PointSize = 2.5 * unit::mm)
![]()
![]()
plot(plot::Function2d(v(m), m = 0..2), Scheitel):

Wir wollen nun für unsere Punkte Platzhalter verwenden, um eine allgemeine
Formel zur Bestimmung der Ursprungs-Regressionsgeraden herzuleiten.
Zunächst überzeugen wir uns davon, dass v auch i.A. eine Parabel ist:
delete x,y:
collect(v(m),m)
![]()
Nun berechnen wir die Steigung m als Minimum von v :
solve(diff(v(m), m), m)[1]
![]()
Natürlich können wir

annehmen, denn anderenfalls würde alle Punkte auf der Ordinaten-Achse
liegen und dann würde unsere Aufgabenstellung nicht sinnvoll sein.
Minimum := (x[1]*y[1]+x[2]*y[2]+x[3]*y[3])
/(x[1]^2 + x[2]^2 + x[3]^3)
![]()
Somit erhalten wir als Formel für die Ursprungs-Regressionsgerade von y auf x:
y = Minimum*x

(4) Reale Datensätze:
Wir wollen unsere Erkenntnisse nun an einem realistischen Beispiel anwenden:
Ein kalter Wasserkessel (aus dem Kühlschrank) wird aufgeheizt. Bei 17°C ist der
Aufheizprozess voll im Gange. Wir wählen diesen Zeit-Temperatur-Datenwert
als Ursprungspunkt. Es wurden folgende Messwerte beobachtet:
Nr._____x (Zeit / Minuten) ______y (Temperatur / °C)
0_________0,0___________________0,00
1_________0,2___________________4,62
2_________0,4___________________9,52
3_________0,6__________________15,70
4_________0,8__________________21,90
5_________1,0__________________29,22
6_________1,2__________________34,43
7_________1,4__________________39,98
8_________1,6__________________44,88
9_________1,8__________________49,92
10___-_____2,0______--___________53,91
Benutze
a) die Messwerte 1 bis 3,
b) die Messwerte 8 bis 10,
c) alle Messwerte,
um die Regressionsgeraden durch den Ursprung zu berechnen.
Welche Prognosen ergeben sich jeweils für den Zeitpunkt des Kochens
(83°C über der Starttemperatur) ?
Zunächst schreiben wir die Daten wieder in Listen:
x := [0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0]:
y := [4.62, 9.52, 15.70, 21.90, 29.22,
34.43, 39.98, 44.88, 49.92, 53.91]:
a) Berechnung der Regressionsgeraden unter Verwendung der
Messwerte 1 bis 3:
v := m -> sum((m*x[i] - y[i])^2, i = 1..3):
Steigung := solve(diff(v(m), m), m)[1]
![]()
plot1 := plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 1..3,
plot::Point2d([x[i], y[i]],
Color = RGB::Grey,
PointSize = 2.5 * unit::mm)
$i=4..10:
plot2 := plot::Function2d(Steigung*z, z = 0..2):
plot(plot1, plot2)

Wie man an der Zeichnung sieht, bekommt man in diesem Fall für die Steigung
der Regressionsgeraden einen sehr ungenauen Wert.
b) Berechnung der Regressionsgeraden unter Verwendung der
Messwerte 8 bis 10:
v := m -> sum((m*x[i] - y[i])^2, i = 8..10):
Steigung := solve(diff(v(m), m), m)[1]
![]()
plot1 := plot::Point2d([x[i], y[i]],
Color = RGB::Grey,
PointSize = 2.5 * unit::mm)
$i=1..7,
plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 8..10:
plot2 := plot::Function2d(Steigung*z, z = 0..2):
plot(plot1, plot2)

c) Berechnung der Regressionsgeraden unter Verwendung der
Messwerte 1 bis 10:
v := m -> sum((m*x[i] - y[i])^2, i = 1..10):
Steigung := solve(diff(v(m), m), m)[1]
![]()
plot1 := plot::Point2d([x[i], y[i]],
Color = RGB::Black,
PointSize = 2.5 * unit::mm)
$i = 1..10:
plot2 := plot::Function2d(Steigung*z, z = 0..2):
plot(plot1, plot2)

(5) Allgemeine Regressionsgeraden:
Wir betrachten wieder die drei Datenpunkte von oben:
x := [3,6,9]:
y := [1,6,12]:
Statt durch den Ursprung soll die Regressionsgerade aber nun durch einen
vorgegebenen Punkt

bzw. durch den Schwerpunkt der Punktwolke verlaufen. Sie soll durch

beschrieben werden. Man kann diesen Fall auf den oben analysierten
zurückführen: Dazu denkt man sich den Ursprung des Koordinatensystems
nach M verschoben. Die Punkte sind dann bezogen auf den neuen Ursprung

Die Steigung der Regressionsgeraden von y auf x durch den Punkt M ist

oder allgemeiner im Fall von p vorgegebenen Datenpunkten

Wir berechnen nun die Steigung und den Streuwert der Regressionsgeraden,
welche durch
a)

b)

c)

d) den Schwerpunkt

verläuft.
Wir wenden zunächst mehrfach die obige Formel für die Steigung an:
m := sum((x[i]-x0)*(y[i]-y0), i = 1..3)
/sum((x[i]-x0)^2, i=1..3):
xm := sum(x[i],i=1..3)/3:
ym := sum(y[i],i=1..3)/3:
m1 := m | (x0 = x[1], y0 = y[1]):
m2 := m | (x0 = x[2], y0 = y[2]):
m3 := m | (x0 = x[3], y0 = y[3]):
ms := m | (x0 = xm, y0 = ym):
Und berechnen nun die zugehörigen Streuungen:
d := (m, x0, y0) ->
sum((m*(x[i] - x0) + y0 - y[i])^2, i = 1..3):
float(d(m1, x[1], y[1]));
float(d(m2, x[2], y[2]));
float(d(m3, x[3], y[3]));
float(d(ms, xm, ym));
![]()
![]()
![]()
![]()
Es stellt sich also heraus, dass der Streuwert am kleinsten ausfällt, wenn die
Regressionsgerade durch den Schwerpunkt verläuft.
Die Regressionsgerade von y auf x durch den Schwerpunkt

bezeichnet man in der Literatur als die Regressionsgerade. Sie minimiert die
vertikalen Abweichungsquadrate. Die Regressionsgerade von x auf y durch
den Schwerpunkt minimiert die horizentalen Abweichungsquadrate. Ihre
Steigungen berechnen sich wie folgt:
Regression von y auf x:

Regression von x auf y:

Der Korrelationskoeffizient

hat betraglich die gleiche Größe wie die Wurzel aus dem Quotienten

der Steigungen. Aus der Tatsache, dass die Summe der vertikalen
Abstandsquadrate positiv ist kann man herleiten, dass der Korrelationskoeffizient
zwischen -1 und 1 liegt. Falls dieser genau -1 oder genau 1 ist, so verschwindet
die Summe der Abweichungsquadrate. Die Datenpunkte liegen in diesem Fall
genau auf einer Geraden.
(6) Aufgabe (Auswertung eines Experiments):
Du stellst ein Pedal Deines Fahrads nach oben, steigst auf und drückst das
Pedal nur mit Deinem Körpergewicht ganz nach unten. Gemessen wird die
Rollweite, die Du mit diesem "Schwung" aus einer halben Pedalumdrehung
erreichst.
Rollen (bei fester Übersetzung) schwere oder leichte Versuchspersonen weiter
oder ist die Rollweite vom Körpergewicht unabhängig ?
Die folgende Tabelle enthält zeilenweise Datenpaare (x,y), bei denen x das
Körpergewicht (in kg) und y die Rollweite (in Meter) angibt. Die Daten gehören
zu einem Trekkingrad mit 15 kg Eigengewicht. Es wurde die höchste Übersetzung
benutzt:
Körpergewicht: _____Rollweite:
__63 _____________37.85
__63 _____________56.50
__65 _____________51.10
__74 _____________50.20
__74 _____________58.70
__52 _____________45.15
__52 _____________52.15
__71 _____________55.80
__82 _____________61.70
__56 _____________35.10
__60 _____________42.28
__83 _____________42.80
__65 _____________63.80
__61 _____________30.40
__61 _____________45.70
__68 _____________36.20
__68 _____________51.80
__89 _____________43.30
__89 _____________52.50
__69 _____________46.07
__69 _____________47.40
__46 _____________38.00
__46 _____________39.20
__79 _____________47.60
__79 _____________57.04
__76 _____________50.00
__76 _____________57.04
__84 _____________48.80
__84 _____________57.00
__74 _____________55.90
__74 _____________59.50
__68 _____________37.45
__80 _____________39.00
__64 _____________27.00
__55 _____________30.35
__50 _____________27.50
__51 _____________34.00
__55 _____________38.80
__63 _____________29.00
__42 _____________61.00
__56 _____________42.00
a) Definiere die Tabelle wie oben in MuPAD als Listen von x- und y-Werten und
__stelle die Gewicht-Rollweite-Datensätze als Punktwolke dar.
__
b) Berechne das mittlere Gewicht der Testpersonen und die mittlere Rollweite.
c) Berechne und zeichne die Regressionsgerade von y auf x und beantworte die
__eingangs gestellte Frage.
d) Um wieviel Meter nimmt die Rollweite im Mittel je kg Körpergewicht ab/zu ?
__Interpretiere dazu die Regressionsgerade.
e) Berechne und zeichne auch die Regressionsgerade von x auf y.
f ) Berechne den Korrelationskoeffizienten.
Ergänzungen:
Führe die gleiche Untersuchung auch für ein Mountain-Bike durch, das wegen
grober Stollenbereifung sehr viel schlechter rollt als das Trekkingrad mit glatter
Bereifung. Hier sind die zugehörigen Daten:
Körpergewicht: _____Rollweite:
51 ____________16.30
87 ____________25.25
53 ____________23.70
69 ____________25.46
74 ____________30.50
70 ____________28.68
62 ____________29.90
53 ____________24.60
42 ____________19.40
69 ____________26.38
70 ____________22.30
80 ____________16.50
59 ____________19.60
52 ____________21.50
77 ____________21.30
49 ____________21.00
50 ____________23.30
62 ____________26.70
60 ____________21.24
64 ____________19.40
63 ____________21.86
76 ____________25.30
35 ____________20.50
________________________________________________________________________________
Anmerkungen:
1. Dieses Notebook basiert auf der Ausarbeitung Ausgleichsrechnung im Grundkurs Mathematik von
Jürgen Rau und Wolfgang Riemer, erschienen in der Reihe NRW-Learn-Line unter der URL
http://www.learn-line.nrw.de/angebote/cas/allemat.htm
2. Weitere Anregungen finden Sie unter: http://schule.mupad.de bzw. http://studium.mupad.de
________________________________________________________________________________