MuPAD Education Group: Kostenlose Materialen für MuPAD Pro:
www.sciface.com/education, schule.mupad.de, studium.mupad.de, mupad.zum.de.

________________________________________________________________________________

 

Inhalt....: Einführung Ausgleichsrechnung

Kategorie.: Unterrichtsmaterial

Mathematik: Statistik

MuPAD.....: 3.1.0

Datum.....: 2003-03-04

Autoren...: Alessandro Dell'Aere <dellaere@mupad.de>

Funktionen: |, plot, plot::Point2d, plot::Function2d, solve, assign

Funktionen: is, delete, sum, plotfunc2d, PointSize, YRange

________________________________________________________________________________

 

Eine Einführung in die Ausgleichsrechnung

 

Das folgende Arbeitsblatt basiert auf der Unterrichtseinheit "Ausgleichsrechnung im Grundkurs

Mathematik" von Jürgen Rau und Wolfgang Riemer.

 

Gegenstand des Arbeitsblattes ist eine Einführung in die Technik der Ausgleichsrechnung. In

diesem Rahmen werden lineare und quadratische Funktionen gewinnbringend miteinander

verkoppelt. Im neuen Lehrplan der Sekundarstufe II NRW wird Ausgleichsrechnung (Regression

und Korrelation) im Rahmen beschreibender Statistik verbindlich vorgeschrieben. Es wird eine

erprobte Sequenz zur Erarbeitung der Thematik vorgestellt.

 

Unterrichtliche Voraussetzungen

 

Eine Unterrichtsreihe mit dem in diesem Notebook beschriebenen Inhalt

setzt folgende Vorbereitung voraus:

 

- den Begriff der linearen Funktion

 

- den Begriff der quadratischen Funktion

 

- die Berechnung von Nullstellen und Minimalstellen

 

- evtl. Grundkenntnisse des Differenzierens

 

 

Mögliche Durchführung der Unterrichtseinheit und didaktische Vorbemerkungen

 

Es werden beide Ausgleichsgeraden-Typen (von x auf y einerseits und von y auf x andererseits)

parallel betrachtet, um deutlich zu machen, dass die Optimalität von den verwendeten Kriterien

abhängt.

 

Durch den Einsatz von MuPAD lassen sich die verschiedenen Abweichungsmaße funktional deuten

(positive Funktionen mit linksgekrümmten Graphen, die sich im ersten Fall als Parabeln entpuppen).

 

Erst durch den Einsatz von MuPAD wird die experimentelle Untersuchung verschiedener

Punktwolken praktikabel ("Handlungsorientierung"), ebenso die Untersuchung verschiedener

Streuungsmaße.

 

Teilweise ist der Einsatz von MuPAD prinzipiell nicht notwendig. Man kann aber methodisch so

vorgehen, dass man die komplizierten Ergebnisse der Termumformungen des CAS präsentiert

und dann nach den abgelaufenen Rechenschritten fragt.

 

Wirklich sinnvoll ist der Einsatz von MuPAD bei Verarbeitung realer Meßdaten, insbesondere

beim Erstellen von Prognosen.

 

Die experimentelle Variation des vorgegebenen Punktes in (5) ist ohne MuPAD nur schwer

praktikabel. Das gilt ebenso für die Auswertung der experimentellen Daten in (6).

 

Die Teilbereiche (1) bis (6) sollten in chronologischer Reihenfolge abgearbeitet werden.

 

 

 

(1)  Die experimentelle Untersuchung von

       Ursprungs-Regressions-Geraden:

 

Es seien die drei Punkte

image

image

image

gegeben. Diese liegen nicht alle auf einer Geraden, denn konstruiert man die

Gleichung der eindeutig bestimmten Geraden

 

___y = mx + b

 

durch zwei dieser Punkte, so

wird der dritte Punkt diese Gleichung nicht erfüllen:

 

x := [3,6,9]:

y := [1,6,12]:

S := solve({y[1] = m*x[1] + b, y[2] = m*x[2] + b}, [m, b]):

assign(S[1]);

is(m*x[3] + b = y[3])

math

math

Es soll nun eine Ursprungsgerade y = mx gezeichnet werden, die nach

Augenmaß möglichst genau an den genannten Punkten vorbeigeht.

Wir wählen hierfür m = 1:

 

plot1 := plot::Point2d([x[i], y[i]],

                       Color = RGB::Black,

                       PointSize = 2 * unit::mm)

         $ i = 1..3:

plot2 := plot::Function2d(1*z, z = 0..10):

plot(plot1,plot2);

MuPAD graphics

Die Streuung der Punkte in vertikaler Richtung um diese Gerade misst man

durch

image

und die Streuung der Punkte in horizentaler Richtung um diese Gerade misst

man durch

image

Es sind also v und h als Funktionen der Steigung m einer Geraden

aufzufassen. Wir wollen nun v und h für unsere obige Schätzung m = 1

berechnen:

 

delete m:

v := m -> sum((m*x[i] - y[i])^2, i = 1..3):

h := m -> sum((1/m*y[i] - x[i])^2, i = 1..3):

v(1);

h(1);

math

math

Mit Hilfe der Funktionsgraphen von v und h schätzen wir, für welche m die

Streuungen minimal werden. Dazu verkleinern wir schrittweise den

Zeichenbereich, so dass wir die Minima recht genau ablesen können:

 

plotfunc2d(v(m), h(m), m = 0.5..2)

MuPAD graphics

plotfunc2d(v(m), h(m), m = 1..1.5)

MuPAD graphics

plotfunc2d(v(m), h(m), m = 1.1..1.3)

MuPAD graphics

Wir lesen für v ein Minimum bei m = 1.17 und für h ein Minimum bei m = 1.23 ab.

 

m1 := 1.17:

plot2 := plot::Function2d(m1*z, z = 0..10,

                          Color = RGB::Red):

m2 := 1.23:

plot3 := plot::Function2d(m2*z, z = 0..10,

                          Color = RGB::Blue):

plot(plot1, plot2, plot3)

MuPAD graphics

Die Gerade, für welche die vertikale Streuung minimal wird, heißt

 

"Regressionsgerade von y auf x".

 

Die Gerade, für welche die horizentale Streuung minimal wird, heißt

 

"Regressionsgerade von x auf y".

 

Den Quotienten der Steigungen

image

nennt man

"Bestimmtheitsmaß".

 

Er ist das Quadrat des sog.

 

"Korrelationskoeffizienten".

 

Wenn nichts anderes gesagt wird,

meinen wir mit Regressionsgerade die Regressionsgerade von y auf x.

 

Als nächstes wollen wir einsehen, dass die Steigungen der beiden

Regressionsgeraden umso mehr voneinander abweichen,

je mehr die Punkte streuen. Zu diesem Zweck definieren wir neue

Punktwolken:

 

x := [1, 2, 3]:

y := [1, 2, 3]:

plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm),

     plot::Point2d([x[i], y[i]], Color = RGB::Black,

                   PointSize = 2.5 * unit::mm)

     $i = 1..3):

plotfunc2d(v(m), h(m), m = 0.5..2,

           ViewingBox = [0.5..2, 0..15])

 

 

MuPAD graphics

MuPAD graphics

Hierbei liegen alle Punkte auf einer Ursprungsgeraden.

Die Funktionen v und h haben beide bei m = 0 ihr Minimum.

Nun lassen wir die Punkte von diesem Sonderfall abweichen,

d.h. sie werden gestreut:

 

x := [1, 2, 3]:

y := [0, 2, 4]:

plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm),

     plot::Point2d([x[i], y[i]],

                 Color = RGB::Black,

                 PointSize = 2.5 * unit::mm)

     $i = 1..3):

plotfunc2d(v(m), h(m), m = 0.5..2,

           ViewingBox=[0.5..2,0..15])

MuPAD graphics

MuPAD graphics

Wir sehen, dass die Minima der Funktionen v und h nun voneinander

abweichen. Wir werden nun die Punkte nun noch weiter auseinander streuen:

 

x := [1, 2, 3]:

y := [-2, 2, 4]:

plot(plot::Point2d([0,0], PointSize = 2.5 * unit::mm ),

     plot::Point2d([x[i], y[i]],

                   Color = RGB::Black,

                   PointSize = 2.5 * unit::mm)

     $i = 1..3);

plotfunc2d(v(m), h(m), m = 0.5..2,

           ViewingBox=[0.5..2,0..15])

MuPAD graphics

MuPAD graphics

Nun sind die Minima der Funktionen v und h noch weiter voneinander

abgewichen.

 

(2)  Experimentelle Erforschung weiterer Abweichungsmaße:

 

Wir betrachten wieder die folgende Punktwolke:

 

x := [3,6,9]:

y := [1,6,12]:

 

Ein Abweichungsmaß kann auch alternativ definiert werden,

indem man die Differenzen

image

auf andere Art und Weise verarbeitet. Einige wichtige Abweichungsmaße

ergeben sich zum Beispiel, wenn man zur Berechnung von v

 

a) die Differenzen nicht quadriert

b) die Beträge der Differenzen verwendet

c) die dritte Potenz der Differenzen verwendet

d) die vierte Potenz der Differenzen verwendet

 

v1 := m -> sum((m*x[i] - y[i]), i=1..3):

v2 := m -> sum(abs(m*x[i] - y[i]), i=1..3):

v3 := m -> sum((m*x[i] - y[i])^3, i = 1..3):

v4 := m -> sum((m*x[i] - y[i])^4, i = 1..3):

plot(plot::Function2d(v1(m), m = 0.9..1.4)):

plot(plot::Function2d(v2(m), m = 0.9..1.4)):

plot(plot::Function2d(v3(m), m = 0.9..1.4)):

plot(plot::Function2d(v4(m), m = 0.9..1.4)):

MuPAD graphics

MuPAD graphics

MuPAD graphics

MuPAD graphics

 

Wie aus den Zeichnungen zu erkennen ist, ist der Optimalwert für m vom

jeweiligen Abweichungsmaß abhängig.

 

(3) Herleitung der Formel für die Ursprungs-Regressionsgerade:

 

Wenn man die quadratische vertikale Abweichung

image

in Abhängigkeit von der Steigung m graphisch darstellt,

vermutet man eine Parabel. Wir wollen nun analytisch vorgehen und so

den Scheitelpunkt dieser Parabel exakt bestimmen:

 

expand(v(m));

msv := solve(v'(m), m)[1]:

Scheitel := plot::Point2d(msv, v(msv),

                          Color = RGB::Blue,

                          PointSize = 2.5 * unit::mm)

math

math

plot(plot::Function2d(v(m), m = 0..2), Scheitel):

MuPAD graphics

Wir wollen nun für unsere Punkte Platzhalter verwenden, um eine allgemeine

Formel zur Bestimmung der Ursprungs-Regressionsgeraden herzuleiten.

Zunächst überzeugen wir uns davon, dass v auch i.A. eine Parabel ist:

 

delete x,y:

collect(v(m),m)

math

Nun berechnen wir die Steigung m als Minimum von v :

 

solve(diff(v(m), m), m)[1]

math

 

Natürlich können wir

image

annehmen, denn anderenfalls würde alle Punkte auf der Ordinaten-Achse

liegen und dann würde unsere Aufgabenstellung nicht sinnvoll sein.

 

Minimum := (x[1]*y[1]+x[2]*y[2]+x[3]*y[3])

          /(x[1]^2 + x[2]^2 + x[3]^3)

math

Somit erhalten wir als Formel für die Ursprungs-Regressionsgerade von y auf x:

 

y = Minimum*x

math

(4) Reale Datensätze:

 

Wir wollen unsere Erkenntnisse nun an einem realistischen Beispiel anwenden:

Ein kalter Wasserkessel (aus dem Kühlschrank) wird aufgeheizt. Bei 17°C ist der

Aufheizprozess voll im Gange. Wir wählen diesen Zeit-Temperatur-Datenwert

als Ursprungspunkt. Es wurden folgende Messwerte beobachtet:

 

Nr._____x (Zeit / Minuten) ______y (Temperatur / °C)

 

0_________0,0___________________0,00

1_________0,2___________________4,62

2_________0,4___________________9,52

3_________0,6__________________15,70

4_________0,8__________________21,90

5_________1,0__________________29,22

6_________1,2__________________34,43

7_________1,4__________________39,98

8_________1,6__________________44,88

9_________1,8__________________49,92

10___-_____2,0______--___________53,91

 

Benutze

 

a) die Messwerte 1 bis 3,

b) die Messwerte 8 bis 10,

c) alle Messwerte,

 

um die Regressionsgeraden durch den Ursprung zu berechnen.

Welche Prognosen ergeben sich jeweils für den Zeitpunkt des Kochens

(83°C über der Starttemperatur) ?

 

Zunächst schreiben wir die Daten wieder in Listen:

 

x := [0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0]:

y := [4.62, 9.52, 15.70, 21.90, 29.22,

      34.43, 39.98, 44.88, 49.92, 53.91]:

 

 

 

a) Berechnung der Regressionsgeraden unter Verwendung der

     Messwerte 1 bis 3:

 

v := m -> sum((m*x[i] - y[i])^2, i = 1..3):

Steigung := solve(diff(v(m), m), m)[1]

math

plot1 := plot::Point2d([x[i], y[i]],

                       Color = RGB::Black,

                       PointSize = 2.5 * unit::mm)

         $i = 1..3,

         plot::Point2d([x[i], y[i]],

                       Color = RGB::Grey,

                       PointSize = 2.5 * unit::mm)

         $i=4..10:

plot2 := plot::Function2d(Steigung*z, z = 0..2):

plot(plot1, plot2)

MuPAD graphics

Wie man an der Zeichnung sieht, bekommt man in diesem Fall für die Steigung

der Regressionsgeraden einen sehr ungenauen Wert.

 

b) Berechnung der Regressionsgeraden unter Verwendung der

     Messwerte 8 bis 10:

 

v := m -> sum((m*x[i] - y[i])^2, i = 8..10):

Steigung := solve(diff(v(m), m), m)[1]

 

math

plot1 := plot::Point2d([x[i], y[i]],

                       Color = RGB::Grey,

                       PointSize = 2.5 * unit::mm)

         $i=1..7,

         plot::Point2d([x[i], y[i]],

                       Color = RGB::Black,

                       PointSize = 2.5 * unit::mm)

         $i = 8..10:

 

plot2 := plot::Function2d(Steigung*z, z = 0..2):

plot(plot1, plot2)

MuPAD graphics

c) Berechnung der Regressionsgeraden unter Verwendung der

     Messwerte 1 bis 10:

 

v := m -> sum((m*x[i] - y[i])^2, i = 1..10):

Steigung := solve(diff(v(m), m), m)[1]

math

plot1 := plot::Point2d([x[i], y[i]],

                       Color = RGB::Black,

                       PointSize = 2.5 * unit::mm)

         $i = 1..10:

plot2 := plot::Function2d(Steigung*z, z = 0..2):

plot(plot1, plot2)

MuPAD graphics

(5) Allgemeine Regressionsgeraden:

 

Wir betrachten wieder die drei Datenpunkte von oben:

 

x := [3,6,9]:

y := [1,6,12]:

 

 

Statt durch den Ursprung soll die Regressionsgerade aber nun durch einen

vorgegebenen Punkt

image

 

bzw. durch den Schwerpunkt der Punktwolke verlaufen. Sie soll durch

 

image

 

beschrieben werden. Man kann diesen Fall auf den oben analysierten

zurückführen: Dazu denkt man sich den Ursprung des Koordinatensystems

nach M verschoben. Die Punkte sind dann bezogen auf den neuen Ursprung

 

image

 

Die Steigung der Regressionsgeraden von y auf x durch den Punkt M ist

 

image

oder allgemeiner im Fall von p vorgegebenen Datenpunkten

 

image

 

Wir berechnen nun die Steigung und den Streuwert der Regressionsgeraden,

welche durch

 

a)

image

 

b)

image

 

c)

image

 

d) den Schwerpunkt

image

verläuft.

 

Wir wenden zunächst mehrfach die obige Formel für die Steigung an:

 

m  := sum((x[i]-x0)*(y[i]-y0), i = 1..3)

     /sum((x[i]-x0)^2, i=1..3):

xm := sum(x[i],i=1..3)/3:

ym := sum(y[i],i=1..3)/3:

 

m1 := m | (x0 = x[1], y0 = y[1]):

m2 := m | (x0 = x[2], y0 = y[2]):

m3 := m | (x0 = x[3], y0 = y[3]):

ms := m | (x0 = xm, y0 = ym):

 

 

 

Und berechnen nun die zugehörigen Streuungen:

 

d := (m, x0, y0) ->

     sum((m*(x[i] - x0) + y0 - y[i])^2, i = 1..3):

 

float(d(m1, x[1], y[1]));

float(d(m2, x[2], y[2]));

float(d(m3, x[3], y[3]));

float(d(ms, xm, ym));

math

math

math

math

Es stellt sich also heraus, dass der Streuwert am kleinsten ausfällt, wenn die

Regressionsgerade durch den Schwerpunkt verläuft.

 

Die Regressionsgerade von y auf x durch den Schwerpunkt

 

image

 

bezeichnet man in der Literatur als die Regressionsgerade. Sie minimiert die

vertikalen Abweichungsquadrate. Die Regressionsgerade von x auf y durch

den Schwerpunkt minimiert die horizentalen Abweichungsquadrate. Ihre

Steigungen berechnen sich wie folgt:

 

Regression von y auf x:

image

Regression von x auf y:

image

 

Der Korrelationskoeffizient

image

 

hat betraglich die gleiche Größe wie die Wurzel aus dem Quotienten

image

der Steigungen.  Aus der Tatsache, dass die Summe der vertikalen

Abstandsquadrate positiv ist kann man herleiten, dass der Korrelationskoeffizient

zwischen -1 und 1 liegt. Falls dieser genau -1 oder genau 1 ist, so verschwindet

die Summe der Abweichungsquadrate. Die Datenpunkte liegen in diesem Fall

genau auf einer Geraden.

 

(6) Aufgabe (Auswertung eines Experiments):

 

Du stellst ein Pedal Deines Fahrads nach oben, steigst auf und drückst das

Pedal nur mit Deinem Körpergewicht ganz nach unten. Gemessen wird die

Rollweite, die Du mit diesem "Schwung" aus einer halben Pedalumdrehung

erreichst.

Rollen (bei fester Übersetzung) schwere oder leichte Versuchspersonen weiter

oder ist die Rollweite vom Körpergewicht unabhängig ?

 

Die folgende Tabelle enthält zeilenweise Datenpaare (x,y), bei denen x das

Körpergewicht (in kg) und y die Rollweite (in Meter) angibt. Die Daten gehören

zu einem Trekkingrad mit 15 kg Eigengewicht. Es wurde die höchste Übersetzung

benutzt:

 

Körpergewicht: _____Rollweite:

__63 _____________37.85

__63 _____________56.50

__65 _____________51.10

__74 _____________50.20

__74 _____________58.70

__52 _____________45.15

__52 _____________52.15

__71 _____________55.80

__82 _____________61.70

__56 _____________35.10

__60 _____________42.28

__83 _____________42.80

__65 _____________63.80

__61 _____________30.40

__61 _____________45.70

__68 _____________36.20

__68 _____________51.80

__89 _____________43.30

__89 _____________52.50

__69 _____________46.07

__69 _____________47.40

__46 _____________38.00

__46 _____________39.20

__79 _____________47.60

__79 _____________57.04

__76 _____________50.00

__76 _____________57.04

__84 _____________48.80

__84 _____________57.00

__74 _____________55.90

__74 _____________59.50

__68 _____________37.45

__80 _____________39.00

__64 _____________27.00

__55 _____________30.35

__50 _____________27.50

__51 _____________34.00

__55 _____________38.80

__63 _____________29.00

__42 _____________61.00

__56 _____________42.00

 

 

a) Definiere die Tabelle wie oben in MuPAD als Listen von x- und y-Werten und

__stelle die Gewicht-Rollweite-Datensätze als Punktwolke dar.

__

b) Berechne das mittlere Gewicht der Testpersonen und die mittlere Rollweite.

 

c) Berechne und zeichne die Regressionsgerade von y auf x und beantworte die

__eingangs gestellte Frage.

 

d) Um wieviel Meter nimmt die Rollweite im Mittel je kg Körpergewicht ab/zu ?

__Interpretiere dazu die Regressionsgerade.

 

e) Berechne und zeichne auch die Regressionsgerade von x auf y.

 

f ) Berechne den Korrelationskoeffizienten.

 

Ergänzungen:

 

Führe die gleiche Untersuchung auch für ein Mountain-Bike durch, das wegen

grober Stollenbereifung sehr viel schlechter rollt als das Trekkingrad mit glatter

Bereifung. Hier sind die zugehörigen Daten:

 

Körpergewicht: _____Rollweite:

 

51 ____________16.30

87 ____________25.25

53 ____________23.70

69 ____________25.46

74 ____________30.50

70 ____________28.68

62 ____________29.90

53 ____________24.60

42 ____________19.40

69 ____________26.38

70 ____________22.30

80 ____________16.50

59 ____________19.60

52 ____________21.50

77 ____________21.30

49 ____________21.00

50 ____________23.30

62 ____________26.70

60 ____________21.24

64 ____________19.40

63 ____________21.86

76 ____________25.30

35 ____________20.50

________________________________________________________________________________

 

Anmerkungen:

 

1.   Dieses Notebook basiert auf der Ausarbeitung Ausgleichsrechnung im Grundkurs Mathematik von

      Jürgen Rau und Wolfgang Riemer, erschienen in der Reihe NRW-Learn-Line unter der URL

      http://www.learn-line.nrw.de/angebote/cas/allemat.htm

 

2.  Weitere Anregungen finden Sie unter: http://schule.mupad.de bzw. http://studium.mupad.de

 

________________________________________________________________________________

 

 

MuPAD Education Group: Kostenlose Materialen für MuPAD Pro:
www.sciface.com/education, schule.mupad.de, studium.mupad.de, mupad.zum.de.