\mnb150ÿ{\rtf1\ansi\deff0\deftab720{\fonttbl{\f0\fswiss MS Sans Serif;}{\f1\froman\fcharset2 Symbol;}{\f2\fswiss\fprq2 System;}{\f3\fswiss\fprq2 Arial;}{\f4\fmodern\fprq1 Courier New;}{\f5\fswiss\fprq2 Tahoma;}{\f6\fnil\fprq2 SF Math Open Face;}{\f7\fmodern\fprq1\fcharset1 Courier New;}}
{\colortbl\red0\green0\blue0;\red0\green128\blue0;\red255\green0\blue0;\red0\green0\blue255;\red128\green0\blue128;\red128\green0\blue0;\red0\green128\blue128;}
\deflang1031\pard\ri4\plain\f5\fs28\cf0 ____________________________________________________________________
\par \plain\f4\fs20\cf0
\par Inhalt....: Empirische Untersuchungen zur Waldschen Identit\'e4t
\par Kategorie.: Arbeitsblatt
\par Mathematik: Stochastik, Statistik
\par MuPAD.....: 3.1
\par Datum.....: \plain\f7\fs20\cf0 2005-07-04\plain\f4\fs20\cf0
\par Autoren...: Artur Foitzik
\par Autoren...: Thorsten Fraas
\par Autoren...: Gudrun Freitag
\par Autoren...: Zeljko Golic
\par Autoren...: Susanne Koch
\par Autoren...: Katrin Kreh
\par Autoren...: Thorsten Mehlich
\par Funktionen: stats::binomialRandom, stats::exponentialRandom, stats::normalPDF
\par Funktionen: stats::gammaRandom, stats::poissonRandom, stats::normalCDF
\par Funktionen: stats::mean, stats::variance
\par Funktionen: case, op, numeric::solve, stringlib::remove
\par Funktionen: plot::Histogram2d, plot::Point2d, plot::Function2d
\par \plain\f5\fs28\cf0 ____________________________________________________________________
\par \plain\f4\fs20\cf0
\par \plain\f3\fs40\cf0\b Empirische Untersuchungen zur Waldschen
\par Identit\'e4t
\par
\par \plain\f3\fs24\cf1\b Die \plain\f3\fs24\cf1\b\i Waldsche Identit\'e4t\plain\f3\fs24\cf1\b taucht bei der Behandlung bedingter Verteilungen und
\par bedingter Wahrscheinlichkeiten auf: Hier wird eine Summe S(N) von N
\par Zufallsvariablen, die identisch verteilt sind wie eine Zufallsgr\'f6\'dfe X mit Erwartungswert
\par E(X), betrachtet. Dabei ist N eine von den Summanden unabh\'e4ngige Zufallsvariable mit
\par Werten in den nat\'fcrlichen Zahlen. Die Waldsche Identit\'e4t sagt aus, dass der
\par Erwartungswert von S(N) gerade das Produkt aus den Erwartungswerten E(X) und E(N)
\par ist, d.h. E(S(N))=E(N)*E(X). Hier ist die Unabh\'e4ngigkeit von N und X entscheidend.
\par Sind auch die Summanden unabh\'e4ngig voneinander, so l\'e4sst sich auch die Varianz von
\par S(N) als Funktion der ersten beiden Momente von X und N einfach darstellen (s.u.).
\par Im vorliegenden Notebook werden diese Identit\'e4ten f\'fcr eine Beispielsituation aus der
\par Versicherungsmathematik empirisch \'fcberpr\'fcft. Hierbei werden unterschiedliche
\par Verteilungen zum einen f\'fcr die Summanden und zum anderen f\'fcr die Anzahl N
\par angenommen. Abschlie\'dfend wird eine praktische Anwendung demonstriert.
\par \plain\f3\fs24\cf1\b\ul
\par Voraussetzungen:\plain\f3\fs24\cf1\b
\par
\par (1) Zufallsvariablen und ihre Verteilung, insbesondere die Binomial-, die Poisson-, die
\par negative Binomial-, die Exponential- , die Normalverteilung und die Log-Normalverteilung,
\par (2) Momente (theoretisch und empirisch),
\par (3) Zentraler Grenzwertsatz,
\par (4) Histogramm.
\par \plain\f3\fs24\cf1
\par
\par \plain\f3\fs28\cf0 Zun\'e4chst wollen wir die folgende \plain\f3\fs28\cf0\b Situation\plain\f3\fs28\cf0 simulieren:
\par
\par Bei einer Versicherung gehen j\'e4hrlich N Schadensmeldungen ein; dabei ist N
\par eine \plain\f6\fs28\cf0 N\plain\f3\fs28\cf0 -wertige Zufallsvariable. Jeder der Sch\'e4den habe eine zuf\'e4llige
\par Schadensh\'f6he, deren Betrag unabh\'e4ngig von N ist.
\par
\par F\'fcr die Simulation schreiben wir eine Prozedur \plain\f3\fs28\cf2 Gesamtschaden\plain\f3\fs28\cf0 . Hierbei nehmen
\par wir an, dass N eine binomialverteilte Zufallsvariable (mit Parametern n und p) ist
\par und die Schadensh\'f6hen exponentialverteilte Zufallsvariablen (mit Parametern 0
\par und lambda) sind. Als \plain\f3\fs28\cf2 Argumente\plain\f3\fs28\cf0 \'fcbergeben wir der Prozedur \plain\f3\fs28\cf2 Gesamtschaden\plain\f3\fs28\cf0
\par die \plain\f3\fs28\cf1 Verteilungsparameter.\plain\f3\fs28\cf0 Der \plain\f3\fs28\cf3 R\'fcckgabewert\plain\f3\fs28\cf0 der Prozedur ist ein m\'f6glicher
\par Gesamtschaden eines Jahres. Zur Generierung der einzelnen Zufallsvariablen
\par werden die entsprechenden Prozeduren der stats-Bibliothek verwendet.
\par
\par Zun\'e4chst schreiben wir aber eine Prozedur \plain\f3\fs28\cf2 Euro\plain\f3\fs28\cf0 , mittels der\plain\f3\fs28\cf2 \plain\f3\fs28\cf0 im Folgenden
\par alle Schadensh\'f6hen \plain\f3\fs28\cf3 auf zwei Nachkommastellen gerundet werden\plain\f3\fs28\cf0 . Auch mit
\par den Schadensh\'f6hen in Zusammenhang stehende Mittelwerte werden im
\par gesamten Notebook immer auf zwei Nachkommastellen gerundet.
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Euro:=proc(x)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 begin
\par return(float(round(x*100)/100))
\par end_proc:
\par \pard\ri4\plain\f5\fs28\cf0
\par F\'fcr eine einheitliche Ausgabe von Euro-Betr\'e4gen am Bildschirm (ggf. mit
\par 'aufgef\'fcllten Nullen') verwenden wir die Prozedur \plain\f3\fs28\cf2 Eupr\plain\f3\fs28\cf0 .
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Eupr:=proc(x)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 begin
\par if round(100*(float(trunc(10*Euro(x)))-10*Euro(x)))=0 then
\par return(expr2text(Euro(x))."0")
\par else return(expr2text(Euro(x)))
\par end_if
\par end_proc:
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Gesamtschaden:=proc(n,p,lambda)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local i;
\par begin
\par N:=stats::binomialRandom(n,p)(); /*Schadensanzahl*/
\par X:=[Euro(stats::exponentialRandom(0,lambda)()) $ i=1..N];
\par /*Liste der einzelnen Schadensh\'f6hen*/
\par return(_plus(X[i] $ i=1..N)) /*Gesamtschaden*/
\par end_proc:
\par \pard\ri4\plain\f3\fs28\cf0
\par Exemplarisch simulieren wir nun die Gesamtschadensh\'f6hen f\'fcr m=10
\par aufeinander folgende Jahre unter Annahme der Parameter n=1000, p=1/100,
\par lambda=1/50. Dazu berechnen wir den Mittelwert (im Folgenden als "empirischer
\par Erwartungswert" bezeichnet) und die empirische Varianz.
\par
\par (Den Parameter m muss man nicht als Zeitdauer in Jahren betrachten; als
\par alternative Interpretationen bieten sich\plain\f3\fs28\cf0\i Zeitdauer in Monaten, Zeitdauer in
\par Wochen\plain\f3\fs28\cf0 oder \plain\f3\fs28\cf0\i Anzahl von Versicherungsgesellschaften\plain\f3\fs28\cf0 an.)\plain\f5\fs28\cf0
\par \plain\f3\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}m:=10:
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 l:=[Gesamtschaden(1000,1/100,1/50) $ i=1..m]:
\par /*Liste von m Gesamtsch\'e4den*/
\par mitt:=stats::mean(l): var:=stats::variance(l):
\par print(Unquoted, "Gesamtschadenswerte: ". expr2text(op(l))):
\par print(Unquoted, "empirischer Erwartungswert: ". Eupr(mitt)):
\par print(Unquoted, "empirische Varianz: ". Eupr(var)):
\par \pard\ri4\plain\f3\fs28\cf0 In diesem Beispiel erhielten wir Werte, die stark um ihren Mittelwert streuen,
\par was sich in einer sehr gro\'dfen empirischen Varianz niederschl\'e4gt. Wie kommt
\par das zustande?
\par
\par Zun\'e4chst betrachten wir die ersten beiden Momente der zugrunde liegenden
\par Verteilungen. Mit den oben angegebenen Parametern (n=1000, p=1/100,
\par lambda=1/50) erhalten wir f\'fcr die theoretischen Erwartungswerte und die
\par theoretischen Varianzen:
\par
\par \tab E(N)=n*p=10, Var(N)=n*p*(1-p)=9.9,
\par \tab E(X)=1/lambda=50, Var(x)=(1/lambda)^2=2500.
\par
\par F\'fcr den theoretischen Erwartungswert von S(N) erhalten wir mit der
\par \plain\f3\fs28\cf4\b Waldschen Identit\'e4t\plain\f3\fs28\cf0 :
\par
\par \tab E(S(N))=E(N)*E(X)
\par \tab \tab =10*50=500.
\par
\par Die Formel f\'fcr die theoretische Varianz von S(N) findet sich z.B. in
\par \plain\f3\fs28\cf0\i Schmidt (2002, Satz 7.1.4) \plain\f3\fs28\cf0 und in\plain\f3\fs28\cf0\i Klugman et al. (2004, Kapitel 6)\plain\f3\fs28\cf0 :
\par
\par \tab Var(S(N))=E(N)*Var(X)+Var(N)*(E(X))^2.
\par
\par In unserem Beispiel erhalten wir damit
\par
\par \tab Var(S(N))=10*50^2+9.9*50^2=49750.
\par
\par Wir sehen, dass diese theoretischen Werte \plain\f3\fs28\cf0\i ungef\'e4hr\plain\f3\fs28\cf0 den oben erhaltenen
\par empirischen Werten entsprechen.
\par
\par Im Folgenden wollen wir verschiedene Konstellationen von Verteilungen
\par von N und X untersuchen. Dazu schreiben wir eine Prozedur \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 , die als
\par \plain\f3\fs28\cf2 Argumente\plain\f3\fs28\cf0 die \plain\f3\fs28\cf1 Anzahl m der betrachteten Jahre\plain\f3\fs28\cf0 (bzw. Monate / Wochen oder
\par Anzahl der Versicherungsgesellschaften) und \plain\f3\fs28\cf1 f\'fcr N und X jeweils eine Liste
\par (vertN bzw. vertX) mit einer Abk\'fcrzung (Zeichenkette) f\'fcr den Verteilungstyp
\par und mit den zugeh\'f6rigen Parameterwerten\plain\f3\fs28\cf0 erh\'e4lt.
\par
\par F\'fcr N stehen die Binomialverteilung (Abk\'fcrzung \plain\f3\fs28\cf6 "bi"\plain\f3\fs28\cf0 , Parameter \plain\f3\fs28\cf6 n\plain\f3\fs28\cf0 und \plain\f3\fs28\cf6 p\plain\f3\fs28\cf0 ),
\par die Poissonverteilung (Abk\'fcrzung \plain\f3\fs28\cf6 "po"\plain\f3\fs28\cf0 , Parameter \plain\f3\fs28\cf6 lambda\plain\f3\fs28\cf0 ) und die negative
\par Binomialverteilung (Abk\'fcrzung \plain\f3\fs28\cf6 "nb"\plain\f3\fs28\cf0 , Parameter \plain\f3\fs28\cf6 r\plain\f3\fs28\cf0 und \plain\f3\fs28\cf6 beta\plain\f3\fs28\cf0 ; vgl. z.B. \plain\f3\fs28\cf0\i Gentle,
\par 1998, Abschnitt 3.1.10\plain\f3\fs28\cf0 ) zur Auswahl.
\par
\par F\'fcr X steht neben der Binomial- und der Poissonverteilung auch die
\par Exponentialverteilung zur Verf\'fcgung, mit Abk\'fcrzung \plain\f3\fs28\cf6 "ex"\plain\f3\fs28\cf0 und Parametern
\par \plain\f3\fs28\cf6 theta\plain\f3\fs28\cf0 (das ist der Verschiebungsparameter) und \plain\f3\fs28\cf6 lambda\plain\f3\fs28\cf0 (das ist der
\par Skalierungsparameter; es gilt \plain\f3\fs28\cf0\b lambda = 1/E(X) - theta\plain\f3\fs28\cf0 ).
\par
\par Die Prozedur \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 simuliert wie die obige Prozedur \plain\f3\fs28\cf2 Gesamtschaden\plain\f3\fs28\cf0 f\'fcr m
\par Jahre die jeweilige Schadensanzahl N und die zugeh\'f6rigen N Schadensh\'f6hen
\par mit Verteilung von X. Dazu werden die einzelnen Listenelemente aus vertN
\par bzw. vertX verwendet. Die case-Anweisung wird zur Unterscheidung der
\par einzelnen Konstellationen herangezogen. Der Aufruf op(vertN,1) liefert das
\par erste Element der Liste vertN, in diesem Fall also den Verteilungs\plain\f3\fs28\cf0\b typ\plain\f3\fs28\cf0 der
\par Schadensanzahl N (d.h. "bi", "po" oder "nb"). Analog spricht man mit op(vertN,2)
\par bzw. op(vertN,3) die zugeh\'f6rigen Parameterwerte an.
\par
\par Die \plain\f3\fs28\cf5 Ausgabe\plain\f3\fs28\cf0 der Prozedur \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 umfasst \plain\f3\fs28\cf5 Informationen zur zugrunde liegenden
\par Situation, sowie den ermittelten empirischen Erwartungswert\plain\f3\fs28\cf3 \plain\f3\fs28\cf0 (Mittelwert)\plain\f3\fs28\cf3 \plain\f3\fs28\cf5 und
\par die empirischeVarianz (\'fcber die m Jahre) der simulierten Werte von S(N) und
\par die entsprechenden theoretischen Momente aus den Waldschen Identit\'e4ten.
\par \plain\f3\fs28\cf0 Der \plain\f3\fs28\cf3 R\'fcckgabewert\plain\f3\fs28\cf5 \plain\f3\fs28\cf0 der Prozedur ist eine \plain\f3\fs28\cf3 Folge mit f\'fcnf Gliedern\plain\f3\fs28\cf0 , bestehend aus
\par der \plain\f3\fs28\cf3 Liste der m Gesamtsch\'e4den und den ersten beiden empirischen und
\par theoretischen Momenten\plain\f3\fs28\cf0 . \plain\f3\fs28\cf5
\par \plain\f3\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}SN:=proc(m, vertN , vertX)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local N, X, sn, k, i, EN, varN, EX, varX, mitt, var, wald1, wald2;
\par begin
\par sn:=[0 $ m]; print();
\par print(NoNL, "Anzahl m: " .expr2text(m). ", ");
\par for k from 1 to m do
\par case op(vertN,1)
\par of "bi" do
\par N:=stats::binomialRandom(op(vertN,2),op(vertN,3))();
\par EN:=op(vertN,2)*op(vertN,3);
\par varN:=op(vertN,2)*op(vertN,3)*(1-op(vertN,3));
\par if k=1 then
\par print(NoNL,
\par "Verteilung v. N: Bi(".expr2text(op(vertN,2)).",".expr2text(op(vertN,3))."), ");
\par end_if;
\par break;
\par of "po" do
\par N:=stats::poissonRandom(op(vertN,2))();
\par EN:=op(vertN,2);
\par varN:=EN;
\par if k=1 then
\par print(NoNL, "Verteilung v. N: Po(".expr2text(op(vertN,2))."), ");
\par end_if;
\par break;
\par of "nb" do
\par L:=stats::gammaRandom(op(vertN,2),op(vertN,3))();
\par N:=stats::poissonRandom(L)();
\par EN:=op(vertN,2)*op(vertN,3);
\par varN:=EN*(1+op(vertN,3));
\par if k=1 then
\par print(NoNL, "Verteilung v. N: Nb(".expr2text(op(vertN,2)).",".expr2text(op(vertN,3))."), ");
\par end_if;
\par break;
\par otherwise print(Unquoted, "Falsche Verteilungseingabe f\'fcr N. ");return();
\par end_case;
\par
\par case op(vertX,1)
\par of "bi" do
\par X:=[stats::binomialRandom(op(vertX,2),op(vertX,3))() $ i=1..N];
\par EX:=op(vertX,2)*op(vertX,3);
\par varX:=op(vertX,2)*op(vertX,3)*(1-op(vertX,3));
\par if k=1 then
\par print(NoNL, "Verteilung v. X: Bi(".expr2text(op(vertX,2)).",".expr2text(op(vertX,3)).")");
\par end_if;
\par break;
\par of "po" do
\par X:=[stats::poissonRandom(op(vertX,2))() $ i=1..N];
\par EX:=op(vertX,2); varX:=EX;
\par if k=1 then
\par print(NoNL, "Verteilung v. X: Po(".expr2text(op(vertX,2)).")");
\par end_if;
\par break;
\par of "ex" do
\par X:=[Euro(stats::exponentialRandom(op(vertX,2),(op(vertX,3)))()) $ i=1..N];
\par EX:=op(vertX,2)+1/op(vertX,3);
\par varX:=op(vertX,3)^(-2);
\par if k=1 then
\par print(NoNL, "Verteilung v. X: Ex(".expr2text(op(vertX,2)).",".expr2text(op(vertX,3)).")");
\par end_if;
\par break;
\par otherwise print(Unquoted, "Falsche Verteilungseingabe f\'fcr X!");return();
\par end_case;
\par
\par sn[k]:=_plus(X[i] $ i=1..N); /*Das ist der Gesamtschaden im k-ten Jahr*/
\par
\par end_for;
\par
\par mitt:=Euro(stats::mean(sn)); var:=Euro(stats::variance(sn)); /*empirische Momente von S(N)*/
\par wald1:=Euro(EX*EN); wald2:=Euro(EN*varX+varN*EX^2); /* theoretische Momente von S(N)*/
\par
\par print();
\par print(NoNL, "theor. Erwartungswert v. S(N): ". Eupr(wald1). " theor. Varianz von S(N): ". Eupr(wald2));
\par print();
\par print(NoNL, "empir. Erwartungswert v. S(N): ". Eupr(mitt). " empir. Varianz von S(N): ". Eupr(var));
\par print();
\par return(sn,wald1,wald2,mitt,var):
\par end_proc:
\par
\par \pard\ri4\plain\f3\fs28\cf0
\par Exemplarisch verwenden wir die Prozedur \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 f\'fcr die Situation von m=100
\par Jahren, binomialverteilten Schadensanzahlen mit wachsendem n und festem
\par p=0.05, sowie poissonverteilten Schadensh\'f6hen mit erwarteter Schadensh\'f6he
\par lambda=100.
\par \plain\f3\fs28\cf3
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}for n from 100 to 500 step 100 do
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 SN(100,["bi",n,0.05],["po",100]):
\par end_for:
\par \pard\ri4\plain\f3\fs28\cf0 Wieder entsprechen die empirischen Werte der ersten beiden Momente
\par ungef\'e4hr den theoretischen Werten. Wir veranschaulichen nun die empirische
\par Verteilung der Gesamtsch\'e4den von m Jahren mit Hilfe eines Histogramms.
\par Dazu schreiben wir eine Prozedur \plain\f3\fs28\cf2 Hist\plain\f3\fs28\cf0 , welche als \plain\f3\fs28\cf2 Argumente\plain\f3\fs28\cf0 genau \plain\f3\fs28\cf1 die
\par gleichen wie die Prozedur\plain\f3\fs28\cf0 \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 \'fcbergeben bekommt. Die \plain\f3\fs28\cf5 Ausgabe\plain\f3\fs28\cf0 der
\par Prozedur \plain\f3\fs28\cf2 Hist\plain\f3\fs28\cf0 besteht zum einen aus den\plain\f3\fs28\cf5 Informationen, die die Prozedur\plain\f3\fs28\cf0 \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0
\par \plain\f3\fs28\cf5 zu den entsprechenden Argumenten ausgibt\plain\f3\fs28\cf0 und zum anderen aus einem\plain\f3\fs28\cf5
\par Histogramm der Gesamtsch\'e4den, wobei der theoretische Erwartungswert
\par E(S(N)) des Gesamtschadens durch einen gr\'fcnen Punkt markiert wird.
\par \plain\f5\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist:=proc(m, vertN , vertX)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local sn,h,p,simul,wald1,wald2,mitt,var;
\par begin
\par simul:=SN(m,vertN,vertX):
\par sn:=op(simul,1);
\par wald1:=op(simul,2);
\par wald2:=op(simul,3);
\par mitt:=op(simul,4);
\par var:=op(simul,5);
\par h:=plot::Histogram2d(sn, Area=1, Cells=round(sqrt(m)),
\par XTicksLabelStyle=Vertical,XAxisTitle="",YAxisTitle="");
\par p:=plot::Point2d([wald1,0],PointSize=3, Color=RGB::SeaGreen);
\par plot(h,p,Header="Relative H\'e4ufigkeit der Gesamtsch\'e4den");
\par end_proc:
\par
\par \pard\ri4\plain\f3\fs28\cf0 Im Folgenden lassen wir uns das Histogramm f\'fcr einen Zeitraum von m=1000
\par Jahren in der Situation poissonverteilter Schadensanzahl (hier ist der Parameter
\par zun\'e4chst 400) und exponentialverteilter Schadensh\'f6he (mit Parametern 0 und
\par 1/5) zeichnen.
\par \plain\f5\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist(1000,["po",400],["ex",0,1/5])
\par \pard\ri4\plain\f3\fs28\cf0 Das Histogramm suggeriert, dass S(N) ann\'e4hernd normalverteilt ist. Dies ist
\par nicht sofort einzusehen, da S(N) eine Summe von \plain\f3\fs28\cf0\b\i zuf\'e4llig\plain\f3\fs28\cf0 vielen, unabh\'e4ngigen
\par und identisch verteilten Zufallsvariablen ist. Der klassische zentrale Grenzwertsatz
\par (vgl. \plain\f3\fs28\cf0\i Dehling & Haupt, 2003, Kapitel 10\plain\f3\fs28\cf0 ) sagt nur aus, dass die Verteilung einer
\par Summe von n (fest!) unabh\'e4ngigen, identisch verteilten Zufallsvariablen f\'fcr gro\'dfe
\par n gegen eine Normalverteilung strebt.
\par
\par Dennoch ist unsere Beobachtung nicht v\'f6llig \'fcberraschend: Denn im gew\'e4hlten
\par Fall der Poissonverteilung mit Parameter 400 f\'fcr N ist die durchschnittliche Anzahl
\par von Schadensf\'e4llen pro Jahr, also E(N), gro\'df: In diesem Fall gilt n\'e4mlich gerade
\par E(N)=400. Und f\'fcr gro\'dfe Werte von E(N) ist auch S(N) n\'e4herungsweise
\par normalverteilt (hierzu sei auf\plain\f3\fs28\cf0\i Klugman et al., 2004, Kapitel 6\plain\f3\fs28\cf0 , verwiesen).
\par
\par
\par Wir erweitern nun die Prozedur \plain\f3\fs28\cf2 Hist\plain\f3\fs28\cf0 \plain\f3\fs28\cf5 um den Plot der Normalverteilungsdichte mit
\par Erwartungswert E(S(N)) und Varianz Var(S(N))\plain\f3\fs28\cf0 . Dies geschieht in der Prozedur
\par \plain\f3\fs28\cf2 Hist2\plain\f3\fs28\cf0 :
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist2:=proc(m, vertN , vertX)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local sn,h,p,simul,wald1,wald2,mitt,var,norm;
\par begin
\par simul:=SN(m,vertN,vertX);
\par sn:=op(simul,1); wald1:=op(simul,2); wald2:=op(simul,3); mitt:=op(simul,4); var:=op(simul,5);
\par h:=plot::Histogram2d(sn, Area=1, Cells=round(sqrt(m)),
\par XTicksLabelStyle=Vertical,XAxisTitle="",YAxisTitle="");
\par p:=plot::Point2d([wald1,0],PointSize=3, Color=RGB::SeaGreen);
\par norm:=plot::Function2d(stats::normalPDF(wald1,wald2)(x),
\par x=mitt-3.5*sqrt(var)..mitt+3.5*sqrt(var), Color=RGB::Blue,LineWidth=0.5);
\par plot(h,p,norm,Header="Relative H\'e4ufigkeit der Gesamtsch\'e4den");
\par end_proc:
\par
\par \pard\ri4\plain\f3\fs28\cf0 In der gleichen Situation wie eben ergibt sich dann folgendes Bild:\plain\f5\fs28\cf0
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist2(1000,["po",400],["ex",0,1/5])
\par \pard\ri4\plain\f3\fs28\cf0 Da die eben gew\'e4hlte Exponentialverteilung f\'fcr die Schadensh\'f6hen rechtsschief
\par (das hei\'dft auch \plain\f3\fs28\cf0\i linkssteil\plain\f3\fs28\cf0 ) ist, funktioniert der zentrale Grenzwertsatz f\'fcr kleinere
\par E(N) noch nicht so gut (die Verteilung von S(N) ist dann ebenfalls rechtsschief):
\par Dies k\'f6nnen wir gut erkennen, wenn wir die mittlere Schadensanzahl durch einen
\par kleineren Parameter bei der Poissonverteilung (10 statt 400) reduzieren:
\par \plain\f5\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist2(1000,["po",10],["ex",0,1/5])
\par \pard\ri4\plain\f3\fs28\cf0 F\'fcr ungef\'e4hr symmetrisch verteilte Schadensh\'f6hen wird der zentrale
\par Grenzwertsatz auch schon f\'fcr kleinere N 'greifen', z.B. in der folgenden
\par Situation:
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}Hist2(1000,["po",10],["bi",20,0.45])
\par \pard\ri4\plain\f3\fs28\cf0 Wir wollen uns nun einer \plain\f3\fs28\cf0\b praktischen Anwendung\plain\f3\fs28\cf0 widmen. In \plain\f3\fs28\cf0\i Klugman et
\par al. (2004, Examples 6.4, 6.5),\plain\f3\fs28\cf0 wird folgende \plain\f3\fs28\cf0\b Situation\plain\f3\fs28\cf0 vorgestellt:
\par
\par Empirische Mittelwerte und Standardabweichungen der Schadensanzahlen
\par bzw. Schadensh\'f6hen aus vergangenen 10 \plain\f3\fs28\cf0\b Monaten\plain\f3\fs28\cf0 sind gegeben.
\par
\par Zun\'e4chst (vgl. \plain\f3\fs28\cf0\i Example 6.4\plain\f3\fs28\cf0 ) sollen daraus mit Hilfe der Waldschen Formeln
\par die Werte E(S(N)) und Var(S(N)) gesch\'e4tzt werden (hierbei ist S(N) nun der
\par \plain\f3\fs28\cf0\b monatliche\plain\f3\fs28\cf0 Gesamtschaden).
\par
\par Die folgende Prozedur \plain\f3\fs28\cf2 EMPIR1\plain\f3\fs28\cf0 dient dazu, diese Berechnungen f\'fcr
\par \plain\f3\fs28\cf0\b simulierte Daten\plain\f3\fs28\cf0 (wie oben in der Prozedur \plain\f3\fs28\cf2 SN\plain\f3\fs28\cf0 ) f\'fcr eine Anzahl m von
\par Monaten durchzuf\'fchren. Als \plain\f3\fs28\cf2 Argumente\plain\f3\fs28\cf0 enth\'e4lt die Prozedur \plain\f3\fs28\cf2 EMPIR1\plain\f3\fs28\cf0 also
\par eine \plain\f3\fs28\cf1 Anzahl m von Monaten, den Verteilungstyp der Schadensanzahl (mit
\par Parametern) und den Verteilungstyp der Schadensh\'f6hen (mit Parametern).\plain\f3\fs28\cf0
\par \plain\f3\fs28\cf5 Ausgegeben \plain\f3\fs28\cf0 werden dann\plain\f3\fs28\cf5 die beiden Verteilungen, die theoretischen Werte
\par der ersten beiden Momente von S(N) und die gesch\'e4tzten Werte dieser beiden
\par Gr\'f6\'dfen.\plain\f3\fs28\cf0 Letztere gehen aus den simulierten Daten durch Anwendung der
\par Waldschen Identit\'e4ten hervor. Der \plain\f3\fs28\cf3 R\'fcckgabewert\plain\f3\fs28\cf0 der Prozedur ist \plain\f3\fs28\cf3 die Folge
\par der gesch\'e4tzten Werte f\'fcr die ersten beiden Momente\plain\f3\fs28\cf0 .
\par \plain\f5\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}EMPIR1:=proc(m, vertN , vertX)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local N, X, k, i, l, Nlist, sumN, sumN2, mittN, varN, empvarN,
\par sumX, sumX2, mittX, varX, empvarX, empwald1, empwald2;
\par begin
\par Nlist:=[0 $ m];
\par /*Initialisierung der Liste der m Schadensanzahlen*/
\par sumX:=0;
\par sumX2:=0;
\par print();
\par print(NoNL, "Anzahl m: " .expr2text(m). ", ");
\par for k from 1 to m do
\par case op(vertN,1)
\par of "bi" do
\par N:=stats::binomialRandom(op(vertN,2),op(vertN,3))();
\par EN:=op(vertN,2)*op(vertN,3);
\par varN:=op(vertN,2)*op(vertN,3)*(1-op(vertN,3));
\par if k=1 then
\par print();
\par print(NoNL, "Verteilung von N: Bi(".expr2text(op(vertN,2)).",".expr2text(op(vertN,3))."), ");
\par end_if;
\par break;
\par of "po" do N:=stats::poissonRandom(op(vertN,2))();
\par EN:=op(vertN,2);
\par varN:=EN;
\par if k=1 then
\par print(NoNL, "Verteilung von N: Po(".expr2text(op(vertN,2))."), ");
\par end_if;
\par break;
\par of "nb" do
\par L:=stats::gammaRandom(op(vertN,2),op(vertN,3))();
\par N:=stats::poissonRandom(L)();
\par EN:=op(vertN,2)*op(vertN,3);
\par varN:=EN*(1+op(vertN,3));
\par if k=1 then
\par print(NoNL, "Verteilung von N: Nb(".expr2text(op(vertN,2)).",".expr2text(op(vertN,3))."), ");
\par end_if;
\par break;
\par otherwise print(Unquoted, "Falsche Verteilungseingabe f\'fcr N.");return();
\par end_case;
\par
\par case op(vertX,1)
\par of "bi" do
\par X:=[stats::binomialRandom(op(vertX,2),op(vertX,3))() $ i=1..N];
\par EX:=op(vertX,2)*op(vertX,3);
\par varX:=op(vertX,2)*op(vertX,3)*(1-op(vertX,3));
\par if k=1 then
\par print(NoNL, "Verteilung von X: Bi(".expr2text(op(vertX,2)).",".expr2text(op(vertX,3)).")");
\par end_if;
\par break;
\par of "po" do
\par X:=[stats::poissonRandom(op(vertX,2))() $ i=1..N];
\par EX:=op(vertX,2);
\par varX:=EX;
\par if k=1 then
\par print(NoNL, "Verteilung von X: Po(".expr2text(op(vertX,2)).")");
\par end_if;
\par break;
\par of "ex" do
\par X:=[Euro(stats::exponentialRandom(op(vertX,2),op(vertX,3))()) $ i=1..N];
\par EX:=op(vertX,2)+1/op(vertX,3);
\par varX:=op(vertX,3)^(-2);
\par if k=1 then
\par print(NoNL, "Verteilung von X: Ex(".expr2text(op(vertX,2)).",".expr2text(op(vertX,3)).")");
\par end_if;
\par break;
\par otherwise print(Unquoted, "Falsche Verteilungseingabe f\'fcr X!");return();
\par end_case;
\par Nlist[k]:=N;
\par sumX:=sumX+_plus(X[i] $ i=1..N);
\par sumX2:=sumX2+_plus((X[i])^2 $ i=1..N);
\par end_for:
\par wald1:=Euro(EX*EN); wald2:=Euro(EN*varX+varN*EX^2); /*theoretische Momente von S(N)*/
\par print();
\par print(NoNL, " E(S(N)) theoretisch: ". Eupr(wald1). " Var(S(N)) theoretisch: ". Eupr(wald2));
\par sumN:=_plus(Nlist[i] $ i=1..m); sumN2:=_plus((Nlist[i])^2 $ i=1..m);
\par mittN:=sumN/m; empvarN:=(sumN2-m*(mittN)^2)/(m-1); /*empirische Momente von N*/
\par mittX:=sumX/sumN; empvarX:=(sumX2-sumN*(mittX)^2)/(sumN-1);/*empirische Momente von X*/
\par empwald1:=Euro(mittX*mittN);
\par empwald2:=Euro(mittN*empvarX+empvarN*mittX^2);/*gesch\'e4tzte und gerundete Momente von S(N)*/
\par print();
\par print(NoNL, " E(S(N)) gesch\'e4tzt: ". Eupr(empwald1). " Var(S(N)) gesch\'e4tzt: ". Eupr(empwald2));
\par print();
\par return(empwald1, empwald2):
\par end_proc:
\par \pard\ri4\plain\f5\fs28\cf0
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}EMPIR1(10, ["po", 100], ["ex",0,1.5]):
\par \pard\ri4\plain\f3\fs28\cf0 Nun soll, wie in \plain\f3\fs28\cf0\i Example 6.5\plain\f3\fs28\cf0 in \plain\f3\fs28\cf0\i Klugman et al. (2004),\plain\f3\fs28\cf0 die Wahrscheinlichkeit
\par daf\'fcr berechnet werden, dass S(N) mehr als das 1.4-fache des gesch\'e4tzten
\par Wertes E(S(N)) betr\'e4gt.
\par
\par Dazu wird zum einen die Normalverteilungsapproximation f\'fcr S(N) verwendet.
\par Zum anderen wird in der angegebenen Literatur (ohne theoretische Grundlage)
\par vorgeschlagen, f\'fcr kleine Werte von E(N) die Log-Normalverteilung zur
\par Approximation zu nutzen, da die Verteilung von S(N) dann \'fcblicherweise schief
\par ist.
\par
\par Die folgende Prozedur \plain\f3\fs28\cf2 EMPIR2\plain\f3\fs28\cf0 erm\'f6glicht diese Berechnungen f\'fcr simulierte
\par Daten aus m Monaten. Der Parameter f gibt an, um welchen Faktor der
\par Erwartungswert \'fcberschritten wird (im obigen Beispiel ist f=1.4).\plain\f3\fs28\cf1 Dieser\plain\f3\fs28\cf0 wird,
\par zusammen mit der \plain\f3\fs28\cf1 Anzahl m von Monaten\plain\f3\fs28\cf0 und den \plain\f3\fs28\cf1 Verteilungen f\'fcr N und X\plain\f3\fs28\cf0 ,
\par der Prozedur als \plain\f3\fs28\cf2 Argument\plain\f3\fs28\cf0 \'fcbergeben. \plain\f3\fs28\cf5 Ausgegeben \plain\f3\fs28\cf0 werden dann\plain\f3\fs28\cf5 \plain\f3\fs28\cf0 zum einen\plain\f3\fs28\cf5
\par die bereits in der Prozedur \plain\f3\fs28\cf2 EMPIR1\plain\f3\fs28\cf5 ausgegebenen Informationen \plain\f3\fs28\cf0 und zum
\par anderen\plain\f3\fs28\cf5 die Wahrscheinlichkeiten, dass S(N) den f-fachen Wert des gesch\'e4tzten
\par Wertes von E(S(N)) \'fcberschreitet; einmal unter der Annahme, dass S(N)
\par normalverteilt ist \plain\f3\fs28\cf0 (die Parameter werden dabei gerade durch die gesch\'e4tzten
\par Werte der ersten beiden Momente gegeben) \plain\f3\fs28\cf5 und einmal unter der Annahmne,
\par dass S(N) log-normalverteilt ist. \plain\f3\fs28\cf3 Der R\'fcckgabewert\plain\f3\fs28\cf0 der Prozedur ist \plain\f3\fs28\cf3 die Folge der
\par \'dcberschreitungswahrscheinlichkeiten (einmal unter Normalverteilungs- und einmal
\par unter Log-Normalverteilungsannahme).\plain\f3\fs28\cf0
\par
\par Es sei angemerkt, dass eine Zufallsvariable Y \plain\f3\fs28\cf0\i log-normalverteilt zu den
\par Parametern mu und sigma\plain\f3\fs28\cf0 hei\'dft, wenn log(U) normalverteilt zu den Parametern
\par mu und sigma ist. Dann gilt
\par E(Y)=exp(mu+0.5*sigma^2), E(Y^2)=exp(2*mu+2*sigma^2) . (*)
\par \plain\f5\fs28\cf0
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}EMPIR2:=proc(m, vertN , vertX, f)
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2 local estim, erwS, varS, fh1, fh2, h1, h2, h3, mu, sig2,
\par p1, pn1, pn2, p2, pln1, pln2;
\par begin
\par estim:=EMPIR1(m, vertN , vertX);
\par erwS:=op(estim,1); varS:=op(estim,2); /* gesch\'e4tzte, gerundete Momente von S(N)*/
\par fh1:=floor(f); fh2:=stringlib::remove(expr2text(frac(f)),"0.");
\par print(NoNL, "Wahrscheinlichkeit f. \'dcberschreitung d. ".expr2text(fh1).
\par ".".fh2."-fachen Erwartungswertes v. S(N):");
\par print();
\par h1:=(erwS*f-erwS)/sqrt(varS); /*f-facher Erwartungswert, standardisiert*/
\par p1:=1-stats::normalCDF(0,1)(h1); /*\'dcberschreitungswahrscheinlichkeit, mit NV-Annahme*/
\par pn1:=floor(p1); pn2:=stringlib::remove(expr2text(frac(p1)),"0.");
\par DIGITS:=10;
\par print(NoNL, " - m. Normalverteilungs-Approximation: ".expr2text(pn1).".".pn2); print();
\par DIGITS:=100;
\par h2:=[x+0.5*y=log(E,erwS),2*x+2*y=log(E,varS+erwS^2)]; /* Ausnutzen von (*) */
\par h3:=numeric::solve(h2,[x,y=0.0001..infinity]);
\par if h3=\{\} then
\par print(NoNL, "- mit Log-Normalverteil.-Approximation: keine L\'f6sung");
\par DIGITS:=10; break;
\par end_if;
\par mu:=text2expr(stringlib::remove(expr2text(op(op(h3,1),1)),"x = "));
\par sigma:=sqrt(text2expr(stringlib::remove(expr2text(op(op(h3,1),2)),"y = ")));
\par h4:=(log(E,erwS*f)-mu)/sigma; /*f-facher Erwartungswert, standardisiert*/
\par DIGITS:=10;
\par p2:=1-stats::normalCDF(0,1)(h4); /*\'dcberschreitungswahrscheinlichkeit, mit Log-NV*/
\par pln1:=floor(p2); pln2:=stringlib::remove(expr2text(frac(p2)),"0.");
\par print(NoNL, " - mit Log-Normalvert.-Approximation: ".expr2text(pln1).".".pln2);
\par print();
\par return(p1,p2):
\par end_proc:
\par
\par \pard\li300\ri5\fi-300{\*\pn\pnlvlblt\pnf1\pnindent300{\pntxtb\'b7}}\plain\f4\fs24\cf2 {\pntext\f1\'b7\tab}EMPIR2(12, ["nb", 4000, 0.9], ["bi",40,0.5], 1.1):
\par \pard\li600\ri1\fi-300\plain\f4\fs24\cf2
\par \pard\ri4\plain\f5\fs28\cf0
\par ______________________________________________________________________
\par \plain\f3\fs22\cf0
\par \plain\f3\fs24\cf1\b Anmerkungen:
\par \plain\f3\fs24\cf1
\par \plain\f3\fs24\cf1\b 1. Literatur:
\par \plain\f3\fs24\cf1
\par Dehling, H. & Haupt, B.: "Einf\'fchrung in die Wahrscheinlichkeitstheorie und Statistik", Springer-Verlag
\par Berlin Heidelberg 2003
\par
\par Gentle, J. E.: "Random Number Generation and Monte Carlo Methods", Springer-Verlag New York
\par 1998.
\par
\par Klugman, S. A., Panjer, H. H. & Willmot, G. E.: "Loss models. From data to decisions", 2. Auflage,
\par John Wiley & Sons Hoboken New Jersey 2004
\par
\par Schmidt, K. D.: "Versicherungsmathematik", Springer-Verlag Berlin Heidelberg 2002
\par \plain\f5\fs28\cf0
\par \plain\f3\fs24\cf1\b 2. Aufgaben:\plain\f3\fs24\cf1
\par
\par Variieren Sie die Verteilungstypen und Verteilungsparameter in den Prozeduren SN,
\par Hist, Hist2, EMPIR1 und EMPIR2 und
\par
\par (a) vergleichen Sie theoretische und empirische Mittelwerte;
\par (b) studieren Sie die G\'fcltigkeit des zentralen Grenzwertsatzes.
\par \plain\f5\fs28\cf0 _____________________________________________________________________
\par \plain\f4\fs20\cf0\b
\par
\par \plain\f5\fs28\cf2
\par }