Günther Bourier Beschreibende Statistik Günther Bourier Beschreibende Statistik Praxisorientierte Einführung Mit Aufgaben und Lösungen 9., aktualisierte Auflage Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar Professor Dr Günther Bourier lehrt Statistik an der Hochschule Regensburg Auflage 1996 Auflage 2008 Auflage 2010 Auflage 2011 Alle Rechte vorbehalten © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Jutta Hauser-Fahr | Renate Schilling Gabler Verlag ist eine Marke von Springer Fachmedien Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media www.gabler.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: MercedesDruck, Berlin Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8349-2763-7 Vorwort zur neunten Auflage Das Bu ch wurde für die neun te Auflage kriti sch dur chgeseh en , übe rarbe itet und in einige n Passagen umforrnuli ert mit dem Z iel, dem Lese r die Ma terie mögl ich st klar, verständlich und ans chaulich zu verm itteln Die beiden im Gabler Ve rlag erschienenen Lehrbücher "Beschre ibe nde Stati stik " und "Wahrsch einlichkeitsrechnung und schl ieß end e Statistik" stelle n zusa mme n mit dem von mir verfass ten Übungs buch "Statistik-Ü bunge n" (ersc hiene n im Gabl er Verlag) eine umfassend e Einhe it dar , die den Studierende n die Ane ign ung und Umsetz ung statistischer M ethoden ermöglichen so ll Als hilfreiches Zusat zmittel gibt es zu den drei Büchern die Lern software " PCStatistiktrainer", die unter ww w.gabler.de (sie he dazu S 233) kosten frei heruntergeladen werden kann Vorwort Da s vorliege nde Leh rbu ch ist als Einführu ng in die beschreibende Statistik kon zipiert, Es um faßt die Stoffb ereiche, die sich Stud ent en der Betrieb swirt sch aft slebre an Fachhoc hsc hulen im Grundstudium zu erarbe iten hab en Als pr axisorien- tierte Ergänzung zu theoriege1eit eten Vorlesungen richt et es sic h zugle ich an Universit ätsstudenten Ni cht zuletzt öffn et sich das Lehrbuch auch dem Praktiker, da es so abgefaßt ist , daß der Stoff im Selb ststudium erarbe itet we rden kann Die An we ndung und praktisch e Umse tzung statis tische r Me thode n stehe n Im Vordergrund dieses Lehrbuches Daher wird bewußt auf au sfüh rlich e mat hematische Darlegungen wi e etwa Ableitungen od er Beweisführungen verz ichtet Dafü r wird der Darlegung der gedanklichen Konzeptionen, die den Meth oden zug runde liegen , ein hoher Stell enwert eingerä umt Bei der Beschreibung der statistischen Methoden wird besonderer W ert auf hohe Anscha ulichke it, Ve rständlichkeit und Nachvo llzie hbar keit ge legt Zu diesem Zweck werd en die Me tho den programmartig Schritt für Schri tt det lliert erklärt und stets anha nd von Beisp ielen veransc haulicht Das Studium der Stati stik erfordert viel eigenes Tun und Üben So sind jedem Kapitel zahlreiche Übungsaufgaben und Kontrollfragen angefügt Sie sollen beim Erarbeiten des Stoffes weiterhelfen, eine Selbstkontrolle des eigenen Wissensstandes ermöglichen und auch der Klausurvorbereitung dien en Für jeden rechnerisch zu lösenden Aufgabentyp ist in Kapitel eine ausführliche Lösung angegeben Jeder Verfasser ist auf ein Umfeld angewiesen, das ihm die Arbeit erm öglicht und erleic htert So gilt mein Dank meiner Frau und meinen Kindem, die mir den für die Entstehung des Buches nötigen Freiraum gelassen haben Meiner Ko llegin Frau Professor Klaiber danke ich herz lich für die mühevolle kritische Durchsicht des Manuskripts und viele weltvolle Anregungen Dem Gabler Verlag und Fra u Jutta Hauser-Fahr als verantwortlicher Lektorin danke ich für die rei bungslose Zusammenarbeit Günther Bourier Inhaltsverzeichnis Vorw ort Einführung 1.1 Begriff und Aufgaben der Statistik V 1.2 Statistische Grundbegriffe 1.2.1 Merkmalsträger und Grundgesamtheit 1.2.1 I Sachliche Abgrenzung 1.2.1.2 Räumliche Abgrenzung 1.2.1.3 Zeitliche Abgrenzung 1.2.2 Merkmal und Merkmalswert 1.2.2.1 Qualitative und quantitative Merkmale 1.2.2.2 Diskrete und stetige Merkma le 1.2.2.3 Häufbare und nicht-häufbare Merkmale 4 5 10 11 12 1.3 Statistische Meßskalen 1.3.1 No minalskala 1.3.2 Ordina1skala 1.3.3 Metrische Skala 1.3.3 Intervallskala 1.3.3.2 Verhältnisskala 1.3.4 Bedeutung der Meßskalen 13 14 15 15 16 17 17 1.4 Mißbrauch der Statistik 19 1.5 Übungsa ufgabe n und Kontrollfragen 23 Ablauf der statistischen Unters uchung 25 2.1 Planung 25 2.2 Datenerhebung 2.2 Konkretisierung des Unte rsuchungszieles 2.2.2 Erheb ungstechniken 2.2.2.1 Herkunft der Daten 2.2.2.1 Primärstatistik 2.2.2 1.2 Sekundärstati stik 26 26 27 27 27 28 VIII Inhaltsverzeichnis 2.2 2.2 Erhebungsumfang 30 2.2.2.2 I Voll erhebung 30 2.2.2.2 Teilerhebung 30 2.2.2.3 Arte n der Erhebung 2.2 2.3.1 Beobachtung 2.2.2.3.2 Befragung 31 31 32 2.3 Datenaufbereitung 2.3 Kontrolle der Daten 33 2.3.2 Auszählen der Daten 33 34 2.3 2.1 Urliste 34 2.3.2.2 Str ich liste 35 2.3.2.3 Häufi gkeit stabelle 36 2.4 Tabellarische Darstellung von Daten 2.4.1 Eindimens ionale H äufigkeitsverteilung 37 38 2.4 1.1 Einfache H äufigk eitsverteilung 38 2.4.1.2 Kumuli erte Häufi gkeit sverteilung 40 2.4 Mehrdimensionale H äufigkeitsverteilung 41 2.4 Klassifi zierte Häufigkeitsvert eilung 44 2.5 Graphische Darstellung von Daten 2.5 Einfa che H äufigkeitsverteilungen 2.5 1.1 Das Stabdiagramm 2.5.1.2 Das Rechteckdi agramm 50 51 51 54 2.5.1.3 Da s Kreisdiagramm 55 2.5.1.4 Das Histogramm 56 2.5 1.5 Der Polygonzug 59 2.5.2 Kumuli ert e Häufigkeitsverteilungen 61 2.5.2.1 Die Treppenfunktion 61 2.5 2.2 Das Summenpolygon 62 2.6 Datenanalyse und -interpretati on 64 2.7 Übungsaufgaben und Kontrollfragen 65 Inhaltsverzeichnis IX Parameter von Häufigkeitsverteilungen 67 3.1 Mittelwerte 3.1 Der Modus 3.1.2 Der Med ian 3.1.3 Das arithmetische Mittel 3.1.4 Das harmonische Mittel 3.1.5 Das geometrische Mitte l 67 68 72 77 81 84 3.2 Streuungsmaße 88 3.2.1 Die Spannweite 89 3.2.2 Der zentrale Qua rtilsabstand 91 3.2.3 Die mitt lere abso lute Abweichung 93 3.2.4 Die Varian z und Standardabweichung 96 3.2.5 Der Variationskoeffizient 10 I 3.3 Schiefe und Wölbung 104 3.4 Konzentrationsmessung 3.4 Relative Konzentrationsmessung 106 107 3.4 1.1 Ermittlungsverfahren 3.4 1.2 Lorenzkurve 3.4 1.3 Der Gini-Koeffizient 3.4 Abso lute Konzentrationsmessung 107 3.5 Übungsaufgaben und Kontrollfragen Verhältniszahlen 110 112 115 116 I 19 4.1 Gliederungszahlen 119 4.2 Beziehungszahlen 120 4.3 Meßzahlen 121 4.4 Übungsaufgaben und Kontrollfragen 125 Indexzahlen Preisindizes 5.1.1 Anforderungen 5.1.2 Preis index nach Laspeyres 5.1.3 Preisindex nach Paasc he 127 127 128 130 133 Lösungen zu Kapitel 265 t) Kosten bei Ausbringungsmenge 5.000 Für die Kostenermittlung ist der Wert x = (in 1.000 Stück) in die Regressionsfunktion einzusetzen: Y5 = 9,82·5 + 10,9 = 60 Tsd € Bei einer Ausbringungsmenge von 5.000 Stück wären tendenziell Kosten in Höhe von 60 000 € angefallen - Die Güte dieser Aussage ist sehr hoch, da die Abhängigkeit der Kosten von der Menge - wie unter d) und e) beschrieben - sehr stark ausgeprägt ist Aufgabe 6: Jahreseinkommen b) Tendenzielle Jahresersparnis Mit der Regressionsgeraden y ergibt YlO = 0,14·10 + 0,4 = 1,8 Tsd € Interpretation: Haushalte mit einem verfügbaren Jahreseinkommen von 10 Tsd € haben in einem Jahr tendenziell 1,8 Tsd € gespart Kritik: Diese Haushalte werden diese Erspamisse i.d.R nicht aufbringen können Die Regressionsgerade gilt für den Einkommensbereich 30 Tsd € bis 50 Tsd € Haushalte mit einem Einkommen von 10 Tsd € liegen zu weit außerhalb Aufgabe 8: Eignungstest Das Merkmal Abitumote X ist ordinalskaliert und das Merkmal Testergebnis Y ist verh ältnisskaliert Bei der Untersuchung des Zusammenhangs zwischen den bei den Merkmalen ist daher der Rangkorrelationskoeffizient von Spearman zu berechnen Schritt I: These : "Je besser die Abitumote, desto besser das Testergebnis." Schritt 2: Zuordnung der Rangziffem hinsichtlich der Abitumote Abiturient E erhält als bester Rangziffer I, , A als schlechtester Rangziffer Schritt : Zuordnung der Rangziffem hinsichtlich des Tests C mit der höchsten Punktzahl erhält Rangziffer 1, , A mit der niedrigsten Punktzahl Rangziffer - Die vollständige Zuordnung der Rangziffem ist der nachstehenden Arbeitstabelle zu entnehmen Lösung ausgewählter Übungsaufgaben 266 Abiturient Note xi Test Yj Rg x, Rg y, O1 · O~ A 3,2 55 8 0 B 70 80 -2 C 2,6 1,8 I I I 2,9 75 4 16 E 1,6 72 -4 F G H 3,1 2,8 2,1 78 78 68 2,5 2,5 4,5 20 ,25 2,5 -4 6,25 16 67 ,5 Schritt : Ermittlung von p (Formel 7.3.4 1.-1) Die hierfür notwendige Berechnung der quadrierten Differenzen mit anschließender Summenbildung ist in der obigen Arbeitstabelle durchgeführt worden p = - 6· LD? ,:: -:-1 n3 - n + 0,196 = I _ 6· 67,5 = - 804 83 - ' (mit Bravais-Pearson: r = + 0, 1916) Interpretation: Es besteht die schwache Tendenz, d mit einem hưheren Rangplatz für X auch ein höherer Rangplatz für Y verbunden ist Bezogen auf die These heißt dies: Es besteht die schwache Tendenz, daß mit besserer Abiturnote auch ein besseres Testergebnis erzielt wird Bei der alternativen These "je besser die Abiturnote, desto schlechter das Testergebnis" sind die Rangziffern Rg Y in der umgekehrten Reihenfolge anzuordnen (A mit Rangziffer 1, C mit Rangziffer 8) Der Rangkorrelationskoeffizient lautet p = - 0, 185 (mit Bravais-Pearson: r = - 0,1916) Das negative Vorzeichen zeigt an, daß die These "je besser die Abiturnote, desto schlechter das Testergebnis" abzulehnen ist Es besteht die schwache Tendenz, d mit einem hưheren Rangplatz für X ein niedrigerer Rangplatz für Y verbunden ist Bezogen auf die These heißt dies wieder: Es besteht die schwache Tendenz, daß mit besserer Abiturnote auch ein besseres Testergebnis erzielt wird Lösungen zu Kapitel 267 Aufgabe 11: Kundenzufriedenheit Das Merkmal X (Firma) ist nominalskaliert, das Merkmal Y (Zufriedenheit) ist ordinalskaliert Bei der Untersuchung des Zusammenhangs zwischen den bei den Merkmalen ist daher der Kontingenzkoeffizient zu berechnen Mit Formel 7.3.5 -1 wird zunächst festgestellt, welche Häufigkeiten sich im Falle der Unabhängigkeit einstellen würden Die Berechnungen dazu finden sich in der nachstehenden Tabelle ~ sehr zufrieden zufrieden unzufrieden Summe Firma A 200·180 =72 500 200·260 = 104 500 200·60 = 24 500 200 B 120·180 = 43 ,2 500 120·260 = 62 ,4 500 120·60 = 14 50 ' 120 C 180·180 = 64 ,8 500 180·260 = 93 ,6 500 180·60 = 21 500 ' 180 Summe 180 260 60 500 Mit Vorliegen der tatsächlichen Häufigkeiten und der Häufigkeiten, die sich bei Unabhängigkeit einstellen würden, kann im Schritt mit Formel 7.3.5.-2 ChiQuadrat berechnet werden x2 + (100 - 104)2 104 + (20 - 24)2 24 + (66 - 62,4)2 62,4 + (14 - 14,4)2 14,4 (60 - 64,8)2 64,8 = (80 - 72)2 72 (40 - 43,2)2 43,2 = + (94 - 93,6)2 93,6 + (26 - 21,6)2 21,6 0,8889 + 0,1538 + 0,6667 0,3556 + 0,0017 + 0,8963 + + + 0,2370 + 0,2077 + 0,0111 + = 3,4188 268 Lösung ausgewählter Übungsaufgaben Im nächsten Schritt wird mit Formel 7.3.5.-3 der Kontingenzkoeffizient K von Pearson berechnet: K- ~ X2 +n - 3,4188 3,4188 + 500 = 0,0824 Im abschließenden Schritt wird mit Hilfe der Formeln 7.3 5.-4 und 7.3.5.-5 der korrigierte Kontingenzkoeffizient berechnet: K max = min{v,w} - min{v,w} = !f min{3,3} - min{3,3} = 0,8165 K 0,0824 Kkorr = ~ = 08165 = 0, 10 max , Interpretation: Der Zusammenhang zwischen der Kundenzufriedenheit und der herstellenden Firma ist schwach ausgeprägt Anders ausgedrückt: Für das Aus maß der Kundenzufriedenheit mit Gut G ist es nahezu unbedeutend, von welcher der drei Firmen das Gut hergestellt wurde Aufgabe 12: Umsatz und Materialaufwand x· I 2 Yi XjYi x· I 2.106 6.084 85 105 116 27 28 31 32 2.380 3.255 3.712 7.225 11.025 13.456 729 784 961 1.024 91 74 28 25 2.548 1.850 8.281 5.476 784 625 484 78 Yj 63 22 75 26 1.386 1.950 3.969 5.625 676 85 98 105 57 30 2.550 7.225 900 31 32 24 3.038 3.360 1.938 9.604 11.025 3.249 961 1.024 576 1.032 336 29.503 92.244 9.528 269 Lösungen zu Kapitel a) Regressionsgeraden Neben den in der obenstehenden Arbeitstabelle angegebenen Werten werden noch folgende Werte für die Berechnung der beiden Regressionsgeraden benötigt x- LXi - n - 1.032 12 = 86' ' nxy = 10 · 18 ·29 = 28.896; y= LnYi = 336 = 28 12 nx = 88.752; ny2 = 9.408 i) Regressionsgerade y b1 LXiYi -nxy 29.503 -28 896 92.244 - 88.752 L nx xf - = 607 3.492 = 0,17 a1 = y - b 1x = 28 - 0,17 ·86 = 13,38 Y = 0,17x + 13,38 ii) Regressionsgerade x 'Y' - LX 11 -nxyb2 - Lyt - ny2 = 29.503 - 28.896 607 = 120 9.528 - 9.408 = 5,06 a2 = x - b 2y = 86 - 5,06 ·28 = - 55,68 x = 5,06y - 55,68 b) 70 Mio € Umsatz Bei einem Umsatz in Höhe von 70 Mio € sind tendenziell mit Y70 = 0,17·70 + 13,38 = 25,28 Mio € Materialaufwand zu rechnen c) Regressionsparameter i) Regressionsparameter b Der Regressionsparameter b = 0,17 besagt als Steigungsmaß, daß ein um eine Mio € höherer Umsatz tendenziell mit einem um 0,17 Mio € höheren Materialaufwand verbunden war Lösung ausgewählter Übungsaufgaben 270 ii) Regressionsparameter a1 Der Regressionsparameter a1 = 13,38 Mio € besagt als Schnittpunkt mit der Or- dinate, daß bei einem Umsatz von Mio € tendenziell 13,38 Mio € Materialaufwand angefallen sind Diese Interpretation kann inhaltlich nicht sinnvoll sein Ursache dafür ist, daß der Umsatz Mio € weit außerhalb des Untersuchungsbereichs [57; 116] liegt d) Korrelationskoeffizient r von Bravais-Pearson Der Korrelationskoeffizient r errechnet sich mit Formel 7.3.2.1.-5 wie folgt: LXjYj -nxy J(Lxf-nx }(Lyf-ny2) 607 13.492.120 = 607 647,3 29.503 - 28.896 (92.244 -88.752)·(9.528 - 9.408) J = 0,938 Oder einfacher mit Formel 7.3.2.-6 r= Jb b = JO,174 5,058 = 0,938 Der Wert 0,938 besagt, daß ein sehr starker gleichläufiger Zusammenhang zwischen dem Umsatz und dem Materialaufwand besteht D.h es besteht die sehr starke Tendenz, daß mit zunehmendem Umsatz der Materialaufwand zunimmt entlang der Regressionsgeraden y e) Bestimmtheitsmaß B Da der Korrelationskoeffizient aus Aufgabe d) bekannt ist, kann das Bestimmtheitsmaß vereinfacht mit Formel 7.3.3 1.-3 berechnet werden : B = r = 0, 938 = 0, 880 Das Bestimmtheitsmaß drückt aus, daß die Varianz des Materialaufwands zu 88,0 % durch den Umsatz erklärt werden kann Das heißt die quadrierten Abweichungen des Materialaufwands vom durchschnittlichen Materialaufwand werden zu 88,0 % durch den Umsatz bestimmt Der Einfluß des Umsatzes auf den Materialaufwand ist folglich sehr hoch Lưsungen zu Kapitel 271 Aufgabe 13: Semesterzahl und Abschlnote Das Merkmal Semesterzahl X ist verhältnisskaliert und das Merkmal Abschlußnote Y ist ordinalskaliert (Verschlüsselung, Codierung; s.S 15) Bei der Untersuchung des Zusammenhangs zwischen den beiden Merkmalen ist daher der Rangkorrelationskoeffizient von Spearman zu berechnen Schritt 1: These: "Je höher die Semesterzahl, desto schlechter die Abschlußnote." Schritt : Zuordnung der Rangziffern hinsichtlich der Semesterzahl Student C mit der höchsten Semesterzahl erhält die Rangziffer I, , D mit der niedrigsten Semesterzahl die Rangziffer Schritt : Zuordnung der Rangziffern hinsichtlich der Abschlußnote G mit der schlechtesten Note erhält die Rangziffer 1, , D mit der besten Note die Rangziffer Die vollständige Zuordnung der Rangziffern ist der nachstehenden Arbeitstabelle zu entnehmen Student x·1 Yi Rgxi A B 10 12 13 2,4 2,8 1,7 2,3 1,8 3,2 2,1 5 C D E F 10 11 10 G H RgYi I D·I D~ -1 -I -2 -I I I I 4 I 16 Schritt 4: Ermittlung von p (Formel 7.3.4.1.-1) Die hierfür notwendige Berechnung der quadrierten Differenzen D mit anschließender Summenbildung ist in der obigen Arbeitstabelle durchgeführt worden p = - 6· LD? n3 - n +0 ,81 = - Ll§ 83 - = - 19 ' (mit Bravais-Pearson: r = + 0,81) Lösung ausgewählter Übungsaufgaben 272 Interpretation: Es besteht die starke Tendenz, d mit einem hưheren Rangplatz für X auch ein höherer Rangplatz für Y verbunden ist Bezogen auf die These heißt dies : Es besteht die starke Tendenz, d mit hưherer Semesterzahl schlechtere Abschlnoten einhergehen Bei der alternativen These "je höher die Semesterzahl, desto besser die Abschlußnote" sind die Rangziffern Rg y in der umgekehrten Reihenfolge anzuordnen Der Rangkorrelationskoeffizient lautet p = -0,76 (mit Bravais-Pearson: r = - 0,81) Das negative Vorzeichen zeigt an, daß die These "je hưher die Semesterzahl, desto besser die Abschlnote" abzulehnen ist Es besteht die starke Tendenz, daß mit einem höheren Rangplatz für X ein niedrigerer Rangplatz für Y verbunden ist Bezogen auf die These heißt dies wieder: Es besteht die starke Tendenz, d mit hưherer Semesterzahl schlechtere Abschlnoten einhergehen Stichwortverzeichnis A Abgrenzung - ,räumliche - , sachliche - ,zeitliche ff Abgrenzungsmerkmal Abhängigkeit - , formale 198 - , sachliche 198 - ,statistische 196, 198 - , von Merkmalen 196 ff absolute Häufigkeit 38,40,43 absolute Konzentration 115 absolute mittlere Abweichung 93 ff absolute Streuung 101 f Abweichung - , mittlere absolute 93 ff - , mittlere quadratische 96 ff additive Verknüpfung 158 f., 181 ff additive Schwankungskomponente 182 ff analytische Statistik Anwesenheitsmasse arithmetisches Mittel 77 ff artmäßiges Merkmal 10 Assoziationsmaß 207 Auskunftsperson 32 Auskunftsstelle 32 Ausreißer 69, 74, 79, 95, 99 B Balkendiagramm 52 f Basisperiode 122 Basisregion 150 Basiszeit 122, 124 f Befragung 32 ff Beobachtung 31 ff Beobachtungswert Berichtsregion 150 Berichtszeit 122 beschreibende Statistik 3, 64 f Bestandsmasse f Bestimmtheitsmaß 207,214 ff beurteilende Statistik Bewegungsmasse Beziehungszahl 120 f Bravais 207 c Chi-Quadrat 224 ff D Datenanalyse I, 64 ff Datenaufbereitung I, 33 ff Datendarstellung - ,graphische 50 ff - , tabellarische 37 ff Datenerhebung 1, 26 ff Datenherkunft 27 ff Datenkontrolle 33 f Deflationierung 146 deskriptive Statistik Determinationskoeffizient 214 Dezil (Dezentil) 77 G Bourier, Beschreibende Statistik, DOI 10.1007/978-3-8349-6556-1, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011 )~ 274 Stichwortverzeichnis Dezentilsabstand, zentraler 91 Dichte 57 dichtester Wert 68 diskretes Merkmal 11 Disparität 112 Durchschnitt 77 Durchschnitt, gleitender 159 ff., 179 ff E eindimensionale Häufigkeitsverteilung 38 ff einfache Häufigkeit 38 r, 51 ff einfache Häufigkeitsverteilung 38 f Element Ereignismasse Erhebungsarten 31 ff Erhebungstechniken 27 ff Erhebungsumfang 30 f Exponentialfunktion 172 ff Exzeß 106 F Fehlerrisiko Flächendiagramm 54 flächenproportionale Darstellung 54, 55,56 formale Abhängigkeit 198 Fortschreibung 189 G gegenläufiger Zusammenhang 210, 211,222 Gemeinsamkeitskorrelation 198 geometrisches Mittel 84 ff Gesamtheit Gesamtwertindex 138 Gewichtungsschema 128 f Gini-Koeffizient 112 ff glatte Komponente 157 gleichl äufiger Zusammenhang 209, 213,222 gleitender Durchschnitt 159 ff , 179 ff - , gerader Ordnung 162 ff - , ungerader Ordnung 161 f Gliederungszahl 119 f graphische Darstellung 50 ff Grundgesamtheit ff H harmonisches Mittel 81 ff häufbares Merkmal 12, 14 Häufigkeit - , absolute 38, 40, 43 - , einfache 38, 51 f - , klassifizierte 45 - , kumuliett e 40 f , 43 - , relative 38 f Häufigkeitsdichte 57 Häufigkeitstabelle 36 f Häufigkeitsverteilung - , eindimensionale 38 ff - , einfache 38 f , 51 ff - , klassifizierte 44 ff - , kumulierte 40 f , 61 ff - , mehrdimensionale 41 ff - , zweidimensionale 41 ff., 53 häufigster Wert 68 Stichwortverzeichnis Histogramm 56 ff höhenproportionale Darstellung 51 I Identifikationsmerkmal Indexlehre 127 ff Indexzahlen 127 ff induktive Statistik Inflation 146 Inflationierung 146 Inhomogenitätskorrelation 198 intensitätsmäßiges Merkmal 10, 15 Interquartilsabstand 91 ff Intervallskala 13, 16 ff intervallskaliertes Merkmal 17 K 275 - , relative 112 Konzentrationsmessung - , absolute 115 - , relative 107 ff Konzentrationskurve 110 ff Konzentrationsmaß 112 Konzentrationsmessung 106 ff Konzentrationsrate 115 Korrelationsanalyse 195, 207 ff Korrelationskoeffizient 208 ff korrigierter Kontingenzkoeffizient 227 Kovarianz 208 ff Krei sdiagramm 55 f kumulierte Häufigkeit 40 f., 43 kumulierte Häufigkeitsverteilung 40f ,61ff Kurtosis 106 Kardinalskala 13, 15 f Kaufkraft 150 Kaufkraftparität 150 ff Klassenanzahl 46 Klassenbildung 46 ff Klassenbreite 47 Klassengrenze 48 Klassenhäufigkeit 45 f Klassenmitte 59 klassifizierte Häufigkeitsverteilung 44 ff kleinste Quadrate 168 ff Komponenten einer Zeitreihe 156 ff Kontingenzkoeffizient 223 ff - , korrigierter 227 - , von Pearson 226 Konzentration - , absolute 115 L Lageparameter 68 Laspeyres 130 Laspeyres-Mengenindex 137 f Laspeyres-Preisindex 130 ff lineare Regressionsfunktion 199 ff linearer Trend 169 ff linksschiefe Verteilung 104 f linkssteile Verteilung 104 Logarithmierung 172, 175 ff logistische Funktion 177 ff Lokalisationsparameter 68 Lorenz 110 Loren zkurve 110 ff 276 Stichwortverzeichnis M Manipulation 20 ff Maßkorrelation 208 Masse Median 72 ff Medianklasse 75 mehrdimensionale Häufigkeitsverteilung 41 ff Mehrfachnennung 12 Mengenindex 136 ff., 147 - , nach Laspeyres 137 f - , nach Paasche 137 f Merkmal ff - , abhängiges 196 ff., 200 f - , artmäßiges 10 - , diskretes 11 - , extensives 107 - , häufbares 12 - , intensitätsmäßiges 10, 15 - , intervallskaliertes 17 - , metrisches 16 - , nicht-häufbares 13 - , nominalskaliertes 14, 18 - , ordinalskaliertes 15 - , qualitatives 10 - , quantitatives 10 f - , statistisches - , stetiges 11 f - , unabhängiges 196 ff., 200 f - , verhältnisskaliertes 17 Merkmalsausprägung Merkmalsträger Merkmalswert Merkmalswertsumme 78 f., 106 f Meßskalen 13 ff Meßzahlen 121 ff Methode der gleitenden Durchschnitte 159ff., 179 ff Methode der kleinsten Quadrate 167 ff., 179 ff., 200 ff metrische Skala 13, 15 f metrisch skaliertes Merkmal 16 Mißbrauch der Statistik 19 ff Mittel - , arithmetisches 77 ff - , geometrisches 84 ff - , harmonisches 81 ff Mittelwert 67 ff mittlere absolute Abweichung 93 ff mittlere quadratische Abweichung 96 ff Modalwert 68 Modus 68 ff Modusklasse 70 multiplikative Schwankungskomponente 186 ff multiplikative Verknüpfung 159, 185 ff N negativer Zusammenhang I0, 213, 222 f nicht-häufbares Merkmal 12 f nichtlineare Regression 201 nichtlinearer Trend 172 ff nomineller Umsatz 147 f nomineller Wert 146 Nominalskala 13 f nominalskaliertes Merkmal 14, 18 Nonsense-Korrelation 198 Stichwortverzeichnis Norrnalverteilung 100 f Punktewolke 199 o Q offene Randklasse 47 Ordinalskala 13, 15 qualitatives Merkmal 10 Quantil 77 ordinalskaliertes Merkmal 15 quantitatives Merkmal 10 f Qumtil77 p Paasche 133 Paasche-Mengenindex 137 f Paasche-Preisindex 133 ff Pearson 208, 226 Quartilsabstand, zentraler 91 ff R Randverteilung 42 Randklasse 47 periodische Schwankung 156 f., Rangfolge 15 180 ff Periodogrammverfahren 180 ff Rangkorrelationskoeffizient 207 , positiver Zusammenhang 209 , 213 , 222 218 ff Rangordnung 15, 72 f., 219 ff Rangskala 15 Rangziffer 219 räumliche Abgrenzung realer Umsatz 147 Potenzfunktion 174 ff Prädikatsmerkmal Rechteckdiagramm 54 Perzentil 77 Perzentilabstand, zentraler 91 Polygonzug 59 ff realer Welt 146 Preisbereinigung 146 ff Preisindex 127 ff - , für die Lebenshaltung 142 f., 148 ff rechtsschiefe Verteilung 104 f - , nach Laspeyres 130 ff - , nach Paasche 133 ff Regressionsfunktion 199 ff Regressionsgerade 199 ff Preismeßzahl 122, 129 Preisniveauunterschied 150 Regressionskoeffizient 205 Primärerhebung 27 ff rechtssteile Verteilung 104 Regressand 200 Regressionsanalyse 195, 199 ff Regressionskonstante 205 Primärstatistik 27 ff Produkt-Moment-Koeffizient 208 Prognose 155, 189 ff Regressionsparameter 204 ff Regressor 200 relative Häufigkeit 38 ff relative Konzentration 107 ff Pseudokorrelation 198 relative Streuung 101 f 277 278 Stichwortverzeichnis Resthäufigkeit 41 Restkomponente 157 f., 185, 189 Rückschluß 2,3,30 s sachliche Abgrenzung sachliche Abhängigkeit 198 Saisonnormale 184 f., 188 f Säulendiagramm 52 f Scheinkorrelation 198 Schiefe 104 f schließende Statistik Schwankung, periodische 156 f., 180 ff Schwankungskomponente - , additive 182 ff - , multiplikative 186 ff Sekundärerhebung 28 f Sekundärstatistik 28 f Skala 13 ff Spannweite 89 f Spearman 217 Stabdiagramm 51 ff Standardabweichung 96 ff Statistik - , analytische - , beschreibende 3, 64 f - , deskriptive - , induktive - , schließende statistische Abhängigkeit 196 ff statistische Einheit statistische Gesamtheit statistische Masse statistische Untersuchung 25 ff stetiges Merkmal 11 f Stichprobe 2, Streckenmasse Streuung 88 ff., 101 f., 208 Streuungsdiagramm 199 Streuungsmaß 88 ff., 202 Streuungszerlegung 214 ff Strichliste 35 f Summenhäufigkeit 40 Summenpolygon 62 ff symmetrische Verteilung 104 f T tabellarische Darstellung 37 ff Teilerhebung 30 f Teilgesamtheit 2, 3, 30 Totalerhebung 30 f Trend 156 Trendermittlung 159 ff Trendfunktion 167 ff Treppenfunktion 61 f u Umbasierung 140 ff Umsatzindex 138 ff., 147 Unabhängigkeit von Merkmalen 196 ff Unbestimmtheitsrnaß 217 Unsinnskorrelation 198 Untersuchungseinheit Untersuchungsmerkmal Untersuchungsziel 26 f Urliste 34 f Stichwortverzeichnis v Varianz 96 ff Varianzzerlegung 214 ff Variationsbreite 89 f Variationskoeffizient 101 ff Verbrauchergeldparität 150 f Verbraucherpreisindex 148 ff Verhältnisskala 13, 17 f verhältnisskaliertes Merkmal 17 Verhältniszahl 119 ff Verkettung 143 Verknüpfung von Indexzahlen 142 ff Verknüpfung von Komponenten 158 f - , additive 181 ff - ,multiplikative 185 ff Vollerhebung 30 f Volumenindex 136 w Wachstumsfaktor 85 f Wachstumsrate 85 fo Wahrscheinlichkeitsrechnung Warenkorb 131, 134, 149 Wert - ,dichtester 68 - , häufigster 68 Wertindex 138 Wölbung 104, 106 Wölbungskoeffizient 106 z zeichnerische Darstellung 50 ff zeitliche Abgrenzung ff 279 Zeitraumbestandsmasse Zeitreihe 155 Zeitreihenanalyse 155 ff Zeitreihenzerlegung 156 ff zentraler Dezentilsabstand 91 zentraler Perzentilsabstand 91 zentraler Quartilsabstand 91 ff Zentralwelt 72 ff Zusammenhang - ,gegenläufiger 210 f., 222 - ,gleichläufiger 209 f., 213, 222 - , negativer 210 f., 222 - , positiver 209 f., 213, 222 - , schwacher 213, 222 - , starker 209, 213, 222 Zusammenhang zwischen Merkmalen 195 ff zweidimensionale Häufigkeitsverteilung 41 ff., 53 zyklische Schwankung 156, 180 ...Günther Bourier Beschreibende Statistik Günther Bourier Beschreibende Statistik Praxisorientierte Einführung Mit Aufgaben und Lösungen 9., aktualisierte Auflage Bibliografische... Aussagekraft und Genauigkeit Andererseits ist mit der erstmaligen Erhebung der Daten ein höherer zeitlicher und finanzieller Aufwand verbunden 2.2.2.1.2 Sekundärstatistik Eine Sekundärstatistik (Sekundärerhebung)... Kontingenzkoeffizienten 219 221 223 7.4 Übungsaufgaben und Kontrollfragen 228 Lösung ausgewählter Übungsaufgaben 233 Stichwortverzeichnis 273 Einführung 1.1 Begriff und Aufgaben der Statistik Unte rne hme n sind