Entwicklung und Förderung von Datenkompetenz in den Klassen 1-6 Anja Wagner Kassel, September 2006 KaDiSto: Kasseler Online-Schriften zur Didaktik der Stochastik, Band 3 Herausgegeben von Rolf Biehler, Fachbereich Mathematik/Informatik, Universität Kassel Bd.3KaDiSto Kurzbeschreibung der Schriftenreihe In den Kasseler Online-Schriften zur Didaktik der Stochastik (KaDiSto) werden vom Herausge- ber und ggf. weiteren Gutachtern geprüfte Materialien publiziert, z.B. Staatsexamensarbeiten, Disser- tationen, Berichte von Forschungs- und Entwicklungsprojekten, Unterrichtsmaterialien und „Occasio- nal Papers“, die sich mit der Didaktik der Stochastik und dem Stochastikunterricht beschäftigen. Die Arbeiten werden oft zusammen mit weiteren elektronischen Materialien, z.B. Dateien von Computer- programmen zur Stochastik publiziert. Die Reihe wurde ins Leben gerufen wurde, um Materialien zu veröffentlichen, die in der Arbeits- gruppe des Herausgebers oder bei Kooperationspartnern in Wissenschaft und Schulpraxis entstanden sind. Die Reihe steht grundsätzlich auch anderen Autorinnen und Autoren offen. Kurzbeschreibung des Dokuments Der vorliegende Band ist unter der Betreuung von Rolf Biehler am Fachbereich Mathema- tik/Informatik der Universität Kassel als Wissenschaftliche Hausarbeit für das 1. Staatsexamen ent- standen. Die Förderung von Datenkompetenz in den Klassen 1 – 6 ist ein in der deutschsprachigen didaktischen Literatur kaum beachtetes Thema. In der vorliegenden Arbeit wird die umfangreiche eng- lischsprachige Literatur zu diesem Thema erschlossen und ausgewertet, um der Fragestellung, wie sich Datenkompetenz entwickelt und wie man diese Entwicklung im Unterricht geeignet fördern kann, nachzugehen. Alle Phasen im Prozess der Datenanalyse werden dabei aufgegriffen: Die Wahl einer Fragestellung und die Erhebung von Daten, die Organisation und graphische Darstellung sowie die Beschreibung und Interpretation von Daten mithilfe statistischer Verfahren. Die innovative Werkzeug- software TinkerPlots (http://www.keypress.com/x5715.xml) wird im Hinblick auf die Möglichkeit, Da- tenkompetenz zu fördern untersucht, und exemplarische Unterrichtsideen werden damit konkretisiert. Intention der Arbeit ist, einen Beitrag dazu zu leisten, dass der Stellenwert von Datenkompetenz in den Klassen 1-6 neu überdacht wird. Technischer Hinweis Zu dem Dokument gehören 13 TinkerPlots-Dateien, auf die im Dokument referenziert wird. Da- mit die Links im Dokument funktionieren, legen Sie die Dateien in denselben Ordner wie das Doku- ment. Für die TinkerPlots™-Dateien Cats, Heaviest Backpack, New Zealand Students, Olympics und US Students liegt die Genehmigung zur Veröffentlichung im Rahmen dieser Arbeit von Key Curriculum Press vor: TinkerPlots™, Key Curriculum Press, 1150 65th Street, Emeryville, CA 94608, 1-800-995- MATH, www.keypress.com/tinkerplots. Unter http://www.keypress.com/x17679.xml können Sie eine Evaluationsversion von Tin- kerPlots™ herunterladen. Kasseler Online-Schriften zur Didaktik der Stochastik: https://kobra.bibliothek.uni-kassel.de/handle/urn:nbn:de:hebis:34-2006062213595 Herausgegeben von Rolf Biehler, Fachbereich Mathematik/Informatik, Universität Kassel, biehler@mathematik.uni-kassel.de Bd. 3: http://nbn-resolving.org/urn:nbn:de:hebis:34-2006092214690 © Anja Wagner, ehemalige Studentin des Fachbereichs Mathematik/Informatik, Universität Kassel, wagner.wehretal@t-online.de Entwicklung und Förderung von Datenkompetenz in den Klassen 1- 6 Anja Wagner Inhaltsverzeichnis 1. Einleitung ........................................................................................................... 5 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? ............................................................................................................... 7 2.1 (Historischer) Überblick zur Entwicklung der klassischen Statistik...................... 7 2.2 Der Prozess der Datenanalyse.................................................................................. 8 2.3 Die Explorative Datenanalyse als neue Richtung innerhalb der Statistik ......... 11 2.4 Abschließender Vergleich zwischen klassischer Statistik und EDA .................. 15 2.5 Explorative Datenanalyse im Unterricht – Chancen und Schwierigkeiten........ 16 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! . 18 3.1 Was beinhaltet der Begriff „Datenkompetenz“?.................................................... 18 3.2 Argumente für die Förderung von Datenkompetenz in den Klassen 1-6.......... 20 3.2.1 Pragmatische und kulturelle Argumente ................................................................ 20 3.2.2 Methodisch-didaktische Argumente........................................................................ 21 3.2.3 Formal bildende Argumente..................................................................................... 23 3.2.4 Lernpsychologische Argumente .............................................................................. 24 4. Prinzipien und Standards der Datenanalyse................................................. 26 4.1 Die NCTM-Standards 2000 zur Datenanalyse...................................................... 27 4.1.1 Standard für die Klassen Pre-K-2 ........................................................................... 31 4.1.2 Standard für die Klassen 3-5 ................................................................................... 36 4.1.3 Möglicher Standard für die Klasse 6....................................................................... 40 4.2 Die NCTM-Standards 2000 im Vergleich mit hessischen Curricula und nationalen Bildungsstandards.................................................................................. 42 4.2.1 Curriculum und Bildungsstandards der Primarstufe ............................................ 43 4.2.2 Curricula und Bildungsstandards der Sekundarstufe I ........................................ 45 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 52 5.1 Kriterien zur Auswahl von Themen und Datensätzen.......................................... 52 5.2 Formulierung einer statistischen Fragestellung .................................................... 54 5.3 Methoden der Datenerhebung................................................................................. 58 6. Daten organisieren und graphisch darstellen .............................................. 63 6.1 Vorstellung der Datenanalyse-Software TinkerPlotsTM ....................................... 64 6.2 Systematik verschiedener graphischer und numerischer Darstellungen.......... 65 6.3 Graphische Darstellungen univariater Daten und deren unterrichtspraktische Einführung................................................................................................................... 68 6.4 Graphische Darstellungen bivariater Daten und deren unterrichtspraktische Einführung................................................................................................................... 92 6.5 Die Entwicklung des Verständnisses graphischer Darstellungen.................... 109 6.6 Graphische Darstellungen erfinden ...................................................................... 114 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten .120 7.1 Begriffe zur Beschreibung von Auffälligkeiten in Daten .................................... 121 7.2 Begriffe zur Beschreibung der Verteilungsform .................................................. 122 7.3 Begriffe zur Beschreibung der Streuung .............................................................. 124 7.4 Lageparameter ......................................................................................................... 125 7.4.1 Modalwert bzw. modale Klasse ............................................................................. 126 7.4.2 Median ....................................................................................................................... 129 7.4.3 Arithmetisches Mittel ............................................................................................... 133 7.4.3.1 Zur Einführung des Algorithmus......................................................................... 133 7.4.3.2 Eigenschaften des arithmetischen Mittels und deren unterrichtliche Umsetzung ................................................................................................................ 134 7.5 Schülervorstellungen vom Durchschnitt und von Repräsentativität ................ 146 7.6 Die Verwendung von modalen Gruppen als Alternative zu konventionellen Lageparametern....................................................................................................... 149 7.7 Methoden zum Vergleich zweier Datensätze ...................................................... 154 7.8 Interpretation von Datensätzen im inhaltlichen Kontext .................................... 159 8. Die Beziehung zwischen Stichprobe und Population .................................161 8.1 Intuitive und formale Ideen zur Stichprobenziehung.......................................... 161 8.2 Schülervorstellungen vom Begriff der Stichprobe und von Methoden der Stichprobenziehung................................................................................................. 164 8.3 Didaktische Möglichkeiten zur Förderung der Einsicht in die Beziehung zwischen Stichprobe und Population.................................................................... 169 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 ....................................................................................................175 9.1 Entwicklung von Bewertungskriterien für Unterrichtsmaterialien ..................... 175 9.2 Übersicht und Bewertung von Unterrichtsmaterialien........................................ 176 10. Analyse und Überarbeitung eines ausgewählten Unterrichts- vorschlages ....................................................................................................184 10.1 Darstellung des Unterrichtsvorschlages „Looking at Mystery Data“................ 184 10.2 Kritische Analyse des Unterrichtsvorschlages „Looking at Mystery Data“ ..... 188 10.3 Überarbeiteter Unterrichtsvorschlag ..................................................................... 190 10.4 Anregungen zur Weiterarbeit in Form von projektorientierten Unterricht ....... 197 11. Zusammenfassung und Ausblick .................................................................203 12. Literaturverzeichnis .......................................................................................208 12.1 Software .................................................................................................................... 215 13. Literaturhinweise............................................................................................216 13.1 Verzeichnis der Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 ............................................................................................................... 216 13.2 Verzeichnis der Themenhefte zur Datenanalyse in den Klassen 1-6 ............. 217 13.3 Verzeichnis ausgewählter deutschsprachiger Artikel mit Unterrichtsvorschlägen zur Datenanalyse in den Klassen 1-6......................... 217 14. Anhang ............................................................................................................219 15. Versicherung ..................................................................................................235 Wissenschaftliche Hausarbeit zur Ersten Staatsprüfung für das Lehramt an Grundschulen Entwicklung und Förderung von Datenkompetenz in den Klassen 1-6 Fach: Mathematik Anja Wagner wagner.wehretal@t-online.de Betreuer: Prof. Dr. Rolf Biehler Eingereicht am 1.6.2005 1. Einleitung 5 1. Einleitung Die vorliegende Arbeit befasst sich mit der Thematik, welchen Beitrag zur Entwick- lung und Förderung von Datenkompetenz der Mathematikunterricht in den Klassen 1-6 leisten kann und sollte. Die Wahl dieses Themas begründet sich in erster Linie in meinem persönlichen Interesse an dem mathematischen Teilgebiet der Datenanalyse. Bereits die fachwissenschaftliche Vorlesung „Elementare Stochastik“ weckte mein Interesse an die- sem Thema, da diese Veranstaltung aufgrund ihres explorativen Ansatzes eine experimen- telle Form mathematischen Arbeitens in den Vordergrund stellte, die mir aus meinem bis- herigen Studium nicht bekannt war. Zusätzlich besuchte ich das Fachdidaktische Seminar mit dem Schwerpunkt Stochastik, da ich mich dafür interessierte, wie man Inhalte der Sto- chastik bereits in der Grundschule thematisieren kann. Im Rahmen dieses Seminars ent- stand auch die Idee zu dieser Arbeit, in welcher ich versuche zu verdeutlichen, dass der Bereich der Datenanalyse für sich genommen in den unteren Klassen bereits einen Eigen- wert besitzt, zugleich aber eine Herstellung von Bezügen zu weiteren mathematischen Teilgebieten, wie etwa zur Geometrie oder zur Arithmetik, zulässt. Besonders im englischsprachigen Raum richten mehrere mathematikdidaktische For- scher seit einigen Jahren den Fokus darauf, wie jüngere Schüler mit Daten umgehen und in diesem Zusammenhang wurden auch verschiedene Unterrichtsvorschläge entwickelt. Diese und weitere Quellen werden inhaltlich strukturiert, geordnet und kritisch betrachtet, um der im Mittelpunkt dieser Arbeit stehenden Fragestellung, wie sich Datenkompetenz entwi- ckelt und wie man diese Entwicklung im Unterricht geeignet fördern kann, nachzugehen. Um diese Frage zu beantworten, sehe ich es zunächst als erforderlich an, die (Explorative) Datenanalyse als neue Richtung innerhalb der Statistik mit der klassischen Statistik zu ver- gleichen und den Prozesscharakter der Datenanalyse und dessen Vorteile im Unterricht zu verdeutlichen (Kapitel 2). Vor diesem Hintergrund werde ich im dritten Kapitel definieren, was ich im Rahmen dieser Arbeit unter dem Begriff „Datenkompetenz“ verstehe und Ar- gumente aufführen, die für eine frühe Förderung von Datenkompetenz sprechen. Im vier- ten Kapitel stelle ich die Prinzipien und Standards der Datenanalyse vom National Council of Teachers of Mathematics (NCTM) vor und vergleiche diese mit den hessischen Curricu- la der betreffenden Schulstufen und den nationalen Bildungsstandards, um durch diese Gegenüberstellung den Stellenwert von Datenkompetenz in den unteren Klassen unseres Bildungssystems zu beleuchten. Nachdem erläutert wurde, welche Elemente der Datenana- lyse laut Curricula und Bildungsstandards unterrichtet werden müssen, wird in den Kapi- 1. Einleitung 6 teln 5-7 aufgezeigt, wie man die in Kapitel 3 definierte Datenkompetenz umfassend för- dern kann. Die Darstellungsstruktur orientiert sich dabei im Wesentlichen an dem Prozess der Datenanalyse, so dass zunächst Wege zur Wahl eines geeigneten Themas, einer Frage- stellung und zur Erhebung von Daten aufgezeigt werden. Danach wird erläutert, wie man die erhobenen Daten organisieren und graphisch darstellen kann und wie sich das Ver- ständnis von graphischen Darstellungen bei Schülern1 entwickelt. Kapitel 7 gibt Möglich- keiten an, wie man Begriffe und Methoden zur Beschreibung und Interpretation von Da- tensätzen im Unterricht der Klassen 1-6 einführen kann. In den Kapiteln 6 und 7 werde ich zudem erörtern, wie man die Datenanalysesoftware TinkerPlotsTM sinnvoll in den Unter- richt integrieren kann. In Kapitel 8 wird dargelegt, wie man die komplizierte Beziehung zwischen der Stichprobe und der Population im Unterricht thematisieren könnte und wel- che Probleme dabei auftauchen. Kapitel 9 befasst sich mit der Bewertung von bereits exis- tierenden Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 und wurde mit der Intention verfasst, interessierten Lehrern eine grobe Orientierung zu geben, welche Materi- alien zur Förderung von Datenkompetenz geeignet sind. Abschließend wird ein ausgewähl- ter Unterrichtsvorschlag exemplarisch vorgestellt, kritisch analysiert und überarbeitet (Ka- pitel 10). Alles in allem soll diese Arbeit mit ihren vielfältigen praktischen Anregungen sowie mathematikdidaktischen Hintergründen einen Beitrag dazu leisten, dass der Stellenwert von Datenkompetenz in den Klassen 1-6 neu überdacht wird. Daten begegnen uns in unse- rer Umwelt überall und daher muss ein kompetenter Umgang mit Daten bereits in den un- teren Klassen gefordert und gefördert werden und zwar in einem noch stärkeren Maße, als dies bereits durch die Bildungsstandards in den unteren Klassen gefordert wird. 1 Zum Zwecke der Vereinfachung und im Sinne einer leichteren Lesbarkeit wird in der gesamten Arbeit die Bezeichnung „Schüler“ geschlechtsneutral, also sowohl für männliche als auch für weibliche Personen, ver- wendet. Entsprechendes gilt für die Bezeichnung „Lehrer“. 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 7 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? In diesem Kapitel wird eine relativ neue Richtung der Statistik, die Explorative Da- tenanalyse, vorgestellt und mit der klassischen Statistik verglichen, um die Frage zu be- antworten, welche der beiden Ansätze man dem Schulunterricht zugrunde legen sollte. Zunächst wird dazu ein Überblick über die Entwicklung der klassischen Statistik gegeben sowie der Prozess der Datenanalyse vorgestellt. 2.1 (Historischer) Überblick zur Entwicklung der klassischen Statistik Die klassische Statistik hat eine lange Entwicklungsgeschichte erfahren. Einfache statistische Erhebungen wurden bereits um 3000 v. Chr. durchgeführt. Es handelte sich dabei um Volkszählungen, welche offensichtlich eine praktische Bedeutung für Regierung und Verwaltung in Hinblick auf militärische und steuerliche Zwecke hatten. Im 17. Jahr- hundert wurde der wissenschaftliche Charakter der Statistik durch die moderne Staatswis- senschaft geprägt. Die Bevölkerungsentwicklung wurde anhand von Geburtshäufigkeiten und Sterbezahlen untersucht (vgl. Kütting, 1985, S. 89). Mit dem Entstehen der Wahrscheinlichkeitsrechnung wurde der Einfluss der Wahr- scheinlichkeitstheorie auf die Statistik bemerkbar. Bereits Jakob Bernoulli (1654 - 1705) erkannte den Zusammenhang zwischen der mathematischen und der statistischen Wahr- scheinlichkeit (Empirisches Gesetz der großen Zahlen). Im 20. Jahrhundert entwickelten sich mit den Methoden der Wahrscheinlichkeitstheorie neue Verfahren und Möglichkeiten, wie beispielsweise die repräsentative Stichprobenziehung als Alternative zur Gesamterhe- bung. So entstanden zwei Teilgebiete der Statistik: Die deskriptive (beschreibende) Statis- tik und die induktive (schließende) Statistik (vgl. Kütting, 1985, S. 90). Die deskriptive Statistik beschäftigt sich mittels Angabe charakteristischer Kenngrößen und graphischer Darstellungen mit der Wiedergabe von Merkmalsausprägungen, die beobachtet wurden. Die Techniken der beschreibenden Statistik bilden meist den ersten Teil einer statistischen Analyse, da sie in den Daten enthaltene Informationen offen legen und somit empirische Fakten strukturieren. Auf diese Weise werden mögliche Erkenntnisse aus den Daten er- zeugt. Die induktive Statistik hingegen befasst sich mit dem Planen von Beobachtungen, mit dem Analysieren von Daten und mit dem Ziehen von Schlussfolgerungen. Sie bewertet die möglichen Erkenntnisse aus der deskriptiven Statistik und verfolgt das Ziel, begründba- 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 8 re Vermutungen über einen Sachverhalt zu erzeugen (vgl. Hussain & Borovcnik, 1995, S. 4). So werden beispielsweise die in der deskriptiven Statistik aufgestellten Hypothesen in der induktiven Statistik getestet, um somit von der Stichprobe auf die Population zu schlie- ßen. Nicht zuletzt durch den technischen Fortschritt und zur Verbesserung der statisti- schen Praxis entstand in den 70er Jahren des 20. Jahrhunderts eine neue Richtung inner- halb der Statistik, nämlich die Explorative Datenanalyse, die maßgeblich durch den ameri- kanischen Statistiker John W. Tukey beeinflusst ist. Bevor die Explorative Datenanalyse genauer charakterisiert wird, soll jedoch zunächst zum besseren Verständnis der Prozess einer Datenanalyse erläutert werden. 2.2 Der Prozess der Datenanalyse Eine statistische Untersuchung besteht laut Bright und Friel (vgl. 1998, S. 64) im Wesentlichen aus vier Phasen: 1. Entwicklung einer statistischen Fragestellung 2. Datenerhebung 3. Analyse der gesammelten Daten 4. Interpretation der Ergebnisse. Wie Abbildung 2.1 illustriert, ist ein Sachproblem aus der realen Welt Ausgangs- punkt jeder Datenanalyse. Um dieses Problem zu lösen bzw. diese Fragestellung zu beant- worten, muss zunächst die allgemeine Fragestellung in eine statistische Fragestellung transformiert werden, um dann geeignete Daten zu sammeln (vgl. Konold & Higgins, 2003, S. 195). Die gewonnenen Daten werden organisiert, graphisch dargestellt und mittels statistischer Verfahren analysiert, damit dann die Ergebnisse in Bezug auf das reale Sach- problem interpretiert werden können. Als eine fünfte Phase könnte man die Kommunikati- on der Ergebnisse betrachten, da hierdurch die Nützlichkeit einer Datenanalyse betont wird: “Statistical understanding is not useful unless that understanding can be communica- ted to others“ (Bright & Friel, 1998, S. 64). Zudem soll Abbildung 2.1 deutlich machen, dass eine Datenanalyse ein dynamischer, iterativer Prozess ist, der nicht linear verläuft. Vielmehr hängen die Phasen wechselseitig voneinander ab, was die Verbindungslinien zwischen den einzelnen Phasen illustrieren (vgl. Abb. 2.1). Beispielsweise wird manchmal erst während der Analyse oder der Interpretation deutlich, dass andere Zusammenhänge in 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 9 den Daten bestehen als erwartet. Dies kann dazu führen, dass erneut Daten gesammelt werden und diese unter einem anderen Gesichtspunkt analysiert werden (vgl. Konold & Higgins, 2003, S. 194). Der Kreislauf in Abbildung 2.1 muss dann durchbrochen oder so- gar mehrmals durchlaufen werden, um das Problem wirklich zu durchdringen (vgl. Bright & Friel, 1998, S. 64). Abb. 2.1: Modell des Datenanalyseprozesses 1. Pose the Question Problem COMMUNICATION of RESULTS 2. Collect the Data 4. Interpret the Results 3. Analyze the Data Data (Darstellung wie bei Bright & Friel, 1998, S. 65) Was in obiger Abbildung jedoch nicht deutlich wird, ist die Tatsache, dass erfahrene Forscher Erwartungen formulieren, wie die zu sammelnden Daten wohl aussehen und wel- che Ergebnisse sie im Verlauf des Prozesses entdecken werden. Durch dieses vorausschau- ende Denken entwickeln und verfeinern sie ihre statistische Untersuchungsfrage, entschei- den welche Daten gesammelt werden und wählen geeignete Methoden zur Analyse aus. Wurden die Daten schließlich erhoben, so werden sie analysiert, indem man in den Daten nach Hinweisen sucht, die die eigenen Erwartungen bestätigen oder widerlegen (vgl. Ko- nold & Higgins, 2003, S. 194). Biehler (1999, S. 4) spricht in diesem Zusammenhang von einem „Dialog mit den Daten“. Zusammenfassend lässt sich sagen, dass in einer Planungs- 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 10 phase der Datenanalyseprozess mental durchlaufen wird, bevor der reale Prozess gestartet wird. Weiterhin ist auffällig, dass der Datenanalyseprozess gleichzeitig auch einen Mo- dellbildungsprozess beinhaltet. Humenberger und Reichel (1995, S. 33-35) beschreiben den Prozess des Modellierens folgendermaßen: Ausgehend von einer realen Situation wird durch Vereinfachen, Idealisieren und Strukturieren ein reales Modell geschaffen. Dieses wird durch Mathematisieren in ein mathematisches Modell umgewandelt, wobei es auch verschiedene sinnvolle mathematische Modelle für die gleiche Situation geben kann. Durch mathematisches Arbeiten wird eine mathematische Lösung entwickelt, die abschlie- ßend interpretiert wird, also in die Realität rückübersetzt wird. Außerdem wird das Modell validiert, was bedeutet, dass das Modell bewertet wird. Falls es als unzureichend einzustu- fen ist, so wird der Modellierungskreislauf unter Verwendung eines anderen Modells er- neut durchlaufen. Bei sehr einfachen Problemen kann auch das reale Modell ausgelassen werden und sofort ein mathematisches Modell erstellt werden (vgl. Abb. 2.2). Abb. 2.2: Der Modellierungskreislauf Reale SITUATION Reales MODELL Mathematische LÖSUNG Mathematisches MODELL Interpretieren Vereinfachen Mathematisches Arbeiten Mathematisieren (Darstellung wie bei Humenberger & Reichel, 1995, S. 35) Der statistische Modellbildungsprozess lässt sich nun analog beschreiben: Ausge- hend von der realen Situation oder dem realen Problem wird durch Vereinfachen und Ma- thematisieren eine allgemeine Fragestellung in eine statistische Fragestellung verwandelt, 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 11 wozu auch die Definition geeigneter Variablen gehört. Durch Mathematisieren, also durch die Erhebung von Daten, entsteht das mathematische Modell, welches den gesammelten Daten entspricht. Das mathematische Arbeiten bedeutet im Fall der Datenanalyse, dass die Daten organisiert, graphisch dargestellt und analysiert werden. So erhält man eine mathe- matische Lösung, die jedoch bei der Datenanalyse keineswegs eindeutig sein muss. Die gewonnenen mathematischen Erkenntnisse werden schließlich im Kontext des Sachprob- lems interpretiert, um einen Beitrag zur Lösung des realen Problems zu leisten. Gerade im Prozess der Datenanalyse ist ein ständiges Vermitteln zwischen Mathema- tik und Realität notwendig, um das Sachproblem besser zu verstehen bzw. zu lösen. Man muss kontinuierlich Zusammenhänge herstellen zwischen den Daten und dem was die Da- ten darstellen (vgl. Russel & Corwin, 1989, S. 2). “Data are numbers with a context“ (Moore, 1997, S. XV). Der Anwendungsbezug von Mathematik, insbesondere bei der Da- tenanalyse, wird hier deutlich. Der Zusammenhang zwischen den Daten und der Sachsituation wird besonders durch das Konzept der Explorativen Datenanalyse betont, welches im nächsten Abschnitt näher beschrieben werden soll. 2.3 Die Explorative Datenanalyse als neue Richtung innerhalb der Statistik „Exploratory data analysis is detective work – numerical detective work – or count- ing detective work – or graphical detective work“ (Tukey, 1977, S. 1). Mit dieser Metapher des Datendetektivs begründete John W. Tukey 1977 eine neue Richtung in der Statistik, die Explorative Datenanalyse (EDA). Tukey verglich die Datenanalyse mit der Arbeit ei- nes Detektivs, welcher ausgehend von einem realen Problem in den zugehörigen Daten nach Mustern und Besonderheiten sucht, gefundenen Hinweisen nachgeht und Hypothesen aufstellt. Unter Einbeziehung aller ihm sonst zugänglichen Informationen versucht der Datendetektiv, seine Frage zu beantworten bzw. seine Hypothese zu bestätigen oder zu verwerfen. Durch diese Detektivarbeit nimmt die Statistik neue Funktionen wahr. Zuvor hatte sie sich im Wesentlichen darum gekümmert, Wissenschaftlern beim Beschreiben des Datenmaterials (deskriptive Statistik), beim Testen von Hypothesen und bei der statisti- schen „Absicherung“ von Ergebnissen (induktive Statistik) zu unterstützen. Die EDA un- terstützt besonders die Phase der Hypothesengenerierung, in der es um das Erkennen von Strukturen und Auffälligkeiten im Datenmaterial geht (vgl. Biehler & Weber, 1995, S. 4). 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 12 Wie genau sieht nun die Auseinandersetzung mit dem Datenmaterial in der EDA ba- sierend auf dem Leitmotiv des Datendetektivs aus? Bei dieser Zugangsweise versucht man, die Daten meist mittels Softwareunterstützung zu explorieren, wobei das Sachproblem im Vordergrund stehen muss. Wesentliches Element der Exploration ist die Verwendung ver- schiedener graphischer Darstellungen, um Auffälligkeiten in Daten zu entdecken und diese vor dem Hintergrund des Sachproblems zu interpretieren (vgl. Biehler & Weber, 1995, S. 4f.). Dazu entwickelte Tukey (1977) neue graphische Repräsentationsformen wie zum Bei- spiel den Box-Plot und das Stängel-Blatt-Diagramm (vgl. Konold & Higgins, 2003, S. 194). Die Darstellungen in der EDA besitzen eine Doppelfunktion: „Einerseits repräsentie- ren sie Daten, sie haben eine simulative Funktion. Andererseits sind sie ein Mittel für die Tätigkeit des Explorierens von Daten, sie haben eine explorative Funktion“ (Biehler, 1982, S. 13). Dennoch muss man sich bewusst sein, dass Graphiken in der Regel die Daten nicht so darstellen wie sie sind, sondern eine bestimmte Perspektive auf die Daten zeigen. Daher muss der Datendetektiv dazu in der Lage sein, verschiedene Graphiken zu betrachten und zu vergleichen. Da zudem aus Sicht der EDA keine einzelne, absolut optimale Graphik existiert, liefert dieser Vergleich verschiedener Darstellungen wichtige Einsichten in das Sachproblem (vgl. Biehler, 1995a, S. 62). “Different graphs show us quite different aspects of the same data“ (Tukey, 1977, S. 157). Neben der Multiplität der Darstellungen ist auch das substanzielle Modifizieren von Graphiken typisch für die EDA (vgl. Biehler, 1995a, S. 62). Ein Beispiel dafür ist die Änderung der Intervallbreite bei einem Histogramm. Moder- ne Software zur Datenanalyse unterstützt den Datendetektiv bei seiner Spurensuche und ermöglicht zeitökonomischeres Arbeiten. Ferner unterscheidet sich das von der EDA analysierte Datenmaterial von dem der klassischen Statistik. Biehler (1995a, S. 56f.) differenziert zwischen vier Arten von Daten: • Einmalige Daten/ Datenunikate: Daten aus Gesamterhebungen, z.B. historische Daten • Daten aus nebulös gewonnenen Stichproben: Daten aus potentiell größeren Populationen, bei denen zu analysieren ist, ob die daraus gewonnenen Erkenntnisse über die Stichprobe hinaus Gültigkeit besitzen und somit verallgemeinert werden können. • Daten aus Zufallsexperimenten: Daten, die bei mehrfacher Experimentwiederholung sehr ähnliche Verteilungen zeigen und deshalb idealisierend durch ein Wahrscheinlichkeitsmodell beschrieben werden können. 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 13 • Daten aus Zufallsstichproben: Durch eine repräsentative Zufallsstichprobe aus einer wohldefinierten Population gewonnenen Daten. Die klassische Statistik ist auf Daten aus Zufallsstichproben oder Zufallsexperimen- ten zugeschnitten, wohingegen die EDA neue Methoden und Strategien entwickelt hat, um auch Datenunikate und Daten aus nebulös gewonnenen Stichproben zu untersuchen, da diese auch reale Daten darstellen, denen man Respekt entgegen bringen sollte. Biehler (1995a, S. 56) weist zudem darauf hin, dass eine Beschreibung solcher Daten modellhaft ist, also nicht eindeutig sein muss und somit kritisch hinterfragt werden muss. Ein weiteres Merkmal der Datenexploration besteht darin, dass diese einen interakti- ven Prozess zwischen dem Bearbeiter und dessen Kenntnissen über das Sachproblem und den mathematischen Zwischenergebnissen darstellt (vgl. Borovcnik, 1990, S. 80). Dies bedeutet, dass eine Datenanalyse nicht im Voraus bis ins Detail geplant werden kann, son- dern dass die jeweils nächste Teilanalyse abhängig von der Interpretation der Zwischener- gebnisse im Sachkontext ist. Weiterhin ist Datenexploration ein iterativer Prozess (vgl. hierzu Abschnitt 1.2). Zusammenfassend sind nach Biehler (1999, S. 4) folgende Merkmale charakteris- tisch für die Arbeitsweise der EDA: • Datenexploration ist ein interaktiver und iterativer Prozess, in dem Umwege und Irrwege als Lernchancen begriffen werden. • Realen Daten wird Respekt entgegen gebracht, weil man sich nicht gegenüber Un- erwartetem durch Modell und Hypothesen vorab immunisiert und ein waches Auge nicht nur für die auffälligen Strukturen, sondern auch für Besonderheiten besitzt. • Begriffe und graphische Darstellungen dienen als Werkzeug der Exploration, nicht nur als Mittel der Ergebnispräsentation. Borovcnik (vgl. 1990, S. 79) ergänzt hierzu, dass sich die Verfahren der EDA durch verschiedene Kennzeichen ausweisen: • Besonderheiten und Muster: Idee der Explorativen Datenanalyse ist es, Datensätze so zu analysieren, dass nicht nur ein spezielles Muster, wie zum Beispiel die Normalverteilung erkennbar wird, 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 14 sondern dass auch Besonderheiten, wie etwa Ausreißer oder Cluster, interpretiert werden müssen. • Flexibilität der Verfahren: Nach Bedarf können statistische Verfahren abgewandelt werden, wenn es dem Zweck dient, neue Erkenntnisse aus den Daten zu gewinnen. • Robustheit: Die EDA bevorzugt Verfahren, die robust gegenüber Ausreißern sind, da man sich gerade von einer sachgerechten Interpretation der Ausreißer neue Einsichten er- hofft. Deshalb dürfen diese extremen Werte nicht von der Analyse ausgeschlossen werden, wie es empfindliche Verfahren erfordern. Ein Beispiel dafür ist die zumeist bevorzugte Verwendung von Median und Interquartilabstand anstelle von arithme- tischem Mittel und Standardabweichung. • Geringer Aufwand: Zudem sollen die verwendeten Verfahren leicht verständlich und leicht durchführ- bar sein. So zählt man beispielsweise den Median ab, anstatt das arithmetische Mit- tel zu berechnen. • Praktische Ausrichtung: Die Verfahren der EDA sind nicht auf ihren mathematischen Gehalt zu reduzieren. Im Mittelpunkt der Datenanalyse steht das Sachproblem. • Visuelles Arbeiten: Explorative Arbeitstechniken haben einen stark visuellen Charakter. Durch geeig- nete Darstellungen werden Strukturen aufgedeckt und damit sachliche Einsichten geweckt. • Einfache Konzepte: Die verwendeten Konzepte sind ohne Bezug auf weitere Theorie zu verstehen. Das Verstehen von Zwischenergebnissen wird damit erleichtert und der Prozess der Da- tenanalyse kann geeignet fortgesetzt werden. Zusammenfassend lässt sich sagen, dass die Explorative Datenanalyse eine moderne Richtung der Statistik ist, die eigens zur Verbesserung der statistischen Praxis entwickelt wurde. Die Philosophie der EDA lässt sich in erster Linie kennzeichnen durch eine stärkere Verschränkung formaler Datenbearbeitung mit Wissen aus dem jeweiligen Sachkontext. Die Techniken ähneln denen der deskriptiven Statistik, obwohl sie noch einfacher und we- 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 15 sentlich stärker graphisch ausgeprägt sind (vgl. Borovcnik, 1990, S. 61). Im folgenden Ab- schnitt wird die EDA der klassischen Statistik kontrastierend gegenübergestellt. 2.4 Abschließender Vergleich zwischen klassischer Statistik und EDA Alles in allem bleibt festzuhalten, dass die Explorative Datenanalyse der deskriptiven Statistik ähnelt, da sie das deskriptive Vokabular weitgehend übernommen hat. Deshalb wird sie auch von einigen Wissenschaftlern als Teilgebiet der deskriptiven Statistik ange- sehen. Dennoch bestehen einige Unterschiede zwischen der klassischen Statistik und der durch Tukey begründeten EDA, die im Folgenden zusammengestellt werden. Borovcnik & Ossimitz (vgl. 1987, S. 199-201) sehen Unterschiede in den Vorausset- zungen, Intentionen und dem Ablauf der Analyse, in den Ergebnissen sowie in der Bezie- hung zwischen dem Modell und der Realität: Bei der klassischen Statistik wird im Allgemeinen vorausgesetzt, dass die Daten aus einer Zufallsstichprobe oder einem Zufallsexperiment stammen und damit eine bestimmte Wahrscheinlichkeitsverteilung aufweisen. Die zu überprüfenden Hypothesen müssen vor der Analyse aufgestellt werden. Dadurch ist auch der Ablauf der Analyse beinah eindeutig festgelegt. Bei der Datenexploration hingegen werden an die Daten keine Voraussetzungen gestellt und auch die Hypothesen müssen nicht vor der Analyse formuliert werden, sondern können vielmehr beim iterativen Durchlaufen der Prozessphasen entwickelt werden. Auch der Analyseablauf ist abhängig von den vorliegenden Zwischenergebnissen und dem Wis- sen über das Sachproblem, so dass man nicht vorab jeden Analyseschritt genau planen kann, sondern im Sinne einer offenen Analyserichtung experimentiert. Dabei werden die Daten oft unter verschiedensten Gesichtspunkten mehrfach analysiert. Die Ergebnisse der Analyse sind in der klassischen Statistik meist eindeutig und im Wesentlichen von der Ausgangshypothese abhängig. Explorativ gewonnene Erkenntnisse geben ein Spektrum möglicher Sichtweisen wieder, wobei auch divergierende Ergebnisse auftreten können. Oft werden hierbei Hypothesen generiert, die Anlass zu weiteren Unter- suchungen geben. Die strikte Trennung zwischen Realität und Modell ist typisch für die klassische Sta- tistik. Lediglich am Anfang und am Ende einer statistischen Analyse existieren Schnittstel- len zwischen der Realität und dem Modell. Demgegenüber werden bei der Explorativen Datenanalyse eher mehrere alternative oder einander ergänzende Modelle einer Sachsitua- 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 16 tion betrachtet. Es steht weniger das Modell, sondern die zu erforschende Sachsituation im Vordergrund. Welcher Zugang zur Statistik ist nun für den Unterricht in der Schule sinnvoll und warum? Diese Frage wird im nächsten Abschnitt erörtert. 2.5 Explorative Datenanalyse im Unterricht – Chancen und Schwierigkeiten Die spezielle Arbeitsweise der EDA, welche sich besonders durch Kreativität aus- zeichnet, bringt sowohl Chancen als auch Probleme für den Schulunterricht mit sich. Vorteilhaft für den Schulunterricht ist, dass die EDA im Vergleich zur klassischen Statistik auf einfacheren Konzepten beruht und Verfahren mit geringerem Aufwand bevor- zugt, was jedoch nicht heißt, dass Mathematik elementarisiert wird. Vielmehr können Schüler durch diesen Ansatz einen Einblick in die Arbeitsweisen empirischer Wissenschaf- ten gewinnen und erwerben dadurch ein realistischeres Bild von Mathematik, das im her- kömmlichen Mathematikunterricht schwer zu vermitteln ist. Biehler und Weber (1995, S. 5-6) sehen weitere Vorteile im explorativen Umgang mit Daten in der Schule: Der betont interaktive und iterative Erkenntnisprozess bietet zusätzliche Chancen für einen forschen- den und entdeckenden Unterricht, in welchem der Umgang mit Daten motivierender und spannender gestaltet werden kann. Die EDA legt also die Methodik eines projektorientier- ten Unterrichts nahe, der entdeckendes und selbständiges Lernen der Schüler ermöglicht. In diesem Rahmen erfordert und ermöglicht die EDA offenere Arbeitsweisen: Dies bedeu- tet, dass sich Schüler stärker als im herkömmlichen Statistikunterricht als Experten etwa bezüglich des Sachproblems einbringen können und der Lehrer gleichzeitig seine Rolle als Wissensvermittler zurücknimmt, um sich stärker als Moderator, Organisator und Berater zu betätigen und so den Lernprozess seiner Schüler begleiten zu können. Da in der EDA das Sachproblem im Vordergrund steht, ermöglicht ein explorativer Umgang mit Daten, dass Anwendungen mit offenem Ende im Mathematikunterricht thematisiert werden. Der Blick auf die Sache dient also keinesfalls bloß der Motivation. Zugleich werden dabei in- terpretative und begriffliche Aspekte von Mathematik betont, so dass den Schülern klar wird, dass Mathematik mehr ist als reines Rechnen, da die Software zeitintensive Rechen- und Zeichenarbeit übernimmt. Der sachgerechte Umgang mit moderner Software leistet außerdem noch einen Beitrag zur informationstechnischen Bildung. 2. Explorative Datenanalyse oder klassische Statistik – Was sollte man lehren? 17 Nichtsdestotrotz weisen Biehler und Weber (1995, S. 6) auch auf Gefahren hin, die der Computereinsatz mit sich bringen kann. Einmal können dadurch neue Lernhürden ent- stehen, denn die Schüler müssen sich zunächst in die Handhabung des Softwarewerkzeugs einarbeiten. Diese Einarbeitungsphase muss in die Unterrichtseinheit integriert werden. Es besteht die Gefahr, dass die Schüler vor lauter Graphiken und Tabellen den Überblick ver- lieren und schon mit der Anfertigung derselbigen das Problem als gelöst betrachten. Wei- terhin ist es möglich, dass Methoden unverstanden angewandt werden, ohne zuvor diese Anwendung ohne Software an kleineren Datensätzen geübt zu haben. Daher wird empfoh- len, die Arbeitsphasen am PC mit großem Zeitansatz zu versehen und sorgfältig zu struktu- rieren, indem man klar formulierte und schriftlich fixierte Fragestellungen bzw. Ar- beitsaufträge den Schülern an die Hand gibt, welche zielgerichtetes Arbeiten ermöglichen aber zugleich auch offen genug sind für eigene Nuancierungen und Interpretationen. Ein weiteres Problem ist der hohe Zeitbedarf, den Unterrichtsarrangements dieser Art benötigen. Dagegen ist Unterricht mit Inhalten und Methoden der klassischen Statistik zeit- ökonomischer. Auch stellt die Gestaltung eines solchen Unterrichts hohe Anforderungen an Lehrer wie Schüler. Der Lehrer benötigt neben seinem fachspezifischen Wissen zusätzliche Sach- kompetenz bezüglich des zu bearbeitenden realen Problems sowie die Fähigkeit, geeignete Lernumgebungen zu schaffen, die Schüler zu beraten und deren Lernprozesse zu begleiten. Interpretationen der Schüler müssen ernst genommen werden und dürfen nicht abgewertet werden. Es muss unbedingt vermieden werden, dass „authentische Datenanalyse zum ver- breiteten Unterrichtsspiel entartet, in dem die Lernenden erraten müssen, was die Lehren- den wohl meinen“ (Biehler, 1995a, S. 57). Stattdessen sollen die Schüler lernen, Methoden bewusst auszuwählen und deren Einsatz zu reflektieren. Weiterhin müssen sie eine expe- rimentelle Arbeitshaltung entwickeln, welche im üblichen Statistikunterricht nicht gefor- dert wird. Alles in allem bringt ein explorativer Ansatz zwar auch Schwierigkeiten für den Un- terricht mit sich, aber er bietet deutliche didaktisch-methodische Vorzüge gegenüber der klassischen Statistik. Die EDA trägt nämlich mit ihrer zentralen Orientierung am Sach- problem dazu bei, dass Schüler ein konzeptionelles Verständnis von statistischen Begriffen erlangen und nicht bloß nach Plan vorgegebene Arbeitsschritte abarbeiten, ohne zu verste- hen, warum dies notwendig ist und welche Bedeutungen einzelne Arbeitsschritte haben. Daher sollte in der Schule ein verstärkt explorativer Umgang mit Daten erfolgen. 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 18 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! Vor dem Hintergrund der Entwicklung von Statistik und Explorativer Datenanalyse sowie der Vorteile eines explorativen Umgangs mit Daten in der Schule soll nun der Beg- riff „Datenkompetenz“ genauer betrachtet werden. Zunächst wird eine Definition erarbei- tet, die dieser Arbeit zugrunde gelegt wird und die sich besonders auf die anzustrebenden Fähigkeiten und Fertigkeiten der Schüler in den Klassen 1-6 bezieht. Weiterhin wird aus verschiedensten Perspektiven heraus begründet, warum Schule bereits so früh einen Bei- trag zur Entwicklung und Förderung von Datenkompetenz leisten sollte. 3.1 Was beinhaltet der Begriff „Datenkompetenz“? Biehler und Weber (1995, S. 5) weisen darauf hin, wie schwierig es ist, den Begriff „Datenkompetenz“ bzw. „Data Literacy“ zu beschreiben und verweisen auf ähnlich schwierig zu definierende Begriffe wie „soziale Kompetenz“ oder „Medienkompetenz“: „Von Kompetenz spricht man offensichtlich immer dann, wenn man vor dem Dilemma steht, dass man eine ganze Fülle von Fertigkeiten, Fähigkeiten, Begriffen, Einsichten etc. meint, sich aber kaum in der Lage sieht, dieses alles umfassend zu beschreiben“. Hancock (1995, S. 34) ergänzt, dass sich der Ausdruck „Kompetenz“ (Literacy) auf ein „umfassen- des System von Praktiken, Begriffen und anerkannten Bedeutungen“ bezieht, „das sich erst in vielen Jahren entwickeln kann“. Im Allgemeinen meint man also eine Vielzahl von Fer- tigkeiten, Fähigkeiten, Begriffen, Einsichten, etc., die sich über einen längeren Zeitraum hinweg entwickeln und welche notwendig oder zumindest hilfreich beim sachgerechten Umgang mit Daten sind, wenn man von Datenkompetenz spricht. In Anlehnung an Hancock (1995, S. 33) und Biehler (2001, S. 98), die unter Daten- kompetenz ebenfalls zahlreiche Teilfähigkeiten des Erhebens, Strukturierens, Darstellens und Interpretierens von Daten verstehen, wird im Folgenden der Begriff „Datenkompe- tenz“ erläutert, der besonders die Fähigkeiten und Fertigkeiten jüngerer Schüler in Betracht zieht und an dem sich daher diese Arbeit orientiert. 1) Methoden der Datenerhebung wie Beobachtung, Experiment, Befragung, etc. ken- nen und durchführen können. Den Unterschied zwischen numerischen und katego- rialen Variablen kennen. 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 19 2) Wissen, dass Daten verschieden angeordnet und strukturiert werden können und dass diese Anordnungen unterschiedlichen Nutzens sind, sowie die Fähigkeit, ge- eignete Anordnungen zu finden. 3) Kenntnisse über verschiedene Arten von Darstellungen und Graphen und deren Reichweite: Erzeugen, Lesen und Interpretieren von Graphiken, sowie die geeigne- te Auswahl von Graphiken zur Analyse und Präsentation. Die Fähigkeit, eigene Darstellungen zu erfinden und herzustellen. 4) Nutzen von intuitiven, offenen Begriffen bezüglich Mittelwert, Streuung und Ver- teilungsform; später folgt das Nutzen von statistischen Begriffen (Modalwert, Me- dian, arithmetisches Mittel, Spannweite, glockenförmig,…). Diese Begriffe bei der Verteilungsbeschreibung verwenden und deren Aussagekraft verstehen und richtig interpretieren können. 5) Wissen, dass man unter bestimmten Bedingungen von der Stichprobe auf die Popu- lation schließen kann. 6) Transformation einer allgemeinen Fragestellung in eine statistische Fragestellung; Planung einer Datenanalyse. 7) Geeignete Methoden auswählen und deren Einsatz und Nutzen reflektieren. 8) Interpretation von Darstellungen und Ergebnissen im Sachkontext. 9) Unterscheiden zwischen einer Meinung und einer mit Daten untermauerten Schlussfolgerung; Wissen, dass Daten nur einen Teil der Wirklichkeit abbilden und dass die Ergebnisse zunächst nur für die untersuchten Daten gelten. 10) Fähigkeit, über die Resultate einer Datenanalyse schriftlich und mündlich zu kom- munizieren. 11) Umgang mit einem Softwarewerkzeug zur Datenanalyse. Während die Punkte 6) bis 10) sich auf die Phasen im Prozess der Datenanalyse be- ziehen, zählen die ersten fünf Punkte Teilkompetenzen auf, welche in unterschiedlicher Weise in den verschiedenen Prozessphasen relevant sind. Dass der Umgang mit geeigneter Software zur Datenanalyse (Punkt 11) bereits in den Klassen 1-6 sinnvoll möglich ist und dass bereits solche Software existiert, werde ich in den Kapiteln 6 und 7 näher analysieren. Orientiert man sich an obiger Definition, so muss bereits im Unterricht der Klassen 1-6 sichergestellt werden, dass alle Phasen einer Datenanalyse durchlaufen werden. Zwar 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 20 sind die Prozesse stark vereinfacht, aber dennoch einer auf höherem Niveau durchgeführ- ten Datenanalyse sehr ähnlich. Außerdem macht die Definition deutlich, dass ein propä- deutischer Zugang in den ersten Grundschuljahren favorisiert wird, der sich durch die Verwendung von intuitiven Begriffen und offenen Konzepten auszeichnet, um geeignete Grundvorstellungen aufzubauen. Dieser offenere Ansatz wird im Verlauf der Zeit zuneh- mend durch mathematisch exakte Begriffe und Konzepte ergänzt und schließlich abgelöst. Ziel einer so definierten Datenkompetenz für Schüler der Klassen 1-6 ist der Aufbau einer kritischen Haltung gegenüber datengestützter Argumentationen anderer. Besonders in den Massenmedien werden Graphiken und Statistiken zur Manipulation genutzt. Zahlen und Graphiken nicht blind zu vertrauen, sondern diese kritisch zu durchleuchten, ist damit ein Argument für eine frühe Förderung von Datenkompetenz. 3.2 Argumente für die Förderung von Datenkompetenz in den Klassen 1-6 Im Folgenden werden Gründe für die Behandlung der Datenanalyse in den Klassen 1-6 aufgeführt, die den oft genannten Einwand widerlegen, dass in den unteren Klassen ein gesichertes Verständnis in den mathematischen Teilgebieten Arithmetik und Geometrie zunächst vorrangig sei. Dabei wird zwischen pragmatischen und kulturellen Argumenten, methodisch-didaktischen, formal bildenden und lernpsychologischen Argumenten unter- schieden2. 3.2.1 Pragmatische und kulturelle Argumente „Mathematische Grundbildung ist die Fähigkeit einer Person, die Rolle zu erkennen und zu verstehen, die Mathematik in der Welt spielt, fundierte mathematische Ur- teile abzugeben und sich auf eine Weise mit der Mathematik zu befassen, die den Anforderungen des gegenwärtigen und künftigen Lebens dieser Person als kon- struktivem, engagiertem und reflektierendem Bürger entspricht.“ (Baumert, Klieme, Neubrand, Prenzel, Schiefele, Schneider, Tillmann & Weiß, 2000, S. 2) 2 Die Systematik der Gliederung orientiert sich teilweise an Blum (1996). 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 21 Führt man sich die Definition der mathematischen Grundbildung (mathematical lite- racy) aus der großen internationalen Vergleichsstudie PISA vor Augen, so wird sofort deutlich, dass Datenkompetenz Teil der mathematischen Grundbildung sein muss, denn dass die Mathematik und insbesondere die Statistik einen immer größeren Stellenwert in unserem Leben einnehmen, wird zweifellos bereits sichtbar, wenn man eine Tageszeitung aufschlägt und mit einer Vielzahl von Daten in Form von Tabellen oder Diagrammen kon- frontiert wird. „Zeitungsmeldungen, Grafiken und Schaubilder (…) in ihren Aussagen nicht nur oberflächlich aufzunehmen und als richtig hinzunehmen, sondern derartige In- formationen kritisch zu hinterfragen, zu durchleuchten und anders interpretieren zu kön- nen, scheint mehr denn je notwendig“ (Bönig & Ruwisch, 2004, S. 6), um als mündiger Staatsbürger am öffentlichen Leben und den politischen Debatten unserer Zeit teilnehmen zu können. Außerdem ist der kompetente Umgang mit Daten ein wichtiger Bestandteil vieler Berufe (vgl. Konold & Higgins, 2003, S. 193), was unter anderem auch daran deut- lich wird, dass Statistik das meist unterrichtete Fach an deutschen Universitäten ist (vgl. Gigerenzer & Krauss, 2001, S. 53). Datenkompetenz wird somit zu einer Schlüsselqualifi- kation für mündige Staatsbürger und künftige Arbeitnehmer in unserer Informationsgesell- schaft. Zudem sollen Kinder schon früh den Stellenwert von Mathematik in unserer Welt verstehen und dazu gehört natürlich auch das Teilgebiet Datenanalyse und Statistik. Kinder sollen verstehen, dass Mathematik im Alltag oft versteckt ist, aber einen Teil unserer Kul- tur bildet. 3.2.2 Methodisch-didaktische Argumente Neben dieser Begründung gibt es zudem methodisch-didaktische Argumente, welche für die bewusste Förderung von Datenkompetenz in den unteren Klassen sprechen. Ausge- hend von Datenanalyse und Statistik lassen sich sowohl innermathematische als auch au- ßermathematische Bezüge herstellen (vgl. Konold & Higgins, 2003, S. 193). So kann man zum Beispiel Verbindungen zum Zahlbegriff oder zum Messen herstellen und somit Da- tenanalyse mit Arithmetik bzw. Geometrie verknüpfen. Die Arbeit mit einem Stängel- Blatt-Diagramm und geeigneten Daten kann unter anderem die Einsicht in den Aufbau des dezimalen Stellenwertsystems fördern bzw. vertiefen. Verbindet man Datenanalyse mit anderen Fächern, beispielsweise mit den Naturwissenschaften, so lernen die Schüler laut 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 22 Konold & Higgins (2003, S. 193) mathematische Ideen anzuwenden, um reale Probleme zu lösen. Beispielsweise kann man im Sachunterricht durch Experimente zum Thema „Schwimmen oder Sinken“ Daten sammeln und interpretieren, um die Frage zu beantwor- ten, welche Objekte im Wasser schwimmen und welche sinken. Neben dieser bewussten und offensichtlichen Verknüpfung von Datenanalyse mit anderen Fächern existiert jedoch bei jeder Datenanalyse auch eine für viele eher unbewusste Verbindung zum Bereich Spra- che. Die Sprachentwicklung wird besonders bei der Formulierung von Fragestellungen, der Definition von Variablen, bei der Klassifikation von Daten, zu der man Kategorien sprach- lich korrekt definieren muss, und natürlich auch bei der Kommunikation der Ergebnisse gefördert. Datenanalyse vernetzt somit auf natürliche Weise den Mathematikunterricht mit den Fächern Sprache und Sachunterricht (vgl. Abb. 3.1). Abb. 3.1: Datenanalyse als Vernetzung von Mathematik, Sprache und Sachunterricht Datenanalyse Mathematik SachunterrichtSprache Ein von Anfang an explorativer Umgang mit Daten ermöglicht weiterhin den Einsatz von verschiedensten Methoden, wie beispielsweise Projektunterricht oder das entdeckende Lernen. Solche Methoden tragen dazu bei, dass die Schüler neben fachspezifischem Wis- sen weitere Schlüsselqualifikationen erwerben, was im nächsten Abschnitt weiter ausge- führt wird. 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 23 3.2.3 Formal bildende Argumente Die Schüler erwerben durch komplexe Fragestellungen, die beispielsweise in Projek- ten erarbeitet werden können, zusätzlich allgemeine Qualifikationen (Schlüsselqualifikati- onen) wie etwa die Fähigkeit zum Modellbilden, zum Problemlösen und zum Argumentie- ren und Kommunizieren, was so früh wie möglich Gegenstand des Unterrichts sein sollte. Abbildung 3.2 zeigt ein Modell zum Problemlösen im Kontext eines Datenanalyse- projekts. Bohan, Irby und Vogel (1995, S. 257f.) differenzieren 7 Schritte zur Lösung eines Problems aus der realen Welt: Im ersten Schritt werden mittels eines Brainstormings im Klassenverband für die Schüler relevante Fragen gesammelt. Im zweiten Schritt wählen die Schüler ein Problem aus oder formulieren eine Forschungsfrage, die sie beantworten wol- len. Als nächstes versuchen die Schüler vorauszusagen, welche Ergebnisse ihre Forschung hervorbringen könnte. Das heißt, dass sie Hypothesen generieren und ihre Erwartungen formulieren. Im vierten Schritt entwickeln die Schüler einen Plan um ihre aufgestellten Hypothesen zu überprüfen, wozu neben praktischen Planungen wie Zeitmanagement natür- lich auch die Planung der statistischen Datenanalyse gehört. Die Schüler müssen also die zu erhebenden Variablen sowie die Methode der Datenerhebung auswählen. Nachdem sie im fünften Schritt ihren Plan in die Realität umgesetzt haben, folgt die Analyse und an- schließende Interpretation der gesammelten Daten. Die Frage, ob die Daten die aufgestellte Hypothese unterstützen oder widerlegen steht dabei im Mittelpunkt. Zum Abschluss des Datenanalyseprojekts schauen die Schüler zurück, werden sich klar darüber, was sie ge- lernt haben und überlegen, wie sie ihre Ergebnisse anderen mitteilen können. Zudem kön- nen die Schüler Überlegungen bezüglich statistischer Inferenz anstellen, indem sie sich zum Beispiel fragen, inwieweit ihre Ergebnisse verallgemeinerbar sind. 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 24 Abb. 3.2: Modell zum Problemlösen im Kontext eines Datenanalyseprojekts (Darstellung aus: Bohan et al., 1995, S. 257) Dieses Modell weist offensichtlich alle Phasen eines Datenanalyseprozesses auf, die in Kapitel 2.2 beschrieben wurden. Selbst das mentale Durchlaufen des Datenanalysepro- zesses zu Beginn wird von den Schülern in elementarer Form verlangt. 3.2.4 Lernpsychologische Argumente Wählt man zudem Problemstellungen aus den subjektiven Erfahrungsbereichen der Kinder aus, so führt dies zu einer höheren Motivation und somit zu besseren Lerneffekten. So können statistische Grundvorstellungen ausgebildet werden, die mit Unterstützung der Lehrer weiter ausgebaut und präzisiert werden können. Weiterhin können Schüler im Be- reich der Datenanalyse stark eigenaktiv tätig werden, was nach dem Prinzip learning-by- doing auch zu einem besseren Verständnis der mathematischen Sachverhalte beiträgt. Zu- dem bietet dieses Teilgebiet der Mathematik Gelegenheit zum selbständigen Entdecken mathematischer Strukturen in realen Problemlösekontexten. 3. Bewusste Förderung von Datenkompetenz bereits in den Klassen 1-6?! 25 Kinder auf das Leben in einer Informationsgesellschaft vorzubereiten und sie dazu zu befähigen, ihre Umwelt mit mathematischen Mitteln zu erschließen, ist eine der Hauptauf- gaben der Grundschule und der weiterführenden Schulen. Durch die Behandlung von Da- tenanalyse in den Klassen 1-6 kommt man zudem nicht nur der Forderung nach fächer- übergreifendem und vernetztem Lernen nach, sondern zugleich der nach mehr Anwen- dungs- und Handlungsorientierung im Mathematikunterricht. Da das Mathematisieren von Situationen und Problemen nicht in einem „Kurzlehr- gang“ erlernt werden kann, bedarf es dazu „jahrelanger Bemühungen“ (Winter, 1976, S. 23). Gleiches gilt für den Aufbau tragfähiger Grundvorstellungen unter anderem aus dem Bereich der Datenanalyse. „Der Lernbereich Stochastik sollte in der Grundschule kein ei- genständiges Stoffgebiet darstellen, sondern primär als ein Aspekt (als Unterrichtsprinzip) den gesamten Mathematikunterricht durchziehen“ (Winter, 1976, S. 33). Die Förderung der Datenkompetenz von Schülern aller Jahrgangsstufen ist also dringend notwendig und dieses Unterrichtsthema sollte „im Sinne eines Spiralcurriculums immer wieder aufgegrif- fen und vertieft werden“ (Bönig & Ruwisch, 2004, S. 6). Datenanalyse soll also nach dem Prinzip des vorwegnehmenden Lernens und nach dem Prinzip der Fortsetzbarkeit gelehrt werden. Was Heinrich Winter schon 1976 forderte, wurde 1989 vom National Council of Teachers of Mathematics (NCTM) erstmals in Form eines Standards in Statistik und Wahr- scheinlichkeit für alle Schulstufen festgehalten. Da der Bereich der Datenanalyse für sich auch bereits in den unteren Jahrgängen einen Eigenwert hat, wie durch die Argumentation dargelegt werden sollte, werden im folgenden Kapitel die aktuellen NCTM-Standards 2000 aus dem Bereich der Datenanalyse ausführlich vorgestellt und es wird der Frage nachge- gangen, inwiefern dieser Standard mit den nationalen Bildungsstandards in Deutschland und den hessischen Curricula vereinbar ist. 4. Prinzipien und Standards der Datenanalyse 26 4. Prinzipien und Standards der Datenanalyse 1989 wurden erstmals sich über alle Klassenstufen hinweg erstreckende Standards zur Datenanalyse und Wahrscheinlichkeit vom National Council of Teachers of Mathema- tics in Amerika und Kanada eingeführt und zuletzt im Jahr 2000 in überarbeiteter Form erneut publiziert. Der National Council of Teachers of Mathematics (NCTM) wurde 1920 gegründet und ist eine Bildungsorganisation mit fast 100.000 Mitgliedern in den USA und Kanada, die es zum Ziel hat, das Lehren und Lernen von Mathematik zu verbessern. Die NCTM-Standards 2000 enthalten inhaltsorientierte und prozessorientierte Stan- dards. Die fünf Inhaltsstandards sind „Zahlen und Operationen“, „Algebra“, „Geometrie“, „Messen“ sowie „Datenanalyse und Wahrscheinlichkeit“. Sie geben also an, welche Inhal- te der Mathematikunterricht aufgreifen sollte, während die Prozessstandards beschreiben, auf welche Weise die Schüler ihr Wissen erwerben sollten. Zu den Prozessstandards gehö- ren das Problemlösen, das rationale Begründen und Beweisen, das Kommunizieren, das Aufstellen von Beziehungen und das Darstellen von Wissen (vgl. NCTM, 2002, S. 2). In Deutschland wurden erst kürzlich nationale Bildungsstandards von der Kultusmi- nisterkonferenz (KMK) entwickelt, die sich auf das Fach Mathematik beziehen. Diese Bil- dungsstandards greifen allgemeine Bildungsziele auf und legen Kompetenzen fest, die Schüler bis zu einer bestimmten Jahrgangsstufe im Fach Mathematik erworben haben soll- ten, wozu auch Aspekte der Datenanalyse gehören. Sie lösen jedoch nicht die Lehrpläne der einzelnen Schulstufen ab, sondern ergänzen diese und zielen auf eine verbesserte Ver- gleichbarkeit der Schülerleistungen ab. Die nationalen Bildungsstandards in Deutschland sind verbindlich, während die NCTM-Standards lediglich unverbindliche Richtlinien dar- stellen, die von einigen Bundesstaaten der USA sogar explizit abgelehnt werden. Im Folgenden werden die NCTM-Standards 2000 aus dem Bereich der Datenanalyse für die Klassen K-6 zunächst allgemein vorgestellt und danach altersspezifisch konkreti- siert. Es werden also für die jeweilige Altersstufe vom NCTM als geeignet eingestufte sta- tistische Begriffe, Methoden und Darstellungsformen dargelegt. Schließlich werden die Standards des NCTM aus dem Jahr 2000 mit den hessischen Curricula und deutschen Bil- dungsstandards verglichen, um zu erkennen, ob diese vergleichbar mit den amerikanischen Standards sind oder eine andere Akzentuierung setzen. 4. Prinzipien und Standards der Datenanalyse 27 4.1 Die NCTM-Standards 2000 zur Datenanalyse3 Der Standard zur Datenanalyse des NCTM besagt, dass von der Vorschule bis zur Klasse 12 alle Schüler in altersangemessener Weise dazu befähigt werden sollen, „Fragen zu formulieren, die mit Daten angegangen werden können und relevante Daten so zu sam- meln, zu organisieren und darzustellen, dass die Fragen beantwortet werden können“ (NCTM, 2001, S. 11). Zudem sollen die Schüler lernen, geeignete statistische Methoden auszuwählen und einzusetzen, um Daten zu analysieren, sowie auf Daten basierende Schlussfolgerungen und Vorhersagen herzuleiten und zu bewerten (vgl. NCTM, 2001, S. 11). Datenanalyse soll also nicht, wie in vielen anderen Ländern üblich, den mittleren und oberen Klassenstufen vorbehalten sein, sondern soll ein Unterrichtsprinzip sein, dass sich durch alle Schulstufen hindurchzieht. Begründet wird dieser Standard mit dem enorm hohen Stellenwert, den Daten und Statistiken heute im öffentlichen Leben und in der Arbeitswelt einnehmen. Grundkenntnis- se aus den Bereichen der Datenanalyse und Wahrscheinlichkeitsrechnung sind notwendig, um statistisch argumentieren zu können, welches eine Fertigkeit ist, die für „informierte Staatsbürger und intelligente Konsumenten“ (NCTM, 2001, S.11) unabdingbar ist. Daher sollte man bereits ab dem Kindergarten statistische Verfahren und Konzepte anbahnen, die mit den Klassenstufen zunehmend anspruchsvoller werden (vgl. NCTM, 2001, S. 11-12). Um grundlegende Ideen der Statistik und Datenanalyse zu verstehen, müssen die Schüler direkt mit realen Daten umgehen und dabei gleichzeitig neue Ideen und Verfahren kennen lernen. Auf den verschiedensten Klassenstufen bieten sich dabei sowohl innerma- thematische Bezüge, als auch Verbindungen zu anderen Schulfächern an: „Der Strang über Daten und Statistik erlaubt Lehrenden, Schülerinnen und Schülern eine Reihe von Verbindungen zu mathematischen Ideen und Vorgehensweisen aus anderen Gebieten herzustellen, wie z.B. zum Zahlbegriff, Meßbarkeitsfragen und Problemen aus Algebra und Geometrie. Das Arbeiten im Bereich Datenanalyse und Wahrscheinlichkeit bietet natürliche Möglichkeiten für Schülerinnen und Schüler, mathematisches Wissen mit anderen Schulfächern und mit ihren Erfahrungen im täglichen Leben zu verbinden und zu vernetzen“ (NCTM, 2001, S. 12). 3 Im Folgenden wird aus der deutschen Übersetzung der NCTM-Standards zitiert: National Council of Teachers of Mathematics (2001). Prinzipien und Standards für Schulmathematik: Daten- analyse und Wahrscheinlichkeit. (Übersetzt von Christine Bescherer und Joachim Engel, Ludwigs- burg). In M. Borovcnik/ J. Engel/ D. Wickmann (Hrsg.), Anregungen zum Stochastikunterricht: Die NCTM-Standards 2000. Klassische und Bayessche Sichtweise im Vergleich (S. 11-42). Hildesheim, Berlin: Franzbecker Verlag. 4. Prinzipien und Standards der Datenanalyse 28 Außerdem lernen die Schüler beim Umgang mit Daten, dass die Lösung zu manchen Problemen von den getroffenen Annahmen abhängt und eine gewisse Unsicherheit in sich birgt (vgl. NCTM, 2001, S. 12), was für viele Schüler nicht selbstverständlich ist, da die meisten nur Mathematikaufgaben mit genau einer richtigen Lösung kennen. Fragen stellen und entsprechende Daten erheben, aufbereiten und darstellen Da kleine Kinder häufig Fragen über Gegenstände, Personen, etc. aus ihrer subjekti- ven Erfahrungswelt stellen, etwa „Welche Haustiere haben die Klassenkameraden?“ (NCTM, 2001, S. 12), bieten solche Fragen die Gelegenheit, in die Untersuchung von Da- ten einzusteigen. Je höher die Klassenstufe, umso komplexere Themen und Problemberei- che können thematisiert werden (vgl. NCTM, 2001, S. 12). In der Primarstufe können die Kinder einfache Pläne zur Datensammlung entwerfen und die Lehrer können die Kinder unterstützen, indem sie etwa beim Formulieren einer geeigneten Fragestellung helfen oder eine Tabelle vorbereiten, auf der die Daten festgehal- ten werden können. Die Daten selbst können aber auch reale Objekte sein, wie etwa die Schuhe der Kinder (vgl. NCTM, 2001, S. 12), die der Größe nach angeordnet werden kön- nen. Die Kinder selbst können aber auch Daten repräsentieren, indem sie sich nach Interes- sensgebieten gruppiert aufstellen, um eine Verteilung zu visualisieren. Sobald die Kinder die Primarstufe verlassen, sollen sie mehr Zeit für die Planung der Datenerhebung aufwen- den und abschließend auch bewerten, ob ihre Methoden geeignet sind, um diejenigen Da- ten zu sammeln, die zur Beantwortung der Fragestellung dienen. Zudem soll beginnend in den mittleren Klassenstufen zunehmend mit Archivdaten, also mit bereits existierenden Datensätzen, gearbeitet werden (vgl. NCTM, 2001, S. 12). „Eine grundlegende Idee von der Vorschule bis zur Klasse 2 ist die Vorstellung, dass Daten aufbereitet und angeordnet werden können und dass dieses „Bild“ der Daten Infor- mationen über das untersuchte Phänomen oder die Ausgangsfrage liefert“ (NCTM, 2001, S. 12). In den Klassen 3-5 sollen die Schüler unterschiedliche graphische Darstellungsfor- men wie etwa Säulendiagramme, Tabellen oder eindimensionale Streudiagramme kennen lernen und sie sollen verstehen, was unterschiedliche Zahlen, Symbole oder Punkte in den einzelnen Darstellungen bedeuten. Das Lesen und Verstehen der einzelnen Darstellungs- formen soll in den Klassen 5-6 vertieft werden, so dass die Schüler dazu befähigt werden, die Effektivität verschiedener Darstellungsformen zu vergleichen, indem sie etwa die Da- 4. Prinzipien und Standards der Datenanalyse 29 ten einem Publikum präsentieren oder sie zu einer weiteren Analyse erneut aufbereiten. Sobald die Datensätze größer werden, kann auf Statistik-Software zurückgegriffen werden, um den Schwerpunkt der Arbeit auf die Analyse und Interpretation der Daten und ihrer Darstellungen zu verlagern (vgl. NCTM, 2001, S. 12-13). Außerdem sind laut NCTM die Schüler, sobald sie verschiedene graphische Darstel- lungsformen kennen, also bereits in den Klassen 3-5, dazu in der Lage, zwei oder mehrere Datensätze miteinander zu vergleichen (vgl. NCTM, 2001, S. 13). Dieser angebliche Au- tomatismus gestaltet sich in der Realität allerdings wesentlich komplizierter, da beim Ver- gleich zweier Datensätze verschiedenste Faktoren zu berücksichtigen sind. Wenn die Gruppengrößen nicht übereinstimmen, erfordert ein verlässlicher Vergleich das Arbeiten mit relativen Häufigkeiten, welche aber in den Klassen 1-5 noch nicht eingeführt sind. Folglich müsste sich der Vergleich auf Datensätze gleicher Größe beschränken, wenn man keine alternativen Methoden zum statistischen Vergleich zulässt. Außerdem müssen zu- nächst Kriterien entwickelt werden, anhand welcher man zwei Datensätze überhaupt mit- einander vergleichen kann. Dazu gehören die Verteilungsform, sowie das Verwenden von Lage- und Streumaßen. Nur in Spezialfällen ist ein optischer Vergleich ohne explizite Verwendung von Lage- und Streumaßen möglich, etwa wenn der eine Datensatz ein Viel- faches des anderen Datensatzes ist und folglich optisch verschoben ist. Damit sei zunächst darauf hingewiesen, dass sich die Fähigkeit, einen gültigen statis- tischen Vergleich zu ziehen, sich nicht automatisch mit der Verwendung verschiedener Datensätze entwickelt, sondern dass diese Fähigkeit schrittweise erlernt werden muss. Das Problem des Vergleichs von Datensätzen wird in Kapitel 7, Abschnitt 7.7 ausführlich dis- kutiert und es werden Hinweise gegeben, wie man mit Hilfe von alternativen Methoden selbst in den unteren Klassen Datensätze ungleichen Umfangs miteinander vergleichen kann (vgl. Abschnitt 7.7). Schon der Vergleich der Effektivität zweier verschiedener Darstellungsformen eines Datensatzes scheint selbst für Schüler höherer Klassen problematisch zu sein. Beispiels- weise berichten Biehler & Steinbring (1991, S. 16), dass den Schülern einer 8. Klasse „die Beziehungen zwischen verschiedenen Graphiken keineswegs unmittelbar klar“ sind, son- dern dass diese eigens zum Thema gemacht werden müssen und dass „die neuen Darstel- lungen mit ihren spezifischen Leistungen und Schwächen im Kontext der alten“ deutlich gemacht werden müssen. Zudem brauchen die Schüler der unteren Klassen zunächst Wis- sen über Auffälligkeiten in Daten, um überhaupt beschreiben zu können, welche Darstel- lungsform welche Besonderheiten des Datensatzes hervorhebt. 4. Prinzipien und Standards der Datenanalyse 30 Geeignete statistische Methoden zur Datenanalyse auswählen und einsetzen Während Kinder in den Schulstufen K-2 überwiegend Interesse an den eigenen Da- ten im Graph zeigen, also an einzelnen Teildaten, soll durch das Zusammenbringen aller Daten in einer graphischen Darstellung die Aufmerksamkeit auf den gesamten Datensatz gezogen werden. Schrittweise sollen die Schüler lernen, den Datensatz als Ganzes zu sehen und zu beschreiben. In den Klassen 3-5 sollen die Schüler ein Verständnis für aggregierte Daten entwickeln. Sobald die Verteilung als Ganzes wahrgenommen wird, benötigen die Schüler statistische Kennwerte, darunter sowohl Lagemaße wie z.B. den Modalwert oder den Median, als auch Streumaße wie die Spannweite. Weiterhin sind Kenntnisse über ver- schiedene Verteilungsformen hilfreich, um Datensätze zu beschreiben. Während in der Grundschule informelle Ideen und Vorstellungen, wie etwa von der Mitte oder dem Zent- rum, für das Verständnis genügen, so sollen die Schüler in der Sekundarstufe zunehmend selbst geeignete zusammenfassende Statistiken auswählen (vgl. NCTM, 2001, S. 13). Zudem sollen die Schüler in ihrer Schulzeit lernen, was es heißt, gültige statistische Vergleiche zu ziehen. Beginnend in den Klassen 3-5 soll der Schwerpunkt sich von der Analyse eines Datensatzes zum Vergleich zweier oder mehrerer Datensätze verlagern. Im Laufe der Mittelstufe benötigen die Schüler dazu mehr Hilfsmittel, genauer gesagt neue graphische Darstellungsformen, wie zum Beispiel das Histogramm oder das Stängel-Blatt- Diagramm (vgl. NCTM, 2001, S. 13). Auf Daten basierende Schlussfolgerungen und Vorhersagen herleiten und bewerten Die Schüler der unteren Klassenstufen arbeiten oft mit den Daten einer Totalerhe- bung. Sie erheben beispielsweise die Lieblingseiscreme aller Kinder in der Klasse und un- tersuchen diesen Datensatz. Die Vorstellung, dass die Klasse als Stichprobe einer größeren Gesamtpopulation, wie beispielsweise der Schule oder der gesamten Kinder dieser Alters- stufe im Land, angesehen werden kann, ist in diesen Klassen nicht selbstverständlich und die Idee der Stichprobe erscheint den Kindern als kompliziert. Da die Entwicklung einer Vorstellung von statistischer Inferenz sehr anspruchsvoll ist, kann eine Behandlung dieser Thematik in den Klassen 5-8 beginnen und sollte in den Klassen 9-12 fortgesetzt werden (vgl. NCTM, 2001, S. 13-14). Das Problem der statistischen Inferenz wird eigens in Kapi- tel 8 aufgegriffen (vgl. Kapitel 8). 4. Prinzipien und Standards der Datenanalyse 31 4.1.1 Standard für die Klassen Pre-K-2 Fragen stellen und entsprechende Daten erheben, aufbereiten und darstellen Vom Kindergarten bzw. von der Vorschule bis zur 2. Klasse sollen die Kinder erfah- ren, dass der Hauptzweck des Sammelns von Daten darin besteht, Fragen zu beantworten, die nicht unmittelbar offensichtlich sind. Die natürliche Neigung der Kinder, Fragen zu stellen, muss hierbei gefördert werden, so dass mit Hilfe der Lehrenden dann Wege entwi- ckelt werden können, um Informationen zur Beantwortung der Fragestellung zu sammeln. Anhand der erhobenen Daten lernen die Schüler, wie man Entscheidungen basierend auf den Daten treffen kann (vgl. NCTM, 2001, S. 15-16). Ausgangspunkt jeder Datenanalyse soll also eine für die Kinder bedeutsame Fragestellung sein, die gegebenenfalls noch ver- feinert werden muss, um die benötigten Informationen zu erhalten. Ist eine statistische Fragestellung gefunden, so muss im nächsten Schritt die Daten- erhebung geplant werden. „Datenuntersuchungen können Schülerinnen und Schüler ermu- tigen, sich mit Zählproblemen auseinanderzusetzen, die bei allen Datenerhebungen funda- mental sind: Wen zähle ich? Wie kann ich mir sicher sein, dass ich jedes Datum einmal und nur einmal gezählt habe?“ (NCTM, 2001, S. 18)4. Lernen die Kinder durch vielfältige Aktivitäten verschiedene Methoden der Datener- hebung kennen und sammeln Daten über sich selbst und ihre Umwelt, so stellt sich im Fol- genden die Frage, wie man die Daten oder Objekte entsprechend ihrer Eigenschaften sor- tiert und klassifiziert. Hierbei kann der Lehrer an ein breites Vorwissen anknüpfen, wel- ches durch alltägliche, vorschulische Ordnungserfahrungen geprägt ist. Beim Einräumen von Lebensmitteln zusammen mit den Eltern wird durch die begleitenden Gespräche die Aufmerksamkeit der Kinder auf die Merkmale der Gegenstände gelenkt, so dass sie ein Verständnis für die Zusammengehörigkeit von Dingen entwickeln. Kinder beginnen, Ob- jekte bzw. Daten in Kategorien einzuteilen und erweitern dadurch gleichzeitig ihren Wort- schatz zur Beschreibung von Merkmalen und zur Einordnung von Gegenständen nach Kri- terien. Man erkennt, dass Sprachentwicklung und vorschulische Lernerfahrungen zusam- menwirken. Ziel ist es, dass am Ende des zweiten Schuljahres Objekte mit zwei Merkma- len gleichzeitig sortiert und klassifiziert werden können (vgl. NCTM, 2001, S. 16). 4 Dieser Aspekt wurde im Standard unter der Überschrift „Geeignete statistischen Methoden zur Datenanaly- se auswählen und einsetzen“ aufgeführt, aber hier unter „Fragen stellen und entsprechende Daten erheben, aufbereiten und darstellen“ eingeordnet, da dieser sich unmittelbar auf die Datenerhebung bezieht. 4. Prinzipien und Standards der Datenanalyse 32 Zudem sollen die Schüler bis zur 2. Klasse lernen, dass die Aufbereitung und Dar- stellung der Daten von der zu beantwortenden Frage abhängt. Die Repräsentation der Da- ten erfolgt über konkrete Objekte, über Bilder oder über Graphen. Stellt man zum Beispiel die Frage nach dem Lieblingsgetränk in der Schulcafeteria, so können reale Objekte, wie Milch- oder Safttüten eingesammelt, sortiert und ausgestellt werden. Bilder von Objekten, Zählmarken, Namenskärtchen oder Strichlisten sind weitere Möglichkeiten, um Vorlieben anzuzeigen. Dass sich die Art der Aktivitäten, die Vorschulkinder im Vergleich zu Zweit- klässlern benötigen, unterscheidet, wird am folgenden Beispiel deutlich (vgl. NCTM, 2001, S. 16-17): Die Anzahl der Taschen an den Kleidungsstücken der Schüler soll ermit- telt werden. Kinder der untersten Klassenstufe befragen ihre Mitschüler und sammeln Da- ten, indem sie die Namen auflisten und dann die Zahl der Taschen hinter dem Namen ver- merken. Im Klassenverband wird dann gemeinsam ein großes Balkendiagramm (um 90° im Uhrzeigersinn gedrehtes Säulendiagramm) erstellt, welches die Anzahl der Taschen eines jeden Schülers wiedergibt. Die Länge der Balken verdeutlicht die Anzahl der Ta- schen (vgl. Abbildung 4.1). Da jedem Fall genau eine Merkmalsausprägung zugeordnet wird, bezeichnen Konold & Higgins (2003, S. 199) diese Graphiken als „Case-Value Plots“. 4. Prinzipien und Standards der Datenanalyse 33 Abb. 4.1: Case-Value Plot der Anzahl der Taschen der Kindergartenkinder Collection 1 Yolanda Victor Wendy Sam Robert Quinton Paula Octavio Nicki Mark Lynda Keith Ian Hannah Gertrude Fred Eleanor Donald Christine Barbara Anthony 0 2 4 6 8 10 St ud en t Number_of_Pockets Value Bar Horizontal (Darstellung wie bei: NCTM, 2001, S.16) „Im zweiten Schuljahr könnten sich die Schülerinnen und Schüler jedoch auch ent- scheiden, die Zahl der Personen zu zählen, die eine bestimmte Anzahl von Taschen haben“ (NCTM, 2001, S.17). Diese Vorgehensweise unterscheidet sich von der der untersten Klassen, da die Daten nicht alphabetisch wie oben, sondern nach Anzahl der Taschen gruppiert wurden. Diese Methode der Sammlung und Aufbereitung der Daten kann dann in eine Darstellung durch ein eindimensionales Streudiagramm münden (vgl. Abb.4.2). 4. Prinzipien und Standards der Datenanalyse 34 Abb. 4.2: Eindimensionales Streudiagramm der Anzahl der Taschen Collection 1 0 2 4 6 8 10 0 5 co un t Number_of_Pockets Circle Icon Diese beiden Graphen unterscheiden sich deutlich bezüglich der Komplexität, da die Zahlen in den einzelnen Diagrammen unterschiedlich interpretiert werden müssen. Wäh- rend der Case-Value Plot aus Abbildung 4.1 jedem Fall bzw. jedem Schüler genau einen Wert, nämlich die Anzahl der Taschen, zuordnet, werden im eindimensionalen Streudia- gramm (Abb. 4.2) die Anzahl der Schüler (absolute Häufigkeit) dargestellt, die eine be- stimmte Anzahl von Taschen an ihren Kleidungsstücken besitzen. Im Vergleich zum Histogramm wird aber im eindimensionalen Streudiagramm noch jeder einzelne Schüler durch einen Punkt repräsentiert, so dass von den Schülern zumindest noch jeder einzelne Fall genau identifiziert werden kann. Die optisch eindeutige Zuordnung im Case-Value Plot, bei dem ungruppierte Daten geplottet werden, ist für Kinder sicherlich zunächst ein- facher zu verstehen, da jeder individuelle Fall sofort wieder zu erkennen ist und diesem Fall genau ein Wert zugeordnet wird. Allerdings wird im obigen Beispiel der Anzahl der Taschen an Kleidungsstücken nicht die Sortierung nach Größe im Balkendiagramm empfohlen, so dass der Case-Value Plot zu mehr als nur zum Ablesen einzelner Werte dienen könnte. Es wird auch nicht her- ausgestellt, dass durch diese Sortierung ein Übergang vom Case-Value Plot zum eindimen- sionalen Streudiagramm erleichtert werden könnte. Wird eine bestimmte Fragestellung in Gruppenarbeit bearbeitet, so sollten die ver- schiedenen Darstellungen der Schüler in der Klasse „besprochen, diskutiert und bewertet werden, da sich daran das Verständnis der Lernenden zeigt“ (NCTM, 2001, S. 17). So können zum Beispiel auch irreführende Darstellungen von Daten enttarnt und verbessert werden. In einer ersten Klasse wurden zum Beispiel Herzen verschiedener Größe gebastelt, 4. Prinzipien und Standards der Datenanalyse 35 um anschließend die Anzahl der jeweiligen Herzen zu bestimmen. Dazu mussten die ge- bastelten Herzen der Größe nach geordnet werden. Das erste Piktogramm in Abbildung 4.3 (a) erweckte fälschlicherweise bei den Schülern den Eindruck, dass große Herzen am häu- figsten gebastelt wurden. Ein Klassengespräch lenkte die Aufmerksamkeit der Schüler auf die Anzahl und die Größe der Herzen in der Darstellung, so dass der ursprüngliche Graph revidiert wurde, um die Daten exakter darzustellen. Gleichzeitig machten die Schüler erste Erfahrungen mit verschiedenen Skalierungen (vgl. NCTM, 2001, S. 17-18). Abb. 4.3: Piktogramme mit unterschiedlich (a) und gleich großen Icons (b) im Vergleich (Darstellung aus: NCTM, 2001, S.17) „Sobald die Schülerfragen komplizierter und ihre Datenmengen größer werden, soll- te die Verwendung traditioneller Darstellungsformen zunehmen“ (NCTM, 2001, S. 15). Am Ende des zweiten Schuljahres sollten die Schüler mit Darstellungen wie Strichlisten, Tabellen, Balkendiagrammen und eindimensionalen Streudiagrammen vertraut sein und diese einsetzen können. Zudem sollten ihre Graphiken klar bezeichnet sein, so dass auch Außenstehende die Repräsentation verstehen können. „Wenn Schüler mit Zahlenmaterial arbeiten, sollen sie anfangen, die Bedeutung verschiedener Zahlen zu unterscheiden – sol- che, die Werte repräsentieren („Ich habe vier Personen in meiner Familie“) und solche, die Häufigkeiten darstellen, d.h. wie oft ein Wert in einem Datensatz vorkommt („Neun Kin- der haben vier Personen in ihren Familien“)“ (NCTM, 2001, S. 15). 4. Prinzipien und Standards der Datenanalyse 36 Geeignete statistische Methoden zur Datenanalyse auswählen und einsetzen Beim Gespräch über die Repräsentationen und die darin enthaltenen Informationen über die Daten sollen die Lehrenden die Schüler ermutigen, „Teile der Daten zu verglei- chen („Die gleiche Anzahl von Kindern hat Hunde wie Katzen“) und Aussagen über die Daten als Ganzes zu machen („Die meisten Kinder in der Klasse haben nur zwei Zähne verloren“)“ (NCTM, 2001, S. 18). Wie genau dies im Unterricht umgesetzt werden kann wird vom NCTM an dieser Stelle nicht erläutert und wird daher im Kapitel 6 und 7 näher analysiert (vgl. Kapitel 6-7). Auf Daten basierende Schlussfolgerungen und Vorhersagen entwickeln und bewerten Wie bereits erwähnt, ist das Gebiet der statistischen Inferenz fortgeschritteneren Schülern, also den Klassen 5-8, vorbehalten, da die Forschung gezeigt hat, dass die Ent- wicklung eines angemessenen Begriffsverständnisses von Stichprobe und Population für Kinder in den unteren Klassen schwierig ist. Dennoch kann eine informelle erste Annähe- rung an dieses Thema geschehen, indem Lehrende offene Gespräche darüber anregen, ob zum Beispiel die Kinder der Parallelklasse zu einem ähnlichen Ergebnis kämen oder nicht, wenn sie in ihrer Klasse eine Erhebung zum selben Thema durchführen würden. Die Wahrscheinlichkeit bzw. Unwahrscheinlichkeit von Ereignissen aus der Erfahrungswelt der Schüler kann somit thematisiert werden. Derartige Diskussionen sind Vorläufer des Verstehens von Schlussfolgerungen aus einer Stichprobe (vgl. NCTM, 2001, S. 15, 18). 4.1.2 Standard für die Klassen 3-5 Fragen stellen und entsprechende Daten erheben, aufbereiten und darstellen Während in den Klassen K-2 die Lehrenden die Schüler im gesamten Datenanalyse- prozess unterstützen können, sollen die Schüler in den Klassen 3-5 bereits lernen, Untersu- chungen zur Beantwortung von Fragestellungen zunehmend selbständig zu entwerfen. Als Unterrichtsmethode wird das Projekt vorgeschlagen, in welchem Schüler zu Eigenaktivität angehalten werden (vgl. NCTM, 2001, S. 20). 4. Prinzipien und Standards der Datenanalyse 37 Werden keine Archivdaten verwendet, die beispielsweise über das Internet erhältlich sind, so müssen die Schüler entscheiden, welche Methode der Datenerhebung bezüglich der gewählten Fragestellung angebracht ist, wobei sie im Wesentlichen das Experiment, die Beobachtung oder die Umfrage bereits kennen sollten. Im weiteren Verlauf der Pla- nungsphase müssen die Schüler „oft ihre Fragen verfeinern und sich Aspekte des Daten- sammelns überlegen wie z.B. die genaue Formulierung von Fragen, wen sie fragen, wann sie beobachten, was und wie sie messen und wie sie ihre Daten aufzeichnen“ (NCTM, 2001, S. 20-21). Werden schon bestehende Datensätze verwendet, dann muss trotzdem die Art, wie die Daten erhoben wurden, berücksichtigt werden. Den Schülern soll dabei be- wusst werden, dass die Methode der Datenerhebung die Art des Datensatzes beeinflusst (vgl. NCTM, 2001, S. 20-21). Weiterhin sollen die Schüler dieser Klassenstufen vertraut werden mit einer Vielfalt von Darstellungen, wie zum Beispiel Tabellen oder Graphiken wie eindimensionalem Streudiagramm, Säulendiagramm und Balkendiagramm. Dies geschieht, indem die Schüler eigene Diagramme unter Beobachtung der Lehrenden erstellen oder bereits vorhandene Darstellungen aus Zeitschriften, Zeitungen, etc. betrachten und analysieren. Um jedoch geeignete Darstellungen auswählen zu können, müssen die Schüler den Unterschied zwi- schen numerischen und kategorialen Daten verstehen und lernen, dass für die beiden Da- tentypen unterschiedliche Repräsentationsmöglichkeiten existieren. Die Schüler sollen erfahren, dass unterschiedliche Kategorisierungen gegebenenfalls unterschiedliche Sicht- weisen wiedergeben. „Beim Erstellen von Graphen geordneter numerischer Daten müssen sie erkennen, was die Werte entlang der horizontalen und vertikalen Achse darstellen“ (NCTM, 2001, S. 21). In den Klassen 3-5 soll bereits Computer-Software zum Sortieren, Aufbereiten und Darstellen der Daten eingesetzt werden, da zum Beispiel graphische Software oder Tabel- lenkalkulationsprogramme es ermöglichen, große Datensätze zu bearbeiten und eine Viel- zahl an Graphen zu erstellen, die miteinander verglichen und bewertet werden können (vgl. NCTM, 2001, S. 21). Die Schüler lernen dadurch, dass sich durch verschiedene Darstel- lungen auch verschiedene Aspekte und Muster in den Daten hervorheben lassen. 4. Prinzipien und Standards der Datenanalyse 38 Geeignete statistische Methoden zur Datenanalyse auswählen und einsetzen In den Klassen 3-5 entwickeln die Schüler die Fähigkeit, einen Datensatz als Ganzes wahrzunehmen und nicht nur einzelne Aspekte, meist ihre eigenen Daten, zu sehen. Bei der Beschreibung eines geordneten numerischen Datensatzes sollen die Schüler wichtige Charakteristika erkennen können: „Wo sind die Daten konzentriert oder geklumpt? Gibt es Werte, für die es keine Daten gibt, oder Datenpunkte mit ungewöhnlichen Werten?“ (NCTM, 2001, S.21). Durch die Diskussion der Verteilungsform und anderer Merkmale lernen die Schüler Begriffe wie Spannweite und Ausreißer kennen, mit deren Hilfe sie Da- tensätze beschreiben können (vgl. NCTM, 2001, S. 21-22). Während in den Klassen K-2 einzelne Verteilungen beschrieben und interpretiert werden, so soll sich die Arbeit mit Daten in den Klassen 3-5 hauptsächlich auf den Ver- gleich von Datensätzen konzentrieren. Da ein Vergleich von Datensätzen allerdings genau- ere Beschreibungen und zusammenfassende Statistiken erfordert, kann in diesem Kontext allmählich die Vorstellung von „typischen“ oder durchschnittlichen Werten entwickelt werden. „Aufbauend auf ihrem propädeutischen Verständnis von „der meiste“ und „der mittlere“ Wert“ (NCTM, 2001, S. 22) lernen die Schüler drei Mittelwerte kennen, nämlich den Modalwert, den Median und das arithmetische Mittel. Wichtig ist hierbei, dass die Schüler mehr lernen, als den jeweiligen Kennwert zu bestimmen. „Sie sollen ein Verständ- nis dafür entwickeln, was z.B. der Median über die Daten verrät, und was dieser Wert im Kontext anderer Charakteristika der Daten bedeutet“ (NCTM, 2001, S. 22). Sobald die Kinder den Modalwert und insbesondere den Median angemessen in ihre Datenanalyse mit einbeziehen, können sie in der 5. Klasse damit beginnen, die Schwerpunkteigenschaft des arithmetischen Mittels in kleinen Datensätzen zu entdecken. Da die Interpretation des a- rithmetischen Mittels als numerische Zusammenfassung und Reduktion der Daten im Zu- sammenhang der gesamten Verteilung sehr komplex ist, wird geraten, die Betrachtung in den weiteren Klassenstufen fortzusetzen und zu vertiefen (vgl. NCTM, 2001, S. 23). Welche Eigenschaften der jeweiligen Kennwerte genau die Kinder erfassen sollen und wie sie etwa die Schwerpunkteigenschaft des arithmetischen Mittels erkunden können, wird in den Standards nicht erläutert und bedarf daher einer genaueren Analyse im Kapitel 7 (vgl. Kapitel 7). 4. Prinzipien und Standards der Datenanalyse 39 Auf Daten basierende Schlussfolgerungen und Vorhersagen entwickeln und bewerten „Beim Diskutieren von Datenerhebungen zu einer speziellen Frage, lernen die Schü- lerinnen und Schüler zu unterscheiden zwischen dem, was die Daten explizit zeigen und möglichen Ursachen zur Erklärung der beobachteten Resultate“ (NCTM, 2001, S. 23). Die Schüler lernen zwischen den Ergebnissen der Datenanalyse und den daraus generierten Hypothesen, die diese Ergebnisse möglicherweise erklären könnten, zu differenzieren. Die Hypothesen können dann durch weitere Untersuchungen geprüft werden, in denen eventu- ell noch weitere Daten gesammelt werden müssen. Folgendes Beispiel illustriert diesen Prozess (vgl. NCTM, 2001, S. 23): In einer vierten Klasse wurde das Schlafverhalten von Erstklässlern mit dem von Fünftklässlern verglichen und nach Beschreibung der Verteilung festgestellt, dass die Erstklässler einen festeren Schlaf haben (vgl. Abb. 4.4). Die Schüler entwickelten die Hypothese, dass Erstklässler ein höheres Aktivitätsniveau haben, weil sie häufig im Freien spielen und dies zu einem tieferen Schlaf führt. „Sie stellten fest, dass sie Daten über einen typischen Tag von Erst- und Fünftklässlern erheben müssten, um ihre Hypothese zu untersuchen“ (NCTM, 2001, S. 23). Abb. 4.4: Schülerstudie zum Schlafverhalten von Erst- und Fünftklässlern (Darstellung aus: NCTM, 2001, S.23) Außerdem eignet sich dieses Beispiel, um das Verständnis von Datensätzen als Stichprobe einer größeren Population weiterzuentwickeln. Die Schüler können verschiede- ne Stichproben derselben Population betrachten, also weitere Klassen ihrer Schule befra- gen. So gibt es Gelegenheit, um über Einflüsse auf die Repräsentativität einer Stichprobe nachzudenken und zu erkennen, dass Stichproben aus derselben Grundgesamtheit variieren können (vgl. NCTM, 2001, S. 23-24). 4. Prinzipien und Standards der Datenanalyse 40 4.1.3 Möglicher Standard für die Klasse 6 Da sich die NCTM-Standards immer über drei Jahrgangsstufen erstrecken, wird im Folgenden eine Auswahl an Inhalten vorgestellt, die sich in der 6. Jahrgangsstufe umsetzen lässt. In Ergänzung dazu werden weitere mögliche Inhalte genannt. Fragen stellen und entsprechende Daten erheben, aufbereiten und darstellen Die Anknüpfung an vielfältige Erfahrungen mit der Datenanalyse ermöglicht ab der Jahrgangsstufe 6 eine Beschäftigung mit zunehmend komplexeren Fragestellungen. Die Schüler lernen, relevante Daten in verschiedenen Quellen zu finden, wie zum Beispiel im Internet oder in gedruckten Quellen. Da die Schüler bereits über ein Repertoire an ver- schiedenen Darstellungsformen verfügen, darunter Tabellen, eindimensionale Streudia- gramme oder Balkendiagramme, kann dieses nun erweitert werden durch graphische Dar- stellungsformen, die sich insbesondere zum Vergleich von Gruppen eignen (vgl. NCTM, 2001, S. 24-26). Untersuchen die Schüler etwa ein gemeinsames, numerisches Merkmal zweier unterschiedlicher Populationen, so eignet sich beispielsweise die semigraphische Darstellungsform des Stängel-Blatt-Diagramms zum statistischen Vergleich (vgl. Abb. 4.5). Abb. 4.5: Stängel-Blatt-Diagramm (stem-and-leaf plot) (Darstellung aus: Landwehr & Watkins, 1995, S. 22) Besonders die Darstellung als “Back-to-Back Stem-and-Leaf“ eignet sich, um den visuellen Vergleich zweier Datensätze zu vereinfachen (vgl. Biehler, 1982, S. 73). Dabei werden zwei Datensätze Rücken an Rücken in einem Stängel-Blatt-Diagramm dargestellt (vgl. Kapitel 6, Abb. 6.28). 4. Prinzipien und Standards der Datenanalyse 41 Weitere Graphiken wie das Histogramm oder den Boxplot, die unter anderem für die Klassen 6-8 vom NCTM (2001, S. 24) vorgeschlagen werden, würde ich noch nicht in der 6. Klasse einsetzen, da insbesondere der Prozentbegriff noch nicht eingeführt ist und da diese Graphen relativ komplex aufgebaut sind. Arbeitet man allerdings mit Software, die das Entdecken graphischer Darstellungen ermöglicht, so könnten auch diese Graphiken bereits in der Jahrgangsstufe 6 informell von Schülern verwendet werden. Was mit dem Entdecken und informellen Verwenden von Graphiken gemeint ist, wird im Kapitel 6 nä- her erläutert (vgl. Kapitel 6). Geeignete statistische Methoden zur Datenanalyse auswählen und einsetzen Wie bereits erwähnt soll ab der Klasse 6 die Betrachtung des arithmetischen Mittels fortgesetzt werden, so dass die Eigenschaften dieses Mittelwerts im Vergleich zu anderen Mittelwerten wie Median oder Modalwert verstanden werden (vgl. NCTM, 2001, S. 26). Erst wenn die Schüler vielfältige Erfahrungen mit verschiedensten Datensätzen gemacht haben, eigene Ideen über das Typische bzw. die Mitte eines Datensatzes äußern und erken- nen, dass große Werte durch kleine Werte ausgeglichen werden, kann nach der Einführung des Medians auch der Algorithmus zur Berechnung des arithmetischen Mittels gelehrt werden (vgl. Russel & Mokros, 1996, S. 363-364). “Even though the procedure for finding the mean is easy to teach, we recommend delaying the teaching of this procedure until about sixth grade, and only after students have developed their own ideas about balance” (Russel & Mokros, 1996, S. 363). „Schülerinnen und Schüler sollen auch in Betracht ziehen, wie gut verschiedene Gra- phen wichtige Eigenschaften von Datensätzen wiedergeben. Beispielsweise können sie bemerken, dass es viel leichter ist, Symmetrie oder Schiefe an einem Graph zu beobachten als in einer Wertetabelle“ (NCTM, 2001, S. 27). Die Beziehungen zwischen den Datensät- zen und ihren verschiedenen Repräsentationsformen sollen also reflektiert werden. Auf Daten basierende Schlussfolgerungen und Vorhersagen entwickeln und bewerten Das Verständnis über das Verhältnis der Stichprobe zur Population soll auch in der Klasse 6 weiter vertieft werden. Die Schüler sollen „Beobachtungen über die Unterschiede 4. Prinzipien und Standards der Datenanalyse 42 zwischen zwei und mehreren Stichproben nutzen, um Vermutungen über die Gesamtpopu- lation abzuleiten“ (NCTM, 2001, S. 24). Weiterhin sollen sie „Vermutungen anstellen, um neue Fragen zu formulieren und neue Untersuchungen dazu zu planen“ (NCTM, 2001, S. 25). Die Beziehungen zwischen zwei numerischen Merkmalen einer Stichprobe auf der Grundlage von Streudiagrammen und einer eingepassten Geraden zu untersuchen (vgl. NCTM, 2001, S. 25) bleibt weitgehend den Klassen 7-8 vorbehalten, da grundlegende Begriffe wie beispielsweise Proportionalität und Geradensteigung noch nicht bekannt sind. Dennoch kann auch dieser Diagrammtyp ausgehend von einer Vierfeldertafel mit Hilfe der Software TinkerPlotsTM von den Schülern entdeckt werden (vgl. Kapitel 6). Alles in allem bleibt festzuhalten, dass sich die NCTM-Standards 2000 zur Daten- analyse zu großen Teilen am aktuellen Forschungsstand orientieren und einen detaillierten Einblick in diejenigen Kompetenzen geben, die Schüler in den verschiedenen Jahrgangs- stufen erwerben sollten. Zumeist werden den Lehrenden auch durch die verschiedenen Beispiele Anregungen gegeben, welche Aufgaben und Unterrichtsarrangements geeignet sind, um den Schülern den Erwerb der genannten Kompetenzen zu ermöglichen. Aber ge- rade bei komplexen Unterrichtsinhalten, wozu beispielsweise das Begriffsverständnis des arithmetischen Mittels oder die Inferenzstatistik zählt, fehlen diese Beispiele und es bleibt zunächst unklar, wie man diesen Kompetenzerwerb geeignet unterstützen kann. Dazu muss weitere Literatur zu Rate gezogen werden. 4.2 Die NCTM-Standards 2000 im Vergleich mit hessischen Curricula und natio- nalen Bildungsstandards Nachdem die NCTM-Standards der Datenanalyse für die Klassen K-6 ausführlich beschrieben worden sind, sollen nun einige hessische Curricula sowie die deutschen Bil- dungsstandards auf Aspekte der Datenanalyse hin untersucht werden. Die Leitfrage dabei ist, welchen Stellenwert Statistik und Datenanalyse in den unteren Klassen in Deutschland einnimmt und ob eine andere Nuancierung im Vergleich zu den NCTM-Standards vorliegt. Zunächst sollen die Curricula und Bildungsstandards der Primarstufe und anschließend die der weiterführenden Schulen auf diese Frage hin untersucht werden. 4. Prinzipien und Standards der Datenanalyse 43 4.2.1 Curriculum und Bildungsstandards der Primarstufe Der hessische „Rahmenplan Grundschule“ (Hess. Kultusministerium, 1995) ist nach den traditionellen Arbeitsbereichen „Mengen und Zahlen“, „Größen“ und „Geometrie“ gegliedert. Weder Stochastik im Allgemeinen noch Datenanalyse oder Statistik im Speziel- len werden als eigenständiges Thema oder Teilgebiet der Mathematik im hessischen Rah- menplan für die Grundschule erwähnt. Dennoch weisen die Aufgaben und Ziele des Ma- thematikunterrichts in der Grundschule durchaus stochastische Ansätze auf: „Der Mathe- matikunterricht soll grundlegende, intellektuelle Fähigkeiten entwickeln und schulen; dazu gehören: Vergleichen, ordnen, sortieren, Daten sammeln, Regeln erkennen, verallgemei- nern, Lösungswege finden, Vorgehensweisen begründen“ (Hess. Kultusministerium, 1995, S.144). Die Datenanalyse steht in diesem Curriculum im engen Zusammenhang zum Sach- rechnen, welchem insgesamt ein relativ hoher Stellenwert eingeräumt wird, da das Sach- rechnen „die verbindende Klammer zwischen den Arbeitsbereichen Arithmetik, Größen und Geometrie sowie zwischen der Mathematik und den anderen Fächern“ (Hess. Kultus- ministerium, 1995, S.148) darstellt. Die Anteile der Datenanalyse im Sachrechnen sind jedoch gering. Explizit genannt wird hier lediglich das „Sammeln und Bewerten von Da- ten“ (Hess. Kultusministerium, 1995, S.149). Warum Daten überhaupt gesammelt werden sollen bleibt jedoch unklar, da es nicht empfohlen wird, von einer für die Schüler relevanten Fragestellung auszugehen, die mit Hilfe von Daten beantwortet werden kann. Es wird zudem nicht darauf hingewiesen, dass die im Rahmenplan hervorgehobenen Fähigkeiten und Fertigkeiten, wie das Zählen, Rech- nen, Schätzen, Messen oder Sortieren auch durch die Behandlung von Stochastik gefestigt werden können und das man besonders gut im Bereich der Datenanalyse Bezüge zu ande- ren Fächern herstellen kann, um fächerübergreifendes Lernen zu fördern (vgl. Kap. 3). Die am 15.10.2004 beschlossenen hessischen Bildungsstandards im Fach Mathema- tik für den Primarbereich (Jahrgangsstufe 4), welche zu Beginn des Schuljahres 2005/2006 als Grundlage der fachspezifischen Anforderungen für den Unterricht in der Grundschule übernommen werden, deuten eine Trendwende an. Die Standards orientieren sich nur im- plizit an den traditionellen Sachgebieten des Mathematikunterrichts der Grundschule. In den Vordergrund gestellt werden vielmehr allgemeine und inhaltsbezogene mathematische Kompetenzen, die für das Mathematiklernen und die Mathematik insgesamt charakteris- tisch sind und untrennbar aufeinander bezogen sind. Unter allgemeinen mathematischen 4. Prinzipien und Standards der Datenanalyse 44 Kompetenzen werden das Problemlösen, das Kommunizieren, das Argumentieren sowie das Modellbilden und das Darstellen verstanden. Zu den inhaltsbezogenen mathematischen Kompetenzen gehören „Zahlen und Operationen“, „Raum und Form“, „Muster und Struk- turen“, „Größen und Messen“ sowie „Daten, Häufigkeit und Wahrscheinlichkeit“ (vgl. Kultusministerkonferenz, 2004a, S. 9-14). Die Stochastik wird also aufgewertet, da sie zunehmend als ein Themengebiet angesehen wird, welches Grundschülern nicht verschlos- sen bleiben sollte. Welche Aspekte von Daten und Häufigkeit sollen laut Bildungsstandards im Zent- rum stehen? Die Beschäftigung mit der Datenanalyse beschränkt sich in der Grundschule auf das Erfassen und Darstellen von Daten. Die Schüler sollen „in Beobachtungen, Unter- suchungen und einfachen Experimenten Daten sammeln, strukturieren und in Tabellen, Schaubildern und Diagrammen darstellen“ (Kultusministerkonferenz, 2004a, S. 14). Zu- dem sollen sie dazu fähig sein, aus den genannten Repräsentationen Informationen zu ent- nehmen (vgl. Kultusministerkonferenz, 2004a, S. 14). Weiterhin sollen die Schüler selbst geeignete Darstellungen entwickeln, auswählen und nutzen, eine Darstellung in eine ande- re übertragen können sowie Darstellungen miteinander vergleichen und bewerten können (vgl. Kultusministerkonferenz, 2004a, S. 10), wobei diese Fähigkeiten und Fertigkeiten zu den allgemeinen mathematischen Kompetenzen gehören, die aber in der Datenanalyse, speziell in der Explorativen Datenanalyse, von besonderer Bedeutung sind, da Graphiken nicht nur zur Ergebnispräsentation dienen, sondern auch als Werkzeug der Exploration (vgl. Biehler & Weber, 1995, S. 4). Bezüglich der Bildungsstandards für die Grundschule bleibt festzuhalten, dass zwar im Vergleich zum hessischen Rahmenplan (1995) ein Bewusstsein dafür entstanden ist, dass bereits die Grundschule einen Beitrag zum Aufbau von Datenkompetenz leisten kann, aber eine enorme Lernchance vertan wurde, da der Prozess der Datenanalyse für Grund- schulkinder ausschließlich auf die Datenerhebung und Darstellung der Daten beschränkt wurde. Dadurch wird ein völlig falscher Eindruck von Mathematik vermittelt. Stattdessen sollte den Kindern bewusst gemacht werden, dass die Repräsentation von Daten in Tabel- len und Graphiken nicht bloß zum Selbstzweck vorgenommen wird, sondern um eine für sie relevante Fragestellung durch die Interpretation von graphischen Darstellungen der Daten zu beantworten. Die reine Informationsentnahme aus Tabellen und Graphiken, wie sie in den Bildungsstandards gefordert wird, reicht nicht aus, um Kinder an statistische Methoden und Verfahrensweisen heranzuführen. Da nicht einmal ein Sachproblem als 4. Prinzipien und Standards der Datenanalyse 45 Ausgangsbasis einer Datenanalyse vorgeschlagen wird, könnte dies im schlimmsten Fall bei den Kindern den Eindruck erwecken, dass Mathematik eine Spielerei mit Zahlen und deren Darstellungen ist, die ohne jeden Bezug zur Realität steht. 4.2.2 Curricula und Bildungsstandards der Sekundarstufe I Welche Aspekte der Datenanalyse stehen in der Mittelstufe im Vordergrund? Dazu werden im Folgenden die hessischen Lehrpläne und nationalen Bildungsstandards der drei unterschiedlichen Schulformen analysiert und bewertet. In der hessischen Hauptschule ist die Stochastik allein in der Jahrgangsstufe 8 ver- bindliches Thema des Unterrichts. Fakultativ können in der Jahrgangsstufe 6 und 7 Ver- bindungen zur Stochastik, speziell zur Datenanalyse, hergestellt werden, da das Rechnen innerhalb der Stochastik „in enger Verbindung zur Bruch- und Prozentrechnung“ steht (Hess. Kultusministerium, 2002a, S. 7). So könnte laut Lehrplan in der 6. Klasse der Mit- telwert mit Hilfe von Tabellenkalkulationsprogrammen berechnet werden (vgl. Hess. Kul- tusministerium, 2002a, S. 13). In der 7. Klasse sollen Kreisdiagramme gelesen und inter- pretiert, eventuell auch gezeichnet werden, wobei auch der Einsatz von geeigneter Soft- ware empfohlen wird (vgl. Hess. Kultusministerium, 2002a, S. 15). In der Jahrgangsstufe 8, in welcher Stochastik einmalig ein verbindliches, aber mit 15 Unterrichtsstunden relativ kurzes Unterrichtsthema darstellt, wird die Behandlung dieses Themengebiets damit be- gründet, dass Neugier und Verständnis für stochastische Fragestellungen in Wissenschaft, Technik sowie im täglichen Leben geweckt werden soll, sowie damit, dass das Thema die Gelegenheit bietet, die Bruch- und Prozentrechnung zu wiederholen und anzuwenden. Der Schwerpunkt liegt dabei auf der Wahrscheinlichkeitsrechnung (Zufallsversuche, Berech- nen und Schätzen von Wahrscheinlichkeiten) und nicht auf der Datenanalyse. Lediglich Häufigkeitsverteilungen mit zugehörigen absoluten und relativen Häufigkeiten sowie das Auswerten von Strichlisten und Tabellen sind verpflichtende Unterrichtsinhalte aus dem Bereich der Datenanalyse. Positiv ist anzumerken, dass Querverweise zu anderen Fächern, wie zum Beispiel zum Fach Deutsch existieren, wodurch, wenn auch sehr knapp, auf die Möglichkeit des fächerübergreifenden Arbeitens hingewiesen wird (vgl. Hess. Kultusmi- nisterium, 2002a, S. 22). 4. Prinzipien und Standards der Datenanalyse 46 Auch im Abschlussprofil für die Jahrgangsstufe 9 werden lediglich die Fähigkeiten und Fertigkeiten genannt, Diagramme und Schaubilder zu erstellen und zu interpretieren, sowie Informationen aus Texten, Tabellen und Diagrammen zu entnehmen. Dasselbe gilt für das Abschlussprofil der Jahrgangsstufe 10 (vgl. Hess. Kultusministerium, 2002a, S. 32- 33). In der hessischen Realschule nimmt der Bereich Stochastik insgesamt einen größeren Stellenwert ein als in der Hauptschule. Begründet wird dies damit, dass Statistiken täglich in den Medien präsent sind. Daher gehören „grundlegende Kenntnisse statistischer Begrif- fe und Methoden“ und die „kritische Auseinandersetzung mit ihren Ergebnissen und Prä- sentationsformen zur Aufgabe einer Realschulbildung“ (Hess. Kultusministerium, 2002b, S. 5). Außerdem sind laut Lehrplan handlungsorientierte Aufgabenstellungen, wie etwa die Durchführung einer eigenen Umfrage, in den Vordergrund zu stellen (vgl. Hess. Kultusmi- nisterium, 2002b, S. 5). Der Lehrplan ordnet die Berechnung des arithmetischen Mittels in der Jahrgangsstu- fe 6 der Dezimalrechnung zu. Fakultativ kann die Mittelwertberechnung großer Daten- mengen mit einem Tabellenkalkulationsprogramm erfolgen (vgl. Hess. Kultusministerium, 2002b, S. 12). Eine umfassendere Einheit zur Beschreibenden Statistik muss im Rahmen der Prozentrechnung in Jahrgangsstufe 7 durchgeführt werden. Die Schüler lernen absolute und relative Häufigkeiten kennen, erstellen Diagramme und bewerten deren Aussagekraft. Fakultativ können die Diagramme, insbesondere Säulen- und Kreisdiagramme, auch mit einem Tabellenkalkulationsprogramm erstellt werden, wobei dann auch eine kritische Wer- tung der technisch möglichen Darstellungsformen erfolgen sollte. Als Arbeitsmethode der Schüler wird dabei explizit das Sammeln, Ordnen und graphische Aufarbeiten von Daten genannt, weil eigene Erhebungen und Präsentation der Ergebnisse zu einem bestimmten Thema aus dem Alltag wichtige Grunderfahrungen sind, auch im Hinblick auf die Aussa- gekraft der verschiedenen Diagramme (vgl. Hess. Kultusministerium, 2002b, S. 16). „Die abstrakteren Berechnungen zu Wahrscheinlichkeiten wiederholen in Jahrgangsstufe 8 die Bruchrechnung und Dezimalbrüche“ (Hess. Kultusministerium, 2002b, S. 5), wobei das Berechnen von Wahrscheinlichkeiten und Zufallsexperimente verbindliche Unterrichtsin- halte darstellen. Grundbegriffe der Statistik und deren Berechnung werden in der Jahr- gangsstufe 10 eingeführt, da diese laut Lehrplan angeblich einen höheren Abstraktionsgrad erfordern. Darunter befinden sich Begriffe wie Urliste, Rangliste sowie absolute und rela- tive Häufigkeit. Weiterhin soll von der Stichprobe auf die Gesamtheit geschlossen werden 4. Prinzipien und Standards der Datenanalyse 47 und die Schüler sollen Lageparameter, wie zum Beispiel die drei Mittelwerte (Modalwert, Median und arithmetisches Mittel) und verschiedene Streuungsparameter (Spannweite, Varianz, Standardabweichung,…) bestimmen und berechnen können, wobei auch Tabel- lenkalkulationsprogramme eingesetzt werden dürfen. Die Schüler sollen dabei eigene sta- tistische Erhebungen durchführen, Häufigkeitsverteilungen visualisieren und mit Hilfe von Lage- und Streumaßen durch Software auswerten, wobei auch die Ergebnisse im realen Kontext interpretiert werden sollen. Dieses große Gebiet der Statistik und Datenanalyse soll in nur 8 Stunden bearbeitet werden (vgl. Hess. Kultusministerium, 2002b, S. 32). Das Abschlussprofil der Jahrgangstufe 10 der Realschulen in Hessen besagt, dass die Schüler aus erhobenen Daten Diagramme und Schaubilder erstellen und interpretieren können sollten. Weiterhin sollten sie dazu in der Lage sein, Informationen aus Texten, Ta- bellen und Diagrammen zu entnehmen. Sie sollten zudem das arithmetische Mittel in Sachaufgaben berechnen können, sowie die mittlere Abweichung, die Varianz und die Standardabweichung einer Datenreihe ermitteln können (vgl. Hess. Kultusministerium, 2002b, S. 33-34). Bezüglich der Curricula für Haupt- und Realschulen ist kritisch anzumerken, dass die Datenanalyse nicht spiralförmig den Lehrplan durchzieht. In manchen Jahrgangsstufen wird dieses mathematische Teilgebiet völlig außer Acht gelassen. Außerdem orientieren sich die Curricula nicht am aktuellen Forschungsstand. So wird zum Beispiel nur die Be- rechnung bzw. Bestimmung des arithmetischen Mittels gefordert und dem Gebiet der De- zimalrechnung zugeordnet, ohne zuvor den Schülern die Gelegenheit gegeben zu haben, die Eigenschaften dieses Kennwertes in verschiedenen Datensätzen zu entdecken und die- sen sinnvoll zu interpretieren oder überhaupt informelle Ideen über das Zentrum eines Da- tensatzes aufzubauen. Des Weiteren ist unklar, warum der Aufbau eines kritischen Um- gangs mit Daten lediglich Aufgabe einer Realschulbildung sei und nicht zur Aufgabe der Hauptschule gehört. Schließlich begegnen auch Hauptschülern Daten in ihrer Umwelt! Außerdem ist die Stochastik das Teilgebiet, welchem die geringste Stundenanzahl gewid- met wird. So gleicht die Stochastik eher einer Randerscheinung in den Lehrplan, was unter anderem dadurch deutlich wird, dass auf die Thematisierung statistischer Vergleiche ver- zichtet wird. Die kürzlich von der Kultusministerkonferenz beschlossenen Bildungsstandards für den Hauptschulabschluss (Jahrgangsstufe 9) und den Mittleren Schulabschluss, die zu Be- 4. Prinzipien und Standards der Datenanalyse 48 ginn des Schuljahres 2005/ 2006 bzw. 2004/ 2005 übernommen werden müssen, legen folgende Leitideen dem Mathematikunterricht zu Grunde: „Zahl“, „Messen“, „Raum und Form“, „funktionaler Zusammenhang“ und schließlich „Daten und Zufall“. Diese Leit- ideen vereinigen Inhalte verschiedener mathematischer Sachgebiete und durchziehen ein mathematisches Curriculum spiralförmig (vgl. Kultusministerkonferenz, 2003, S. 13 & 2004b, S. 9). Die erwarteten Lernergebnisse der Schüler im Bereich der Datenanalyse ähneln sich bei den beiden verschiedenen Schulformen. Die Schüler sollen dazu in der Lage sein, sys- tematisch Daten zu sammeln, diese in Tabellen zu erfassen und sie graphisch darzustellen, auch unter Verwendung geeigneter Hilfsmittel wie Software. Zudem sollen sie graphische Darstellungen und Tabellen von statistischen Erhebungen auswerten können. Für den mitt- leren Schulabschluss wird auch erwartet, dass die Schüler fähig sind, statistische Erhebun- gen zu planen. Die Interpretation von Daten unter Verwendung von Kenngrößen, die sich in der Hauptschule auf Häufigkeiten und Mittelwerte beschränken, wird ebenfalls von den Schülern erwartet. Schüler, die den mittleren Schulabschluss anstreben, sollten zudem dazu in der Lage sein, Argumente, die auf einer Datenanalyse basieren, zu reflektieren und zu bewerten (vgl. Kultusministerkonferenz, 2003, S. 16 & 2004b, S. 11). Die Bildungsstandards für die Sekundarstufe I stehen weitgehend im Einklang mit den NCTM-Standards 2000. Die beigefügten Aufgabenbeispiele stellen Transparenz her und geben den Lehrern Ideen zur praktischen Umsetzung der Standards. Es bleibt zu kriti- sieren, dass in der Hauptschule die Planungsphase der Datenanalyse und die letzte Phase der Datenanalyse, nämlich die Interpretation und Bewertung der Ergebnisse, nicht als wichtige Komponente zur Erlangung von Datenkompetenz angesehen wird. Ähnlich wie in den deutschen Bildungsstandards für die Primarstufe liegt auch hier der Schwerpunkt eher auf der Datensammlung und Darstellung. Im Lehrplan für den gymnasialen Bildungsgang kann man in jeder Jahrgangsstufe verbindliche Elemente aus dem Bereich der Stochastik finden, wobei jedoch umfangrei- chere Einheiten zur Stochastik erst ab der Klasse 7 vorgeschrieben sind (vgl. Hess. Kul- tusministerium, 2002c, S. 8-9). In der Jahrgangsstufe 5 sollen die Schüler „erste Vorerfahrungen zu Inhalten und Methoden der Stochastik“ (Hess. Kultusministerium, 2002c, S.10) gewinnen, indem sie bei der Behandlung der natürlichen Zahlen die absolute Häufigkeit kennen lernen und Dia- 4. Prinzipien und Standards der Datenanalyse 49 gramme und Tabellen als Darstellungs- und Abzählhilfe nutzen. In der Jahrgangsstufe 6 wird beim Rechnen mit Dezimalbrüchen die Stochastik mit eingebunden, da die relativen Häufigkeiten, Gewinnchancen und Mittelwerte thematisiert werden sollen (vgl. Hess. Kul- tusministerium, 2002c, S. 15). Die Jahrgangsstufe 7 baut dann auf den Begriffen absolute und relative Häufigkeit auf, um den Wahrscheinlichkeitsbegriff einzuführen. Grundbegrif- fe der Wahrscheinlichkeitsrechnung sowie Ereignisse in Zufallsexperimenten sind verbind- liche Unterrichtsinhalte (vgl. Hess. Kultusministerium, 2002c, S. 17, 22). Fortgeführt wird die Wahrscheinlichkeitsrechnung in der Jahrgangstufe 8, und zwar unter dem Gesichts- punkt der Modellbildung und der Simulation mit Hilfe des Computers. Durch die Verwen- dung geeigneter Software sollen Zufallszahlen generiert werden und größere Datenmengen in Strecken-, Balken- und Kreisdiagrammen dargestellt werden (vgl. Hess. Kultusministe- rium, 2002c, S. 27). In der Jahrgangsstufe 9 ist die Beschreibende Statistik das verbindli- che Unterrichtsthema aus dem Bereich der Stochastik. Die Schüler lernen graphische Dar- stellungen statistischer Daten kennen, sowie die Lagemaße Modalwert, Median und arith- metisches Mittel. Weiterhin werden unter den Streumaßen die Spannweite und die Stan- dardabweichung eingeführt. Mit diesem Wissen können die Schüler nun den gesamten Prozess der Datenanalyse durchlaufen: Sie erheben Daten, stellen diese graphisch dar und werten die Daten anhand der erstellten Diagramme und unter Nutzung von geeigneten Kennwerten aus. Schließlich beurteilen sie die Aussagekraft der Statistiken im realen Kon- text (vgl. Hess. Kultusministerium, 2002c, S. 35). In der Jahrgangsstufe 10 werden die bereits ab dem 7. Jahrgang behandelten mehrstufigen Zufallsversuche erneut aufgegriffen und unter dem Aspekt der stochastischen Modellbildung vertieft (vgl. Hess. Kultusministe- rium, 2002c, S. 36). Im Übergangsprofil von der Jahrgangsstufe 10 in die gymnasiale Oberstufe, welches Voraussetzungen für eine erfolgreiche Mitarbeit im Fach Mathematik in der Oberstufe beschreibt, werden folgende Aspekte der Beschreibenden Statistik genannt: Die Schüler sollen statistische Daten erheben und auswerten können, mit absoluten und relativen Häu- figkeiten und mit Streifen- und Säulendiagrammen umgehen können. Weiterhin sollen sie den Median und das arithmetische Mittel kennen (vgl. Hess. Kultusministerium, 2002c, S. 45). Auch der Lehrplan für den gymnasialen Bildungsgang zeigt einige Schwachstellen in Bezug auf die Behandlung der Datenanalyse auf. Mit Ausnahme, dass das Spiralprinzip weitgehend gesichert ist, gilt dieselbe Kritik, die bereits an den Lehrplänen der Haupt- und 4. Prinzipien und Standards der Datenanalyse 50 Realschulen geübt wurde. Zudem wird die Möglichkeit verschwiegen, Verbindungen zu anderen Fächern herzustellen. Alles in allem bleibt festzuhalten, dass laut den hessischen Curricula die Datenanaly- se in den unteren Klassen einen sehr geringen Stellenwert einnimmt. Unabhängig von der Schulart ist in den Klassen 1-6 kein Durchlauf einer kompletten Datenanalyse mit ihren vier Phasen vorgesehen. Statistische Grundbegriffe, denen sich auch die Datenanalyse be- dient, werden zumeist erst systematisch in der Art eines „Kompaktkurses“ in den Klassen 9 oder 10 eingeführt, ohne dass zuvor informelle Vorstellungen und Ideen auf Seiten der Schüler reifen konnten. Das vom NCTM geforderte Spiralprinzip wird in den Klassen 1-6 keineswegs beachtet. Die Datenanalyse stellt insgesamt einem peripheren Bestandteil der Curricula dar. Die nationalen Bildungsstandards hingegen sind im Vergleich zu den hessischen Curricula schon fortschrittlicher, im Vergleich zu den NCTM-Standards sind sie jedoch als unzureichend zu bewerten. Das Gebiet „Daten und Zufall“ zählt zwar zu den inhaltsbezo- genen mathematischen Kompetenzen, jedoch beschränken sich die von den Grundschülern verlangten Kompetenzen leider auf das Sammeln und Darstellen von Daten und selbst in der Hauptschule liegt der Schwerpunkt eindeutig auf diesen beiden Phasen der Datenana- lyse. Die Gefahren einer solchen Behandlung der Datenanalyse wurden bereits aufgezeigt. Lediglich die Bildungsstandards für den Mittleren Schulabschluss greifen in etwa so weit wie die NCTM-Standards aus dem Jahr 2000. Unabhängig davon, ob die Aspekte der Datenanalyse, die laut Bildungsstandards in den unteren Klassen in Deutschland behandelt werden sollen gar nicht oder nur als unzu- reichend bewertet werden, so sind jedoch Veränderungen in der Aus- und Weiterbildung der Lehrer dringend notwendig, um den Schülern den Erwerb von statistischen Kompeten- zen im Unterricht zu ermöglichen. Es muss ein Bewusstsein dafür geschaffen werden, dass der Aufbau von Datenkompetenz und einer stochastischen Denkweise ein längerfristiger Prozess ist, der schon in der Grundschule und sogar in der Vorschule und im Kindergarten angeregt werden sollte. Konkret bedeutet dies, dass Datenanalyse und Statistik in die Aus- bildung aller Grundschullehrer integriert werden müssen. Eine weitere Aufgabe besteht in der Entwicklung entsprechender Unterrichtsmaterialien, die im Einklang mit den Bildungs- standards und den didaktischen Prinzipien stehen. 4. Prinzipien und Standards der Datenanalyse 51 Nachdem in diesem Kapitel beschrieben wurde, welche Kompetenzen aus dem Be- reich der Datenanalyse Schüler in den Klassen 1-6 laut NCTM-Standards 2000 und der hessischen Curricula und Bildungsstandards erwerben sollten, so folgt in den nächsten Ka- piteln eine ausführliche Darstellung und Analyse von Teilkompetenzen der Datenkompe- tenz. Es wird erläutert, wie man Schüler beim Erwerb einzelner Teilkompetenzen im Un- terricht geeignet unterstützen und fördern kann. Die Darstellungsstruktur orientiert sich im Wesentlichen an den Phasen einer Datenanalyse. Allein die Beziehung zwischen der Popu- lation und der Stichprobe wird aufgrund ihrer Komplexität im Kapitel 8 gesondert betrach- tet, auch wenn diese eher zu den ersten beiden Phasen der Datenanalyse gehört. 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 52 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung In diesem Kapitel steht zunächst die Frage im Mittelpunkt, welche Themen und Da- tensätze zur Datenanalyse im Unterricht geeignet sind. Dabei werden Kriterien, die bei der Auswahl zu berücksichtigen sind, sowie konkrete Beispiele mit möglichen Variablen an- gegeben, welche man im Unterricht der Klassen 1-6 thematisieren könnte. Im zweiten Ab- schnitt wird dann die Transformation einer inhaltlichen in eine statistische Fragestellung didaktisch analysiert und es werden Typen statistischer Fragestellungen klassifiziert. Die unterschiedlichen Methoden der Datenerhebung, welche Schüler der unteren Klassen im Verlauf der Zeit kennen lernen sollten, werden im letzten Abschnitt vorgestellt. 5.1 Kriterien zur Auswahl von Themen und Datensätzen Bei der Auswahl von Themen zur Datenerhebung oder von bereits existierenden Da- tensätzen sind der Phantasie beinah keine Grenzen gesetzt. Dennoch sind in Anlehnung an Biehler & Steinbring (1991, S. 8) folgende Kriterien bei der Auswahl von Themen und Datensätzen für die Klassen 1-6 zu beachten: • Das Thema und die dazu gesammelten Daten müssen inhaltlich interessant und re- levant für die Schüler sein. • Das Thema muss aus dem Erfahrungsbereich der Schüler stammen, damit Hinter- grundinformationen zur Interpretation verfügbar sind. • Die Definition der Variablen muss verständlich sein. • Die Analyse bringt interessante Muster und Besonderheiten in den Daten hervor. • Der Umfang des Datensatzes sollte für die Schüler überschaubar bleiben. • Der Datensatz zeigt die Nützlichkeit aber auch die Grenzen von Datenanalyseme- thoden, so dass die Schüler auch Gelegenheit haben eigene Herangehensweisen, wie zum Beispiel das Erfinden eigener Graphiken, auszuprobieren. Welche Themen könnte man konkret im Unterricht bearbeiten und welche Variablen lassen sich zu diesen Themen definieren? Dazu wird im Folgenden eine Übersicht zur An- regung gegeben, die jedoch keine Vollständigkeit anstrebt: 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 53 Thema Mögliche Variablen Familie Anzahl der Familienmitglieder, Alter der Schüler,… Bücher/ Literatur Lieblingsbuch(sorte), Zeit für Lesen pro Woche,… Musik Lieblingsmusikband, Musikinstrumente die Schüler spielen,… Film/ Fernsehen Lieblingsfilm, Anzahl der TV-Stunden pro Tag,… Tiere Lieblingstier, Tiere vor denen man sich fürchtet,… Ernährung Lieblingsgericht in der Cafeteria, Anzahl der Bonbons pro Packung, Anzahl der Früchte, die Schüler pro Tag essen,… Sport Lieblingssportart, Zeit für sportliche Aktivitäten pro Woche, Zeit für 100-Meter-Lauf,… Körpermerkmale Größe, Fußlänge, Gewicht, Schuhgröße, Haar- und Augenfarbe, Herzschläge pro Minute, Atemzüge pro Minute,… Wetter/ Jahreszeiten Anzahl sonniger Tage pro Monat, Temperaturverlauf an einem Tag,… Feste und Feiertage Geburtsmonat, Weihnachtsessen,… Tagesablauf Zeit zu der man aufsteht, Bettzeit, Schlafzeit,… Geographie/ Reisen Entfernung von Urlaubszielen, Lieblingsreiseziel,… Sprachen Anzahl gesprochener Sprachen, Anzahl der Buchstaben in Namen,… Umwelt und Natur Anzahl der Gänseblümchen auf einer Wiese, schwimmende Objekte/ sinkende Objekte,… Straßenverkehr Schulwegzeit, Verkehrsmittel für Schulweg, liebstes Fortbewe- gungsmittel, … Schule Zeit für Hausaufgaben pro Woche/ pro Tag, Lieblingsfach,… Zufallsspiele Anzahl der Gewinne,… Das Thema sollte möglichst gemeinsam mit den Schülern bestimmt werden, um mo- tiviertes Arbeiten zu ermöglichen. Besonders effektiv ist es auch, wenn man aktuelle The- men und Fragestellungen aufgreift, die im Schulalltag aufkommen, da dann eine echte Notwendigkeit in einer Datenanalyse besteht. So kann man zum Beispiel das Abstimmen über ein Ausflugsziel thematisieren oder das „Lieblingsessen“ der Schüler erheben, um die Ergebnisse an die Schulcafeteria weiterzuleiten. Solche Fragen, die Entscheidungen beein- 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 54 flussen können, sind besonders zu berücksichtigen, da dann die Nützlichkeit einer Daten- analyse direkt erlebt wird. Während in den unteren Klassen überwiegend einzelne Merkmale untersucht wer- den, kann man in den höheren Klassen auch mit komplexeren Datensätzen arbeiten, die mehrere Variablen auch aus unterschiedlichen Themenbereichen enthalten. Ein Beispiel dafür ist das Projekt „Wir lernen uns kennen“, welches sich besonders für die Jahrgangs- stufe 5 eignet, da die Klassen neu zusammengesetzt worden sind und damit ein echtes Mo- tiv im gegenseitigen Kennenlernen liegt. Bei diesem Projekt können beinah alle der oben genannten Themen mit aufgegriffen werden. Eine geeignete Methode dazu stellt die Grup- penarbeit dar. Eine Gruppe kann beispielsweise die Körpermerkmale erfassen und analy- sieren, während sich eine andere Gruppe mit den Freizeitaktivitäten der Schüler beschäftigt (vgl. Leneke, 1999, S. 17-19). Des Weiteren geben komplexere Datensätze den Schülern die Möglichkeit, die Beziehung zwischen zwei Merkmalen zu erkunden. Die obige Aufstellung der möglichen Themen und Variablen zeigt außerdem, dass man vielfältige Bezüge zu anderen Fächern herstellen kann, so dass auch fächerübergrei- fendes Arbeiten ermöglicht wird. Auch können die oben genannten Themen in verschiede- nen Jahrgangsstufen behandelt werden, da die Art der Merkmale und der statistischen Fra- gestellung den Schwierigkeitsgrad bestimmen. Nach der Auswahl eines Themas bzw. eines Datensatzes ist eine konkrete Fragestel- lung zu erarbeiten. Was es bedeutet, eine inhaltliche Fragestellung in eine statistische Fra- gestellung zu transformieren und welche Typen von statistischen Fragestellungen existie- ren, soll im nächsten Abschnitt erörtert werden. 5.2 Formulierung einer statistischen Fragestellung Gewöhnlicherweise beginnt eine Datenanalyse mit einer Fragestellung, die der realen Welt entstammt (vgl. Konold & Higgins, 2003, S. 195). Kinder sind voller Fragen und damit ihre natürliche Neugier erhalten bleibt sollten Lehrer den Schülern zeigen, dass sie dazu in der Lage sind, Informationen zu sammeln, um einige ihrer Fragen eigenständig beantworten zu können. Jüngere Kinder sind in erster Linie an sich selbst und ihrer unmit- telbaren Umgebung interessiert. Im Verlauf der Grundschulzeit werden ihre Fragen jedoch immer komplexer und der Entwicklung einer geeigneten Fragestellung fällt immer mehr Bedeutung zu (vgl. Chapin, Koziol, MacPherson & Rezba, 2002, S. 2-3). “Being observant 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 55 (aware) and curious are the well-springs of the question generation process that all innova- tive learning results from” (Wild & Pfannkuch, 1999, S. 233). Arbeiten die Schüler bereits mit komplexeren Datensätzen, die mehrere Merkmale enthalten, so müssen sie zum Bei- spiel Hypothesen bilden, zwischen welchen Merkmalen wohl Beziehungen bestehen und wie die Daten aussehen könnten, um interessante Fragestellungen zu entwickeln. Dies er- fordert sowohl Sachwissen bezüglich des Kontexts, als auch statistisches Wissen im enge- ren Sinn. Eine erste Herausforderung besteht nun darin, diese allgemeine, inhaltliche Frage- stellung in eine statistische zu transformieren, so dass anhand dieser Daten gesammelt werden können. Durch die Analyse der gesammelten Daten wird dann die statistische Fra- gestellung beantwortet, wodurch im Idealfall auch etwas über das reale Ausgangsproblem ausgesagt werden kann (vgl. Konold & Higgins, 2003, S. 195). Um eine statistische Frage- stellung zu entwickeln, müssen die Schüler lernen, ihre Frage so genau zu stellen, dass eine Datenerhebung möglich ist. Gleichzeitig sollte aber sichergestellt werden, dass in diesem Transformationsprozess die Ausgangsfrage nicht trivialisiert wird. Zudem müssen die Schüler lernen, zwischen den gesammelten Daten und dem realen Ereignis, dass sie beo- bachten und beschreiben wollen, zu unterscheiden, ohne aber die Daten als reine Zahlen zu behandeln, da die Daten immer nur einen Teil der Wirklichkeit abbilden (Biehler & Steinbring, 1991, S. 9). Eine Schwierigkeit besteht also darin, die Daten einerseits als Zah- len im Kontext wahrzunehmen, sie aber andererseits auch vom Kontext abstrahieren zu können (vgl. Konold & Higgins, 2003, S. 195). Die Schüler durchlaufen bei der Transfor- mation einer inhaltlichen Fragestellung aus der realen Welt in eine statistische Fragestel- lung den ersten Schritt des Modellbildungsprozesses, welcher den Schülern Abstraktions- fähigkeit abverlangt. Die abstraktere statistische Frage stellt dabei das reale Modell dar (vgl. Abschnitt 2.2). Grundschüler können viel über die Natur der Daten lernen, indem sie diesen ersten Teil des Modellbildungskreislaufs durchlaufen. Indem die Schüler antizipieren, wie sie die statistische Fragestellung beantworten würden, entdecken sie nicht nur die Spanne mögli- cher Antworten, sondern auch dass die Frage eventuell verschieden interpretiert werden könnte und dass folglich der Wortlaut von besonderer Bedeutung ist (vgl. Konold & Hig- gins, 2003, S. 195). Weiterhin erkennen die Schüler, dass eine genaue Definition von Merkmalen nötig ist, um eine einheitliche Beantwortung der Frage sicherzustellen: "Initial decisions about definition profoundly affect the outcomes of many statistical studies” (Russell & Corwin, 1989, S. 22). Wollen Schüler etwa Daten zur „Anzahl der Familien- 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 56 mitglieder“ sammeln, so ist zunächst zu definieren, was man unter einer Familie versteht, also welche Personen mitgezählt werden und welche nicht. Vielfältige Probleme können dabei auftreten: Zählt man große Geschwister mit, die nicht mehr im selben Haus leben? Zählt die Tante mit zur Familie, weil sie mit im Haus lebt? Wie zählt man getrennt lebende Eltern? Jedes Kind hat sicherlich eine eigene Definition oder einen eigenen Begriff von einer Familie. Dennoch muss eine einheitliche Definition gefunden werden, die sich an dem Aspekt orientiert, an dem die Schüler bei ihrer Datenanalyse hauptsächlich interessiert sind. Die Definition muss also nicht mit der offiziellen Definition übereinstimmen, bei dem unter einer Familie die Anzahl der im Haushalt lebenden Personen verstanden wird (vgl. Russell & Corwin, 1989, S. 23). Um die Schüler dafür zu sensibilisieren, dass unterschied- liche Definitionen zu ganz unterschiedlichen Daten führen, könnte man die Schüler in Gruppen verschiedene Definitionen der Variablen und folglich auch verschiedene Frage- stellungen erarbeiten lassen, zu denen dann jeweils Daten erhoben werden, deren Vertei- lungen anschließend miteinander verglichen werden. Dabei wird einerseits deutlich, dass Daten generell variieren und andererseits, dass die Verteilung zudem abhängig von der Definition des Merkmals ist. Neben der präzisen sprachlichen Formulierung und Definition der Variablen tritt ein weiteres Problem auf, nämlich dass die Schüler durch die Formulierungsprobleme aus dem Auge verlieren, was sie eigentlich untersuchen wollen: “In transforming a general question to a statistical one, the problem is not only in wording it so that people will interpret it con- sistently but also in making sure the question gives you the information you “really, really“ want“ (Konold & Higgins, 2003, S. 196). Nur durch wiederholte Erfahrungen und Diskus- sionen, sowie die Unterstützung der Lehrkräfte entwickeln die Schüler die Fähigkeit, eine allgemeine Frage in eine statistische Frage zu transformieren (vgl. Chapin et al., 2002, S. 2). Insgesamt ist die Formulierung einer statistischen Fragestellung also ein iterativer Teil- prozess im Modellbildungsprozess, da die Schüler ihre Fragen meist mehrmals überarbei- ten und konkretisieren müssen, um eine einheitliche Interpretation sicherzustellen. Das reale Modell wird dabei also schrittweise verbessert. In jedem Fall sollte der Lehrer die von den Schülern gefundene Fragestellung nicht vereinfachen, auch wenn er voraussieht, dass die Fragestellung problematisch ist und etwa zu einer Fülle von unübersichtlichen Daten führt. Die Schüler sollten trotzdem Daten sammeln und selbst erkennen, dass die Frage nicht geeignet gestellt ist. Aus diesem Fehler werden sie dann lernen und die Fragestellung derart überarbeiten, dass sinnvolle Daten gesammelt werden können (vgl. Russell & Corwin, 1989, S. 68). 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 57 Des Weiteren bestimmt der Zweck der Datenanalyse die statistische Fragestellung. In Anlehnung an Biehler (2001, S. 98) und Chapin et al. (2002, S. 88-91) unterscheide ich vier verschiedene Typen statistischer Fragen: 1. Fragen, die sich auf die Verteilung eines Merkmals beziehen: • Wie viele…? • Wie lang…? • Welche…? • Was ist das Lieblings…? • Was ist der/ die/ das typische/ durchschnittliche…? 2. Fragen, die auf einen Vergleich von Verteilungen (Gruppenvergleich) abzielen: • Gibt es Unterschiede/ Gemeinsamkeiten zwischen…? • Wie verhalten sich… gegenüber …? 3. Fragen, die die Beziehung zwischen zwei Variablen erörtern • Welche Beziehung besteht zwischen …? • Sind … auch…? 4. Fragen, die auf Vorhersagen basierend auf einem Datensatz abzielen: • Kann man vorhersagen…? • Welche/ Wieviel würdest du…? • Gibt es einen Trend…? Diese Klassen von Fragen beziehen sich zudem auf unterschiedliche Verständnis- ebenen von Daten und ihren Darstellungen. Während die erste Kategorie von Fragen sich eher auf das „Read the data“ und das „Read between the data“ (das einfache Analysieren und Vergleichen von Anzahlen innerhalb eines Datensatzes) bezieht, erfordern die anderen drei Kategorien von Fragen auch zunehmend das „Read beyond the data“ (Voraussagen, Vergleichen und Schlussfolgern unter Einbeziehung von Hintergrundwissen)5. Dennoch ist bereits beim Typ 1 der statistischen Fragen teilweise auch Sachwissen zur Interpretation 5 Die Ausdrücke „Read the data“, „Read between the data“ und „Read beyond the data“ nach Curcio (2001, S. 7) werden im nächsten Kapitel genau definiert (vgl. Abschnitt 6.5). 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 58 erforderlich, etwa wenn Ausreißer speziell betrachtet und Hypothesen über diese gebildet werden. 5.3 Methoden der Datenerhebung Ist eine statistische Fragestellung gefunden, so stellt sich als nächstes die Frage, wie man geeignete Daten gewinnen kann. “Defining how to count or measure is a critical part of data analysis” (Russell & Corwin, 1989, S. 22). Dabei unterscheidet man drei Methoden der Datenerhebung: 1. Befragung 2. Beobachtung 3. Experiment 1. Befragung: Befragungen können mündlich durch ein Interview oder schriftlich mit Hilfe von Fragebögen durchgeführt werden. Besonders im zweiten Fall müssen die Fragen klar for- muliert sein, da keine Möglichkeit zur Nachfrage besteht. Weiterhin muss sichergestellt sein, dass man wirklich die Daten erhebt, die man benötigt (Validität). Das Formulieren von statistischen Fragestellungen und besonders das Generieren von Hypothesen werden also auch dabei geübt, denn die Schüler müssen überlegen, welche Antwortmöglichkeiten es geben könnte und wie und zu welchem Zeitpunkt sie diese ordnen und kategorisieren. Diese Überlegungen führen zu den unterschiedlichen Typen von Fragen und den dahinter stehenden Merkmalstypen (numerische oder kategoriale Merkmale). Pollok (1995, S. 22) unterscheidet fünf Typen von Fragen: • Einfachauswahl: Bei diesem Typ von Frage darf aus den vorgegebenen Ant- wortmöglichkeiten eine einzige ausgewählt werden. Ein Beispiel dafür sind „viel/ mittel/ wenig-Fragen“. Die „Alternativ-Frage“ stellt einen Spezialfall der Einfachauswahl dar, bei der nur zwei Antwortmöglichkeiten gegeben werden. Ein typisches Beispiel für eine Alternativ-Frage ist die Frage nach dem Geschlecht. Wählt man diesen Typ von Frage aus, so entstehen kategori- 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 59 ale Variablen bzw. im Fall der Alternativ-Frage binäre kategoriale Variablen, also Merkmale mit nur zwei Kategorien. • Mehrfachauswahl: Bei der Mehrfachauswahl dürfen mehrere Antworten an- gekreuzt werden. Eine Auswertung solcher Fragen mit Hilfe von Software ist aufwändig, da jede Auswahl als binäre kategoriale Variable codiert werden muss, je nachdem ob sie ausgewählt wurde oder nicht. • Skalenfrage: Bei Skalenfragen werden codierte Zahlen zum Ankreuzen vor- gegeben, um Ausprägungsgrade eines Merkmals zu erfassen. Ein Beispiel ist die Frage, wie sehr man sich für Quiz-Shows interessiert. Dabei kann die 1 für „sehr wenig“ stehen und die 5 für „sehr viel“ oder auch umgekehrt. Die Richtung der Skala ist frei wählbar. Die Anzahl der vorgegebenen Zahlen be- stimmt dabei den „Auflösungsgrad“. So entstehen ordinale kategoriale Merkmale, da die Reihenfolge der Merkmalsausprägungen von Bedeutung ist. • Maßzahlfrage: Um numerische Merkmale wie Körpergröße oder Alter zu er- mitteln werden Maßzahlfragen verwendet. • Offene Frage: Bei einer offenen Frage werden keine Antwortmöglichkeiten vorgegeben. Die unterschiedlichen Antworten müssen bei der Analyse der Daten gegebenenfalls kategorisiert werden. Bei offenen Fragen entstehen zumeist kategoriale Variablen, die gegebenenfalls zur besseren Übersicht gröber kategorisiert werden müssen. Außerdem gibt es noch einen weiteren Fragetyp, den man mit dem Begriff „Punktefrage“ oder „Anteilsfrage“ bezeichnen könnte: • Punktefrage/ Anteilsfrage: Bei diesem Typ wird eine bestimmte Anzahl von Punkten vorgegeben (zumeist 100 Punkte), die dann auf gegebene Kategorien so verteilt werden müssen, dass klar wird, welchen prozentualen Anteil jede Kategorie besitzt. Beispiel: „Verteile … 100 Punkte so auf die folgenden Ka- 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 60 tegorien, wie es deinen Gewohnheiten entspricht, Computer außerhalb des Unterrichts zu gebrauchen“ (Biehler, Kombrink & Schweynoch, 2003, S. 7). Die prozentualen Anteile mit denen jeder Befragte die entsprechenden Kate- gorien wählt werden dann in Form von numerischen Variablen dargestellt, die meist von 0 bis 100 reichen. Die Skalen- und Punktefragen sind die beiden Fragetypen, die Schüler kaum eigen- ständig entdecken werden. Sie müssten gegebenenfalls in den höheren Klassenstufen durch den Lehrer vorgestellt werden. Nutzen die Schüler unterschiedliche Fragetypen, so werden sie die Vor- und Nachtei- le entdecken, die es haben kann, wenn man Antwortmöglichkeiten vorgibt oder die Ant- wort offen lässt. Die Schüler erfahren, dass detaillierte Informationen verloren gehen, bzw. dass sie die Detailgenauigkeit selbst festlegen können, je nachdem wie sie ihre Fragen stel- len (vgl. Kniep-Riehm, 1995, S. 29). Zudem erkennen die Schüler, dass unterschiedliche Variablentypen existieren, nämlich numerische und kategoriale. Die kategorialen Merkma- le lassen sich zudem unterscheiden in ordinale und nominale Merkmale. Bei ordinalen Merkmalen ist im Gegensatz zu nominalen Merkmalen die Reihenfolge der Kategorien von Bedeutung. In jedem Fall erfordert das Vorgeben von Antwortmöglichkeiten bei der Erstellung eines Fragebogens Antizipationsfähigkeit, die Fähigkeit zum Ordnen, Sortieren und Klassifizieren sowie hohe sprachliche Kompetenz. Ist der Fragebogen fertig gestellt, so empfiehlt es sich die Befragung in einem Rol- lenspiel zu üben bevor diese durchgeführt wird (Kniep-Riehm, 1995, S. 29), damit schüch- terne Schüler Hemmungen verlieren. Gleichzeitig kann man dadurch die Qualität des Fra- gebogens testen. 2. Beobachtung: Unter einer Beobachtung versteht man das aufmerksame und planmäßige Wahrneh- men von Vorgängen oder Verhaltensweisen in Abhängigkeit von bestimmten Situationen. Bei einer Beobachtung werden also Daten gesammelt, indem die Schüler notieren was sie sehen (z.B. die Anzahl der Gänseblümchen auf einem Quadratmeter) oder was sie oder andere Personen machen (z.B. die Zeit zu der sie morgens aufstehen). Dabei muss vor der Untersuchung festgelegt werden, was genau beobachtet werden soll und es muss den Schü- lern klar werden, dass die Beobachtung immer unter den gleichen Bedingungen stattfinden muss. 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 61 3. Experiment: Experimente eignen sich besonders gut zur Untersuchung naturwissenschaftlicher Phänomene. Auch stochastische Simulationen können durchgeführt werden, indem man ein geeignetes stochastisches Modell findet, um Daten zu generieren, welche zur Beant- wortung der Fragestellung nützlich sind. Bei einem Experiment müssen die Daten also erst in geeigneter Weise erzeugt werden, damit man sie erfassen kann. Dieses Erzeugen von Daten erfolgt unter bestimmten Versuchsbedingungen und mit Hilfe von fundamentalen mathematischen Ideen wie Schätzen oder Messen. Dazu benötigen die Schüler bestimmte Werkzeuge, wie etwa ein Maßband oder ein Thermometer. Der richtige Umgang mit die- sen Werkzeugen ist dabei im Unterricht zu üben, damit die Gewinnung realistischer Daten gewährleistet ist. Außerdem muss festgelegt werden, wie man die Daten messen will, da- mit relevante Informationen beschafft werden, die zur Problemlösung beitragen. Je nach- dem in welcher Jahrgangsstufe man Daten durch Messen erheben will, muss man entspre- chende Messverfahren zulassen. Können die Schüler etwa noch nicht mit standardisierten Maßen umgehen, so können auch Daten durch den indirekten Vergleich mit einer selbst gewählten Maßeinheit generiert werden. Bei dieser Phase der Datenerhebung besteht also ein innermathematischer Bezug zur Geometrie. Eine Alternative zu den oben beschriebenen Methoden zur Datenerhebung stellt das Nutzen von Sekundärstatistiken dar. Dabei können die Schüler Quellen wie Bücher oder das Internet nutzen, um geeignete Archivdaten zu finden, die bereits von anderen Personen erhoben wurden. Sicherlich ist es besonders in den unteren Klassen vorzuziehen, die Kin- der selbst Daten sammeln zu lassen, da sie dann einen direkteren Bezug zu den Daten ha- ben und sie dadurch auch besser in der Lage sind, diese im Sachkontext zu interpretieren. “Students seem particularly vulnerable to treating data as numbers only when they work with data they themselves have not collected” (Konold & Higgins, 2003, S. 211). Bevor man Daten erhebt ist zudem in einer Planungsphase zu entscheiden, ob man eine Vollerhebung oder eine Stichprobe durchführt. Entscheidet man sich für eine Stich- probe, so ist diese derart zu definieren, dass sie repräsentativ ist, damit man basierend auf der Stichprobe Aussagen über die zugrunde liegende Population machen kann. Wie bereits erwähnt ist die Idee der Stichprobe jedoch nicht selbstverständlich für Schüler der Klassen 1-6, da sie zunächst nur an den Ergebnissen einer kleinen Gruppe, etwa der Schulklasse, interessiert sind. Die für die Schüler schwierig zu verstehende Beziehung zwischen einer 5. Themen, statistische Fragestellungen und Methoden der Datenerhebung 62 Stichprobe und der Population wird daher im Kapitel 8 ausführlich dargelegt (vgl. Kapitel 8). Entscheidet man sich für die Methode der Beobachtung oder des Experiments, so ist zudem zu überlegen, wie die Schüler die gewonnenen Daten notieren, damit ihnen auch am Tag nach der Datensammlung noch klar ist, was die Zahlen bedeuten. Neben vorstruktu- rierten Tabellen ist die Strichliste ein geeignetes einfaches Instrument zum Sammeln und gleichzeitigen Darstellen von Daten, ebenso wie das Stängel-Blatt-Diagramm. Diese und andere graphische Repräsentationen von Daten werden im nächsten Kapitel genau vorge- stellt. 6. Daten organisieren und graphisch darstellen 63 6. Daten organisieren und graphisch darstellen In diesem Kapitel werden verschiedene konventionelle Graphen sowie neuere Tech- niken der graphischen Darstellungsformen beschrieben, die sich zum Einsatz in den Klas- sen 1-6 eignen. Zunächst wird ein Überblick über die Systematik dieser Graphiken gege- ben und dann werden Möglichkeiten betrachtet, univariate Daten darzustellen. Dazu gehö- ren unter anderem Strichlisten und Häufigkeitstabellen6, Piktogramme, eindimensionale Streudiagramme, Säulen- und Balkendiagramme, Stängel-Blatt-Diagramme und Kreisdia- gramme. Außerdem werden Graphiken zum Beschreiben und Explorieren bivariater Daten, welche teilweise auch zum Gruppenvergleich geeignet sind, vorgestellt. Dies sind Venndi- agramme, Vierfeldertafeln, Back-to-Back Stem-and-Leaf Plots, multiple Balken- und Säu- lendiagramme, zweidimensionale Streudiagramme und Liniendiagramme. In jedem Ab- schnitt werden neben der Vorstellung der Diagrammtypen unterrichtspraktische Möglich- keiten zur Einführung der verschiedenen Graphiken angegeben. Dabei orientieren sich die unterschiedlichen Einführungsmöglichkeiten an dem didaktischen Prinzip der Repräsenta- tionsformen nach Jerome S. Bruner. Dieser unterscheidet drei mathematisch prinzipiell gleichwertige, aber zunehmend abstraktere, Repräsentationsformen, welche sich am geisti- gen Entwicklungsstand der Schüler orientieren und somit einen Unterricht nach dem Spi- ralprinzip ermöglichen (vgl. Bruner 1972, zitiert nach Lauter, 1991, S. 67): • die enaktive (handelnde) Darstellung • die ikonische (bildliche) Darstellung und • die symbolische Darstellung, wozu auch die Versprachlichung gehört7 Zur enaktiven Darstellungsform gehören die „menschlichen Graphen“, die durch ge- eignetes Aufstellen der Schüler hergestellt werden können, sowie die gegenständlichen Graphen, die durch Anordnen von Objekten wie etwa Steckwürfel oder Pappkärtchen ent- stehen. Die ikonische Darstellungsform ist dann erreicht, wenn die Schüler die Graphiken aufzeichnen können, was je nach Graphiktyp unterschiedliche Anforderungen an die Schü- ler stellt. 6 Strichlisten und Häufigkeitstabellen sind streng genommen keine graphischen sondern semigraphische bzw. numerische Darstellungen, werden aber hier mit aufgeführt, da man zunächst oft die Daten in Tabellen orga- nisieren muss, um Graphiken herzustellen (vgl. Friel/Curcio/ Bright, 2001, S. 128). 7 Die symbolische Repräsentationsform ist für dieses Kapitel nicht von Relevanz und wurde nur der Voll- ständigkeit halber aufgeführt. Die Versprachlichung spielt aber bei der Analyse und Interpretation von Ver- teilungen eine entscheidende Rolle (vgl. Kapitel 7). 6. Daten organisieren und graphisch darstellen 64 Außerdem wird in diesem Kapitel die Nutzung der Software TinkerPlotsTM darge- stellt und didaktisch bewertet. Neben der Vorstellung von Diagrammtypen und deren Einführungsmöglichkeiten mit und ohne Software wird analysiert, wie sich ein Verständnis von graphischen Darstel- lungen entwickelt und wie man diese Entwicklung im Unterricht geeignet fördern kann. Außerdem wird eine Alternative zur instruktiven Hinführung zum graphischen Darstellen beschrieben, bei der Schüler explizit zum Erfinden eigener Graphiken ermutigt werden. Dieser konstruktive Erwerb von Graphikkompetenz wurde speziell beim Design der Soft- ware TinkerPlotsTM verfolgt. Im Folgenden wird diese Software zunächst kurz vorgestellt. Eine ausführliche Diskussion der Vor- und Nachteile dieser Software beim Darstellen und Analysieren von Daten wird in dieses und in das nächste Kapitel integriert. 6.1 Vorstellung der Datenanalyse-Software TinkerPlotsTM TinkerPlotsTM ist eine für die Klassen 4-8 geeignete Software zur Datenanalyse, die es Schülern erlaubt, eigene Datensätze oder Sekundärstatistiken mit Hilfe von graphischen Darstellungen zu analysieren und die Ergebnisse in Form von schriftlichen Berichten fest- zuhalten. Einerseits wird diese Software in dieser Arbeit als Werkzeug verwendet, um gra- phische Darstellungen herzustellen, andererseits wird aus didaktischer Perspektive aufge- zeigt wie man TinkerPlotsTM im Unterricht einsetzen kann, um die Einsicht der Schüler in Graphiken zu fördern. Im Unterricht kann die Software ebenfalls einmal als Werkzeug der Lehrenden genutzt werden, die damit geeignete Arbeits- und Lernumgebungen herstellen, und einmal als Werkzeug der Lernenden, die mit Hilfe der gestalteten Arbeits- und Lern- umgebungen Wissen eigenständig konstruieren und Zusammenhänge entdecken. Das Besondere dieser Software liegt im handelnden Aufbau von Graphen, wie der Name TinkerPlots, den man mit „Graphen basteln“ übersetzen könnte, bereits aussagt. Im Gegensatz zu den meisten anderen Programmen zur Datenanalyse gibt TinkerPlotsTM nicht eine Fülle von konventionellen Graphiken vor, aus denen die Schüler auswählen müssen, sondern erlaubt Schülern mit den intuitiven Operationen wie „stack“ (stapeln), „order“ (der Größe nach ordnen) und „separate“ (in Teilgruppen trennen) Daten in graphischen Darstel- lungen schrittweise zu organisieren8. Wenn man einen Datensatz mit TinkerPlotsTM öffnet, 8 Da diese Software erst 2005 auf den Markt gekommen ist, existiert noch keine deutschsprachige Version, was den Einsatz im Unterricht erschwert. Dennoch sollen die didaktischen Vorteile dieser Software unter 6. Daten organisieren und graphisch darstellen 65 so erscheinen die Daten, repräsentiert durch Icons, in einer zufälligen Anordnung. Indem die Schüler die oben genannten Operationen in unterschiedlichen Kombinationen nutzen, können sie verschiedene Graphiken produzieren, darunter sowohl Standard-Graphiken als auch unkonventionelle, selbst erfundene Graphiken (Konold, 2002, S. 2-3). Diese Software unterstützt also den konstruktiven Erwerb von Fähigkeiten zum graphischen Darstellen, Lesen und Interpretieren von Daten, da sie ausgehend von Grundideen der Statistik wie Ordnen und Gruppieren vom Wissensstand der Schüler ausgeht und interaktives und expe- rimentelles Arbeiten ermöglicht. Insofern stellt TinkerPlotsTM eine für Statistik-Anfänger geeignete Software dar, die in späteren Jahrgängen weitgehend problemlos durch die Soft- ware FathomTM ersetzt werden kann, da diese beiden Programme eng miteinander „ver- wandt“ sind und viele Merkmale, wie etwa den Formeleditor, gemeinsam haben. Die Verwendung der Software TinkerPlotsTM im Unterricht ist als Zwischenstufe zwischen der enaktiven und der ikonischen Darstellung anzusiedeln, da einerseits zwar die Graphen handelnd aufgebaut werden, aber andererseits dies nicht mit konkretem Material sondern virtuell geschieht. Bevor für die Klassen 1-6 geeignete Darstellungen einzeln vorgestellt werden, gebe ich zunächst einen Überblick über die Systematik der graphischen und numerischen Dar- stellungen in Abhängigkeit von den zu untersuchenden Merkmalen. 6.2 Systematik verschiedener graphischer und numerischer Darstellungen Besonders in der Explorativen Datenanalyse sind graphische Darstellungen das we- sentliche Werkzeug bei einer Datenexploration (vgl. Kapitel 2, Abschnitt 2.3). Graphiken sind ein exploratives Mittel, um Muster und Strukturen in den Daten zu entdecken und ein kommunikatives Mittel, da man mittels Graphiken Informationen übermitteln kann. Sie dienen zudem als Wertespeicher, wenn man sie zum Darstellen und Ablesen einzelner Werte nutzt und haben die Funktion, relationale Beziehungen und Strukturen mitzuteilen. Dennoch stellen Graphiken immer eine bestimmte Perspektive auf die Daten dar; sie haben einen Modellcharakter. Hiermit ergibt sich zwar einerseits eine Gefahr der Verfälschung, aber andererseits auch die Chance der Konzentration auf bestimmte Aspekte. Die Wahl der Graphik hängt also davon ab, was man untersuchen und mitteilen möchte. Weiterhin sind Ausblendung der Sprachprobleme aufgezeigt werden, in der Hoffnung, dass eine deutschsprachige Version erarbeitet wird. 6. Daten organisieren und graphisch darstellen 66 graphische Darstellungen veränderbar, da keine optimale Graphik existiert, die die Daten so darstellt, wie sie sind. Manchmal kann erst eine Vielfalt von Graphiken Einsicht in die Daten und damit in das Sachproblem ermöglichen (vgl. Biehler & Steinbring, 1991, S. 9). Im Folgenden wird versucht, einen Überblick über die verschiedenen graphischen Darstellungen und deren Beziehungen zueinander zu geben, die für die Klassen 1-6 geeig- net scheinen. Die Darstellungsformen hängen davon ab, wie viele Variablen man in einer Graphik darstellen will und von welchem Typ diese Variablen sind (vgl. Biehler & Steinbring, 1991, S. 9). Untersucht man ein einziges Merkmal, so eignen sich Graphiken univariater Daten, untersucht man die Beziehung zwischen zwei Merkmalen oder führt man einen Gruppenvergleich durch, so sind Graphiken bivariater Daten zu wählen. Die zu untersuchenden Merkmale lassen sich in drei Kategorien einteilen: 1. Namensvariablen, z.B. Schülername 2. Kategoriale Variablen, z.B. Lieblingstier, Haarfarbe,… 3. Numerische Variablen, z.B. Körpergröße, Gewicht,… Für jedes Merkmal oder jede sinnvolle Kombination zweier Merkmale gibt es nun geeignete Darstellungsweisen, die in Abbildung 6.1 aufgeführt sind. Abb. 6.1: Systematik elementarer graphischer und numerischer Darstellungen Graphiken univariater Daten Namensvariable und numerisches Merkmal Kategoriales Merkmal Numerisches Merkmal Case-Value Plot Strichliste Strichliste Piktogramm Häufigkeitstabelle Häufigkeitstabelle* Eindimens. Streudiagramm Balken- u. Säulendiagramm* Stängel-Blatt-Diagramm Kreisdiagramm* 6. Daten organisieren und graphisch darstellen 67 Graphiken bivariater Daten 2 kategoriale Merkmale 1 numerisches und 1 kategoriales Merkmal 2 numerische Merkmale Venndiagramm Back-to-Back Stem-and-Leaf Liniendiagramm Vierfeldertafel Plot Zweidim. Streudiagramm Multiple Balken- und (Scatterplot) Säulendiagramme* Paired Case-Value Plot Der Variablentyp bestimmt weiterhin die Art der Zuordnung, die in den Graphen dargestellt wird. So wird bei der Namensvariablen jedem Namen, also jeder Untersu- chungseinheit in der Grundmenge, genau eine Merkmalsausprägung des untersuchten Merkmals zugeordnet. Bei den anderen Variablen hingegen wird jeder Merkmalsausprä- gung deren absolute oder relative Häufigkeit zugeordnet, da die Daten gruppiert und da- durch reduziert wurden. Die mit * gekennzeichneten Graphiken eignen sich auch für die Visualisierung einer relativen Häufigkeitsverteilung, welche jedoch erst ab Klasse 6 einge- setzt werden können, da in dieser Jahrgangsstufe eine Erweiterung des Zahlbereichs auf nichtnegative rationale Zahlen stattfindet. Bei Repräsentationen bivariater Daten unterscheidet man Graphiken, die sich zum Vergleich von Verteilungen eignen, von solchen, die Beziehungen zwischen Variablen sichtbar machen. Die Entscheidung für oder gegen eine bestimmte Graphik hängt vom Datensatz selbst ab, sowie von dem Zweck der Untersuchung und dem, was man kommunizieren möchte. 6. Daten organisieren und graphisch darstellen 68 6.3 Graphische Darstellungen univariater Daten und deren unterrichtspraktische Einführung Strichliste und Häufigkeitstabelle Strichlisten und Häufigkeitstabellen lassen sich sowohl für kategoriale, als auch für numerische Variablen verwenden. Eine Strichliste ist eine spezielle Häufigkeitstabelle, bei der jeder Merkmalsausprägung ihre absolute Häufigkeit zugeordnet wird, wobei durch die Darstellung durch Striche noch jeder einzelne Wert identifizierbar ist. Häufigkeitstabellen unterscheiden sich dadurch von Strichlisten, dass die Häufigkeit durch Zahlen anstatt durch Striche angegeben wird. Sie sind dadurch abstrakter, da die einzelnen Werte verschwinden und in einer einzigen Zahl pro Merkmalsausprägung ausgedrückt werden (vgl. Abb. 6.2). Weiterhin können den Merkmalsausprägungen in Häufigkeitstabellen auch relative Häu- figkeiten zugeordnet werden. Abb. 6.2: Kombinierte Strichliste und Häufigkeitstabelle der Lieblingsfrüchte der Schüler einer Klasse (Darstellung aus: Sheffield, Cavanagh, Dacey, Findell, Greenes & Small, 2002, S. 20) Der Vorteil von Häufigkeitstabellen im Allgemeinen besteht darin, dass man genaue numerische Werte sofort ablesen kann. Nachteilig ist, dass man jedoch keinen schnellen Überblick über die Verteilungsform erhält. Dazu müsste man zunächst die Zahlen erfassen, miteinander vergleichen und sich einen Graph innerlich dazu vorstellen, was hohe kogniti- ve Anforderungen an Schüler der Klassen 1-6 stellen würde. Daher ist es vorzuziehen, die Daten aus den Tabellen zu nutzen, um Graphiken zu erstellen, da diese eine visuelle Explo- 6. Daten organisieren und graphisch darstellen 69 ration der Daten ermöglichen. Strichlisten hingegen können einen Überblick über die Ver- teilungsform geben, wenn die Striche in gleichen Abständen gesetzt werden. Außerdem können in Strichlisten direkt Daten erhoben werden und dann zur graphischen Organisati- on weiterverwendet werden. Strichlisten dürften einigen Schülern bereits aus dem Alltag bekannt sein. Allerdings sollte man deshalb den Einsatz von Strichlisten insbesondere in den unteren Klassen nicht für unproblematisch halten. Besonders die 5er-Bündelung sollte betont werden, da die Bündel übersichtlicher und schneller zu zählen sind als einzelne Striche. Zudem ist es vor- teilhaft, zunächst reale Objekte in Partnerarbeit zählen zu lassen. Ein Schüler kann dann auf die Objekte zeigen oder die gezählten Objekte beiseite legen, während der andere Schüler die Strichliste führt (Lindquist, Luquire, Gardner & Shekaramiz, 1992, S. 12). So können sich die Schüler gegenseitig kontrollieren und gemeinsam lernen, dass kein Objekt doppelt gezählt oder ausgelassen werden darf. Zählt man die Striche jeder Kategorie aus und ersetzt die Striche durch die Anzahl, so erhält man eine Häufigkeitstabelle. Abbildung 6.2 zeigt eine kombinierte Strichliste und Häufigkeitstabelle der Lieblingsfrüchte der Schü- ler einer Klasse (vgl. Abb. 6.2). Mit der Software TinkerPlotsTM lassen sich sowohl konventionelle (vgl. Abb. 6.3 (b)) als auch modifizierte Häufigkeitstabellen darstellen (vgl. Abb. 6.3 (a)). Unter modifizierten Häufigkeitstabellen verstehe ich Graphiken, in denen man die absoluten und /oder relativen Häufigkeiten anzeigen lassen kann, also sozusagen kombinierte Graphiken und Häufig- keitstabellen. Diese sind für jüngere Schüler oft von Vorteil, da davon ausgegangen wird, dass sich Daten in graphischen Darstellungen besser analysieren und interpretieren lassen als in reinen numerischen Darstellungen. Eine konventionelle Häufigkeitstabelle lässt sich in TinkerPlotsTM herstellen, indem man einfach die Icons mit dem Befehl „Hide Icon“ aus- blendet. 6. Daten organisieren und graphisch darstellen 70 Abb. 6.3: Modifizierte und konventionelle Häufigkeitstabelle in TinkerPlotsTM (a) (b) Collection 1 Watermelon Cantaloupe Bananas Apples 8 (40%) 2 (10%) 3 (15%) 7 (35%) Fr ui ts count Circle Icon Collection 1 Watermelon Cantaloupe Bananas Apples 0 2 4 6 8 8 (40%) 2 (10%) 3 (15%) 7 (35%) Fr ui ts count Circle Icon Piktogramm Das Piktogramm ist eine Darstellungsform für kategoriale Variablen und besteht aus einheitlichen Bildern, die Mengen von Objekten bzw. Personen darstellen. Die benutzten Symbole, auch Icons genannt, sollten einheitliche Größe und Form besitzen, um Fehldeu- tungen zu vermeiden (vgl. Abb. 4.3). Man unterscheidet zwei Arten von Piktogrammen: Piktogramme mit Schlüssel und solche ohne Schlüssel. Letztere sind für Kinder einfacher zu verstehen, weil das Icon und die Anzahl der Objekte, die es repräsentiert, in einer 1:1- Korrespondenz zueinander stehen. Piktogramme mit Schlüssel sind abstrakter, da ein Icon mehrere Objekte repräsentiert. Außerdem können in dieser Variante der Darstellung Bruchteile von Icons auftreten, beispielsweise ein halbes Icon, was üblicherweise schwie- riger für die Schüler zu lesen ist (vgl. Curcio, 2001, S. 2 und Abb. 6.4 (b)). Beim Lesen einer solchen Graphik ist also der Schlüssel von großer Bedeutung. 6. Daten organisieren und graphisch darstellen 71 Abb. 6.4: Ein einfaches Piktogramm und ein Piktogramm mit Schlüssel (a) (b) (Darstellung aus: Curcio, 2001, S. 2) Zur Einführung von Piktogrammen existieren bedingt durch die verschiedenen Rep- räsentationsformen mehrere Möglichkeiten. Um die Frage zu beantworten, mit welchem Verkehrsmittel die Schüler der Klasse morgens zur Schule gelangen, lässt sich beispiels- weise auf enaktiver Ebene ein gegenständlicher Graph herstellen. Durch die Auswahl von Verkehrsmitteln (geeignet sind Spielzeugautos, Puppenschuhe für Fußgänger,…) und die Platzierung auf einem vorbereiteten Plakat mit vorstrukturierten Kästchen können die Schüler ihre Daten durch reale Objekte darstellen. Es entsteht ein gegenständliches Pikto- gramm, welches anzeigt, wie die Kinder der Klasse morgens zur Schule kommen. Befes- tigt man die Objekte mit Klebeband, so lässt sich dieser Graph auch als Plakat in der Klas- se anbringen (vgl. Curcio, 2001, S. 36). Eine weitere Möglichkeit besteht darin, die Schü- ler Bilder gleicher Größe malen zu lassen, welche zeigen, wie sie morgens zur Schule ge- langen. Werden diese Bilder auf einem Plakat platziert, so entsteht ein Piktogramm. 6. Daten organisieren und graphisch darstellen 72 Abb. 6.5:Gegenständliches Piktogramm zu den verwendeten Verkehrsmitteln auf dem Schulweg (Darstellung aus: Curcio, 2001, S. 36) Der nächste Schritt besteht dann darin, die verschiedenen Bilder oder Objekte durch einheitliche Icons zu ersetzen. Wählt man abstrakte Icons, wie etwa Quadrate, so lässt sich ein Übergang vom Piktogramm zum Säulen- bzw. Balkendiagramm gut herstellen. Oder man wählt anstatt der Spielzeugautos, etc. Steckwürfel und repräsentiert damit die Anzahl der Schüler, um einen Übergang zu dieser Repräsentationsform zu finden. Bei handgezeichneten Piktogrammen treten laut Du Feu (1995, S. 35) zwei Schwie- rigkeiten auf: Erstens haben die Icons meist unterschiedliche Größen und zweitens sind sie häufig unpräzise positioniert, was zu Fehlinterpretationen führen kann. Um dem entgegen- zuwirken könnte man entsprechendes Quadratgitterpapier austeilen, so dass jedes Icon in genau ein Quadrat gezeichnet wird. Zusätzlich könnte man auch Icons kopieren, so dass die Schüler diese nur noch ausschneiden und auf vorstrukturiertes Papier aufkleben müs- sen. Dennoch ist diese Vorgehensweise erst dann angebracht, wenn die Schüler verstehen, warum man gleich große Icons wählen sollte. Dieses Verständnis kann man durch den Vergleich von Piktogrammen mit unterschiedlichen und mit einheitlichen Icons wecken (vgl. Abb. 4.3). Die Schüler erkennen dadurch, dass man die Größe eines Bildes nicht als Maß für die Häufigkeit verwenden kann. Diese Vorerfahrung könnte zudem zu einer Mi- nimierung von Skalierungsproblemen bei komplexeren Graphen beitragen. 6. Daten organisieren und graphisch darstellen 73 Haben die Schüler verstanden wie Piktogramme aufgebaut sind, so können sie ge- eignete Software nutzen, um diese zu erzeugen. Obwohl TinkerPlotsTM über eine Icon- Bibliothek verfügt, eignet sich diese Software nur bedingt zur Herstellung von Piktogram- men, da man pro Graph nur ein Icon verwenden kann, was dann in verschiedenen Farben je Kategorie erscheint. Darstellungen mit verschiedenen Icons für die unterschiedlichen Verkehrsmittel sind damit nicht möglich. Man könnte jedoch die Icons in einem Textver- arbeitungsprogramm nutzen, um eine derartige Darstellung zu generieren, was jedoch zeit- intensiv ist (vgl. Abb. 6.6). Abb. 6.6: Piktogramm erzeugt mit TinkerPlotsTM und mit einem Textverarbeitungspro- gramm Collection 1 Auto Bus Zu Fuß Bahn 0 2 4 6 Ve rk eh rs m itt el count Image Icon Zusammenfassend bleibt festzuhalten, dass Piktogramme besonders für kleine Da- tensätze geeignet sind, um Strukturen in den Daten zu entdecken. Durch die Icons besteht gerade für jüngere Schüler eine direkte Verbindung zwischen den Daten und dem realen Ereignis, was dazu beitragen könnte, dass sie diese graphische Darstellung im Sachkontext interpretieren: “However, whereas to our eye pictographs may be distracting and unneces- sary, for students they may help establish explicit links between the data and the event, possibly helping them reason about the data in the appropriate context” (Konold & Hig- gins, 2003, S. 198). Ein weiterer Vorteil bei einfachen Piktogrammen besteht darin, dass eine Bezeichnung der Achsen entfällt, da die Bilder die benötigten Informationen liefern. Das Decodieren solcher Graphiken verlangt also keine oder nur geringe schriftsprachliche Kompetenz, was vorteilhaft für schwächere Schüler ist. 6. Daten organisieren und graphisch darstellen 74 Eindimensionales Streudiagramm/ Line Plot/ Stacked Dot Plot Das eindimensionale Streudiagramm, bei dem jeder vorkommende Wert durch ein „X“ (ein Kreuz) über dem Zahlenstrahl repräsentiert wird, ist eine einfache und schnell herzustellende Darstellung zur Organisation von numerischen Variablen, die häufig zu Beginn der Datenanalyse verwendet wird und weniger als Präsentationsgraphik zur Kom- munikation der Resultate. Besonders geeignet ist diese graphische Darstellung, wenn die Spannweite der Daten nicht sehr groß ist und auch der Umfang des Datensatzes relativ klein ist, also ca. 25 oder weniger Werte umfasst (Landwehr & Watkins, 1995, S. 8; Rus- sell & Corwin, 1989, S. 17). Ein weiteres Charakteristikum dieser Graphik ist, dass nur die x-Achse benötigt wird. Die y-Achse zum Bestimmen der Häufigkeit ist nur implizit in der Darstellung enthalten (vgl. Bright & Friel, 1998, S. 74) und wird praktisch durch das Zäh- len der Kreuze ersetzt. Gut erkennbar sind Ausreißer, Lücken und Gruppierungen (cluster) in den Daten. Das Minimum und das Maximum sind leicht ablesbar (vgl. Landwehr & Watkins, 1995, S. 8) und auch die Verteilungsform wird gut sichtbar. Ein weiterer Vorteil dieser Graphik besteht darin, dass Daten direkt darin gesammelt werden können und dass das Erstellen einer Urliste dadurch praktisch entfällt. Allerdings muss dann zuvor die Spannweite ge- schätzt werden (vgl. Russell & Corwin, 1989, S. 18), was jedoch eine gute Übung zur Ar- tikulation von Erwartungen an die Daten darstellt. Zudem ist das Schätzen eine fundamen- tale Idee des Mathematikunterrichts. Ein Nachteil dieser Graphik besteht darin, dass man teilweise die exakten numerischen Werte schlecht daraus ablesen kann (vgl. Landwehr & Watkins, 1995, S. 83-84). Diese Problematik ist jedoch in den Klassen 1-6 von geringer Bedeutung, da überwiegend Daten behandelt werden, die aus dem Zahlbereich der natürli- chen Zahlen stammen. Lediglich einfache Bruchzahlen wie ½ oder ¼ oder die dazugehöri- gen Dezimalzahlen könnten in den Datensätzen vorkommen. Beim Zeichnen von eindimensionalen Streudiagrammen ist darauf zu achten, dass jedes „X“ gleich viel Platz einnimmt. Hilfreich für die Schüler ist dabei wieder vorstruktu- riertes Papier. 6. Daten organisieren und graphisch darstellen 75 Abb. 6.7: Geordnete Urliste und zugehöriges eindimensionales Streudiagramm Geordnete Urliste: 29, 35, 35, 35, 36, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38 X X X X X X X X X X X X X X X 29 30 31 32 33 34 35 36 37 38 (Darstellung wie bei Russell & Corwin, 1989, S. 17) Zur Einführung dieses Diagrammtyps könnte man die Schüler dazu anregen, mithilfe eines Zahlenstrahls die Daten darzustellen und die Ideen der Schüler aufgreifen, um daraus das konventionelle eindimensionale Streudiagramm zu entwickeln. Auf enaktiver Ebene könnte man einen Zahlenstrahl an die Tafel zeichnen und die Schüler dazu auffordern, ihre auf Kärtchen festgehaltenen Daten mit Klebeband oder Magneten über der jeweiligen Zahl zu befestigen. Auf ähnliche Weise könnte man mit Steckwürfeln anstelle von Kärtchen verfahren. So entsteht zunächst eine Art Piktogramm für numerische Variablen, das später in das konventionelle eindimensionale Streudiagramm umgewandelt werden kann, indem einfach die Kärtchen durch Kreuze ersetzt werden. Die Verwendung von Kreuzen rechtfer- tigt sich damit, dass diese schneller zu zeichnen sind als etwa Quadrate oder gar Icons. Mit der Software TinkerPlotsTM lässt sich nur ein eindimensionales Streudiagramm mit Kreisen (anstatt Kreuzen, die sich jedoch importieren ließen) und zwei Achsen realisie- ren, da immer beide Achsen automatisch eingezeichnet werden. Die Existenz der 2.Achse kann jedoch auch ein Vorteil sein, da man mithilfe der unteren Graphik einen einfachen Übergang zum Säulendiagramm finden könnte, indem man einfach im ersten Schritt ein quadratisches Icon (vgl. Abb. 6.8 (b)) und im zweiten Schritt ein randloses Icon (Border- less Icon) wählt (vgl. Abb. 6.8 (c)). Abbildung 6.8 (b) entspricht dem enaktiven Arbeiten mit Kärtchen oder Steckwürfeln, da in dieser Abbildung noch jeder individuelle Fall iden- tifizierbar ist. In TinkerPlotsTM lassen sich jedoch in allen graphischen Darstellungen noch einzelne Werte mit Namen identifizieren (vgl. Abb. 6.8(d)), so dass die Schüler immer noch die Möglichkeit haben, einen Schritt zurück zu gehen und die einzelnen Datenwerte zu betrachten. 6. Daten organisieren und graphisch darstellen 76 Abb. 6.8: Übergang vom Line Plot zum Säulendiagramm realisiert mit TinkerPlotsTM (a) (b) Collection 1 28 30 32 34 36 38 0 2 4 6 co un t Anzahl Square Icon (c) (d) Collection 1 28 30 32 34 36 38 0 2 4 6 co un t Anzahl Circle Icon Collection 1 InaLizErik Max Miro Jan AliTim Nik Uli Till Tilo Ron Pam Tina 28 30 32 34 36 38 0 2 4 6 co un t Anzahl Square Icon Collection 1 28 30 32 34 36 38 0 2 4 6 co un t Anzahl Square Icon Säulen- und Balkendiagramm (für gruppierte Daten) Diese Diagrammtypen eignen sich, um die Häufigkeitsverteilung kategorialer Vari- ablen zu betrachten. Jede Säule bzw. jeder Balken stellt eine Kategorie dar. Im Säulendia- gramm (Balkendiagramm) wird die Häufigkeit jeder Kategorie durch die Höhe (Länge) der rechteckigen Säule (des rechteckigen Balkens) gleicher Breite repräsentiert. Die Höhe (Länge) der Säulen (Balken) ist also proportional zu der Anzahl der Fälle der jeweiligen Kategorie. Der Unterschied zwischen Säulen- und Balkendiagrammen besteht allein darin, dass sie anders angeordnet sind. Dreht man ein Säulendiagramm um 90° mit dem Uhrzei- gersinn, so entsteht ein Balkendiagramm. Dreht man ein Balkendiagramm um 90° gegen 6. Daten organisieren und graphisch darstellen 77 den Uhrzeigersinn, so entsteht ein Säulendiagramm. Bei ordinalen kategorialen Variablen ist die Darstellungsform des Säulen- oder Balkendiagramms dem Kreisdiagramm überle- gen, da diese die Verteilungsform sichtbar machen, welche im Kreisdiagramm nicht zu erkennen ist. Auf enaktiver Ebene lässt sich das Säulendiagramm mit Steckwürfeln einführen. Will man etwa die Verteilung der Haarfarben in der Klasse betrachten, so wählt jeder Schüler einen Steckwürfel entsprechender Farbe aus und gruppiert diese durch Zusammen- stecken mit den anderen Würfeln gleicher Farbe. So entsteht ein dreidimensionales Säu- lendiagramm, welches die Verteilung der Haarfarben visualisiert (vgl. Russell & Corwin, 1990, S. 22). Die Einführung von Säulen- bzw. Balkendiagrammen ist einfach, wenn die Schüler bereits mit Piktogrammen vertraut sind. Curcio (2001, S. 39) schlägt vor, zunächst ein ge- meinsames Piktogramm mit der Klasse an der Tafel anzufertigen, indem jeder Schüler sein auf Karteikarten gezeichnetes Icon in die jeweilige Kategorie einordnet und dort mit Kle- beband befestigt. Dann umrandet der Lehrer mit Kreide die Säulen bzw. Balken, fügt eine vertikale bzw. horizontale Achse ein, die die Häufigkeit angibt, und entfernt dann die Kar- teikarten. So erkennen die Schüler, wie ein Graph aus dem anderen entsteht und durch eine anschließende Diskussion sollte erkannt werden, dass die beiden Graphen genau dieselben Informationen liefern. Lediglich eine Identifikation von einzelnen Daten ist im Balkendia- gramm nicht mehr möglich. Mit der Software TinkerPlotsTM ist dieser Übergang vom Piktogramm zum Säulen- oder Balkendiagramm analog zu vollziehen. Geht man nochmals von der Frage des benut- zen Verkehrsmittels aus, so lässt sich das Piktogramm aus Abbildung 6.6 einfach in ein Balkendiagramm ändern, indem man den Icon-Typ quadratisch (Square Icon) und randlos (Borderless Icon) wählt. Der quadratische Icon-Typ entspricht dem enaktiven Arbeiten mit Steckwürfeln oder Kärtchen (vgl. Abb. 6.9 (a)). Das Wählen eines randlosen Icons ent- spricht dem Umranden der Karteikarten mit Kreide an der Tafel und dem anschließenden Entfernen der Karteikarten (vgl. Abb. 6.9 (b)). 6. Daten organisieren und graphisch darstellen 78 Abb. 6.9: Balkendiagramme erzeugt mit der Software TinkerPlotsTM (a) (b) Collection 1 Auto Bus Zu Fuß Bahn 0 2 4 6 Ve rk eh rs m itt el count Square Icon Collection 1 Auto Bus Zu Fuß Bahn 0 2 4 6 Ve rk eh rs m itt el count Square Icon Zwar sind die Darstellungsformen des Säulen- und Balkendiagramms mathematisch gleichwertig, aber für den visuellen Vergleich ist eine horizontale Anordnung geeigneter, da dass menschliche Auge Längenunterschiede in der Horizontalen leichter wahrnimmt als in der Vertikalen. Dies spricht also für eine Verwendung von Balkendiagrammen anstelle von Säulendiagrammen. Case-Value Plot (Säulen- und Balkendiagramm für ungruppierte Daten) Neben der oben beschriebenen konventionellen Form von Säulen- und Balkendia- grammen zur Repräsentation gruppierter Daten existieren auch entsprechende Diagramme zur Darstellung ungruppierter Daten, in denen jeder Fall durch eine eigene Säule (durch einen eigenen Balken) repräsentiert wird (vgl. Bright & Friel, 1998, S. 65). Konold & Hig- gins (2003, S. 199) bezeichnen diese Graphiken als „Case-Value Plots“ um zu betonen, dass jedem Fall eine Merkmalsausprägung zugeordnet wird. Diese Graphik ist typisch zur Darstellung von einer Namensvariablen und einer numerischen Variablen. Jedem Namen wird dabei genau eine Merkmalsausprägung zugeordnet. 6. Daten organisieren und graphisch darstellen 79 Betrachtet man beispielsweise das Merkmal Körpergröße, so lässt sich mithilfe von „Additionsrollenpapier“ die Größe jedes Schülers repräsentieren. Je zwei Schüler arbeiten zusammen und messen die Körpergröße mit dem Additionsrollenpapier ab. Dabei legt sich ein Schüler auf das Additionsrollenpapier und ein Anderer markiert es entsprechend und schneidet es dann so zu, dass es die Körpergröße darstellt. Danach werden die Papierstrei- fen mit Namen versehen und auf ein großes Plakat geklebt. So entsteht ein lebensgroßer Case-Value Plot, welcher jedem Schüler seine Körpergröße zuordnet (vgl. Curcio, 2001, S. 35). Neben dieser enaktiven Repräsentation des Case-Value Plots kann man diese graphi- sche Darstellungsform auch mit der Software TinkerPlotsTM herstellen. Abbildung 6.10 zeigt zum Beispiel einen ungeordneten und einen geordneten Case-Value-Plot, welche beide die Schulwegzeit von 30 Schülern einer 8. Klasse visualisieren. Abb. 6.10: Nicht geordneter und geordneter Case-Value Plot der Schulwegzeit (a) (b) Collection 1 Daniel Tobias Michael Christian Melanie Viviane Marietta Tamara Daniela Krezimir Hendrik Almira Marvin Karin Kirsten Ergin Songül Bettina Köray Angelika Cemil Reinhard Ullrich Svenja Luciano Adrian Stefanie Annika Snezana Cornelia 0 20 40 60 or de re d by S ch ul w eg ze it (m in ) Schulwegzeit (min) Value Bar Horizontal (Quelle der Daten: Biehler & Steinbring, 1991, S. 11) Collection 1 Adrian Almira Angelika Annika Bettina Cemil Christian Cornelia Daniel Daniela Ergin Hendrik Karin Kirsten Köray Krezimir Luciano Marietta Marvin Melanie Michael Reinhard Snezana Songül Stefanie Svenja Tamara Tobias Ullrich Viviane 0 20 40 60 N am e Schulwegzeit (min) Value Bar Horizontal 6. Daten organisieren und graphisch darstellen 80 Für Schüler ist dies zunächst eine plausible und nahe liegende Veranschaulichung der Daten auf Basis einer Tabelle, die alle Informationen enthält. Sind die Daten nicht ge- ordnet, sondern alphabetisch aufgelistet wie in Abbildung 6.10 (a), so kann dieser Typ der Darstellung oft nicht zu mehr dienen, als die einzelnen Schulwegzeiten abzulesen (vgl. Biehler & Steinbring, 1991, S. 11). Die geordnete Darstellung lässt zusätzlich weitere Ein- zelheiten erkennen, etwa dass genau die Hälfte der Schüler eine Schulwegzeit von bis zu 20 Minuten hat, dass 8 Schüler zwischen 25 und 38 Minuten für den Schulweg benötigen und die restlichen 7 Schüler zwischen 40 und fast 60 Minuten Zeit für den Schulweg auf- bringen müssen. Beim Zeichnen dieser Diagramme mit Papier und Stift ist darauf zu achten, dass die Achsen beschriftet werden, dass die Säulen bzw. Balken eine einheitliche Breite haben und dass sie in einheitlichen Abständen gezeichnet werden. Dennoch ist der Übergang vom Case-Value Plot zu den kumulativen Diagrammen wie dem eindimensionalem Streudiagramm für Schüler schwierig zu verstehen, da letztere jedem Wert seine Häufigkeit zuordnen. Die Software TinkerPlotsTM erlaubt es, diesen Ü- bergang handelnd auszuführen und dynamisch zu visualisieren. Darin besteht die Chance, dass Schülern der Zusammenhang zwischen diesen beiden unterschiedlichen Graphiktypen und den dahinter stehenden Zuordnungen bewusst wird. Indem die Schüler beispielsweise die Graphik aus Abbildung 6.10 (b) derart modifizieren, dass sie den Icon-Typ kreisförmig wählen (vgl. Abb. 6.11 (a)) und die Daten auf die x-Achse stapeln, so erhalten sie ein ein- dimensionales Streudiagramm, welches die Häufigkeit der einzelnen Schulwegzeiten an- gibt (vgl. Abb. 6.11 (b)). 6. Daten organisieren und graphisch darstellen 81 Abb. 6.11: Übergang vom Case-Value Plot zum eindimensionalen Streudiagramm (a) (b) Collection 1 0 10 20 30 40 50 60 0 5co un t, or de re d by S ch ul w eg ze it (m in ) Schulwegzeit (min) Circle Icon Collection 1 Daniel Tobias Michael Christian Melanie Viviane Marietta Tamara Daniela Krezimir Hendrik Almira Marvin Karin Kirsten Ergin Songül Bettina Köray Angelika Cemil Reinhard Ullrich Svenja Luciano Adrian Stefanie Annika Snezana Cornelia 0 10 20 30 40 50 60 or de re d by S ch ul w eg ze it (m in ) Schulwegzeit (min) Circle Icon Stängel-Blatt-Diagramm/ Stem-and-Leaf Plot Das von John W. Tukey erfundene Stängel-Blatt-Diagramm ist eine dem Histogramm ähnliche, semigraphische Darstellungsform. Dies bedeutet, dass Beziehungen zwischen den Zahlen auf geometrische Beziehungen abgebildet werden, so dass Besonder- heiten in den Daten visuell schnell wahrgenommen werden können (vgl. Biehler, 1982, S. 41). Dieser Diagrammtyp ist wie der Line Plot eine einfache Darstellungsweise für nume- rische Daten und ist am besten geeignet für Daten mit einer großen Spannweite und einem zweistelligen Wertebereich (vgl. Russell & Corwin, 1989, S. 29), da die Darstellung sehr kompakt und aussagekräftig ist und bei großen Datensätzen nicht so schnell unübersicht- lich wird wie etwa der Line Plot. Diese Graphik ist gekennzeichnet durch die Trennung der Ziffern jeder Zahl aus der Urliste und ähnelt somit der Stellenwerttafel (vgl. Abb. 6.12): In der linken Spalte werden die Zehnerziffern als „Stängel“ dargestellt und in der rechten 6. Daten organisieren und graphisch darstellen 82 Spalte werden die Einerziffern der Größe nach als „Blätter“ aufgereiht (vgl. Curcio, 2001, S. 5). Ähnlich wie Histogramme gruppieren auch Stängel-Blatt-Diagramme die Daten in Intervalle, meist mit der Intervallbreite 10 wie oben beschrieben (vgl. Bright & Friel, 1998, S. 79). Damit ergibt sich die Klasseneinteilung pragmatisch und braucht nicht eigens the- matisiert zu werden (vgl. Biehler & Steinbring, 1991, S. 13). Die Länge der Zeilen im Stängel-Blatt-Diagramm ist proportional zur Häufigkeit der Daten. Abb. 6.12: Ähnlichkeit des Stängel-Blatt-Diagramms mit der Stellenwerttafel (Darstellung aus: Curcio, 2001, S. 73) Bei drei- oder mehrstelligen Wertebereichen wird die Ziffer des größten Stellenwerts als Stängel notiert und die restlichen Ziffern als Blatt, wobei die restlichen Ziffern der ver- schiedenen Zahlen durch Kommata voneinander getrennt werden. Neben diesem einfachsten Typ des Stängel-Blatt-Diagramms existieren weitere Va- rianten dieser Graphik. Ähnlich wie beim Histogramm hat man auch bei diesem Schaubild die Möglichkeit, verschiedene „Klassenbreiten“ zu wählen. Damit zeigt sich auch das aus dem Histogramm bekannte Phänomen der Abhängigkeit der Verteilungsform von der Klassenbreite (vgl. Biehler, 1982, S. 24). Eine weitere Variante, nämlich der „Back-to- Back Stem-and-Leaf Plot“ zum Vergleich zweier Datensätze, wird im Abschnitt 6.4 ge- nauer vorgestellt. Im Stängel-Blatt-Diagramm sind alle Werte, die überhaupt auftreten, sofort ablesbar, denn alle Informationen der Urliste sind noch im Diagramm enthalten. Direkt ablesbar sind damit das Minimum und das Maximum und folglich auch die Spannweite (vgl. Landwehr & Watkins, 1995, S. 45), sowie der Modalwert und weitere populäre Werte. Weiterhin lässt sich in dieser Darstellungsform der Median durch einfaches Abzählen ermitteln (vgl. Landwehr & Watkins, 1995, S. 84). An der Anzahl der Blätter einer Reihe kann man wei- terhin die Häufigkeitsverteilung der Werte gut ablesen, sofern diese so gezeichnet sind, 6. Daten organisieren und graphisch darstellen 83 dass jedes Blatt die gleiche Fläche einnimmt. Dreht man diesen Diagrammtyp um 90° ge- gen den Uhrzeigersinn, so erhält man eine Graphik, die einem Histogramm ähnelt. Auch die Verteilungsform (symmetrisch, bimodal, rechts- oder linksschief) lässt sich damit im Stängel-Blatt-Diagramm leicht erkennen (vgl. Landwehr & Watkins, 1995, S. 23-24). Im Vergleich zum eindimensionalen Streudiagramm sind jedoch Lücken im Datensatz meist nicht sofort sichtbar (vgl. Russell & Corwin, 1989, S. 30), ebenso wie Ausreißer, da sie sich nicht optisch aufdrängen. Trotzdem lassen sie sich prinzipiell im Stängel-Blatt- Diagramm ermitteln (vgl. Biehler & Steinbring, 1991, S. 13). Gruppierungen (cluster) sind aber im Stängel-Blatt-Diagramm besser zu erkennen, besonders dann, wenn die Verteilung flach ist. Dunkels (1990, S. 5-7) schlägt folgendes Vorgehen zur Einführung des Stängel- Blatt-Diagramms am Beispiel der Variablen „Alter der Mutter“ oder „Alter des Vaters“ vor. Rechteckige Karteikarten werden in der Mitte gefaltet und auf der linken Hälfte der Karte wird die Zehnerziffer notiert und auf der rechten Hälfte die Einerziffer. Dann wird die Karte entlang der Faltlinie in zwei Hälften geschnitten und je ein Exemplar der unter- schiedlichen Zehnerziffern wird an die Wand geheftet. Nacheinander werden dann die Ei- nerzahlen befestigt und gemeinsam werden die Altersangaben aus dem entstandenen Dia- gramm gelesen. Zur Verbesserung der Übersicht werden anschließend die Einerzahlen der Größe nach geordnet. Diese Vorgehensweise ermöglicht ein enaktives Umgehen mit Daten aus einem zweistelligen Wertebereich. Um das einfache Stängel-Blatt-Diagramm zu zeichnen, benötigen die Schüler also die Fähigkeit, Zahlen in Ziffern zu zerlegen und diese Ziffern der Größe nach anzuordnen. Außerdem sollte man sicherstellen, dass jedes Blatt, also jede Einerziffer, den gleichen Platz einnimmt, damit die Verteilungsform nicht verzerrt wird und man an der Länge der Zeilen die Häufigkeit der Daten erkennen kann. Kästchenpapier zur Unterstützung ist dabei sinnvoll. Nutzen die Schüler auch die oben beschriebene Variante des Stängel-Blatt- Diagramms, so besteht laut Landwehr & Watkins (1995, S. 84) eine Schwierigkeit darin, dass man zunächst entscheiden muss, welche „Klassenbreite“ man wählt. Diese Entschei- dung entfällt beispielsweise beim Line Plot. Alles in allem ist das Stängel-Blatt-Diagramm eine relativ einfach zu konstruierende graphische Darstellungsform, die zudem zu einem besseren Verständnis des dezimalen Stellenwertsystems und damit zum Erwerb einer strukturierten Zahlauffassung beitragen kann. Die Relevanz dieses Diagrammtyps bestätigt sich auch im außermathematischen Bereich, da in vielen Städten die Abfahrtszeiten in Bus- oder Straßenbahnfahrplänen prak- 6. Daten organisieren und graphisch darstellen 84 tisch in Form eines Stängel-Blatt-Diagramms dargestellt sind (vgl. Dunkels, 1990, S. 7, 11). Kreisdiagramm/ Tortendiagramm Dieser Diagrammtyp wird verwendet, wenn die Daten es nahe legen, prozentuale Anteile zu vergleichen. Das Kreisdiagramm dient zur Visualisierung der Häufigkeitsvertei- lung kategorialer Variablen. Die Fläche des Kreisdiagramms wird mithilfe des Kreisradius in Sektoren eingeteilt, so dass jeder Sektor einen prozentualen Teil des Ganzen darstellt, also jeder Sektor die relative Häufigkeit der jeweiligen Kategorie angibt. Die Fläche jedes Kreisausschnitts ist also proportional zur Häufigkeit der Kategorie, die der Kreisausschnitt repräsentiert. Meistens wird das Kreisdiagramm zur Darstellung relativer Häufigkeiten genutzt, manchmal, etwa bei der Sitzverteilung in Parlamenten, aber auch für absolute Häufigkeiten verwendet. Insgesamt ergibt sich die Relevanz dieses Graphiktyps laut Cur- cio (2001, S. 4) aus seiner starken Präsenz in den Medien. Ein Grundproblem bei der Einführung von Kreisdiagrammen besteht darin, dass die- se eigentlich das Konzept der Brüche bzw. Prozente voraussetzen. Wie im Folgenden auf- gezeigt wird, existieren jedoch Einführungsmöglichkeiten, die auch ohne den Bruchzahl- oder Prozentbegriff möglich sind und die sowohl auf enaktiver als auch auf ikonischer E- bene geschehen können. Curcio (2001, S. 53) schlägt zunächst eine handlungsorientierte Einführung vor, bei der zur Beantwortung der Frage, welches Lieblingsschauspieler der Schüler sind, ein menschliches Kreisdiagramm (People Circle Graph) mit der gesamten Klasse dargestellt wird. Dazu gruppieren sich die Kinder, die den gleichen Schauspieler favorisieren, und stellen sich im Kreis Schulter an Schulter nebeneinander auf. Danach wird der Mittelpunkt des Kreises auf dem Fußboden geschätzt, an welchem nun Seile mit Klebeband befestigt werden, die bis zu den jeweiligen Punkten des Kreises reichen, an denen der Lieblings- schauspieler der Kinder wechselt. Die Seile teilen also den Kreis in entsprechende Sekto- ren ein, wobei der größte Sektor den Modalwert darstellt (vgl. Abb. 6.13). 6. Daten organisieren und graphisch darstellen 85 Abb.6.13: Menschliches Kreisdiagramm, welches die Anzahl der Schüler aus 26 zeigt, die einen bestimmten Schauspieler favorisieren L: Leonardo DiCaprio J: Jennifer Lopez W: Will Smith (Darstellung aus: Curcio, 2001, S. 53) Hierbei wird zunächst durch den Vergleich der absoluten Häufigkeiten von den Schülern wahrgenommen, dass es 3 Kategorien unterschiedlicher Größe gibt. Man benötigt nicht die Anteils-Grundvorstellung des Bruchzahlbegriffs als Voraussetzung, um den Auf- bau des menschlichen Kreisdiagramms zu verstehen. Wohl aber ist diese Vorstellung bei der Interpretation solcher Graphiken von Nutzen. Will man nun etwa in der Klasse 6 noch in das Konzept der Prozente bzw. der Brü- che einführen, so eignet sich die Hundertstelscheibe (Hundredths Disk) als Hilfsmittel, da diese bereits elementar einsetzbar ist. Die Hundertstelscheibe ist ein Kreis, der in 100 gleich große Sektoren eingeteilt ist (siehe Anhang 1). Diese Hundertstelscheibe legt man nun mit ihrem Mittelpunkt auf den Mittelpunkt des menschlichen Kreisdiagramms, an dem die Seile befestigt sind, und markiert auf der Scheibe, die Schnittpunkte der Seile mit der Hundertstelscheibe. Die so entstehenden Sektoren geben den prozentualen Anteil der Schülergruppen an, die einen bestimmten Schauspieler favorisieren. Durch einfaches Ab- zählen der Hundertstel können die Schüler also die jeweiligen Prozentsätze ermitteln, denn p% bedeutet p von 100 Einheiten. Zwar können die Angaben aufgrund der zwangsweise ungenauen Konstruktion des menschlichen Diagramms nur näherungsweise mit errechne- ten Werten übereinstimmen, aber sie visualisieren das mathematische Konzept der Prozen- te (vgl. Curcio, 2001, S. 54), insbesondere die „von Hundert-Vorstellung“ vom Prozent- 6. Daten organisieren und graphisch darstellen 86 begriff (vgl. Blum & v. Hofe, 2003, S. 15). Zudem soll diese Vorgehensweise in erster Linie eine Einsicht in den Aufbau eines Tortendiagramms geben. Die Genauigkeit der er- mittelten Prozentwerte ist zunächst zweitrangig. Eine zweite Möglichkeit zur Herstellung eines Kreisdiagramms auf enaktiver Ebene bietet die Verwendung von „Additionsrollenpapier“ (Kassenrollenpapier). Jeder der 26 Schüler erhält z.B. ein Papier mit den Maßen 79 cm * 6,5 cm, welches durch Abmessen in 26 Rechtecke à 3cm * 6,5cm eingeteilt wird. Die Schüler müssen nun die Häufigkeit der einzelnen Kategorien bestimmen, also die Anzahl der aneinander grenzenden Rechtecke, die jedem Lieblingsschauspieler aufgrund der Wahl der Schüler zugeordnet werden müs- sen. In unserem Beispiel bedeutet dies, dass 3 benachbarte Rechtecke Jennifer Lopez zu- geordnet werden müssen, 4 werden Leonardo DiCaprio und die restlichen 19 Will Smith zugeordnet. Das übrige Rechteck mit den Maßen 1cm * 6,5 cm wird zum Zusammenkle- ben des Papierstreifens zu einem Kreis benötigt (vgl. Curcio, 2001, S. 54). Allgemein soll- te also die Länge des Papiers ein Vielfaches des Umfangs n der Kollektion plus 1cm oder 2 cm zum Zusammenkleben betragen. Auch in diesem Fall muss der Bruchzahlbegriff nicht vorausgesetzt werden (vgl. Abb. 6.14). Abb. 6.14: Ein Kreisdiagramm hergestellt aus Additionsrollenpapier (Darstellung aus: Curcio, 2001, S. 54) Das so hergestellte Kreisdiagramm (vgl. Abb. 6.14) kann nun als Schablone benutzt werden, um das Diagramm auf Packpapier abzuzeichnen. Der Mittelpunkt wird geschätzt und dann werden die Radien eingezeichnet, die den Kreis in entsprechende Sektoren ein- teilen. Auch hier kann nun die Hundertstelscheibe verwendet werden, um die Prozentanga- ben der einzelnen Kategorien zu bestimmen (vgl. Curcio, 2001, S. 54). Allein wenn man ein Kreisdiagramm auf herkömmlichen Weg zeichnen möchte, be- nötigt man ein Begriffsverständnis von Verhältnissen und Brüchen, sowie zusätzlich die Fähigkeit, mit Zirkel und Geodreieck umzugehen. Die Schüler müssen dazu in der Lage 6. Daten organisieren und graphisch darstellen 87 sein, den prozentualen Anteil in ein entsprechendes Winkelmaß zu transformieren, wobei 100%=360° gilt. Dazu müssten die Schüler einen einfachen Dreisatz einsetzen, was selbst in der Jahrgangsstufe 6 nicht zu erwarten ist. Die obige Methode zum Zeichnen eines Kreisdiagramms hingegen ermöglicht es, auch ohne dieses Vorwissen eine solche graphi- sche Darstellungsform herzustellen. Vielmehr kann dabei das Konzept der Prozente erst entdeckt werden und durch das wenn auch zeitaufwändige Konstruieren der Graphik kann ein besseres Verständnis derselbigen erzielt werden. Eine weitere Möglichkeit zum handelnden Aufbau von Graphen bietet die Software TinkerPlotsTM, wobei die Schüler auch hier kein Begriffsverständnis von Brüchen oder Prozenten benötigen. Die Schüler können eine Kollektion mit den Attributen „Name“ und „Schauspieler“ erstellen, indem sie aus dem Menü den Befehl „Table“ wählen, darin die obigen Attribute benennen und dann ihre Daten per Hand eintragen. In der Datentabelle (Casetable) wird somit jedem Schüler genau ein Lieblingsschauspieler zugeordnet. Will man nun die Verteilung des Attributs Schauspieler in einem Kreisdiagramm visualisieren, so wählt man im Graphikfenster den Befehl „Fuse circular“. So entsteht aus den Daten ein ungeordnetes Kreisdiagramm, welches man mit dem Befehl „Order“ ordnen kann. Dieser letzte Befehl des Ordnens entspricht dem Nebeneinanderstellen der Schüler, die denselben Lieblingsschauspieler haben, im menschlichen Kreisdiagramm bzw. dem Bestimmen der Anzahl derjenigen benachbarten Rechtecke im Kreisdiagramm aus „Additionsrollenpa- pier“, die denselben Schauspieler repräsentieren sollen. Zum besseren Verständnis der Graphik lässt sich noch ein Farbschlüssel mit dem Befehl „Key“ anzeigen, sowie die Ge- samtanzahl der befragten Schüler (hier 26) und den entsprechenden 100% durch den Be- fehl „Case Count“ bzw. „Percent“(vgl. Abb. 6.15). 6. Daten organisieren und graphisch darstellen 88 Abb. 6.15: Ungeordnetes und geordnetes Kreisdiagramm in TinkerPlotsTM (a) (b) Collection 1 Fuse Circular Collection 1 26 (100%) Schauspieler Jennifer Lopez Leonardo DiCaprio Will Smith ordered by Schauspieler Fuse Circular Abbildung 6.15 (a) ist dahingehend problematisch, dass man nicht die einzelnen Da- ten auf einmal sichtbar machen kann, dass also nicht direkt sichtbar ist, dass jedem Fall ein gleich großer Sektor zugeordnet wird. Man kann nur einzelne Fälle anklicken und anzeigen lassen. Ein weiterer Nachteil der Software besteht darin, dass man im geordneten Kreisdia- gramm (vgl. Abb. 6.15 (b)) nicht den prozentualen Anteil der jeweiligen Schauspieler er- mitteln kann. Dazu muss man die Daten im geordneten Kreisdiagramm mit dem Befehl „Separate“ nach ihren Merkmalsausprägungen trennen und mit dem Befehl „Show Column Percent“ die Prozente pro Spalte ermitteln lassen. Diese Art der Darstellung kann jedoch die Schüler verwirren, da jetzt jeder Kreis nicht ein Ganzes darstellt, also 100%, sondern den jeweiligen prozentualen Anteil (vgl. Abb. 6.16 (a)). Einfacher zu verstehen ist in die- sem Fall das Säulendiagramm (vgl. Abb. 6.16 (b)). Es zeigt sich, dass Schüler mit TinkerPlotsTM auch problematische Graphiken entwi- ckeln können. Dies ist jedoch auch positiv zu sehen, da diese Graphiken dann miteinander verglichen werden müssen und Schüler so Kriterien für geeignete Graphiken in Abhängig- keit von der zu betrachtenden Variable entwickeln können. 6. Daten organisieren und graphisch darstellen 89 Abb. 6.16: Kreisdiagramme für einzelne Kategorien eines Merkmals und alternatives Säu- lendiagramm mit Häufigkeitsangaben (a) (b) Collection 1 Jennifer Lopez Will Smith Leonardo DiCaprio 3 (12%) 19 (73%) 4 (15%) Sc ha us pi el er ordered by Schauspieler Fuse Circular Collection 1 20 3 (12%) 4 (15%) 19 (73%) 10 Je nn ife r L op ez Le on ar do D iC ap rio W ill Sm ith 0co un t, or de re d ... Schauspieler, ordered by Schaus... Fuse Rectangular Zudem eignen sich Säulen- oder Balkendiagramm eher, wenn man ein Merkmal mit vielen Merkmalsausprägungen untersucht, da man im Kreisdiagramm die einzelnen pro- zentualen Anteile dann nur noch schwer ablesen kann (vgl. Seidel, 1996, S. 196). Dies können die Schüler mit TinkerPlotsTM eigenständig entdecken, indem sie verschiedene Graphiken derselben Daten herstellen und diese miteinander vergleichen. Zusammenfassend bleibt festzuhalten, dass das Kreisdiagramm von allen bisher auf- geführten Graphiken am schwierigsten zu konstruieren ist (vgl. Curcio, 2001, S. 4), egal auf welcher Repräsentationsebene dies geschieht. Nachdem die verschiedenen Darstellungsformen univariater Daten vorgestellt wur- den, bleibt nun die Frage nach der Reihenfolge, mit der man Schüler mit diesen Graphiken konfrontieren sollte. Zwar ist keine Graphik generell einer anderen überlegen, denn die Auswahl von geeigneten Repräsentationen orientiert sich am Datensatz und am Zweck der Untersuchung. Dennoch sind einige Graphiken schwerer zu verstehen als andere (vgl. Ko- nold & Higgins, 2003, S. 199). Friel, Curcio und Bright (2001, S. 147) schlagen vor, dass in den ersten Schuljahren Darstellungen bevorzugt werden sollten, die den Schülern das Identifizieren einzelner Werte ermöglichen. Dazu gehören Case-Value Plots, Strichlisten, 6. Daten organisieren und graphisch darstellen 90 Piktogramme ohne Schlüssel, eindimensionale Streudiagramme und Stängel-Blatt- Diagramme, da in diesen Darstellungen jedes einzelne Datum ein eigenes Element in der Graphik besitzt. Jeder einzelne Wert wird durch einen Strich, ein Icon, ein Kreuz, einen Balken oder eine Zahl repräsentiert, die die Schüler durch Zeigen identifizieren können. Case-Value Plots sind wohl am einfachsten zu verstehen, da in dieser Darstellung im Ge- gensatz zu allen anderen keine Verteilung der Häufigkeiten visualisiert wird, da die Daten nicht gruppiert werden, sondern jeder Untersuchungseinheit genau eine Merkmalsausprä- gung zugeordnet wird. Laut Bright und Friel (1998, S. 67) können Strichlisten dazu beitra- gen, den Übergang zwischen der Repräsentation unaufbereiteter Daten und reduzierter Daten zu erleichtern, da das Erstellen einer Strichliste Schülern helfen kann, deren Auf- merksamkeit auf die Beziehung zwischen den Datenwerten und ihren Häufigkeiten zu len- ken. Haben die Schüler das Prinzip des Zählens von Häufigkeiten mithilfe einer Strichliste verstanden, so kann ein Übergang vom Case-Value Plot zum konventionellen Säulen- oder Balkendiagramm vollzogen werden: „The process of translating this ungrouped bar graph [case-value plot] to a „standard“ bar graph, however, is not necessarily easy. Students have to conceptualize the tallying of values and shift their view to the appropriate unit for “siz- ing“ plot elements“ (Bright & Friel, 1998, S. 68-69). Eine Transformation von Strichlisten in Häufigkeitstabellen könnte ebenfalls hilfreich sein, um den Aufbau eines konventionel- len Säulendiagramms zu verstehen. In den Klassen 3-5 werden die Datensätze mit denen Schüler arbeiten von zuneh- mend größeren Umfangs sein, wodurch der Einsatz von Graphen mit einer zweiten Achse, die entsprechend skaliert ist, nötig wird. Durch dieses zusätzliche Element in der Graphik, nämlich die zweite Achse, wird eine Interpretation solcher Darstellungen anspruchsvoller (vgl. Bright & Friel, 1998, S. 79). Durch das Herstellen von Piktogrammen mit Schlüsseln können die Schüler erste Erfahrungen mit Skalierungen machen (Friel et al., 2001, S. 148). Bei kategorialen Daten haben die Schüler oft Schwierigkeiten, wenn Kategorien mit der Häufigkeit 0 auftreten. Einige sehen es als unnötig an, diese Kategorien überhaupt aufzu- führen. Auch bei numerischen Daten treten Probleme auf, wenn Werte mit der Häufigkeit 0 vorkommen oder die 0 selbst als Wert auftritt. Schüler skalieren dann oft nur die Werte, die tatsächlich im Datensatz vorkommen, was Lücken und Gruppierungen im Datensatz schlecht erkennen lässt (vgl. Abb. 6.17 und 6.18). So erkennt man zum Beispiel in Abbil- dung 6.17, dass sich zwei Teilgruppen gebildet haben. Eine Teilgruppe von Familien leben zwischen 0 und 6 Jahren in der Stadt und eine andere Gruppe zwischen 10 und 14 Jahren. 6. Daten organisieren und graphisch darstellen 91 Diese Teilgruppen sind in Abbildung 6.18 schwer erkennbar, ebenso wie die Ausreißer bei 25, 35 und 37 (vgl. Konold & Higgins, 2001, S. 18). Abb. 6.17: Eindimensionales Streudiagramm, das die Anzahl der Jahre anzeigt, welche die Familien der Schüler in ihrer Stadt leben Abb. 6.18: Dieselbe Graphik, bei der aber nicht vorkommende Daten nicht skaliert wurden (Darstellungen aus: Konold & Higgins, 2001, S. 18) Diese Schwierigkeiten bei der Skalierung resultieren daraus, dass Schüler oft die Achsen beschriften während sie die Daten plotten. Um zwischen den möglichen Daten und der tatsächlichen Verteilung der Daten zu unterscheiden, sollte man die Schüler zunächst geeignete Skalierungen finden lassen und dann die gesammelten Daten eintragen lassen, wobei es auch hier keine ideale Skalierung gibt, die zeigt, wie die Daten „wirklich“ ausse- hen. Vielmehr gilt auch hier, dass man von mehreren Graphen mit unterschiedlichen Ska- lierungen lernen kann (vgl. Konold & Higgins, 2003, S. 201). Außerdem können in den höheren Klassen Tortendiagramme behandelt werden, wel- che insbesondere in Klasse 6 vertieft werden sollten, da die Schüler dann lernen, mit De- zimalzahlen und Bruchzahlen zu rechnen. Die langsame Hinführung zu Diagrammen, die nicht mehr jedes einzelne Datum vi- sualisieren, trägt auch dazu bei, dass die Schüler lernen, Daten nicht mehr als Sammlung einzelner Werte anzusehen, sondern die gesamte Verteilung der Daten in Betracht zu zie- 6. Daten organisieren und graphisch darstellen 92 hen, welche bestimmte Eigenschaften besitzt, die sich mit statistischen Begriffen beschrei- ben lassen (vgl. Konold & Higgins, 2001, S. 19-21). Schüler müssen also, lernen neben lokalen Beobachtungen einen globalen Blick auf Verteilungen zu werfen, was insbesonde- re für den Gruppenvergleich erforderlich ist. Alles in allem ist darauf zu achten, dass die verschiedenen Graphiken nicht isoliert voneinander unterrichtet werden, damit Schüler ein Verständnis für die mathematischen Beziehungen zwischen den einzelnen Graphiken entwickeln können (vgl. Bright & Friel, 1998, S. 67). Auch Transformationsübungen können helfen, die „Verwandtschaft“ etwa zwischen einem Säulendiagramm und einem eindimensionalem Streudiagramm zu erken- nen (vgl. Friel et al., 2001, S. 128). Besonders die Software TinkerPlotsTM visualisiert dy- namisch die schrittweise Überführung einer Graphik in eine andere. Außerdem sollten Lehrer Gelegenheiten schaffen, in denen verschiedene Repräsentationen eines Datensatzes miteinander verglichen werden. Nur so können die Schüler lernen, dass verschiedene Gra- phiken unterschiedliche Aspekte in den Daten hervorheben (vgl. Bright & Friel, 1998, S. 87-88). Auch dies lässt sich leicht mithilfe der Software TinkerPlotsTM realisieren, da Schüler automatisch verschiedenste Graphiken aufbauen. Als nicht zu unterschätzende Schwierigkeit sind jedoch die wechselnden Rollen von Elementen und Achsen in verschie- denen Graphiken einzustufen. So stellt ein Balken im Case-Value Plot eine Merkmalsaus- prägung dar, während ein Balken im konventionellen Balkendiagramm Häufigkeiten visua- lisiert. Selbst die Achsen wechseln ihre Funktion beim Übergang vom Case-Value Plot zum konventionellen Balkendiagramm, was für Schüler oft nur schwer zu erkennen und zu verstehen ist (vgl. Bright & Friel, 1998, S. 87). 6.4 Graphische Darstellungen bivariater Daten und deren unterrichtspraktische Einführung Stellt man bivariate Daten graphisch dar, geschieht dies entweder um Beziehungen zwischen zwei Variablen zu visualisieren oder um einen Vergleich von Verteilungen durchzuführen, etwa einen Gruppenvergleich zwischen Jungen und Mädchen. Ein Grup- penvergleich anhand absoluter Häufigkeiten, wie er wohl überwiegend in den Klassen 1-6 durchgeführt wird, kann jedoch nur erfolgen, wenn die Gruppengrößen übereinstimmen. Anderenfalls muss ein Vergleich anhand relativer Häufigkeiten durchgeführt werden oder 6. Daten organisieren und graphisch darstellen 93 anhand alternativer Methoden wie etwa dem Halbieren von Datensätzen (vgl. hierzu Kapi- tel 7, Abschnitt 7.7). Auch die Skalierung der Achsen ist von besonderer Bedeutung bei einem Gruppenvergleich der beispielsweise anhand zweier Balkendiagramme durchgeführt wird. Stimmt die Skalierung der y-Achsen nicht überein, führt dies leicht zu Fehlinterpreta- tionen. Zunächst werden Möglichkeiten aufgezeigt, die Beziehung zwischen zwei kategoria- len Variablen darzustellen. Dazu gehören das Venndiagramm, die Vierfeldertafel sowie multiple Balken- und Säulendiagramme. Das einfache Venndiagramm und die Vierfelder- tafel sind jedoch nur für binäre Variablen geeignet, also für zwei kategoriale Merkmale, die jeweils nur zwei Kategorien besitzen. Will man die Beziehung zwischen zwei numeri- schen Variablen erkunden, so sind das zweidimensionale Streudiagramm (Scatterplot) und das Liniendiagramm, welches zur Visualisierung von Zeitreihen verwendet wird, zwei ty- pische Basisdarstellungen der Statistik. Eine Alternative zum Scatterplot, nämlich der Pai- red Case-Value Plot wird zusätzlich dargestellt. Um die Beziehung zwischen einem kate- gorialen und einem numerischen Merkmal zu explorieren, sind Back-to-Back Stem-and- Leaf Plots sowie Abwandlungen dieses Diagrammtyps geeignet. Venndiagramm Das Venndiagramm ist nach John Venn benannt und ist ursprünglich eine Graphik zur Repräsentation von Mengen und zur Verdeutlichung von logischen Zusammenhängen. Je nach Anzahl und Art der Mengen ergeben sich verschiedene Diagramme. Im einfachen Venndiagramm, welches zwei nicht disjunkte, verschiedene Mengen A und B darstellt, lassen sich weitere Mengen visualisieren: Die Komplementärmengen zu A und B, also A und B , die Schnittmenge BA∩ und deren Komplementärmenge BA∩ = BA∪ , die Ver- einigungsmenge BA∪ und deren komplementäre Menge BA∪ = BA∩ , sowie A\B und B\A (vgl. Abb. 6.19). 6. Daten organisieren und graphisch darstellen 94 Abb. 6.19: Venndiagramm zweier nicht disjunkter Mengen A und B A B BA∩ BA∪ Zwar ist das Venndiagramm kein übliches Darstellungsmittel der Statistik oder der Datenanalyse, aber es kann in den Klassen 1-6 dazu beitragen, Grundlagen von Datenkom- petenz wie Logik und Kategorisierung auszubilden. Das obige Diagramm dient weiterhin dazu, die Korrelation zwischen zwei dichotomen Merkmalen zu entdecken. Ein statisti- scher Zusammenhang zwischen zwei binären Merkmalen würde sich im Venndiagramm dadurch äußern, dass die Mehrheit der Werte in der Schnittmenge BA∩ und in der Men- ge BA∪ liegen würden. Im Unterricht lässt sich das Venndiagramm nutzen, um das Ordnen und Klassifizie- ren zu üben, welches ein Grundproblem der Datenanalyse darstellt. Das Klassifizieren von Daten erfordert flexibles Denken bezüglich der Charakteristika der gegebenen Daten, da nun mehr als ein Merkmal betrachtet wird. Die Schüler müssen nicht nur Gemeinsamkei- ten, sondern auch Unterschiede der Objekte oder Personen, die sie mittels Daten beschrei- ben, wahrnehmen. Weiterhin ist zu entscheiden, wie man Daten klassifiziert, da es dazu meist mehrere zweckmäßige Möglichkeiten gibt (vgl. Russell & Corwin, 1990, S. 17), be- sonders dann, wenn man numerische Daten kategorisieren will. Je nachdem wie man die Daten klassifiziert, werden unterschiedliche Informationen vermittelt. Die Kategorisierung ist also abhängig vom Zweck der Untersuchung. Zur Einführung von Venndiagrammen eignet sich das Klassifikationsspiel „Rate die Regel“. Der Lehrer denkt sich eine geheime Regel aus, nach der er die Schüler der Klasse sortiert, beispielsweise „braunhaarig“. Zugrunde liegt also die Klassifikation der Schüler nach der binären Variablen „Haarfarbe“ mit den Kategorien „braunhaarig“ und „nicht braunhaarig“. Dann lässt er zwei Schüler nach vorne kommen, die diese Regel erfüllen und 6. Daten organisieren und graphisch darstellen 95 die restlichen Schüler sollen raten, wer noch in diese Gruppe passt. Werden nicht- braunhaarige Schüler vorgeschlagen, so stellen sich diese der Gruppe der Braunhaarigen gegenüber. Auch dieser scheinbar falsche Vorschlag hilft beim Herausfinden der Regel, da man über die Negation ebenfalls Kategorien definieren kann. So stehen sich nach und nach immer mehr Schüler in den zwei Gruppen gegenüber und die Klassifikationsregel wird sichtbar und sollte dann auch korrekt artikuliert werden (vgl. Russell & Corwin, 1990, S. 14-15). Dann kann ein Venndiagramm zur Beschreibung der obigen Situation eingeführt werden, indem man etwa Seile kreisförmig auf den Boden um die zwei Gruppen legt oder die Kreise aufmalt und die Namen der Schüler in die entsprechenden Kreise schreibt (vgl. Abb. 6.20). Jennifer Tom Niko Marie Harry Nina Tim Sarah Anna Lisa Timo Sven Klaus Mario Melanie Braune Haare Keine braunen Haare Abb. 6.20: Venndiagramm zum Spiel „Rate die Regel“ mit einer Regel Danach kann man zwei Regeln verwenden, zum Beispiel „braunhaarig und trägt ge- streifte Kleidung“, und das Spiel spielen, um ein Venndiagramm mit einer Schnittmenge einzuführen (vgl. Abb. 6.19). Zugrunde liegen dann zwei dichotome Variablen, nämlich einmal die Variable „Haarfarbe“ mit den Kategorien „braunhaarig“ und „nicht braunhaa- rig“ und die Variable „Kleidung“ mit den Kategorien „gestreift“ und „nicht gestreift“. Nachdem (fast) alle Schüler den vier Gruppen zugeordnet wurden, sollte die Regel artiku- liert werden, wobei man auf korrekte Verwendung der logischen Begriffe „und“ und „o- der“ achten muss (vgl. Russell & Corwin, 1990, S. 31, 37), denn die Klassifizierung ist auch ein sprachliches Problem. Zwar ist bei den Merkmalen „Haarfarbe“ und „Kleidung“ kein statistischer Zusammenhang zu erwarten, aber die Regeln eignen sich zur Einführung, da sie schlichtweg gut sichtbar sind. Im zweiten Schritt kann auch hier das Venndiagramm 6. Daten organisieren und graphisch darstellen 96 aufgezeichnet werden und die Namen der Schüler können in die entsprechenden Gruppen eingetragen werden. Die Darstellungsform des Venndiagramms könnte man auch mit der Software Tin- kerPlotsTM realisieren, indem man die Daten per Hand ordnet und dann mit dem „Drawing tool“ Kreise um die entsprechenden Gruppen zeichnet. Dies entspricht dem oben beschrie- benen enaktiven Umgang mit den Daten und sollte daher besser mit konkreten Objekten anstatt virtuell geschehen. Vierfeldertafel Die Vierfeldertafel ermöglicht ähnliche Entdeckungen wie das Venndiagramm, da auch mit Hilfe dieser Darstellungsform die Abhängigkeit zwischen zwei binären Variablen entdeckt werden kann. Im Allgemeinen kann die Korrelation zweier binärer Merkmale visuell besser in einer Vierfeldertafel (vgl. Abb. 6.21 und 6.22) als in einem Venndi- agramm erfasst werden. Numerische Variablen müssen zuvor kategorisiert werden, um mithilfe dieser Darstellung ausgewertet werden zu können. Abb. 6.21: Vierfeldertafel allgemein und am Beispiel der kategorisierten Merkmale Kör- pergröße und Gewicht A A B klein groß leicht BA∩ Wie bereits in Abschnitt 4.1.3 erläutert wurde, ist die Untersuchung der Korrelation zweier numerischer Variablen durch die Anpassung einer Gerade an eine Punktwolke im zweidimensionalen Streudiagramm ohne Softwareeinsatz im Unterricht der unteren Klas- sen problematisch. Eine Alternative dazu stellt jedoch die Vierfeldertafel dar, die auf ver- schiedenen Repräsentationsebenen eingeführt werden kann. Außerdem wird aufgezeigt, dass man mithilfe von TinkerPlotsTM ausgehend von einer Vierfeldertafel den Scatterplot schrittweise herstellen kann. A B∩ =B\A klein u. leicht groß u. leicht schwer B A B∩ =A\B BA∩ = BA∪ klein u. schwer groß u. schwer 6. Daten organisieren und graphisch darstellen 97 Will man auf enaktiver Ebene die Darstellung der Vierfeldertafel einführen, so eig- nen sich Holzklötzchen oder Pappkärtchen, die direkt in die Felder einsortiert werden kön- nen. Untersucht man beispielsweise die Korrelation zwischen der Körpergröße und dem Gewicht der Schüler einer Klasse, so kann man die beiden numerischen Variablen katego- risieren, indem man den Median oder das arithmetische Mittel nutzt, um eine disjunkte Klasseneinteilung in zwei Klassen zu erzeugen. Als „kleine Schüler“ werden beispielswei- se diejenigen charakterisiert, die kleiner als der Durchschnitt sind, und „große Schüler“ sind diejenigen, die größer oder gleich dem arithmetischen Mittel sind. Entsprechendes gilt für das Merkmal Gewicht. Da die Tafel disjunkte Mengen zeigt, wird jeder Schüler genau einem Feld zugeordnet. Um einen enaktiven Umgang mit statistischen Daten zu ermögli- chen, können die Schüler ihre Daten auf Pappfiguren eintragen und diese dann in die Vier- feldertafel einordnen. Später können Striche oder Zahlen, die in die Felder eingetragen werden, die Figuren ersetzen. Eine Korrelation zeigt sich, wenn die Felder „klein und leicht“ und „groß und schwer“ deutlich stärker als die anderen belegt sind (vgl. Schwirtz & Begenat, 2000, S. 45, 50). Auch bei der Vierfeldertafel ist auf die korrekte Verwendung des logischen „und“ und „oder“ zu achten. Mit TinkerPlotsTM lässt sich diese graphische Darstellung ganz einfach dadurch er- zeugen, dass man zwei numerische Variablen auf die jeweiligen Achsen zieht. Die Katego- risierung wird von der Software automatisch vorgenommen, kann aber nach Belieben ge- ändert werden, so dass auch Mehrfeldertafeln, also nicht-dichotome Merkmale, betrachtet werden können. Indem man die beiden Variablen in immer feinere Kategorien einteilt und schließlich die Kategorisierung aufhebt, entsteht letztlich das zweidimensionale Streudia- gramm (Scatterplot). Die von der Software automatisch kategorisierte, aber ursprünglich numerische Variable wurde nun wieder in eine numerische Variable transformiert. Abbil- dung 6.22 zeigt den Weg von der Vierfeldertafel über verschiedene Mehrfeldertafeln hin zum Scatterplot anhand des Datensatzes Babystation. Die Abbildungen zeigen die Korrela- tion zwischen den Merkmalen Gewicht und Körpergröße von 22 Neugeborenen, die bereits in Abbildung 6.22 (a) deutlich zu sehen ist, da die Felder links unten und rechts oben stär- ker belegt sind als die anderen Felder. Diese Tendenz, dass größere Babys auch schwerer sind, zeigt sich auch bei den feineren Klasseneinteilungen in Abbildung 6.22 (b) und (c), so dass man schließlich im Scatterplot nach Augenmaß eine Gerade anpassen und mit Hil- fe des Drawing Tools einzeichnen kann, die diese Tendenz beschreibt. 6. Daten organisieren und graphisch darstellen 98 Abb. 6.22: Von der Vierfeldertafel zu Mehrfeldertafeln und schließlich zum Scatterplot (a) (b) Babystation 2200-2999 3000-3799 3800-4599 40 -4 7, 6 48 ,6 -5 6, 2 57 ,2 -6 5, 8 K ör pe rlä ng e Gewicht Circle Icon (c) (d) Babystation 2200-3299 3300-4399 40-49 50-59 7 (32%) 0 (0%) 4 (18%) 11 (50%) K ör pe rlä ng e Gewicht Circle Icon Babystation 2200 2700 3200 3700 4200 40 45 50 55 60 K ör pe rlä ng e Gewicht Circle Icon (Quelle der Daten: Winter & Rösler, 1995, S.11) Babystation 22 00 -2 55 9 25 60 -2 91 9 29 20 -3 27 9 32 80 -3 63 9 36 40 -3 99 9 40 00 -4 35 9 40-42,3 43,3-45,6 46,6-48,9 49,9-52,2 53,2-55,5 56,5-59,8 K ör pe rlä ng e Gewicht Circle Icon Dabei wird deutlich, dass mit Hilfe der Software TinkerPlotsTM auch Mehrfelderta- feln einfach herzustellen sind und diese als Hinführung zum Scatterplot dienen können. Das Experimentieren mit TinkerPlotsTM erlaubt Schülern also die Entdeckung von neuen 6. Daten organisieren und graphisch darstellen 99 Darstellungen und deren Beziehungen zu bereits bekannten Diagrammtypen. Einfache Mit- tel wie zum Beispiel das Drawing Tool ermöglichen unkompliziertes Erkennen und Visua- lisieren von Strukturen in den Daten, ohne dass Vorwissen etwa bezüglich der Gera- densteigung erforderlich wäre. Multiple Balken- und Säulendiagramme Dieser Diagrammtyp eignet sich zum Vergleich zweier kategorialer Variablen und unterscheidet sich nur dadurch vom einfachen Balken- bzw. Säulendiagramm, dass jeweils zwei oder mehrere verschiedenfarbige Balken pro Kategorie nebeneinander stehen, die die Häufigkeiten der unterschiedlichen Gruppen darstellen. Ein Farbschlüssel dient zur korrek- ten Identifizierung der Gruppen. Werden die absoluten Häufigkeiten geplottet, so muss die Gruppengröße beider Gruppen übereinstimmen, da ansonsten keine adäquaten statistischen Vergleiche gezogen werden können. Eine Einführung kann analog zu der des einfachen Säulen- bzw. Balkendiagramms erfolgen. Will man zum Beispiel die Anzahl von Rosinen in einer Box schätzen, diese durch Zählen bestimmen und dann betrachten, wie Schätzwert und der tatsächliche Wert vonein- ander abweichen, eignet sich diese Darstellungsform, da man einerseits punktuell verglei- chen kann, indem man einfach die Differenz zwischen Schätzwert und Zählung bei jedem Schüler ermittelt, und da man andererseits auch die grundlegende Tendenz erkennt, näm- lich, dass die Schätzungen der Schüler in allen Fällen zu gering sind (vgl. Abb. 6.23). 6. Daten organisieren und graphisch darstellen 100 Abb. 6.23: Multiples Säulendiagramm zum Vergleich von Schätzwert und Zählung (Darstellung aus: Curcio, 2001, S. 74) Besonders bei ordinalen kategorialen Variablen ist es jedoch von Vorteil, wenn man für jede Gruppe getrennt ein Säulen- oder Balkendiagramm erstellt und diese untereinander anordnet, um die Aufmerksamkeit der Schüler auf die Verteilungsform der Daten zu len- ken. Dies kann auch dazu beitragen, dass die Schüler die Verteilung der Daten als Ganzes wahrnehmen und nicht nur punktuell einzelne Kategorien vergleichen. Aus diesen Grün- den ist es mit der Software TinkerPlotsTM nicht möglich, multiple Säulen- und Balkendia- gramme herzustellen, sondern es besteht die Möglichkeit, die Diagramme untereinander anzuordnen. Zweidimensionales Streudiagramm/ Scatterplot Der Scatterplot ist die statistische Basisgraphik zur Untersuchung der Korrelation zweier numerischer Merkmale. Im kartesischen Koordinatensystem wird die eine numeri- sche Variable auf der x-Achse abgetragen und die andere auf der y-Achse, so dass Punkte mit je 2 Koordinaten entstehen. Datensätze dargestellt in einem Scatterplot gleichen einer Punktwolke (vgl. Abb. 6.24). Wie bereits aufgezeigt wurde, ist dieser graphische Darstel- lungstyp ausgehend von einer Vierfeldertafel leicht mit der Software TinkerPlotsTM herzu- stellen (vgl. Abb. 6.22). Eine Einführung auf enaktiver Ebene ist nicht realisierbar. 6. Daten organisieren und graphisch darstellen 101 Abb. 6.24: Streudiagramm zur Visualisierung der Korrelation zwischen den Merkmalen Größe und Gewicht Collection 1 0 20 40 60 80 100 1,5 1,6 1,7 1,8 1,9 2 G ew ic ht Groesse Circle Icon (Quelle der Daten: Muffins-Datensatz9) Besteht ein statistischer Zusammenhang, so lassen sich Geraden nach Augenmaß an- passen und einzeichnen. Dadurch entsteht eine anwendungsbezogene Verknüpfung von statistischen und funktionalen Aspekten, da der Trend in den Daten durch eine Funktion modelliert wird, welche reale, komplexe Beziehungen idealisiert (vgl. Biehler, 1995b, S. 98). Diese Verbindung von statistischen und funktionalen Denken sollte in den weiterfüh- renden Klassen im Sinne des Spiralprinzips vertieft werden. So können zunächst Kurven per Augenmaß, und später mit Software-Unterstützung angepasst werden. Für beide Fälle ist die Software TinkerPlotsTM geeignet, da man mit Hilfe des „Drawing Tools“ Kurven nach Augenmaß einzeichnen kann und eventuell später mit Hilfe des Formel-Editors ge- eignete Funktionen zur Modellierung wählen kann. Das gewählte Modell sollte dann auch auf Genauigkeit überprüft werden, etwa indem man mit der Software die Residuen plottet und das Modell, also die Funktion, gegebenenfalls verändert. 9 Alle verwendeten Datensätze befinden sich auf beiliegender CD-Rom. 6. Daten organisieren und graphisch darstellen 102 Paired Case-Value Plot Zum Vergleich zweier numerischer Variablen eignet sich auch der Paired Case- Value Plot, welcher eine Alternative zum zweidimensionalen Streudiagramm darstellt. Dieser Diagrammtyp besteht aus zwei nebeneinander platzierten Case-Value Plots. Abbil- dung 6.25 zeigt einen Case-Value Plot, der das Körpergewicht jedes einzelnen Schülers in Pfund angibt. Daneben befindet sich ein zweiter Case-Value Plot, der jedem Schüler das Gewicht seines Ranzens zuordnet. Da der zweite Case-Value Plot ebenfalls nach dem Ge- wicht der Schüler geordnet ist, ordnet diese Graphik jedem Schüler sein Körpergewicht und sein Ranzengewicht, dargestellt durch zwei Balken, die sich in derselben Reihe befin- den, zu (vgl. Konold & Higgins, 2003, S. 211). Man kann dieser Abbildung entnehmen, dass schwerere Schüler tendenziell auch schwerere Ranzen bei sich tragen. Abb. 6.25: Paired Case-Value Plot zeigt Beziehung zwischen Körpergewicht und Ranzen- gewicht der Schüler Backpack 0 10 20 30 40 or de re d by B od yW ei gh t ( lb ) PackWeight (lb) Value Bar Horizontal Backpack 0 50 100 150 or de re d by B od yW ei gh t ( lb ) BodyWeight (lb) Value Bar Horizontal (Darstellung wie bei Konold & Higgins, 2003, S. 211) 6. Daten organisieren und graphisch darstellen 103 Diese Variante des Case-Value Plots lässt sich am leichtesten mit der Software Tin- kerPlotsTM realisieren und könnte in offenen Arbeitsphasen von den Schülern selbst ent- deckt und hergestellt werden. Sie ist für Statistik-Anfänger leichter zu verstehen als ein Scatterplot, da Schüler in dieser Darstellung besser erkennen, dass die Werte nach dem Körpergewicht geordnet dargestellt sind. Viele Schüler können nicht wahrnehmen, dass auch in einem Scatterplot die Daten geordnet sind (vgl. Konold, 2002, S. 6) und eine Inter- pretation auf Basis eines Scatterplots fällt ihnen daher schwer. Liniendiagramm Liniendiagramme werden verwendet, um Zeitreihen zu visualisieren. Der Graph be- steht aus dem kartesischen Koordinatensystem und den darin geplotteten Punkten, die durch Linien miteinander verbunden werden, um einen allgemeinen Trend in den Daten erkennen zu können. Die Zeit-Variable wird auf der x-Achse abgetragen, die zweite nume- rische Variable auf der y-Achse, so dass die Veränderung eines numerischen Merkmals in Abhängigkeit von der Zeit visualisiert wird. Der Unterschied zum Scatterplot besteht darin, dass hier jedem x-Wert genau ein y-Wert zugeordnet wird. Abbildung 6.26 zeigt beispielsweise die Hochsprunghöhen der männlichen Goldme- daillengewinner bei den olympischen Spielen von 1896 bis 2000. Daraus ist zu erkennen, dass die Männer ihre sportlichen Leistungen über den gegebenen Zeitraum tendenziell ver- bessert haben (vgl. Abb. 6.26). 6. Daten organisieren und graphisch darstellen 104 Abb. 6.26: Liniendiagramm der Hochsprungleistung der Männer bei den olympischen Spielen von 1896 bis 2000 Olympics 1890 1910 1930 1950 1970 1990 0 1 2 3 M _H ig hJ um p (m et er s) Year Circle Icon (Quelle der Daten: Datensatz Olympics.tp aus TinkerPlotsTM, 2005) Für Schüler ist jedoch ein Säulendiagramm wie in Abbildung 6.27 einfacher zu ver- stehen. Mit TinkerPlotsTM kann man aus dem Säulendiagramm ein Liniendiagramm entwi- ckeln, indem man mit Hilfe des Drawing Tools die obersten Punkte der Säulen verbindet (vgl. Abb. 6.27 (b)) und dann die Säulen mit dem Befehl „Hide Icon“ ausblendet (vgl. Abb. 6.27 (d)). In Abbildung 6.27 (d) sieht man, dass das Liniendiagramm und das selbst gezeichnete Diagramm bis auf kleine Zeichenungenauigkeiten aufeinander fallen. 6. Daten organisieren und graphisch darstellen 105 Abb. 6.27: Vom Säulendiagramm zum Liniendiagramm mit Hilfe des Drawing Tools (a) (b) Olympics 1890 1910 1930 1950 1970 1990 0 1 2 3 M _H ig hJ um p (m et er s) Year Value Bar Vertical Olympics 1890 1910 1930 1950 1970 1990 0 1 2 3 M _H ig hJ um p (m et er s) Year Value Bar Vertical (c) (d) Olympics 1890 1910 1930 1950 1970 1990 0 1 2 3 M _H ig hJ um p (m et er s) Year Circle Icon Olympics 1890 1910 1930 1950 1970 1990 0 1 2 3 M _H ig hJ um p (m et er s) Year Value Bar Vertical Dieses Beispiel zeigt wiederum, dass TinkerPlotsTM es möglich macht, die Bezie- hung zwischen dem Säulendiagramm und dem Liniendiagramm zu erkennen. Für den Unterricht geeignet sind Variablen wie Körpergröße oder Temperatur in Ab- hängigkeit von der Zeit, da diese aus dem Erfahrungsbereich der Schüler stammen und auch selbst erhoben werden können. Das Erheben von Daten durch Messen und das Dar- stellen im Liniendiagramm ermöglicht einen „propädeutischen Zugang zu funktionalen 6. Daten organisieren und graphisch darstellen 106 Zusammenhängen“ (Guder, 2002, S. 40) anhand von empirischen Daten. Zudem können erste Vorerfahrungen mit der Interpolation und der Extrapolation gemacht werden. Da bei diesem Typ Graphik eine handlungsorientierte Einführung nicht realisierbar ist, könnte man den Schülern eine Datentabelle mit einem dazugehörigen Liniendiagramm vorgeben und die Zusammenhänge zwischen beiden Darstellungen entdecken lassen. Da- nach könnten die Daten in TinkerPlotsTM eingegeben werden und ein Liniendiagramm kann hergestellt werden, indem man die beiden numerischen Variablen auf die Achsen zieht und dann im Graphik-Menü die Verbindungslinien anzeigen lässt (Show Connecting Lines). Werden die Diagramme selbst von den Schülern gezeichnet, so ist auch hier auf eine korrekte Skalierung beider Achsen zu achten, da ansonsten die Daten verzerrt darge- stellt werden und zu Fehlinterpretationen führen können. Rücken-an-Rücken Stängel-Blatt-Diagramm/ Back-to-Back Stem-and-Leaf Plot Der Back-to-Back Stem-and-Leaf Plot ist eine Darstellungsform, die sich eignet, um die Beziehung zwischen einer kategorialen und einer numerischen Variablen deutlich zu machen. Es eignet sich also für den typischen Fall eines Gruppenvergleichs, bei dem die Verteilung eines numerischen Merkmals in zwei Gruppen untersucht wird. Diese Variante des Stängel-Blatt-Diagramms unterscheidet sich dadurch vom einfachen Stängel-Blatt- Diagramm, dass links des Stängels die Blätter einer zweiten Teilgruppe zu finden sind. „Diese Form der Anordnung wird für den visuellen Vergleich zweier Datensätze als güns- tiger angesehen, als wenn man zwei Stängel-und-Blätter-Schaubilder einfach nebeneinan- der darstellen würde“ (Biehler, 1982, S. 73). Um adäquate visuelle Vergleiche ziehen zu können, ist auch hier darauf zu achten, dass jede Ziffer eine gleich große Fläche einnimmt (vgl. Landwehr & Watkins, 1995, S. 37). Natürlich kann auch in dieser Darstellungsform ebenso wie beim einfachen Stängel-Blatt-Diagramm die Klassenbreite unterschiedlich ge- wählt werden. Abbildung 6.28 zeigt beispielsweise einen Back-to-Back Stem-and-Leaf Plot mit einer Klassenbreite von 0,5. Eine Einführung dieses Diagrammtyps kann auf die gleiche Art geschehen wie die des einfachen Stängel-Blatt-Diagramms, wobei zunächst die Daten der einen Gruppe rechts des Stängels organisiert und dann die Daten der zweiten Gruppe links des Stängels ergänzt werden. 6. Daten organisieren und graphisch darstellen 107 Abb. 6.28: Ein „Back-to Back Stem-and-Leaf Plot“ mit einer „Klassenbreite” von 0,5 (Darstellung aus: Landwehr & Watkins, 1995, S. 35) Es lassen sich jedoch auch andere Diagrammtypen nutzen, um sie Rücken-an- Rücken darzustellen und zum Gruppenvergleich zu nutzen. Eindimensionale Streudia- gramme und Balkendiagramme eignen sich ebenso wie Stängel-Blatt-Diagramme zum Gruppenvergleich, wenn sie Rücken-an-Rücken angeordnet werden (vgl. Abb. 6.29). Abb. 6.29: Alternative graphische Darstellung zum Vergleich der Körpergröße von Erst- und Viertklässlern (Darstellung aus: Russell & Corwin, 1989, S. 42) 6. Daten organisieren und graphisch darstellen 108 Mit der Software TinkerPlotsTM lassen sich Diagramme zwar nicht Rücken-an- Rücken darstellen, aber man kann sie nebeneinander platzieren oder selbst in einem Gra- phikfenster darstellen. Auf diese Weise kann man leicht zwei oder mehrere Gruppen mit- einander vergleichen, wie es Abbildung 6.30 illustriert. Abbildung 6.30 (a) zeigt die Ver- teilung des Ranzengewichts in den vier Gruppen der Erst-, Dritt-, Fünft- und Siebtklässler mit eingezeichneten arithmetischen Mitteln. Abbildung 6.30 (b) zeigt einen zusätzlich ein- gezeichneten Hat Plot10, welcher eine Vorstufe des Boxplots darstellt. Aus beiden Darstel- lungen wird deutlich, dass ältere Schüler tendenziell schwerere Ranzen tragen, dass aber gleichzeitig die Streuung der Werte mit dem Alter der Schüler zunimmt. Abb. 6.30: Graphik zum Gruppenvergleich vierer Gruppen (a) (b) Backpack One Three Five Seven 0 10 20 30 40 25-75 Percentile Hat Plot of PackWeight (lb) Pa ck W ei gh t ( lb ) Grade Circle Icon Backpack One Three Five Seven 0 10 20 30 40 Pa ck W ei gh t ( lb ) Grade Circle Icon (Quelle der Daten: Datensatz Heaviest Backpack.tp aus TinkerPlotsTM, 2005) Alles in allem wird bei der Visualisierung von Daten deutlich, dass ein direkter Zu- sammenhang zwischen Geometrie und Statistik besteht. Die Schüler müssen geometrische Grundformen kennen und mit Fachbegriffen oder intuitiven Bezeichnungen benennen 10 Die Darstellungsform des Hat Plots in TinkerPlotsTM wird im Kapitel 7 näher vorgestellt, da dieser Graphik die Idee einer modalen Gruppe zugrunde liegt, welche Schüler oft als intuitives Maß angeben, um Datensätze zusammenzufassen und zu vergleichen (vgl. Kap. 7). 6. Daten organisieren und graphisch darstellen 109 können, um die Bestandteile einzelner Graphiken identifizieren zu können. Sie benötigen außerdem räumliches Wahrnehmungsvermögen, da in allen Diagrammen die Beziehungen zwischen den Daten durch direkte geometrische Zusammenhänge visualisiert werden. Pereira-Mendoza (1995, S. 6) sieht für die hier betrachteten Jahrgangstufen eine „Ge- fahr des algorithmischen Vorgehens beim graphischen Darstellen von Daten“, da Grund- schullehrer bisher nur eingeschränkte Erfahrungen beim Umgang mit Graphiken aus der Statistik im Unterricht haben. Zwar muss die Konstruktion von Graphiken transparent sein und im Unterricht reflektiert werden, da diese eine Voraussetzung zum Lesen und Interpre- tieren von Graphiken darstellt, aber die Konstruktion darf nicht überbetont werden. Die Interpretation von graphischen Darstellungen im Sachkontext ist mindestens genauso wichtig wie die Konstruktion. Nicht nur den Lehrern sondern auch den Schülern muss bei allen Graphiken, die sie erstellen, klar werden, dass sie dies nicht zum Selbstzweck tun, sondern um die eingangs aufgeworfene Fragestellung aus der realen Welt zu beantworten. Nur wenn die Schüler eine Beziehung zwischen den Daten und dem, was die Daten darstellen, erkennen, dann kann man davon sprechen, dass sie Graphiken nicht nur zeichnen können sondern auch verstehen, also interpretieren und mit dem Sachproblem in Beziehung setzen können. Auf die Entwicklung des Verständnisses von graphischen Darstellungen soll im nächsten Ab- schnitt näher eingegangen werden. 6.5 Die Entwicklung des Verständnisses graphischer Darstellungen Unabhängig vom Typ der graphischen Darstellung und ob diese selbst hergestellt wurde oder vorgegeben ist, unterscheidet Curcio (2001, S. 7) drei Ebenen des Verständnis- ses von graphischen Darstellungen, die sie mit „Reading the data“, „Reading between the data“ und mit „Reading beyond the data“ bezeichnet. Reading the data Auf der ersten Ebene des Verständnisses liest man zunächst einfach explizit im Graph, im Titel oder in den Achsenbeschriftungen gegebene Informationen ab. Eine Inter- pretation der Graphik findet auf dieser Ebene noch nicht statt, so dass diese Ebene relativ geringe kognitive Anforderungen an den Rezipienten der Graphik stellt. 6. Daten organisieren und graphisch darstellen 110 Reading between the data Die zweite Ebene erfordert mathematische Fähigkeiten und Fertigkeiten, wie die Fä- higkeit, Mengen zu vergleichen und elementare Rechenoperationen durchzuführen, um die Beziehungen in den Daten, die im Graph dargestellt werden, entdecken und interpretieren zu können. Schlussfolgerungen werden allein auf Basis der im Graph entdeckten Struktu- ren gezogen. Reading beyond the data Diese Ebene des Verständnisses von Graphiken erfordert das Voraussagen oder das Schlussfolgern unter Einbeziehung von Hintergrundwissen, also von Informationen, die weder explizit noch implizit in der Graphik enthalten sind. Die drei Ebenen beschreiben eine Entwicklung, bei der sich die Aufmerksamkeit zu- nehmend von lokalen zu globalen Charakteristika eines Graphs verlagert (vgl. Friel, Curcio & Bright, 2001, S. 152), wobei auch bezüglich lokaler Aspekte bereits Sachwissen zur Interpretation erforderlich ist. Als Beispiel seien Ausreißer angeführt, welche eindeutig lokale Besonderheiten in einem Datensatz darstellen, die aber zur näheren Interpretation auch ein „Reading beyond the data“ unter Einbeziehung von Hintergrundwissen erfordern. Um jedoch überhaupt diese Ebenen des Verständnisses von graphischen Darstellun- gen erreichen zu können, benötigen die Schüler Vorwissen aus vier Bereichen. Konfron- tiert man Schüler mit einer graphischen Darstellung, so benötigen sie Lesekompetenz, um den Titel und die Achsenbeschriftung des Graphen zu verstehen. Laut Curcio (1987, S. 383) benötigen sie weiterhin elementare mathematische Fähigkeiten und Fertigkeiten, wie etwa die Kenntnis des Zahlbereichs und elementarer Operationen und Relationen, um den mathematischen Gehalt der Graphik zu verstehen. Außerdem benötigen die Schüler Vor- wissen über den Typ der dargestellten konventionellen Graphik. Weiterhin sollten Schüler bereits Vorwissen bezüglich des Sachproblems haben, um die Graphik im Sachkontext inhaltlich interpretieren zu können und dadurch Stufe 3, also die Fähigkeit zum „Reading beyond the data“ überhaupt erreichen zu können. Diese vier Bereiche sollten im Hinterkopf des Lehrers bleiben, wenn dieser Graphi- ken und Themen als Unterrichtsgegenstände auswählt. Wie kann man weiterhin das Ver- ständnis von Graphiken im Unterricht geeignet unterstützen und fördern? Untersucht man Daten anhand von graphischen Repräsentationen, so schlägt Curcio (2001) vor, dass man den Schülern Fragen stellt, die auf die einzelnen Verständnisebenen abzielen um einerseits 6. Daten organisieren und graphisch darstellen 111 herauszufinden, auf welcher Ebene die Schüler stehen und andererseits deren Verständnis von graphischen Darstellungen zu vertiefen. “Such questions can provide cues that activate the process of graph comprehension” (Friel et al., 2001, S. 130). Im Folgenden werden nun Fragen, die im Unterricht gestellt werden sollten, beispielhaft den drei Ebenen zugeordnet: Read the data • Was wird in dem Graph dargestellt? • Welche Kategorien gibt es? (Bei kategorialen Merkmalen) • Welche Werte kommen vor? (Bei numerischen Merkmalen) • Wie viele Schüler sind in Kategorie x? (Bei Häufigkeitsverteilungen) • Welche Schüler sind befragt worden? (Bei Namensvariablen) Read between the data • Welche Kategorie kommt am häufigsten vor (modale Klasse)? Welches ist der häu- figste Wert (Modalwert)? Woran erkennst du das? • Welche Kategorie kommt am seltensten vor? Wie hast du das herausgefunden? • Welches ist der kleinste/ größte Wert (Minimum/ Maximum)? Woran erkennt man dies? • Sind mehr Schüler in Kategorie x als in Kategorie y? Wenn ja, wie viel mehr? • Wie viele Schüler wurden befragt? • Welchen Titel könnten wir dem Graph geben? Read beyond the data • Welche Fragen kann man mithilfe dieser Graphik beantworten? Welche Fragen kann man nicht beantworten? Welche Zusatzinformationen bräuchte man? • Warum wurden die Kategorien begrenzt? • Sind die Daten realistisch? Begründe! • Wie würde die Graphik aussehen, wenn wir in x Wochen/ Monaten erneut Daten sammeln? Begründe! (Bei Wetter-Daten, Körpergröße,…) • Welcher Zusammenhang besteht zwischen den beiden Variablen? • Vergleiche die beiden Graphiken! Was sind Gemeinsamkeiten, was sind Unter- schiede? Welche Graphik übermittelt mehr Informationen? Welche Graphik ist ein- facher zu lesen und wieso? Wie könnte man die Graphik verbessern? 6. Daten organisieren und graphisch darstellen 112 • Kann man die gesammelten Daten mit Archivdaten vergleichen? Warum (nicht)? • Wie könnte die Verteilung der Nachbarklasse aussehen? Begründe! • Wie könnte der nächste Fall aussehen? Besonders auf der Ebene des „Read between the data“ wird der relationale Charakter von Diagrammen deutlich. Graphiken ermöglichen die visuelle Exploration von Beziehun- gen zwischen den Daten, wie zum Beispiel die Existenz von Ausreißern, denn selbst Aus- reißer sind nur in Bezug auf die restlichen Daten als solche zu identifizieren. Die Relatio- nen sind jedoch keinesfalls bekannt, sondern sollen im Sinne der explorativen Funktion von graphischen Darstellungen erst in den verschiedenen Graphiken entdeckt werden (vgl. Biehler, 1985, S. 74-75). Fragen auf der Ebene „Read between the data“, die besonders den relationalen Aspekt von Diagrammen betonen, helfen Schülern also, die Beziehungen zwi- schen Daten zu erforschen und einzeln abgelesene Informationen miteinander zu vernet- zen, so dass Schüler insgesamt ein tieferes Verständnis von graphischen Darstellungen und dem zugrunde liegenden Datensatz entwickeln können. Beim Umgang mit Graphiken im Unterricht ist insgesamt auch darauf zu achten, dass die Schüler sich der begrenzten Reichweite der Darstellungen bewusst werden. Dies kann dadurch erreicht werden, dass man auch Fragen stellt, die nicht mit Hilfe der Graphik be- antwortet werden können. Laut Pereira-Mendoza (1995, S. 12) sollten auch Vorhersage- fragen bereits bei kleinen Kindern zum Einsatz kommen, wozu die zwei letzten Fragen der Ebene „Read beyond the data“ gehören. Zudem sollen die Schüler lernen, ihre Behauptun- gen immer auf Daten zu stützen, aber dabei das Sachproblem nicht aus dem Auge zu ver- lieren. Deshalb sollen ihre Behauptungen immer begründet werden, wodurch gleichzeitig eine vertiefte Einsicht in den Aufbau der Graphen ermöglicht wird. Fragen, die sich auf die erste Ebene beziehen, bereiten Schülern erwartungsgemäß weniger Schwierigkeiten, aber bereits auf der zweiten Ebene treten häufiger Fehler auf, darunter Rechenfehler, Lesefehler, Skalierungsfehler oder eine falsche Interpretation der Achsen. Die dritte und damit anspruchsvollste Ebene erfordert das Ziehen von Schlussfol- gerungen, zum Beispiel das Vergleichen zweier Datensätze, das Voraussagen eines nächs- ten Falls oder das Identifizieren eines Trends (vgl. Friel et al., 2001, S. 132), was hohe kognitive Anforderungen an die Schüler stellt. Neben einem Verständnis von graphischen Darstellungen soll zudem ein Gespür für Graphiken bei den Schülern geweckt werden, was Friel et al. (2001, S. 145) mit dem Aus- 6. Daten organisieren und graphisch darstellen 113 druck „graph sense“ bezeichnen. Dieses Gespür für Graphen entwickelt sich schrittweise beim Herstellen und Nutzen von Graphiken in verschiedensten problemhaltigen Kontexten, die es erfordern, die Daten zu verstehen. Es ist ein umfassenderer Begriff, der neben dem Verständnis von mathematischen Beziehungen in Graphen verschiedene Fähigkeiten im Umgang mit graphischen Darstellungen beschreibt. Dazu gehören: • das Erkennen von Komponenten in Graphen, deren Beziehung zueinander und de- ren Auswirkungen auf die Informationsvermittlung • das Sprechen in der Sprache der verschiedenen Graphiken • das Verstehen von Beziehungen zwischen Tabellen, Graphen und den Daten • die Auswahl von geeigneten Graphiken in Abhängigkeit von der Natur der Daten und dem Zweck der Analyse • das Bewusstsein über die persönliche Beziehung zum Sachkontext, um Fehlinter- pretationen vermeiden zu können und Objektivität zu bewahren Zweifelsohne stellt dies hohe Anforderungen, sowohl an Lehrer als auch an Schüler. Der Unterricht ist so zu gestalten, dass Schüler die Möglichkeit haben, dieses Gespür für Graphiken schrittweise zu erlangen, auch wenn dieser Prozess nie abgeschlossen ist, da sich das Repertoire an Repräsentationen stets weiterentwickelt und unterschiedlichste Da- tensätze verwendet werden. Möglichkeiten zur reflektierten Auseinandersetzung mit ver- schiedenen graphischen Darstellungen bestehen in der Diskussion innerhalb der Lerngrup- pe oder innerhalb von Kleingruppen oder in schriftlichen Ausführungen. Beide Artikulati- onsformen fördern die aktive Auseinandersetzung mit den verschiedenen Graphen und ermöglichen den Schülern, sich ihrer Gedanken bewusst zu werden, diese anderen mitzu- teilen und konstruktive Kritik aneinander zu üben. Eine weitere Möglichkeit besteht darin, ausgehend von einer graphischen Darstellung Vermutungen anzustellen, wie derselbe Da- tensatz dargestellt in einer anderen Graphik aussehen würde. Die Entwicklung von „graph sense“ muss ein Ziel des Statistikunterrichts sein, wel- ches im Sinne des Spiralprinzips anhand immer neuer Graphiken und Problemstellungen über die Klassenstufen hinweg verfolgt wird. Dennoch beinhaltet der Begriff „graph sense“ von Friel et al. nicht das Erfinden eigener Darstellungen, was jedoch zu einer Teilkompe- tenz der in Kapitel 3 definierten Datenkompetenz gehört (vgl. Kapitel 3, Abschnitt 3.1). 6. Daten organisieren und graphisch darstellen 114 Warum Schüler eigene graphische Darstellungen erfinden sollten und welche Strategien sie dabei verwenden wird im folgenden Abschnitt thematisiert. 6.6 Graphische Darstellungen erfinden Obwohl es nicht zu bestreiten ist, dass einige Graphiken schwerer zu verstehen sind als andere, kritisiert Konold (2002, S. 3) die durch die NCTM-Standards vorgegebene Stu- fung der Einführung von verschiedenen konventionellen graphischen Darstellungen, weil dadurch dem Statistikunterricht ein instruktiver Ansatz zugrunde gelegt wird, bei dem das Hauptaugenmerk darauf liegt, dass Schüler lernen, gemäß geltender Konventionen Gra- phen zu erstellen. Vielmehr plädiert Konold ebenso wie Pereira-Mendoza (1995, S. 12) für einen Unterricht, der sich an dem Vorwissen der Schüler orientiert und Möglichkeiten zur Exploration und zum Aufbau von begrifflichen Konzepten gibt: “Given that there are many alternative representations which students can use to explore and express ideas such as covariation, spread, center, and shape, we would do better to target the underlying concepts in our instructional objectives and to focus less on how students should represent these graphically” (Konold, 2002, S. 9). Konold schlägt also eine konstruktive Hinführung zum graphischen Darstellen vor, bei dem die Schüler explizit dazu ermutigt werden sollen, eigene graphische Darstellungen zur Lösung eines Problems zu finden. Dieser Ansatz ist völlig legitim, da selbst Mathema- tiker und Naturwissenschaftler neue Repräsentationsformen entwickeln, von denen manche im Verlauf der Zeit als Standard-Graphiken anerkannt werden (vgl. Russell & Corwin, 1990, S. 54). Auch bei der Entwicklung der Software TinkerPlotsTM wurde dieser kon- struktive Ansatz zugrunde gelegt. Mit dieser Software können nicht nur konventionelle Graphiken schrittweise aufgebaut und damit wieder entdeckt werden, sondern auch völlig neue Darstellungen von den Schülern erfunden werden (vgl. Konold, 2002, S. 4). Beson- ders bei der Darstellung bivariater Daten ergibt sich eine Vielfalt von Graphiken in Tin- kerPlotsTM. Neben Mehrfeldertafeln (vgl. Abb. 6.22) und Paired Case-Value Plots (vgl. Abb. 6.25) können die Schüler weitere Darstellungen erfinden, etwa den Sliced Scatterplot, bei dem eine numerische Variable kategorisiert wurde. Abbildung 6.31 zeigt einen Sliced Scatterplot, der die Korrelation zwischen den Merkmalen Gewicht und Größe im Muffins- Datensatz visualisiert. Da das numerische Merkmal Gewicht kategorisiert wurde, stellt diese Darstellung eine Alternative zum herkömmlichen Scatterplot dar. Es wird keine 6. Daten organisieren und graphisch darstellen 115 Punktwolke dargestellt, sondern mehrere eindimensionale Streudiagramme, welche für Schüler leichter zu interpretieren sind. Zusätzlich sind die arithmetischen Mittel in jeder Teilgruppe eingezeichnet, so dass man dieser Darstellung entnehmen kann, dass größere Menschen tendenziell auch schwerer sind, da sich das arithmetische Mittel in den Teil- gruppen stets vergrößert. Abb. 6.31: Sliced Scatterplot als neu erfundene alternative Graphik zum konventionellen Scatterplot Collection 1 40-54,9 55-69,9 70-84,9 85-100 1,5 1,55 1,6 1,65 1,7 1,75 1,8 1,85 1,9 1,95 2 G ew ic ht Groesse Circle Icon (Quelle der Daten: Muffins-Datensatz) Eine weitere Möglichkeit zur Entdeckung von Strukturen in Daten und zur Darstel- lung von bivariaten Daten bietet der Farbschlüssel in TinkerPlotsTM. Jede Variable be- kommt in dieser Software eine Farbe zugeordnet. Bei numerischen Variablen handelt es sich um einen Grundton in verschiedenen Farbabstufungen, um die Kontinuität dieser Merkmale sichtbar zu machen. Kategoriale Merkmale bekommen pro Kategorie eine ande- re Farbe zugeordnet. Diese Option macht es möglich, selbst in Graphiken univariater Daten Beziehungen zwischen zwei Merkmalen entdecken zu können. Abb. 6.32 (a) zeigt bei- spielsweise ein eindimensionales Streudiagramm der Körperlänge von 24 Katzen. Da diese Darstellung nach dem Merkmal Körperlänge eingefärbt ist, sind kleinere Katzen durch helle und größere Katzen durch dunklere Icons dargestellt. Die Bimodalität der Graphik 6. Daten organisieren und graphisch darstellen 116 gibt Anlass, Hypothesen aufzustellen. Man könnte zum Beispiel annehmen, dass die Bi- modalität auf das Geschlecht zurückzuführen ist. Um diese Hypothese zu überprüfen, färbt man nun die Icons entsprechend dem Merkmal Geschlecht (vgl. Abb. 6.32 (b)), und man erkennt, dass tatsächlich Katzen tendenziell kleiner sind als Kater, auch wenn das kleinste Tier männlich ist. Die Möglichkeit graphische Darstellungen univariater Daten in der Far- be eines anderen Merkmals einzufärben, vereinfacht die Durchführung eines Gruppenver- gleichs. Die Tatsache, dass die Icons ihren Platz nicht verändern, wenn man sie anders einfärbt hilft Schülern bei der Suche nach Mustern und Trends in den Daten: "Also, the fact that the icons do not change their positions when the new color gradient is added probably helps students keep in mind that the cases are still ordered according to the origi- nal variable, which then allows them to systematically scan the cases in search of a pat- tern” (vgl. Konold, 2002, S. 8). Zieht man hingegen das Merkmal Geschlecht auf die zwei- te Achse, so verändert sich die Position der Icons und man erhält praktisch zwei überein- ander angeordnete eindimensionale Streudiagramme für die jeweiligen Gruppen der Kat- zen und der Kater (vgl. Abb. 6.32 (c)). 6. Daten organisieren und graphisch darstellen 117 Abb. 6.32: Farbschlüssel zur Entdeckung von Beziehungen in Daten (a) (b) Cats 14 16 18 20 22 24 0 5 co un t BodyLength (inches) Gender female male Circle Icon (c) Cats 14 16 18 20 22 24 0 5 co un t BodyLength (inches) BodyLength (inc... 14 24 Circle Icon Cats female male 14 16 18 20 22 24 G en de r BodyLength (inches) Circle Icon (Quelle der Daten: Datensatz Cats.tp aus TinkerPlotsTM, 2005) Auch Curcio und Folkson (1996) legen ihrem „Unterrichtsexperiment“ einen kon- struktiven Ansatz im Statistikunterricht zugrunde. Es wird untersucht, wie Kindergarten- kinder für sie relevante Fragen durch die Sammlung, Darstellung und Analyse von Daten beantworten. Dabei geht es um die Frage, wie häufig das englische Wort „I“ in dem Buch „I Like the Rain“ vorkommt (vgl. Abb. 6.33). Es werden vier verschiedene Strategien der Kinderkartenkinder zum Darstellen der Daten identifiziert, die in Abbildung 6.33 beispiel- haft aufgeführt sind (vgl. Curcio & Folkson, 1996, S. 384f.): 6. Daten organisieren und graphisch darstellen 118 • Die Kinder schreiben das Wort so oft es vorkommt auf, was ermüdend und zeitaufwendig ist. • Die Kinder schreiben Zahlen während sie zählen, was die Fähigkeit zum Zäh- len und Nummerieren erfordert. • Die Kinder fertigen Strichlisten an, während sie zählen, was anzeigt, dass sie zur abstrakten Darstellung von Daten fähig sind. • Einige Kinder notieren nichts als die endgültige Anzahl des gesuchten Worts. Abb. 6.33: Beispiele der vier Strategien, die Kindergartenkinder zum Darstellen von Daten nutzen (Darstellung aus: Curcio & Folkson, 1996, S. 384) Russell und Corwin (1990, S. 76) berichten, dass Schüler Repräsentationen von Da- ten erfinden, die eine Mischung aus Bild, Graph, Tabelle und einer Geschichte sind und dass sie auch bereits Farben verwenden, um bestimmte Strukturen in den Daten hervorzu- heben. Diese selbst erfundenen Darstellungsformen sind aber durchaus als Erkenntnismit- tel geeignet, um die aufgeworfene Frage aus der realen Welt zu beantworten, auch wenn sie nicht den Konventionen graphischer Darstellungen entsprechen. Gerade dadurch, dass sie eigene Wege zur Darstellung ihrer Daten finden, werden die Schüler mit den Daten vertraut, können Hypothesen über die Verteilung der Daten aufstellen (vgl. Russell & Corwin, 1990, S. 54) und dadurch intuitive begriffliche Konzepte aufbauen. Werden Schüler zu unterschiedlichen Vorgehensweisen bei der Repräsentation von Daten ermutigt und werden diese kontrastierend diskutiert, so trägt dies schrittweise dazu bei, den Abstraktionsprozess von realen Objekten hin zu abstrakten Repräsentationen von Daten zu vollziehen (vgl. Curcio & Folkson, 1996, S. 383). Teilweise sind bereits Ansätze zu dieser Abstraktionsfähigkeit bei denen von Curcio und Folkson (1996) beobachteten 6. Daten organisieren und graphisch darstellen 119 Kindergartenkindern zu sehen, etwa wenn Strichlisten angefertigt werden, auch wenn diese nicht der Konvention der 5er-Bündelung entsprechen (vgl. Abb. 6.33). Weiterhin eröffnet Lehrern dieser konstruktive Ansatz einen Einblick in die Denkweise der Schüler, wenn sie ihre Schüler beim Umgang mit Daten und deren Repräsentationen beobachten (vgl. Curcio, 2001, S. 17). Dennoch müssen Schüler lernen, konventionelle Graphen zu erstellen, zu lesen und zu interpretieren, da diese in Wissenschaft und Medien verwendet werden. Wie lässt sich aber der Übergang von eigenen, erfundenen Graphiken zu Standardgraphiken gestalten? Curcio (2001, S. 17) schlägt vor, die erfundenen Graphiken der Schüler mit konventionel- len Graphiken desselben Datensatzes zu vergleichen, ebenso wie die unterschiedlichen Erfindungen der Schüler verglichen werden sollten. Indem die verschiedenen Graphen auf Vor- und Nachteile untersucht werden, etwa indem Schüler Fragen formulieren, die durch die Graphiken beantwortet werden und solche die nicht beantwortet werden können, wer- den die Schüler mit den Charakteristika der Standard-Graphiken vertraut und erkennen wiederum, dass die Auswahl von Graphiken vom Datensatz und der zu untersuchenden inhaltlichen Fragestellung abhängt. Diese Vorgehensweise bildet also die Fähigkeit zum „Reading beyond the data“ und das Gespür für Graphiken zunehmend aus. Mit TinkerPlotsTM geschieht der Übergang von eigenen Graphiken zu konventionel- len Darstellungen beinah von selbst, da die einen aus den anderen hervorgehen oder auch umgekehrt (vgl. Abb. 6.22). Je nachdem, in welcher Reihenfolge die Schüler ihre Daten mit den Befehlen „stack“, „order“ und „separate“ organisieren, entstehen sowohl unkon- ventionelle Graphiken als auch Standard-Graphiken, auch wenn letztere als solche von den Schülern vielleicht nicht als Standard angesehen werden. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 120 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten Um eine Fragestellung aus der realen Welt zu beantworten, genügt es nicht, die Da- ten zu sammeln und graphisch darzustellen, sondern es muss eine Beschreibung mit an- schließender Interpretation der Daten im Sachkontext erfolgen. Um Datensätze in geeigne- ter Weise beschreiben zu können, benötigen die Schüler verschiedene Begriffe, welche in den folgenden Abschnitten beschrieben werden: Begriffe zur Beschreibung von Auffällig- keiten in Daten, Begriffe zur Beschreibung der Verteilungsform und der Streuung, sowie Lagemaße. Einige dieser Begriffe ergeben sich quasi automatisch bei der Diskussion von Verteilungen, andere müssen explizit durch den Lehrer eingeführt werden. Dazu werden im Folgenden verschiedene Möglichkeiten vorgestellt und kritisch analysiert. Sie orientie- ren sich wiederum an den von Bruner identifizierten Repräsentationsebenen (vgl. Kapitel 6). Das heißt, dass die statistischen Begriffe zunächst handlungsorientiert eingeführt wer- den bevor zu abstrakteren bildlichen oder symbolischen Darstellungen übergegangen wird. Zudem werden Möglichkeiten zum Einsatz der Software TinkerPlotsTM angeführt, die eine Einsicht in statistische Begriffe fördern. Des Weiteren werden geeignete Ausdrücke für statistische Fachbegriffe zur Verwendung im Unterricht der Klassen 1-6 vorgeschlagen, die sich am Sprachverhalten der Schüler orientieren (vgl. Hess. Kultusministerium, 1995, S. 145). Dadurch soll ein Operieren mit Worthülsen, zu denen die Schüler keine Vorstel- lung haben, vermieden werden. Eine gewisse Sonderrolle kommt in diesem Kapitel dem Verständnis des arithmetischen Mittels zu, da dieser Lageparameter komplexe Eigenschaf- ten besitzt, die die Schüler verstehen lernen sollen. Es werden geeignete Modelle zum Ein- satz im Unterricht vorgestellt, welche bestimmte Eigenschaften dieses Mittelwertes her- vorheben. Da die Repräsentativität von Mittelwerten insgesamt ebenfalls anspruchsvoll für jüngere Schüler zu verstehen ist, wird diesem Thema ein einzelner Abschnitt gewidmet. Da nicht nur einzelne Verteilungen sondern auch interessante Gruppenvergleiche betrachtet werden sollten, müssen Schüler Methoden dazu entwickeln, wie sie zwei Verteilungen überhaupt miteinander vergleichen können. Auch hier spielt die Idee der Repräsentativität eine entscheidende Rolle und kann im Kontext eines Gruppenvergleichs (weiter)entwickelt werden. Außerdem werden alternative Methoden zum statistischen Vergleich mit Hilfe der Software TinkerPlotsTM vorgestellt. Abschließend wird noch einmal darauf hingewiesen, dass es Schülern oft schwer fällt, Datensätze nicht nur formal zu beschreiben, sondern auch im Sachkontext zu inter- pretieren, um die Fragestellung aus der realen Welt zu beantworten. Es werden Hinweise 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 121 gegeben, wie man verhindern kann, dass Schüler während der Analyse der Daten ihre Fra- gestellung aus den Augen verlieren. 7.1 Begriffe zur Beschreibung von Auffälligkeiten in Daten Da Datensätze für Schüler anfangs nicht mehr als die Summe einzelner Daten dar- stellen, sollen hier zunächst solche Begriffe thematisiert werden, die zur Beschreibung von Auffälligkeiten in Datensätzen dienen und sich eher auf einzelne Aspekte oder Teilmuster des Datensatzes beziehen, als auf die Verteilung als Ganzes (vgl. Konold & Higgins, 2003, S. 202). Als langfristiges Ziel wird allerdings die Wahrnehmung eines Datensatzes als eine Einheit verfolgt. Für Schüler ist jedoch oft nicht klar, warum sie überhaupt die Verteilung des gesamten Datensatzes betrachten sollen, da dieser doch aus individuellen Daten be- steht, die variieren. Konold und Higgins (2003, S. 203) weisen darauf hin, dass man nicht erwarten darf, dass Schüler einen Datensatz als Einheit betrachten, wenn sie dafür keinen expliziten Grund haben. Fragen, die sich auf das Typische im Datensatz beziehen, oder die einen Gruppenvergleich erfordern, können bewirken, dass die Schüler über die Verteilung der gesamten Daten nachdenken und versuchen, diese zu beschreiben. Im Allgemeinen sollten die Schüler dazu ermutigt werden, die Daten umgangs- sprachlich zu beschreiben (vgl. Russell & Corwin, 1989, S. 18). Sie könnten zum Beispiel die Wörter „Klumpen“ oder „Verklumpung“ benutzen, um auf eine Teilgruppe hinzuwei- sen. Teilweise existieren auch keine echten Fachbegriffe zur Beschreibung von bestimmten Verteilungsmerkmalen. So spricht man beispielsweise von „Lücken im Datensatz“, ohne dass es dafür einen Spezialbegriff gäbe. Schließlich besteht dazu auch keine Notwendig- keit, da dieser anschauliche Begriff aus der Alltagssprache sich als durchaus nützlich er- weist. Durch die Verwendung von Alltagssprache erlangen die Schüler zudem eine gewis- se Sicherheit und Motivation, Daten und ihre Darstellungen zu beschreiben und zu erklä- ren. Es besteht also keine Gefahr, dass zu viele Fachbegriffe die Schüler verunsichern und sie es bevorzugen, besser nichts zu sagen, um keine Fehler zu machen. Ein wichtiger Begriff, der Auffälligkeiten in Datensätzen beschreibt, ist der Begriff des Ausreißers. Ausreißer sind untypische bzw. extreme Werte in einem Datensatz, die sowohl nach unten als auch nach oben weit vom Zentrum der Verteilung abweichen kön- nen. Es existiert allerdings keine Definition, wann ein Wert weit genug abweicht, um als Ausreißer bezeichnet zu werden (vgl. Russell & Corwin, 1989, S. 32). Lediglich bei be- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 122 stimmten Darstellungen gibt es Faustregeln, zum Beispiel beim Tukey-Boxplot. Ansonsten muss individuell in Bezug auf die gesamte Verteilung abgewogen werden, welche Werte man als Ausreißer bezeichnen kann. Dabei muss man außerdem abwägen, ob der extreme Wert auch bezüglich der Streuung der Daten als Ausreißer gewertet werden kann. Laut Russell & Corwin (1989, S. 32) entwickeln Schüler die Idee des Ausreißers meist intuitiv, da Schüler einerseits von sich aus Interesse an einzelnen Daten zeigen und sich anderer- seits diese extremen Werte in den meisten graphischen Darstellungen sowieso optisch auf- drängen. Da ohnehin die Bezeichnung Ausreißer sehr anschaulich ist, kann diese sofort eingeführt werden, sobald Schüler in ihren Beschreibungen von Datensätzen die Idee des Ausreißers entwickeln und sich für diese besonderen Daten interessieren. Ist ein Wert als Ausreißer in einer Verteilung identifiziert, so sollte man die Schüler dazu ermutigen, nach Erklärungen für diesen extremen Wert zu suchen. Den Schülern muss klar werden, dass Ausreißer manchmal aufgrund von Mess- oder Übertragungsfehlern entstehen, dass sie aber auch reale Daten sein können (vgl. Russell & Corwin, 1989, S. 32). Im ersten Fall sind diese Fehler zu beheben bzw. sind die Werte von der Analyse auszuschließen und im zweiten Fall muss nach möglichen inhaltlichen Erklärungen für diesen extremen Wert ge- sucht werden. Hat ein Datensatz genau einen Ausreißer, so ist dieser entweder das Minimum oder das Maximum der Verteilung. Das „Minimum“ bzw. das „Maximum“ sollte man im Unter- richt der unteren Klassen der Einfachheit halber mit „kleinster Wert“ bzw. „größter Wert“ bezeichnen. So kann man unnötige Fachbegriffe vermeiden und gleichwertige Alltagsbeg- riffe der Schüler verwenden. 7.2 Begriffe zur Beschreibung der Verteilungsform Um die Aufmerksamkeit der Schüler auf die Gestalt des gesamten Datensatzes zu lenken, ist die Verwendung von Vokabular bezüglich der Verteilungsform nützlich. Um die Verteilungsform hervorzuheben, kann man Kurven in die erstellten Diagramme ein- zeichnen, so dass das zugrunde liegende Muster deutlich wird. Diese Möglichkeit besteht auch in der Software TinkerPlotsTM, bei der man mit Hilfe des „Drawing Tools“ Kurven frei Hand einzeichnen kann, um die Verteilungsform hervorzuheben. Abbildung 7.1 zeigt in einem eindimensionalen Streudiagramm die Verteilung der Fußlänge (in cm) von 199 neuseeländischen Schülern im Alter von 7 bis 14 Jahren. Wie erwartet ergibt sich bei die- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 123 sem relativ großen Untersuchungsumfang eine annähernd symmetrische Verteilung, die man mit der eingezeichneten Kurve hervorheben kann. Abb. 7.1: Beispiel zur Verwendung des „Drawing Tools“ in TinkerPlotsTM New Zealand Students 14 16 18 20 22 24 26 28 30 32 34 36 0 10 20 30 co un t FootLenght (cm) Circle Icon (Quelle der Daten: Datensatz New Zealand Students.tp aus TinkerPlotsTM, 2005) Die Schüler sollten erkennen, dass sich viele Verteilungen mit einem der folgenden Begriffe beschreiben lassen: Symmetrisch/ glockenförmig, bimodal, linkssteil/ rechtsschief und rechtssteil/ linksschief. Dabei sollten zunächst natürlich umgangssprachliche, für die Schüler anschaulichere Begriffe verwendet werden, anstatt der oben genannten Fachbegrif- fe. Die Begriffe „glockenförmig“ bzw. „symmetrisch“ stellen dabei eine Ausnahme dar, da der erste Ausdruck anschaulich und leicht zu merken ist, der zweite Ausdruck aber auch verwendet werden könnte, da die Schüler diesen bereits aus dem Geometrieunterricht ken- nen. Die Bimodalität eines Datensatzes könnte man mit „hat zwei Berge/ Gipfel bei… und bei…“ beschreiben. Links- bzw. Rechtssteilheit könnte man mit „hat links/ rechts einen Gipfel bei…“ beschreiben. Wichtig ist, dass man innerhalb der Schulklasse möglichst ein einheitliches Vokabular zur Charakterisierung der Verteilungsform gebraucht, um Miss- verständnissen bei der unterrichtlichen Kommunikation vorzubeugen. Den Schülern muss allerdings auch klar sein, dass die oben genannten Verteilungs- formen lediglich Prototypen darstellen. Ein realer Datensatz zeigt oftmals keine idealtypi- sche Verteilungsform auf. Besonders wenn viele Ausreißer in eine Richtung vorliegen, ist es oft schwer zu entscheiden, ob etwa eine Verteilung noch als symmetrisch angesehen 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 124 werden kann oder ob diese doch eher eine linkssteile Verteilung darstellt. Bei L- Förmigkeit, also bei stark ausgeprägter Linkssteilheit hingegen fällt die Entscheidung leichter. Jeder Verteilungstyp besitzt also unterschiedliche Ausprägungsgrade. Insgesamt ist es mathematisch aufwändig zu entscheiden, welcher Verteilungstyp vorliegt. In den unteren Klassen kann diese Entscheidung nur auf visuellen Kriterien beruhen und kann daher in manchen Fällen auch nicht eindeutig getroffen werden. Das Wichtigste jedoch ist, dass den Schülern klar wird, welchen Nutzen es hat, die Verteilungsform zu beschreiben und inhaltlich zu interpretieren. Einzelne Kennzahlen rei- chen zur Beschreibung von Verteilungen nicht aus, da man sich kein vollständiges Bild von der Gestalt der Verteilung machen kann. Haben die Schüler bereits Erfahrungen mit verschiedensten Datensätzen und ihren Verteilungsformen gemacht, so bietet es sich an, die Schüler zunächst begründete Hypothesen aufstellen zu lassen, welchen Verteilungstyp sie erwarten. 7.3 Begriffe zur Beschreibung der Streuung Zwar gibt es in der Statistik verschiedene Streuungsparameter, wie zum Beispiel die Standardabweichung, den Interquartilabstand oder die Spannweite, aber im Unterricht der Klassen 1-6 ist nur der letztere von Bedeutung, da alle anderen Begriffe Wissen über statis- tische Kennzahlen voraussetzen und schwierig zu verstehen sind. So setzt ein Verständnis des Interquartilabstands voraus, dass man mit dem Begriff des Perzentils vertraut ist und um die Standardabweichung ausrechnen und interpretieren zu können, muss man ein Ver- ständnis des schwierigen Begriffs des arithmetischen Mittels besitzen. Von den konventio- nellen Streuungsparametern kann allein die Spannweite im Unterricht der unteren Klassen eingeführt werden, da man unter ihr schlicht den Abstand zwischen Maximum und Mini- mum versteht, welcher auch von jüngeren Schülern bereits durch Zählen oder durch das Bilden der Differenz einfach ermittelt werden kann. Die Frage nach der Streuung der Daten in einer Verteilung ergibt sich laut Russell & Corwin (1989, S. 32) intuitiv in einer Datenanalyse. Die Schüler ermitteln den kleinsten und den größten Wert und verstehen, dass alle anderen Werte in dem Bereich zwischen diesen Werten liegen. Sobald die Idee der Spannweite bei den Schülern aufkommt, kann der Begriff eingeführt werden, welcher zudem sehr anschaulich ist, da man ihn mit der Spannweite der Flügel von Vögeln in Verbindung bringen kann. „Ferner ist es wichtig, 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 125 neben quantitativen Begriffen parallel mit offenen qualitativen Begriffen zu arbeiten, an- statt diese nach «genetischer» Einführung zu vergessen“ (Biehler & Steinbring, 1991, S. 16). Dies bedeutet hierbei, dass man neben dem Begriff der Spannweite auch den allge- meinen Begriff der „Streuung“ im Unterricht verwenden sollte, wodurch zusätzlich auf eine Kernidee der Statistik, nämlich die Variation und daraus resultierende Streuung von Daten, hingewiesen wird. Es ist aber auch möglich, die Streuung der Daten ohne konventionelle Streuungspa- rameter im Unterricht zu beschreiben. Vergleicht man etwa die Streuung zweier Gruppen, so kann man sagen, dass die eine Gruppe „mehr streut als“ die andere Gruppe. Man führt also einen qualitativen Streuungsvergleich ohne die Angabe einer Kennzahl ein. Bei Ver- teilungen mit Ausreißern könnte man zudem die „Verteilungsbreite ohne Ausreißer“ als Begriff zur Beschreibung der Streuung einführen, wobei diese Breite abhängig davon ist, welche Werte man als Ausreißer bezeichnet. Halbiert man einen Datensatz, so kann man auch von der „unteren und oberen Streu- ung“ sprechen. Inwiefern diese Maße beim Vergleich zweier Datensätze nützlich sind, wird im Abschnitt 7.7 näher erläutert. 7.4 Lageparameter Einerseits werden Lagemaße genutzt, um einen einzelnen Datensatz zusammenfas- send zu beschreiben und andererseits werden Lageparameter als relative Maße zum Ver- gleich zweier Datensätze verwendet. Besteht für die Schüler eine Notwendigkeit, das „Ty- pische“ in einem Datensatz zu beschreiben oder Daten zusammenzufassen, so taucht die Idee der „Mitte“ oder des „Zentrums“ einer Verteilung bei den Schülern auf (Russell & Corwin, 1989, S. 25). Schüler schlagen oft vor, die Mitte der Verteilung durch die Mitte des Wertebereichs (midrange) zu definieren. Das heißt, sie wählen einfach die Zahl als „Mitte“, die genau mittig zwischen dem Minimum und dem Maximum liegt (Russell & Corwin, 1989, S. 24). Diese Vorstellung von einem Zentrum der Verteilung ist jedoch höchstens bei symmetrischen Verteilungen ohne Ausreißer angemessen. Liegt beispiels- weise eine linkssteile Verteilung vor, die zudem noch Ausreißer nach oben aufweist, so beschreibt die so definierte „Mitte“ nicht das, was man intuitiv als Zentrum der Daten be- zeichnen würde. Ebenfalls intuitiv erfasst wird die Idee des Modalwertes bzw. der modalen Klasse. Ausgehend von der Vorstellung des Meisten erkennen die Schüler intuitiv, dass 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 126 dieser Wert in bestimmten Fällen geeignet ist, um das Typische eines Datensatzes zu be- schreiben. Interessant ist jedoch, dass Schüler auch dazu tendieren, nicht eine einzige Kennzahl anzugeben, sondern einen modalen Bereich wählen, um das Zentrum einer Ver- teilung zu beschreiben, welchen Konold, Robinson, Khalil, Pollatsek, Well, Wing und Mayr (2002, S. 1) als „modal clump“ bezeichnen. Insgesamt haben Schüler folgende Vorstellung von einem idealen Mittelwert: Es sollte ein tatsächlich im Datensatz vorkommender Wert im dichtesten Bereich sein, der gleichzeitig Modalwert und Median ist und zudem in der Mitte des Wertebereichs liegt. All diese Eigenschaften werden jedoch nur bei symmetrischen Verteilungen erfüllt. Viele Da- tensätze mit denen jüngere Schüler arbeiten sind jedoch nicht symmetrisch und daher müs- sen die Schüler einige Kriterien ihres idealen Mittelwertes aufgeben. Die Vorstellung eines Mittelwertes im Sinne des Modalwerts ist jedoch am stärksten ausgeprägt, so dass die meisten Schüler eisern an dieser für sie wichtigsten Eigenschaft festhalten (Konold & Hig- gins, 2003, S. 203). Auffällig ist, dass die Idee eines Schwerpunkts innerhalb der Vertei- lung nicht zu den von den Schülern geforderten idealen Eigenschaften eines Mittelwertes gehört, was demnach Schwierigkeiten beim Verständnis des arithmetischen Mittels mit sich bringt. Die drei geläufigsten Mittelwerte der Statistik, nämlich der Modalwert bzw. die mo- dale Klasse, der Median und das arithmetische Mittel, sowie Möglichkeiten, diese im Un- terricht der Klassen 1-6 einzuführen, werde ich im Folgenden vorstellen, denn sie sind jene statistische Kennzahlen, die die Idee der „Mitte“ aufgreifen: “The mode, median, and the mean are different ways to think about the broader concept of average“ (Friel, 1998, S. 208-209). Ebenfalls werde ich alternative mittlere Werte, wie die Idee einer modalen Gruppe (modal clump), aufgreifen und erläutern, warum aufbauend auf dieser intuitiven Idee der Schüler ein besseres Verständnis von konventionellen Mittelwerten entwickelt werden kann. 7.4.1 Modalwert bzw. modale Klasse Mit Modalwert bzw. modaler Klasse bezeichnet man diejenige Merkmalsausprä- gung, die in einer statistischen Verteilung am häufigsten vorkommt. Man spricht von meh- reren Modalwerten, wenn mehrere Werte mit gleicher Häufigkeit vorkommen. Der Mo- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 127 dalwert ist das einzige Lagemaß, welches man zur Beschreibung eines kategorialen Merk- mals verwenden kann (vgl. Friel, 1998, S. 209). Ausgehend von der Vorstellung des „Meisten“ wird der Modalwert von den Schülern meist intuitiv wahrgenommen und in deren Beschreibungen aufgenommen (vgl. Russell & Corwin, 1989, S. 57). Mit dem Ausdruck „häufigster Wert“ bzw. „häufigste Kategorie“ kann diese Idee dann im Unterricht umschrieben werden. Eine explizite Einführung durch den Lehrer entfällt damit. Zwar ist der Modalwert der einzige konventionelle Lageparame- ter, der intuitiv wahrgenommen wird, aber dies muss nicht bedeuten, dass ein inhaltliches Verständnis des Modalwerts bei den Schülern vorhanden ist. Die Eigenschaft des Modal- werts als zusammenfassende, repräsentative Zahl in einem Datensatz wird häufig von den Schülern nicht erfasst. Eine Einsicht in diese Eigenschaft des Modalwerts könnte durch Gruppenvergleiche von kategorialen Variablen im Unterricht gefördert werden. Außerdem wird die Bedeutung des Modalwerts häufig falsch artikuliert. Drückt man den Modalwert 22 in Abbildung 7.2 derart aus, dass man sagt, „die meisten Schüler haben eine Fußlänge von 22 cm“, so ist dies falsch, da tatsächlich nur 30 von 199 Schülern, also etwa 15%, diese Fußlänge besitzen (vgl. Friel, 1998, S. 209). Zwar kann man den obigen Ausdruck im Sinne der relativen Mehrheit verwenden, aber es ist davon auszugehen, dass die Schüler in den unteren Klassen sich nicht auf die relative Mehrheit beziehen. Im Sinne der absoluten Mehrheit wäre folgende Formulierung angemessen: „Schüler mit einer Fuß- länge von 22 cm kommen am häufigsten vor“. Abb. 7.2: Verteilung der Fußlänge (in cm) von 199 neuseeländischen Schülern New Zealand Students 14 16 18 20 22 24 26 28 30 32 34 36 0 10 20 30 co un t FootLenght (cm) Square Icon (Quelle der Daten: Datensatz New Zealand Students.tp aus TinkerPlotsTM, 2005) 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 128 Zwar ist der Modalwert in fast allen graphischen Darstellungen einfach zu ermitteln, aber umso schwieriger ist es, zu entscheiden, wann dieser Wert wirklich geeignet ist, um eine Verteilung zu beschreiben. Ist der Modalwert nicht sehr ausgeprägt, also kommt er nur geringfügig häufiger vor als andere, so ist gegebenenfalls ein anderer Mittelwert sinn- voller, um die Verteilung zu charakterisieren (vgl. Russell & Corwin, 1989, S. 58). Beson- ders bei numerischen Verteilungen sind Median oder arithmetisches Mittel meist nützlicher (vgl. Friel, 1998, S. 209). Sind den Schülern die Eigenschaften verschiedener Mittelwerte bekannt, so sollten im Unterricht verstärkt Verteilungen behandelt werden, die eine Aus- wahl eines aussagekräftigen Mittelwertes erfordern. Werden verschiedene Graphiken betrachtet, so besteht eine Schwierigkeit darin, dass der Modalwert abhängig von der Klassenbreite ist. Experimentieren die Schüler etwa in TinkerPlotsTM mit verschiedenen Darstellungen, was im Sinne der Explorativen Datenana- lyse unter dem Stichwort der substanziellen Modifikation der Darstellung durchaus er- wünscht ist, so erkennen sie, dass bei einem Histogramm der Klassenbreite 1 der Modal- wert bei 23 liegt (vgl. Abb. 7.3), und nicht mehr bei 22 wie im obigen Säulendiagramm (vgl. Abb. 7.2). Dies liegt daran, dass die 5 Schüler mit einer Fußlänge von 22,5 cm zu denjenigen mit einer Fußlänge von 23 cm hinzugezählt werden. Neben dem Grund für den veränderten Modalwert muss mit den Schülern auch diskutiert werden, welcher Modalwert gemäß ihrer zu beantwortenden Fragestellung angemessen ist, also welcher Genauigkeits- grad erforderlich ist. Abb. 7.3: Histogramm der Klassenbreite 1 mit dem Modalwert 23 New Zealand Students 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 0 10 20 30 co un t FootLenght (cm) Fuse Rectangular (Quelle der Daten: Datensatz New Zealand Students.tp aus TinkerPlotsTM, 2005) 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 129 7.4.2 Median Den Median bzw. Zentralwert kann man sich als „Gruppenhalbierungswert“ vorstel- len, da er den Datensatz so teilt, dass rechts und links vom Median in etwa gleich viele Werte liegen. Die Bestimmung des Medians erfolgt über das Sortieren der Werte eines Datensatzes der Größe nach und anschließendem Zählen bis zur Mitte. Hierzu muss man noch zusätzlich unterscheiden, ob die Anzahl der Daten (n) ungerade oder gerade ist, da bei einer ungeraden Anzahl der Median genau auf den mittleren Wert fällt und bei einer geraden Anzahl zwischen die zwei mittleren Werte. Wenn n gerade ist und die beiden mitt- leren Werte ungleich sind, dann ist der Median ein Wert, der nicht selbst im Datensatz vorkommt. Es gilt also: (1) ⎟⎠ ⎞⎜⎝ ⎛ += 2 1 :~ n xx , falls n ungerade (2) ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ += ⎟⎠ ⎞⎜⎝ ⎛ +⎟⎠ ⎞⎜⎝ ⎛ 1 222 1:~ nn xxx , falls n gerade Für den Median gilt die Halbierungseigenschaft, da er als „Gruppenhalbierungswert“ den Datensatz in zwei etwa gleich große Hälften aufteilt. Das heißt, dass der Anteil aller Werte, die kleiner gleich dem Median sind, mindestens 50% beträgt und der Anteil der Daten, die echt kleiner als der Median sind, höchstens 50% beträgt. Bei wenigen Bindun- gen, also bei wenigen mehrfach vorkommenden Werten in einem Datensatz, gilt die Hal- bierungseigenschaft des Medians angenähert. Eine weitere wichtige Eigenschaft des Medi- ans ist die Robustheit gegenüber Ausreißern, was ihn in bestimmten Datensätzen zu einem aussagekräftigeren Mittelwert macht als das arithmetische Mittel. Die Bezeichnung „Halbierungswert“ eignet sich zur Verwendung im Unterricht, da diese Terminologie die Halbierungseigenschaft des Medians hervorhebt. Wie kann man nun diesen statistischen Kennwert zur Zusammenfassung eines Da- tensatzes im Unterricht einführen? Dazu gibt es entsprechend der Repräsentationsebenen verschiedene Wege. Wichtig ist, dass man zunächst ein begriffliches Verständnis vom Me- dian besitzt, um darauf aufbauend einen Algorithmus entwickeln zu können (vgl. Friel, 1998, S. 209). Zunächst sollte jeder Begriff auf enaktiver Ebene eingeführt werden. Dazu 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 130 bietet es sich an, die Variable Körpergröße zu betrachten und mit den Schülern zusammen jene mittlere Körpergröße zu finden, die den Datensatz halbiert. Zunächst können die Schüler Vorschläge machen, wie man diese spezielle mittlere Körpergröße ermitteln kann. Um die Vorschläge zu testen, stellen sich dann alle Schüler der Größe nach auf (vgl. Abb. 7.4). Gut geeignet ist folgende Strategie: Man zählt jeweils Paare von Schülern von beiden Enden ab, so dass am Ende nur noch ein Schüler übrig bleibt, falls n ungerade. Ist die An- zahl der Daten gerade, so bleiben zwei Schüler übrig und es kann mit den Schülern zu- nächst erörtert werden, welches in diesem Fall die mittlere Körpergröße sein kann, bevor man „definiert“, dass in diesem Fall der Median der Körpergröße genau in die Mitte der beiden Schüler fällt (vgl. Russell & Corwin, 1989, S. 50-52). Eine konkrete Einführung des Medians auf enaktiver Ebene ist natürlich auch mit Materialien wie Steckwürfeln möglich. Abb. 7.4: Handlungsorientierte Einführung des Medians am Beispiel der Variablen Kör- pergröße (Darstellung aus: Russell & Corwin, 1989, S. 52) Auf ikonischer Ebene bietet es sich an, die Werte eines Datensatzes der Größe nach zu ordnen und so auf einen Streifen Papier einzutragen, dass jeder Wert des Datensatzes eine einheitliche Fläche einnimmt. Dazu sollte entsprechendes Gitterpapier zur Verfügung stehen oder hergestellt werden. Der Median kann dann durch Halbieren des Papierstreifens identifiziert werden (vgl. Friel, 1998, S. 210), welches außerdem die Halbierungseigen- schaft dieses Kennwertes deutlich macht, da rechts und links vom Median gleich viele Werte liegen (vgl. Abb. 7.5). 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 131 Abb. 7.5: Ermittlung des Medians durch Falten eines Papierstreifens 2 3 4 4 6 8 11 11 12 13 17 In kleinen Datensätzen sind die oben genannten Strategien des Abzählens oder Fal- tens sinnvoll, bei größeren Datensätzen sind diese Strategien jedoch kaum mehr durch- führbar, da sie sehr zeitaufwändig und fehleranfällig werden. Daher sollte im Unterricht mit zunehmend größeren Datensätzen gearbeitet werden, um die Schüler anzuregen, neue Strategien zur Bestimmung des Medians zu finden. So werden die Schüler auf dem Hinter- grund der enaktiven und ikonischen Erfahrungen mit dem Median herausgefordert, eine „Formel“ oder „Handlungsanweisung“ zur Berechnung des Medians zu entwickeln, welche die symbolische Repräsentationsebene darstellt. Auch wenn man natürlich nicht erwarten kann, dass Schüler in den Klassen 1-6 eine mathematische Formel produzieren, so können sie sicherlich ihr Vorgehen zur Berechnung des Medians in den zwei Fällen beschreiben. Dies könnte folgendermaßen lauten: Zuerst ordnet man die Daten der Größe nach. Ist die Anzahl der Daten gerade und teilt man sie durch zwei, so gibt das Ergebnis an, wieviel Schritte man ausgehend von einem Ende des geordneten Datensatzes zählen muss. Der Median liegt dann genau in der Mitte zwischen diesem und dem nächsten Datenwert. Ist die Anzahl der Daten ungerade und teilt man sie durch zwei, so ergibt sich eine Bruchzahl. Diese rundet man auf und die erhaltene Zahl gibt die Anzahl der Schritte an, die man zäh- len muss, um den Median zu finden (vgl. Friel, 1998, S. 211). Erst das enaktive und ikoni- sche Arbeiten mit dem Median ermöglicht die Entwicklung von tragfähigen Grundvorstel- lungen zu diesem Mittelwert, welche dann zur Entwicklung einer „Handlungsanweisung“ herangezogen werden können. Im Sinne des Spiralprinzips sollte in den späteren Jahrgän- gen aus dieser „Handlungsanweisung“ eine abstrakte Formel zur Berechnung des Medians entwickelt werden. Bei der Bestimmung des Medians kommt es häufig vor, dass die Schüler diesen er- mitteln, ohne vorher eine Rangordnung aufgestellt zu haben. Um dem vorzubeugen, ist besonders die handlungsorientierte Einführung nützlich. Mit dem Bild der nach der Größe aufgestellten Schüler im Kopf, wird die Notwendigkeit einer Rangordnung klar. Häufig wird jedoch das Ergebnis der Division durch 2 selbst als Median angegeben, anstatt dieses Ergebnis als Rangplatz des Medians zu interpretieren. Dieser Fehler wird den Schülern deutlich, wenn sie den Median nicht nur ermitteln, sondern diesen Kennwert auch im 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 132 Sachkontext interpretieren, insbesondere dann, wenn der zugrunde liegende Datensatz aus einem anderen Zahlenraum stammt als die Rangordnung. Ein weiterer häufiger Fehler be- steht darin, dass die Schüler selbst bei kategorialen Variablen einen Median ermitteln. Da- bei muss den Schülern klar gemacht werden, dass bei kategorialen Variablen keine natürli- che Reihenfolge der Kategorien existiert. Vielmehr gibt es meist verschiedene Möglichkei- ten die Kategorien anzuordnen und daher kann man auch den Datensatz nicht vernünftig halbieren. Eine weitere typische Fehlvorstellung des Medians ist, dass Schüler häufig der Auffassung sind, der Median läge immer in der Mitte des Wertebereiches oder in der Mitte der in der Graphik sichtbaren x-Achse (vgl. Russell & Corwin, 1989, S. 56-57). Diese Fehlvorstellung vom Median ist auf die Vorstellung zurückzuführen, die junge Schüler von einem idealen Mittelwert haben (vgl. Konold & Higgins, 2003, S. 203). Der Fehlvorstel- lung, der Median läge immer in der Mitte des Wertebereichs, ist durch geeignete Beispiele unter Verwendung von Ausreißern vorzubeugen. Besonders gut geeignet ist dazu die Ar- beit mit TinkerPlotsTM, da diese Software es ermöglicht, die Mitte des Wertebereichs (midrange) in den Graphiken einzuzeichnen. Die Schüler können in verschiedenen Daten- sätzen den midrange mit dem Median vergleichen und erkennen so, dass diese beiden Kennzahlen nicht übereinstimmen müssen. Ferner erkennen sie, dass der midrange oft nicht im dichtesten Bereich der Daten liegt und zumeist nur sehr geringe Aussagekraft hat. Außerdem können die Schüler die Robustheit des Medians entdecken. Dazu eignet sich ebenfalls die Verwendung von dynamischer Statistiksoftware wie TinkerPlotsTM. Leh- rer können damit interaktive Arbeits- und Lernumgebungen vorbereiten, in denen Schüler experimentell fundamentale Eigenschaften von statistischen Mittelwerten herausfinden können. Beispielhaft habe ich mit TinkerPlotsTM die Arbeits- und Lernumgebung 7.1 her- gestellt (siehe Anhang 2 oder beiliegende CD-Rom), welche sich zur Untersuchung eignet, wie sich Median, arithmetisches Mittel und die Mitte des Wertebereichs verändern, wenn sich einzelne Datenpunkte ändern. Darin kann man die Robustheit des Medians sowie die Empfindlichkeit des arithmetischen Mittels gegenüber Ausreißern dynamisch visualisieren. Außerdem zeigt diese Arbeitsumgebung, dass der Median und die Mitte des Wertebereichs nicht übereinstimmen müssen und trägt damit zum Abbau von Fehlvorstellungen bei. Wichtig ist, dass die Schüler versuchen, ihre in den Arbeits- und Lernumgebungen ge- machten Entdeckungen zu begründen. Die Software TinkerPlotsTM kann also einerseits als Werkzeug der Lehrenden ge- nutzt werden, um Arbeits- und Lernumgebungen zur Förderung von Datenkompetenz zu entwickeln und andererseits als Werkzeug der Lernenden verwendet werden, welche darin 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 133 die Möglichkeit zum explorativen Arbeiten haben und somit fundamentale Ideen der Da- tenanalyse selbständig entdecken können. 7.4.3 Arithmetisches Mittel Das arithmetische Mittel, welches man im Unterricht mit der Bezeichnung „Durch- schnitt“ oder schlicht „Mittelwert“ einführen könnte, ist derjenige der drei geläufigsten Mittelwerte, dessen Eigenschaften am schwierigsten zu verstehen sind, auch wenn die Be- rechnung des arithmetischen Mittels trivial erscheint, da einfach alle Werte aufsummiert werden und diese Summe durch die Anzahl der Werte dividiert wird: ∑ = =+++= n i i n x nn xxxx 1 21 1... . Dennoch beinhaltet dieser eigentlich einfache Algorithmus zahlreiche Fehlerquellen, die im Folgenden erläutert werden. Zudem wird deutlich gemacht, dass die Vermittlung des Algorithmus allein nicht ausreicht, um ein konzeptionelles Verständnis zu erreichen und diese Kennzahl sinnvoll in eine Datenanalyse einzubeziehen. Dazu benötigt man ein Verständnis der Eigenschaften, die dieser Lageparameter besitzt. Diese Eigenschaften des arithmetischen Mittels werden erläutert und es werden Schwierigkeiten vorgestellt, die Schüler beim Verständnis derselbigen haben. Außerdem werden Möglichkeiten zur Visua- lisierung der verschiedenen Eigenschaften im Unterricht vorgestellt und kritisch analysiert. 7.4.3.1 Zur Einführung des Algorithmus Bezüglich des Algorithmus zur Bestimmung des arithmetischen Mittels verfügen vie- le Schüler über Vorerfahrungen, da sie diesen etwa bei der Berechnung eines Notendurch- schnitts anwenden. Es besteht jedoch ein Verständnismangel bezüglich der Bedeutung die- ses Begriffs. Dies resultiert daraus, dass Lehrer oft nur den Algorithmus vermitteln, wel- cher wie jeder Algorithmus ohne jegliches Verständnis ausgeführt werden kann. Viele Schüler sehen also im arithmetischen Mittel nicht mehr als das Resultat einer Rechnung (vgl. Konold & Higgins, 2003, S. 205) und erkennen damit nicht, dass dieser Mittelwert die Beziehung der Daten untereinander beschreibt und damit praktisch einen gesamten Datensatz in einer Zahl zusammenfasst und er sich folglich zum Vergleich von Datensät- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 134 zen eignet. Wird im Unterricht allein der Algorithmus vermittelt, so besteht die Gefahr, dass die Daten völlig ignoriert werden. Ein weiteres Problem besteht darin, dass selbst der so einfach erscheinende Algo- rithmus zahlreiche Fehlerquellen beinhaltet. Bei der Addition vieler Daten können leicht Fehler durch Auslassen oder doppelte Addition geschehen (vgl. Friel/ Mokros/ Russell 1991, S. 45). Auch werden häufig nur einige und nicht alle Daten addiert oder es wird durch eine beliebige Zahl dividiert, anstatt durch die Anzahl der Werte (vgl. Friel et al. 1991, S. 49). Gerade bei den bestehenden Fehlerquellen ist es wichtig, dass Schüler ein Verständnis davon haben, was der Durchschnitt aussagt, denn nur dann können sie ihr er- rechnetes Ergebnis im Sachkontext auf Angemessenheit überprüfen. Zwar ist eine Berechnung des arithmetischen Mittels theoretisch bereits in den Klas- sen 4 oder 5 möglich, da dann die Division mit Rest bekannt ist, aber man sollte den Algo- rithmus besser später einführen, etwa in der Klasse 6, da dieser mehr als nur eine Anwen- dung der Division ist. Die Schüler sollten zunächst die Eigenschaften dieses Lageparame- ters und damit dessen Relevanz für eine Datenanalyse verstehen bevor sie den Algorithmus kennen lernen (vgl. Mokros & Russel, 1995, S. 20; Russell & Mokros, 1996, S. 363). Außerdem sollen sie Kriterien ausbilden, wann dieser Mittelwert dazu geeignet ist, einen Datensatz zu beschreiben: “The computational rule by itself does not tell students when it is appropriate to compute a mean, nor does it give any indication that an answer is reason- able once it has been computed” (Pollatsek/ Lima/ Well, 1981, S. 192). Schließlich ist auch die Idee, dass eine einzige Zahl einen gesamten Datensatz repräsentieren kann, nicht ein- fach zu verstehen. Zunächst sollen die Eigenschaften des arithmetischen Mittels vorgestellt werden, sowie Möglichkeiten, diese Eigenschaften im Unterricht zu vermitteln, um ein adäquates Begriffsverständnis aufzubauen. 7.4.3.2 Eigenschaften des arithmetischen Mittels und deren unterrichtliche Umset- zung Laut Cortina (2002, S. 1) hat das arithmetische Mittel diverse „mathematische Per- sönlichkeiten“, welche den Einsatz dieses Kennwerts in der Statistik und Datenanalyse reflektieren. Strauss und Bichler (1988, S. 65-66) haben 7 Eigenschaften des arithmeti- schen Mittels identifiziert und unterscheiden diese in drei Aspekten des arithmetischen 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 135 Mittels, nämlich im statistischen Aspekt, im abstrakten Aspekt und im repräsentativen As- pekt. Zu dem statistischen Aspekt zählen sie die folgenden drei Eigenschaften: Das arith- metische Mittel liegt zwischen dem Minimum und dem Maximum der Verteilung, aber im Allgemeinen nicht genau in der Mitte des Wertebereichs (Lage-Eigenschaft des arithmeti- schen Mittels). Die Ausgleichseigenschaft besagt, dass die Summe der Abweichungen vom arithmetischen Mittel 0 ist, also ( ) 0 1 =−∑ = n i i xx . Damit beträgt auch die durchschnittliche Abweichung vom arithmetischen Mittel 0. Außerdem wird das arithmetische Mittel durch von ihm abweichende Werte beeinflusst. Es ist damit empfindlich gegenüber Ausreißern. Weitere statistische Eigenschaften des arithmetischen Mittels, die Strauss und Bich- ler (1988, S. 65-66) nicht aufgeführt haben, sind die Gleichverteilungs- und die Schwer- punkteigenschaft. Die Gleichverteilungseigenschaft sagt aus, dass wenn man die Summe aller Werte zu gleichen Anteilen auf alle Fälle verteilen würde, man das arithmetische Mit- tel erhält, denn == ∑ = n i ixxn 1 nxxx +++ ...21 .Die Schwerpunkteigenschaft besagt, dass das arithmetische Mittel so gewählt ist, dass die Summe der Abweichungen nach oben gleich der Summe der Abweichungen nach unten ist: ∑∑ <> −=− n xx i n xx i ii xxxx . Unter dem abstrakten Aspekt des arithmetischen Mittels verstehen Strauss und Bich- ler (1988, S. 65-66) die Eigenschaft, dass das arithmetische Mittel selbst nicht als Wert im Datensatz vorkommen muss, sowie dass es eine fiktive Zahl ist, die keine direkte Entspre- chung in der Realität besitzen muss11. Die dritte abstrakte Eigenschaft des arithmetischen Mittels sehen Strauss und Bichler (1988, S. 66) darin, dass man bei der Berechnung dieses Kennwertes auch Daten mit dem Wert 0 berücksichtigen muss, was Schülern oft Probleme bereitet. Der repräsentative Aspekt des arithmetischen Mittels wird darin gesehen, dass dieser statistische Kennwert einen typischen, mittleren Wert des Datensatzes darstellt, welcher in einer einzigen Kennzahl den gesamten Datensatz zusammenfasst (vgl. Strauss & Bichler, 1988, S. 66). Welche der oben aufgeführten Eigenschaften des arithmetischen Mittels werden von Schülern intuitiv erkannt und welche bereiten Verständnisschwierigkeiten? Strauss und 11 So beträgt zum Beispiel die durchschnittliche Kinderzahl im Jahr 1980 in amerikanischen Familien 1,6, auch wenn es natürlich keinen Bruchteil von Kindern gibt. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 136 Bichler (1988, S. 67-68) untersuchen das Verständnis von jeweils 20 repräsentativ ausge- wählten 8-, 10-, 12- und 14-Jährigen, welche im Schulunterricht noch keine Erfahrungen bezüglich der Eigenschaften des arithmetischen Mittels gemacht haben. Lediglich die 12- und 14-Jährigen kennen den Algorithmus zur Berechnung dieses Kennwerts. Grundlage des Tests sind Textaufgaben, die den Kindern vorgelesen werden und die teilweise mit und teilweise ohne Material gelöst und begründet werden sollen. Beispielhaft soll hier eine Aufgabe vorgestellt werden, die die Lage-Eigenschaft testet: „Kinder brachten Legosteine zum Spielen mit in die Schule. Chaim brachte die größte Anzahl von Steinen mit – 7. Die Kinder entschieden, diese so auszuteilen, dass jeder die gleiche Anzahl erhält. Als sie dies taten, erhielt jeder 8 Steine. Glaubst du, dass dies passieren kann? Warum glaubst du, dass dies (nicht) passieren kann?“ (Strauss & Bichler, 1988, S. 69, Übersetzung A.W.). Es ergeben sich folgende Ergebnisse bezüglich der verschiedenen Eigenschaften: Die Lageeigenschaft wird von etwa 50% der 8-Jährigen und von nahezu allen anderen Schülern verstanden. Die Ausgleichseigenschaft hingegen bereitet allen getesteten Schülern unab- hängig von ihrem Alter große Schwierigkeiten. Beinah alle Schüler haben verstanden, dass das arithmetische Mittel durch von ihm abweichenden Werten beeinflusst wird und dass es sich dabei um eine Zahl handelt, die nicht im Datensatz vorkommen muss. Dass dieser Kennwert zudem eine fiktive Zahl sein kann, zu dem es kein Gegenstück in der Realität gibt, wird von gut 40% der 8-Jährigen, 80% der 10-Jährigen und beinah allen 12- und 14- Jährigen verstanden. Die Tatsache, dass bei der Berechnung des arithmetischen Mittels Daten mit dem Wert 0 mit einbezogen werden müssen, bereitet den Schülern jedoch große Schwierigkeiten. Viele rechtfertigen fälschlicherweise die Vernachlässigung der 0 damit, dass diese im Sinne des neutralen Elements bei der Addition und der Subtraktion auch kei- ne Rolle spielt. Ebenso schwer zu verstehen ist die repräsentative Eigenschaft des arithme- tischen Mittels. Nur sehr wenige 8-Jährige, 25% der 10-Jährigen und 60-65% der 12- und 14-Jährigen können Aufgaben lösen, welche sich auf diese Eigenschaft beziehen. Viele 8- Jährige wählen sogar das Maximum als repräsentative Zahl und versuchen ihre Entschei- dung im Kontext der Aufgaben zu begründen (vgl. Strauss & Bichler, 1988, S. 72-78). Insgesamt zeigt sich also, dass das Verständnis des arithmetischen Mittels sich mit der Zeit verbessert, dass also ältere Schüler tendenziell weniger Probleme mit diesem Beg- riff haben als jüngere. Weiterhin wird deutlich, dass einige Eigenschaften des arithmeti- schen Mittels schwerer zu verstehen sind als andere (vgl. Strauss & Bichler, 1988, S. 78). Lediglich die Lageeigenschaft, die Empfindlichkeit gegenüber abweichenden Werten und die Eigenschaft, dass das arithmetische Mittel selbst nicht unbedingt im Datensatz vor- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 137 kommen muss, sind für die Schüler relativ unproblematisch. Die Ausgleichseigenschaft, die repräsentative Eigenschaft, sowie die Tatsache, dass es zum arithmetischen Mittel oft kein Gegenstück in der Realität gibt, sind ebenso wie die Berechnung dieses Kennwerts unter Berücksichtigung von Daten mit dem Wert 0 Eigenschaften, die schwerer zu verste- hen sind. Es wird außerdem deutlich, dass die Eigenschaften des arithmetischen Mittels kaum mit den Vorstellungen der Schüler von einem idealen Mittelwert korrespondieren. Zwei der Eigenschaften, nämlich dass das arithmetische Mittel selbst nicht im Datensatz vor- kommen muss und dass es eine fiktive Zahl ist, zu der oft kein reales Gegenstück existiert, werden zwar von den Schülern in der Studie von Strauss und Bichler (1988) relativ gut verstanden, sind aber zwei Gründe, die Schüler dafür angeben, dass sie das arithmetische Mittel als nützlichen Durchschnitt ablehnen (vgl. Konold & Higgins, 2003, S. 203). Es stellt sich folglich die Frage, wie man die Schüler bei der Entwicklung eines Ver- ständnisses der verschiedenen Eigenschaften geeignet unterstützen kann und wie man zu- dem auch die Gleichverteilungs- und die Schwerpunkteigenschaft des arithmetischen Mit- tels deutlich machen kann. Dazu werden im Folgenden Repräsentationsmöglichkeiten der verschiedenen Eigenschaften des arithmetischen Mittels vorgestellt und kritisch analysiert. Um die Gleichverteilungseigenschaft des arithmetischen Mittels hervorzuheben, eig- net sich das Modell einer „gerechten Verteilung“, welches den Schülern aus dem Alltag bekannt ist, etwa bei der gerechten Verteilung von Süßigkeiten oder Spielkarten. Untersu- chen die Schüler etwa die Anzahl von Bleistiften, die jeder Schüler bei sich trägt, so lässt sich aus der ungleichen Verteilung eine gerechte Verteilung herstellen, indem man alle Bleistifte zusammenlegt und dann gleichmäßig auf die Schüler verteilt. Das Zusammenle- gen korrespondiert mit der Addition aller Werte und das gleichmäßige Verteilen mit der Division durch die Anzahl der Werte. So erhält man allein durch Handeln und ohne zu rechnen die durchschnittliche Anzahl von Bleistiften, die die Schüler bei sich tragen (vgl. Uccellini, 1996, S. 113). Auch Steckwürfel bzw. Cuisenaire-Stäbe stellen geeignetes Mate- rial dar, um die Gleichverteilungseigenschaft des arithmetischen Mittels zu visualisieren. Will man zum Beispiel den Durchschnitt des Merkmals Familiengröße ermitteln, so stellt zunächst jeder der n Schüler seine Familiengröße durch Steckwürfeltürme entsprechender Höhe dar. Diese werden dann alle zu einem langen Zug zusammengesteckt und dann gleichmäßig in Züge der Länge n geteilt. Die Anzahl der Züge ergibt das arithmetische 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 138 Mittel der Verteilung (vgl. Hollingsworth, 1995, S. 3). Haben 7 Familien beispielsweise die Größen 4, 5, 4, 3, 5, 2, 5, so lässt sich diese Situation mit Steckwürfeln wie in Abbil- dung 7.6 darstellen (vgl. Abb. 7.6). Das Zusammenstecken der Würfel ergibt einen Zug der Länge 28, welcher durch die Anzahl der Daten, also durch 7, geteilt wird. Das arithmeti- sche Mittel beträgt 4, da 4 Türme der Länge 7 entstehen. Abb. 7.6: Die Ermittlung des arithmetischen Mittels mit Hilfe von Steckwürfeln 4 5 4 3 5 2 5 7 7 7 7 (Darstellung wie bei Hollingsworth, 1995, S. 3) Der Einfachheit halber sollte man zunächst mit Beispielen beginnen, in denen das a- rithmetische Mittel eine natürliche Zahl ist. Später, insbesondere in der Klasse 6, können dann auch Bruchzahlen als arithmetisches Mittel einer Verteilung entstehen und diese Bruchzahlen sollten dann auch im Kontext interpretiert werden (vgl. Uccellini, 1996, S. 113-114). So wird deutlich, dass das arithmetische Mittel eine fiktive Zahl ist, zu der es oft keine direkte Entsprechung in der Realität gibt. Der Vorteil dieser Vorgehensweise besteht darin, dass sie direkt auf den Algorithmus zur Berechnung des arithmetischen Mittels führt. Will man diesen einführen, so eignen sich große Datensätze, bei denen eine handelnd aus- geführte Gleichverteilung impraktikabel ist, so dass die Schüler andere Strategien, also den Algorithmus, entwickeln müssen, um das arithmetische Mittel zu bestimmen (vgl. Friel, 1998, S. 213). Aufbauend auf dem konzeptionellen Verständnis zur Gleichverteilungsei- genschaft des arithmetischen Mittels entwickeln die Schüler also prozedurales Wissen, in Form eines Algorithmus. Ein großer Nachteil dieses Modells besteht allerdings darin, dass bei der Umverteilung der originale Datensatz verloren geht und die Schüler so keine Ein- sicht in die statistische Beziehung zwischen dem arithmetischen Mittel und den Daten ge- winnen können, da schlichtweg beide nicht gleichzeitig zu sehen sind (vgl. Russell & Mokros, 1996, S. 362). Das arithmetische Mittel wird dann kaum als Zusammenfassung eines Datensatzes angesehen, sondern allein als Antwort auf eine Divisionsaufgabe. Will man die Ausgleichseigenschaft des arithmetischen Mittels betonen, so bietet sich die Verwendung des Mittelwertabakus an. Dieser soll anhand der Verteilung des 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 139 Merkmals „Anzahl der Streichhölzer pro Schachtel“ erläutert werden. Zunächst bringt der Lehrer Streichholzschachteln mit und lässt die Kinder schätzen, wie viele Streichhölzer diese beinhalten. Zur Überprüfung werden die Anzahlen nachgezählt und die Verteilung der Anzahl der Streichholzschachteln in einem eindimensionalen Streudiagramm darge- stellt. Dies sollte zunächst in einem gegenständlichen Graphen geschehen, bei dem die Anzahl der Streichhölzer auf der jeweiligen Schachtel notiert wird. Ausgehend von der Frage, wieviel Streichhölzer in einer Schachtel wären, wenn alle Hölzer gleichverteilt sind, schlagen die Schüler meist das oben beschriebene Modell des Auskippens und gleichmäßi- gen Verteilens vor oder dass man aus jeder Schachtel so viele Hölzer entfernt, dass in allen Schachteln gleich viele sind und man den Rest gleichmäßig verteilt. Hinter diesen Vor- schlägen steckt also die Idee der Gleichverteilungseigenschaft des arithmetischen Mittels. Der letztere Vorschlag ist aber außerdem nicht weit vom planmäßigen Ausgleichen durch den Mittelwertabakus entfernt. Der Mittelwertabakus ist ein Ausgleichsverfahren, welches aus der wiederholten Ausführung folgender Elementaroperation besteht: Aus einer Schach- tel mit den meisten Hölzern wird ein Streichholz entnommen und in eine der Schachteln mit den wenigsten Hölzern getan. In einem eindimensionalen Streudiagramm, in dem die Anzahl der Streichhölzer geplottet ist, bedeutet dies, dass ein Punkt von rechts außen um eins nach links verschoben wird und gleichzeitig ein Punkt von links außen um eins nach rechts verschoben wird. Dieses Ausgleichsverfahren besteht also in der schrittweisen Ver- änderung der Ausgangsverteilung in Richtung der angestrebten Gleichverteilung. Dabei bleibt die Gesamtanzahl der Hölzer und der Schachteln jedoch gleich. Das Verfahren en- det, wenn nur noch zwei Anzahlen von Streichhölzern existieren oder, falls die Anzahl aller Streichhölzer ein Vielfaches der Anzahl der Schachteln ist, wenn sich in allen Schach- teln die gleiche Anzahl von Streichhölzern befindet. In unserem Beispiel mit 40 Streich- holzschachteln, in denen sich zwischen 35 und 42 Hölzer befinden, erreicht man durch wiederholtes Ausgleichen der Anzahl der Streichhölzer die Endverteilung in Abbildung 7.7 (d). Aus dieser Endverteilung können die Kinder ablesen, dass bei möglichst gleichmäßi- ger Verteilung aller Streichhölzer auf die 40 Schachteln in jeder Schachtel 38 Streichhölzer sind und darüber hinaus sich in 20 Schachteln ein Streichholz mehr befindet (vgl. Spiegel, 1982, S. 9-10; Spiegel, 1985, S. 16-18). 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 140 Abb. 7.7 Bestimmung des arithmetischen Mittels mit Hilfe des Mittelwertabakus (a) (b) Collection 1 35 37 39 41 0 5 co un t Anz_Streichhölzer Circle Icon Collection 1 35 37 39 41 0 5 co un t Anz_Streichhölzer Circle Icon (c) (d) Collection 1 38 39 0 10 20 co un t Anz_Streichhölzer Circle Icon Collection 1 35 37 39 41 0 5 10 co un t Anz_Streichhölzer Circle Icon Man kann aus Abbildung 7.7(d) sogar exakt das arithmetische Mittel ablesen. Es ü- bersteigt die 38 um 40 22 . Der Mittelwert beträgt also 38 40 22 =38,55. Allgemein übersteigt der Mittelwert die unter der linken Säule stehende Zahl um soviel n-tel, wie die Höhe der rechten Säule angibt. Man kann also eine vorgegebene Verteilung so verändern, dass ihr Mittelwert direkt aus der graphischen Darstellung ablesbar ist. Der Mittelwertabakus bietet also die Möglichkeit ohne Rückgriff auf eine formale Definition das arithmetische Mittel 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 141 handlungsorientiert einzuführen und es können selbst Situationen behandelt werden, in denen der Mittelwert keine natürliche Zahl ist. Die enaktive Ebene eignet sich am besten zur Behandlung des Mittelwertabakus, da die Kinder dann gleichzeitig mit beiden Händen den Ausgleich durchführen können. Die ikonischen Ebene, also das Ausstreichen und Zeichnen von Punkten erfordert eine hohe Konzentrationsfähigkeit, da sichergestellt wer- den muss, dass immer paarweise ausgeglichen wird. Gleiches gilt für die Durchführung des Ausgleichsverfahrens mit der Software TinkerPlotsTM mit der Hilfe des „Drag Value Tools“. Nachteile dieses Ausgleichsverfahrens liegen darin, dass dieses nur bei kleinen Datensätzen mit nicht allzu viel verschiedenen Werten sinnvoll einsetzbar ist. Diese be- grenzte Einsatzmöglichkeit des Mittelwertabakus sollte dazu genutzt werden, um Rechen- wege zur Ermittlung des arithmetischen Mittels zu finden (vgl. Spiegel, 1982, S. 9-10; Spiegel, 1985, S. 16-18). Insgesamt ermöglicht der Mittelwertabakus eine integrierte Ver- mittlung zweier wichtiger Eigenschaften des arithmetischen Mittels, da man mit dem Ziel der Gleichverteilung im Wesentlichen die Ausgleichseigenschaft gezielt anwendet, um das arithmetische Mittel zu bestimmen. Um die Schwerpunkteigenschaft des arithmetischen Mittels zu visualisieren, schlägt Cassel (1990, S. 15-16) den Gebrauch einer einfachen Balkenwaage vor, da die Schwer- punkteigenschaft auf dem Hebelgesetz beruht. Die Balkenwaage besteht aus einem 50 cm langen Holzlineal, in das in Abständen von 5 cm Holzstäbchen gesteckt sind und welches auf einem verschiebbaren Drehpunkt aufliegt. Auf die Holzstäbchen können von hohlen Stahlstangen abgesägt Scheiben gesteckt werden. Will man beispielsweise den Mittelwert von 2, 3, 5, 8 und 10 berechnen, so steckt man die 5 Scheiben auf die entsprechenden Stäbchen und verschiebt den Drehpunkt solange, bis der Schwerpunkt gefunden ist. Dieser Schwerpunkt ist gleichzeitig das arithmetische Mittel, welches von der Skala abgelesen werden kann. Durch die Verwendung dieser Apparatur lässt sich zudem leicht erkennen, dass das arithmetische Mittel empfindlich gegenüber Ausreißern ist. Weiterhin nehmen es jüngere Schüler durch das Experimentieren mit dieser Balkenwaage bereitwilliger hin, dass der Schwerpunkt keiner der gegebenen Werte sein muss und auch keine ganze Zahl sein muss, selbst wenn alle Werte ganzzahlig sind. Dieses Modell ist insofern problematisch, dass die Einsicht in die numerische Bezie- hung zwischen dem arithmetischen Mittel und den Daten von dem Verständnis des Hebel- gesetzes abhängt, also der physikalischen Beziehung zwischen Gewicht und Entfernung auf einer Balkenwaage (vgl. Russell & Mokros, 1996, S. 362). Außerdem kann mit einer 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 142 solchen Apparatur nicht jeder Datensatz untersucht werden, da die Daten auf Werte von 1- 10 eingeschränkt sind. Sinnvoll wäre es hier, den Bereich von 0-9 zu wählen, denn dann wird den Schülern klar, warum man die 0 bei der Berechnung des arithmetischen Mittels nicht vernachlässigen darf. Dadurch würden Schüler dann Einsicht in die Schwerpunktei- genschaft als auch in den gesamten abstrakten Aspekt des arithmetischen Mittels gewin- nen. Der repräsentative Aspekt des arithmetischen Mittels bleibt bei dieser Vorgehenswei- se jedoch weitgehend verdeckt. Von dieser physikalischen Darstellung der Schwerpunkteigenschaft des arithmeti- schen Mittels mit einer konkreten Balkenwaage könnte man dann abstrahieren, indem man den Schülern einen Mittelwert vorgibt, zu dem sie eine geeignete Verteilung konstruieren sollen. Friel, Mokros und Russell (1991, S. 39) schlagen vor, im Kontext der Variable „Familiengröße“ die Schülern ausgehend von der Gleichverteilung damit zu beauftragen, eine Verteilung vorgegebenen Umfangs auf enaktiver Ebene mit Steckwürfeln herzustel- len, bei der die durchschnittliche Familiengröße 4 beträgt. Das arithmetische Mittel und der Umfang des Datensatzes werden also vorgegeben und die Schüler sollen dazu passende Verteilungen herstellen. Diese Aufgabenstellung scheint auf den ersten Blick etwas son- derbar, da man üblicherweise zu gegebenen Verteilungen den Mittelwert sucht, aber sie ist nicht etwa realitätsfern, da in den Medien oft nur Mittelwerte als einzige Kennzahlen an- gegeben werden und man sich dann mit Hilfe von Sachwissen passende Verteilungen zu diesem Mittelwert vorstellen muss: “This kind of task is also what statistically literate rea- ders of data do when they see a mean or median; that is, they think about the different distributions that could be represented by this indicator“ (Mokros & Russell, 1995, S. 23). Haben die Schüler erste konkrete Erfahrungen zum Mittelwert durch Operieren mit Steck- würfeln gewonnen, so kann man zu einer ikonischen Darstellung der Verteilung der Fami- liengröße, zum Beispiel in einem eindimensionalen Streudiagramm, übergehen. Außerdem sollte erklärt werden, dass die Summe der Entfernungen (der Abweichungen) von den Da- ten zum arithmetischen Mittel auf der einen Seite so groß ist wie auf der anderen Seite. So wird wieder ausgehend von der Gleichverteilung die Verteilung schrittweise geändert, oh- ne dass sich der Mittelwert verändert. Man fragt dann, wie man die Verteilung ändern muss, wenn eine Familie aus 3 Personen besteht, so dass die Schüler das paarweise Aus- gleichen lernen (vgl. Abb. 7.8 (a)-(c)). Da das paarweise Ausgleichen im Kontext von rea- len Daten auch nicht immer möglich ist, da zum Beispiel keine Familien der Größe 0 exis- tieren, und da dadurch immer symmetrische Datensätze entstehen, sollte auch Gelegenheit gegeben werden, andere Strategien zur Verteilungsveränderung zu entwickeln, die einen 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 143 geforderten Mittelwert hervorbringen. So kann der Lehrer fragen, was mit dem Mittelwert passiert, wenn eine Familie aus 8 Personen besteht (vgl. Abb. 7.8 (d)) und wie man den Mittelwert bei 4 dann beibehalten kann. Die Schüler lernen dadurch, dass der Mittelwert empfindlich gegenüber Ausreißern ist und dass man diesen Ausreißer nach oben durch mehrere, zusätzliche kleine Familien ausgleichen kann (vgl. Abb. 7.8 (e)). Ergänzt man nämlich 2 Familien mit je 2 Personen, so liegt der Schwerpunkt der Verteilung wieder bei 4 (vgl. Friel et al., 1991, S. 39-42). Weiterhin wird den Schülern durch den Einsatz weite- rer Strategien klar, dass eine Verteilung von der nur das arithmetische Mittel bekannt ist, viele unterschiedliche Verteilungsformen haben kann und nicht zwangsläufig symmetrisch sein muss. Abb. 7.8: Finden von Verteilungen zum vorgegebenen arithmetischen Mittel 4 (a) (b) Collection 1 0 2 4 6 8 10 0 5 co un t Familiengrösse Circle Icon Collection 1 0 2 4 6 8 10 0 2 4 6 co un t Familiengrösse Circle Icon (c) (d) Collection 1 0 2 4 6 8 10 0 1 co un t Familiengrösse Circle Icon Collection 1 0 2 4 6 8 10 0 2 co un t Familiengrösse Circle Icon 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 144 (e) Collection 1 0 2 4 6 8 10 0 2 4 co un t Familiengrösse Circle Icon Um deutlich zu machen, dass die Summe der Abweichungen nach oben gleich der Summe der Abweichungen nach unten sein muss, eignen sich Pfeile zur Repräsentation der Residuen (vgl. Abb. 7.9). Abb. 7.9: Repräsentation der Residuen durch Pfeile 1 1 Das oben beschriebene Ausbalancieren der Residuen vom arithmetischen Mittel ist auch dynamisch mit TinkerPlotsTM möglich. Man kann sich das arithmetische Mittel ein- zeichnen lassen und dann mit dem „Drag Value Tool“ ausprobieren, wie man die Daten verändern kann, ohne dabei den Mittelwert zu verändern. Hierzu habe ich Arbeits- und Lernumgebung 7.2 entworfen (siehe Anhang 3 oder beiliegende CD-Rom), durch die man die Schwerpunkteigenschaft des arithmetischen Mittels interaktiv entdecken kann. Mit dieser Vorstellung vom arithmetischen Mittel als Schwerpunkt ist es zudem möglich, diesen in einem vorgegebenen kleinen Datensatz zu schätzen. Die Schätzungen 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 145 können durch Addition der Residuen nach oben und nach unten überprüft werden. Stimmt die Summe der Abweichung nach oben nicht mit der Summe der Abweichungen nach un- ten überein, so sollte man die Schüler fragen, in welche Richtung und wie weit sie das a- rithmetische Mittel verschieben müssen. Die Strategie des Ausbalancierens von Entfernun- gen zum arithmetischen Mittel ist jedoch nur bei kleinen Datensätzen sinnvoll anwendbar. Will man mit größeren Datensätzen arbeiten, so ist es sinnvoll, den Algorithmus einzufüh- ren (vgl. Friel et al., 1991, S. 42-45). Das Schätzen bleibt dennoch wichtig, um den durch den fehleranfälligen Algorithmus berechneten Wert zu überprüfen. Insgesamt bleibt festzuhalten, dass alle Eigenschaften des arithmetischen Mittels erst im Zusammenhang ein vollständiges Begriffsverständnis ermöglichen. Es existiert also keine „unwichtige“ Eigenschaft, auf die man im Unterricht verzichten könnte. Vielmehr greifen alle Eigenschaften ineinander, was teilweise auch in den verschiedenen Modellen zur Einführung des arithmetischen Mittels deutlich wird. Die Eigenschaften dieses Lagepa- rameters sollten im Unterricht zuerst thematisiert werden und im Sinne eines Spiralcurricu- lums wiederholt und vertieft werden, um darauf aufbauend einen Algorithmus zur schnel- len Berechnung zu entwickeln. „Begriffliches Denken steht somit im Rang eindeutig höher als algorithmisches Prozessieren. Algorithmen müssen daher im Unterricht aus Begriffs- entwicklungen hervorgehen“ (Winter, 1983, S. 198). Nur wenn ein konzeptionelles Ver- ständnis dieses Begriffs entwickelt wurde, können auch komplexere Probleme, die zum Beispiel gewichtete Mittelwerte erfordern, gelöst werden. Über Mittelwerte im Allgemeinen sollten die Schüler in Anlehnung an Friel (1998, S. 215-216) Folgendes wissen: Schüler sollten • die Bedeutung/ Eigenschaften der verschiedenen Mittelwerte verstehen. • wissen, wie man die Mittelwerte bestimmt. • in Abhängigkeit von der Verteilung geeignete Mittelwerte zur Zusammenfas- sung auswählen können. • wissen, dass Mittelwerte ein Teil einer Datenanalyse sind und dass man mit ih- rer Hilfe Datensätze vergleichen kann. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 146 • die beschränkte Aussagekraft von Mittelwerten kennen und wissen, dass für ei- ne „umfassende“ Datenanalyse auch die Spannweite, die Verteilungsform, etc. von Bedeutung sind. Insbesondere der vorletzte Punkt ist insofern problematisch, als dass viele Schüler die Repräsentativität der Mittelwerte nicht verstehen und diese somit nicht zum Gruppen- vergleich verwenden. Zugegebenermaßen wurden auch keine Vorschläge gemacht, wie man explizit die repräsentative Eigenschaft von Mittelwerten vermitteln kann, da davon ausgegangen wird, dass sich diese Eigenschaft implizit aus den anderen Eigenschaften und durch den Umgang mit verschiedenen Datensätzen und der Interpretation dieses Lagepa- rameters im Sachkontext ergibt. Im Folgenden wird zunächst der Frage nachgegangen, welche Vorstellungen Schüler überhaupt von dem weit gefassten Begriff des Durchschnitts haben und ob sie diesen als repräsentativ ansehen. Diese Frage soll im nächsten Abschnitt erörtert werden, um festzustellen, ob auf intuitiven Methoden der Schüler aufgebaut wer- den kann, um die repräsentative Eigenschaft des arithmetischen Mittels stärker hervorzu- heben. 7.5 Schülervorstellungen vom Durchschnitt und von Repräsentativität Mokros und Russell (1995, S. 20-24) untersuchen das Verständnis von 21 Viert-, Sechst- und Achtklässlern bezüglich des Durchschnitts12 und dessen repräsentativer Eigen- schaft im Kontext von realen Daten. Es wird dabei untersucht, wie Schüler intuitiv den Durchschnitt als repräsentative Zahl im Sinne eines typischen, mittleren oder durchschnitt- lichen Wertes sinnvoll definieren und ob und inwieweit sie Verbindungen zu konventionel- len Mittelwerten, insbesondere zum arithmetischen Mittel, herstellen. Die getesteten Schü- ler haben keine speziellen Erfahrungen mit realen Daten im Unterricht gemacht, sie verfü- gen lediglich über den Algorithmus zur Berechnung des arithmetischen Mittels. Grundlage dieser Studie sind verschiedene Aufgaben, die sich auf die Konstruktion von Datensätzen zu einem gegebenen arithmetischen Mittel, die Interpretation von durchschnittlichen Wer- ten im Kontext einer bimodalen Verteilung und auf ein Problem mit gewichteten Mittel- werten beziehen. 12 Die Bezeichnung „Durchschnitt“ wird hier informell verwendet um das Typische, Mittlere oder Gewöhnli- che in einem Datensatz zu beschreiben. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 147 Zur Bearbeitung der oben genannten Aufgabentypen nutzen die Schüler 5 verschie- dene Ansätze, die illustrieren, wie Schüler den Begriff des Durchschnitts definieren. Diese Ansätze können in zwei Gruppen eingeteilt wurden: Ansätze, die die Idee der Repräsenta- tivität nutzen und solche, die den Durchschnitt nicht als repräsentativ ansehen. Zunächst werden diejenigen Ansätze der Schüler vorgestellt, die den Durchschnitt nicht als repräsen- tative Zahl verstehen (vgl. Mokros & Russell, 1995, S. 26-32). Durchschnitt als Modalwert Schüler, die diesen Ansatz zur Problemlösung nutzen, verwenden konsequent den Modalwert, um Datensätze mit einem vorgegebenen Durchschnitt zu konstruieren und auch um Datensätze zu interpretieren. Dennoch versuchen sie mit Rückgriff auf ihre Erfah- rungen bezüglich des Sachproblems realistische Verteilungen herzustellen, indem sie auch Werte angeben, die nicht dem Modalwert entsprechen. Sie können aber keine Verteilungen herstellen, bei denen der Durchschnitt selbst nicht als Datenwert vorkommen darf und sie nutzen dann auch keine anderen Strategien zur Problemlösung. Sie interpretieren weiterhin den Modalwert im Sinne von „am meisten“ und erkennen nicht, dass dieser den gesamten Datensatz repräsentieren kann. Den Algorithmus zur Berechnung des arithmetischen Mit- tels wenden sie, wenn überhaupt, oft falsch an. Durchschnitt als Algorithmus Schüler dieser Gruppe sehen im Durchschnitt allein das Ausführen eines in der Schu- le gelernten Algorithmus, welcher oftmals falsch angewendet wird, da sie zum Beispiel die Summe, den Durchschnitt und die Daten verwechseln. Außerdem verfügen diese Schüler nur über begrenzte Strategien zur Überprüfung ihrer Ergebnisse auf Plausibilität, da sie die repräsentative Eigenschaft des arithmetischen Mittels nicht verstehen. Die folgenden drei Ansätze werden von Schülern verwendet, die die Idee der Reprä- sentativität verstehen und diese nutzen um eigene Definitionen vom Durchschnitt zu ent- wickeln. Alle drei Ansätze haben es gemeinsam, dass der Durchschnitt als Werkzeug gese- hen wird, mit dessen Hilfe man die Daten besser verstehen kann. Durchschnitt als vernünftige Zahl Die Schüler wählen den Durchschnitt derart, dass er sowohl vernünftig bezüglich des Sachproblems als auch mathematisch vernünftig erscheint. Sie verwenden dazu neben ih- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 148 rem Erfahrungswissen aus dem Alltag auch mathematisches Wissen zum Beispiel bezüg- lich des Modalwerts oder des arithmetischen Mittels. Falls diese Schüler den Algorithmus zur Berechnung des arithmetischen Mittels verwenden, so prüfen sie, ob das Ergebnis der Rechnung in Einklang mit ihrem Erfahrungswissen bezüglich des Sachproblems steht, also ob ihnen der errechnete Wert auch als vernünftig erscheint, um das reale Problem zu lösen. Allerdings glauben diese Schüler, dass das arithmetische Mittel eines Datensatzes kein exakter Wert ist, sondern eine Approximation darstellt. Durchschnitt als Mittelpunkt Auch die Schüler dieser Gruppe wählen den Durchschnitt ebenfalls derart, dass er sowohl bezüglich des Sachproblems als auch bezüglich der Mathematik sinnvoll erscheint. Die Strategie, die sie dabei anwenden, besteht darin, die Mitte des Datensatzes zu finden, welche entweder als Median oder als Mitte der Spannweite oder als Mitte der in der Gra- phik sichtbaren x-Achse definiert wird. Die Symmetrie von Verteilungen spielt für diese Schüler eine große Rolle. So stellen sie bei Konstruktionsproblemen ausschließlich sym- metrische Verteilungen her und haben große Probleme andere Verteilungsformen zu inter- pretieren. Außerdem glauben die Schüler, dass das arithmetische Mittel und die selbst de- finierte Mitte annähernd übereinstimmen müssen, was allerdings nur im Kontext von symmetrischen Verteilungen der Fall ist, und berechnen dieses daher zur Überprüfung. Insgesamt fehlt dieser Gruppe aber noch eine vertiefte Einsicht in die Beziehung zwischen dem arithmetischen Mittel und den Daten. Durchschnitt als mathematischer Schwerpunkt Die Schüler dieser Gruppe suchen nach einem Balancepunkt, da sie ein erstes Ver- ständnis davon zeigen, dass ein größerer Datenwert durch einen kleineren Datenwert aus- geglichen werden kann. Dabei machen einige jedoch den Fehler, dass sie nicht die Abwei- chungen vom arithmetischen Mittel betrachteten, sondern den Schwerpunkt so wählten, dass die Summe der Datenwerte auf der einen Seite des arithmetischen Mittels genauso groß ist wie die Summe der Datenwerte auf der anderen Seite. Diese fehlerhafte Strategie wird mit „balancing totals“ bezeichnet. Da die Schüler aber versuchen einen Balancepunkt in der Verteilung zu finden, indem sie die Werte aller Daten berücksichtigen, beginnen sie einen Prozess der Definition des arithmetischen Mittels. Sie zeigen ein erstes Verständnis der quantitativen Beziehung zwischen den Daten, der Summe und dem Durchschnitt. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 149 Bei den verschiedenen Ansätzen wird deutlich, dass Schüler, die den Durchschnitt als Modalwert oder als Algorithmus interpretieren, nicht die repräsentative Eigenschaft dieses statistischen Begriffs erkennen, wohingegen die restlichen Schüler sich auf dem Weg zu einer Definition des Durchschnitts befinden. Schüler, die den Durchschnitt als ver- nünftige Zahl ansehen, haben noch keine präzise Definition dieses Begriffs gefunden. Schüler, die den Durchschnitt als Mittelpunkt definieren, haben zwar eine präzisere Defini- tion entwickelt, aber diese erweist sich nur bei symmetrischen Verteilungen als nützlich. Schüler, die den Durchschnitt als Schwerpunkt der Verteilung auffassen, versuchen eine allgemeingültige Definition zu entwickeln, die auf jeden Datensatz anwendbar ist (vgl. Mokros & Russell, 1995, S. 35-37). Es wird also deutlich, dass starke intuitive Ideen bezüglich des Durchschnitts beste- hen, die jedoch nicht immer die Idee der Repräsentativität beinhalten. Folglich sollten Schüler im Unterricht Gelegenheit dazu bekommen, mit verschiedensten Datensätzen zu arbeiten, so dass sie ihre intuitiven Ideen überprüfen und revidieren können und dadurch die Bedeutung des Durchschnitts in einem iterativen Prozess entwickeln können. Außer- dem sollten die Schüler dazu angeregt werden, Datensätze zusammenzufassen oder mitein- ander zu vergleichen, denn erst wenn die Schüler einen Datensatz als Ganzes wahrnehmen und die Idee der Repräsentativität verstehen, sollten spezielle Mittelwerte, wie der Median oder das arithmetische Mittel definiert werden. Mokros und Russell warnen wie bereits erwähnt vor einer verfrühten Einführung des Algorithmus zur Berechnung des arithmeti- schen Mittels, da dies dazu führen kann, dass allein die Berechnung und nicht die Bedeu- tung dieses Begriffs verstanden wird. “Rather than sacrifice understanding, we need to work with children’s intuitive notions and help them develop ways of mapping new, var- ied, and richer concepts onto the ones that they already possess” (Mokros & Russell, 1995, S. 38). 7.6 Die Verwendung von modalen Gruppen als Alternative zu konventionellen La- geparametern Genau wie Mokros und Russell (1995, S. 38) plädieren auch Konold und Higgins (2003, S. 205) für eine Verwendung von informellen Ideen und Methoden bezüglich des Durchschnitts: “Many researchers have emphasized that we should encourage students to use less formal methods …, and that in many situations what students come up with as 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 150 descriptors of average are as good as, or better than, the mean or median in summarizing the data. …Such ideas can provide the bases for later constructing meaningful interpreta- tions of more traditional averages, such as means and medians”. Dass der Modalwert eine starke intuitive Idee der Schüler ist, um die Idee der Mitte zu definieren, wurde bereits mehrfach erwähnt. Neueste Forschungsergebnisse zeigen je- doch, dass Schüler, wenn sie einen Datensatz zusammenfassen sollen, dazu tendieren, nicht eine einzige Kennzahl anzugeben, sondern ein ganzes Intervall, eine modale Gruppe (modal clump) im Zentrum der Verteilung zu wählen, die anzeigt, wo die Mehrheit der Daten liegt. Selbst wenn einzelne Daten verfügbar sind und man theoretisch einen Lagepa- rameter berechnen könnte, bevorzugen die Schüler die modale Gruppe, da sie durch dieses Intervall gleichzeitig die Idee des Zentrums und die Idee der Streuung darstellen können (vgl. Konold et al., 2002, S. 3). Zudem erfüllen die von Schülern gewählten modalen Gruppen beinah alle Kriterien eines für Schüler idealen Mittelwerts, da die modale Gruppe in der Mitte und im dichtesten Bereich des Datensatzes liegt und den Modalwert beinhaltet. Weiterhin ist zu beobachten, dass in den modalen Gruppen mehr Daten liegen als darunter oder darüber. Meistens befinden sich sogar über 50% der Daten im Bereich der modalen Gruppe. Außerdem korrespondieren diese Intervalle sogar häufig mit dem Interquarti- labstand und die Mitte der modalen Gruppe entspricht oft angenähert dem Median (vgl. Konold et al., 2002, S. 5). Kurz gesagt ähneln die von den Schülern gewählten modalen Gruppen also häufig der Box im Boxplot. Wenn Exaktheit nicht erforderlich ist, bieten modale Gruppen gegenüber dem Medi- an oder dem arithmetischen Mittel sogar den Vorteil, dass sie sowohl das Zentrum der Da- ten als auch zu einem gewissen Grad die Streuung der Daten wiedergeben (vgl. Konold et al., 2002, S. 7). Es erscheint also nahe liegend, im Unterricht auf dieser intuitiven Idee der modalen Gruppen einzugehen und ein Fundament für die Zusammenfassung von Datensät- zen zu legen, so dass Schüler darauf aufbauend ein konzeptionelles Verständnis von kon- ventionellen Lageparametern entwickeln können. „By building instruction on what stu- dents already know and do, we believe we can help students develop more robust concep- tual foundations” (Konold et al., 2002, S. 1). Die Frage ist, wie man diesen Ansatz, der von den intuitiven und informellen Methoden der Schüler ausgeht, im Unterricht umsetzen kann. Dazu bietet die Software TinkerPlotsTM geeignete Optionen. Mit TinkerPlotsTM ha- ben die Schüler die Möglichkeit, die modale Gruppe mit Hilfe des „Drawing Tools“ zu kennzeichnen oder sie können mit Hilfe von „Dividern“ den Datensatz in beliebig viele Teile zerlegen und die entstandenen Teilgruppen auszählen lassen (vgl. Konold, 2005, S. 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 151 12). Abbildung 7.10 zeigt eine Möglichkeit zur Dreiteilung von Verteilungen, um so die modalen Gruppen zu identifizieren. Als Basis wird wieder der Datensatz des Ranzenge- wichts von Erst-, Dritt-, Fünft- und Siebtklässlern gewählt (vgl. Abschnitt 6.3). Abb. 7.10: Die Verwendung von „Dividers“ zur Darstellung von modalen Gruppen Backpack One Three Five Seven 0 5 10 15 20 25 30 35 40 0 (0%)12 (71%) 5 (29%) 0 (0%) 19 (90%) 2 (10%) 3 (14%) 14 (64%) 5 (23%) 6 (32%) 11 (58%) 2 (11%) G ra de PackWeight (lb) Circle Icon (Quelle der Daten: Heaviest Backpacks.tp aus TinkerPlotsTM, 2005) Anhand dieser modalen Gruppen könnten die Schüler nun informell die Teilgruppen miteinander vergleichen, indem sie etwa sagen, dass die modale Gruppe der Erstklässler unterhalb der modalen Gruppe der Drittklässler liegt, was bedeutet, dass Erstklässler ten- denziell leichtere Schulranzen tragen als Drittklässler. Bei der Diskussion der Ergebnisse tritt das Problem auf, dass die modalen Gruppen zwar sinnvoll, aber doch mit einer gewissen Willkür von jedem Schüler gewählt werden, da keine einheitliche Definition besteht. Dieses Kommunikationsproblem gibt Anlass dazu, gewisse Konventionen bei der Wahl der modalen Gruppe zu berücksichtigen, um formale- re und damit vergleichbare Methoden zu entwickeln (vgl. Konold et al., 2002, S. 7). Dazu haben die Autoren von TinkerPlotsTM einen neuen Graphiktyp, nämlich den Hat Plot, ent- wickelt, der die Idee einer modalen Gruppe visualisiert. Der Hat Plot kann als Vorläufer des Boxplots angesehen werden, da ebenfalls die Spannweite durch Antennen dargestellt wird und ein mittlerer Bereich durch eine Box visualisiert wird. Wie dieser mittlere Be- reich genau definiert wird, hängt von den Varianten des Hat Plots ab. Es existieren 4 Mög- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 152 lichkeiten, den Hat Plot zu zeichnen: Beim Range Hat Plot wird einfach die Spannweite in drei gleich große Teile zerlegt und über das zentrale Drittel wird die Box der Graphik ge- zeichnet. Diese Variante des Hat Plot ist meistens nur bei symmetrischen Verteilungen sinnvoll. Der Percentile Hat Plot geht von den Perzentilen aus. Wie beim Boxplot wird die Box vom ersten bis zum dritten Quartil gezeichnet, so dass in etwa 50% der Daten inner- halb der Box liegen. Der Percentile Hat Plot unterscheidet sich nur dahingehend vom Box- plot, dass der Median nicht eingezeichnet ist. Der Standard Deviation Hat Plot nutzt die Standardabweichung, um die Ränder der Box zu definieren. Die Ränder weichen jeweils nach oben und nach unten um die Standardabweichung vom arithmetischen Mittel ab. Ent- sprechendes gilt für den Average Deviation Hat Plot, der die mittlere absolute Abweichung vom arithmetischen Mittel verwendet, um die Box zu definieren. Zwar ist von Schülern der Klassen 1-6 nicht zu erwarten, dass sie genau verstehen, wie die einzelnen Hat Plots entstehen, aber sie können damit experimentieren und sich bezüglich des zu untersuchenden Datensatzes eine der Graphiken auswählen, die besonders gut die von ihnen intuitiv gewählte modale Gruppe repräsentiert. So könnte man im obigen Beispiel den Percentile Hat Plot verwenden, da seine Box im Gegensatz zu den anderen Varianten des Hat Plots relativ gut mit den durch die „Divider“ dargestellten modalen Gruppen übereinstimmt (vgl. Abb. 7.11). Abb. 7.11: Der Percentile Hat Plot zur Visualisierung von modalen Gruppen Backpack One Three Five Seven 0 5 10 15 20 25 30 35 40 25-75 Percentile Hat Plot of PackWeight (lb) G ra de PackWeight (lb) Circle Icon (Quelle der Daten: Heaviest Backpacks.tp aus TinkerPlotsTM, 2005) 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 153 Da es bei bestimmten Verteilungen sinnvoll sein kann, einen anderen mittleren Be- reich als die mittleren 50% zu visualisieren, wie es beim Boxplot und beim Percentile Hat Plot der Fall ist, kann man beim Hat Plot an den Kanten der Box ziehen, um eine geeignete modale Gruppe zu erhalten. Dies ist sicherlich legitim, da in allen Darstellungen dieser Art eine gewisse Willkür liegt, die sich nur pragmatisch rechtfertigen lässt (vgl. Biehler & Steinbring, 1991, S. 17). Zeichnen die Schüler weiterhin formale Mittelwerte wie den Median oder das arith- metische Mittel ein, so erkennen sie aber auch, dass diese konventionellen Kennzahlen meist in der modalen Gruppe liegen, die sie intuitiv mit Hilfe von „Dividern“ oder Hat Plots dargestellt haben: “We expect that formal averages, like means and medians, will then eventually make more sense when students see that these are almost always located within what they see as the center clump” (Konold, 2005, S. 12). Die Software Tin- kerPlotsTM bietet also den entscheidenden didaktischen Vorteil, dass man von den intuiti- ven Ideen der Schüler ausgehend formale statistische Methoden einführen kann. Die Schü- ler sehen dann in den formalen Methoden, wie zum Beispiel in den konventionellen Lage- parametern oder später im Boxplot, zumindest einen Teil ihrer Intuitionen bestätigt und haben durch das Arbeiten mit der Software erfahren, dass diese Konventionen notwendig und sinnvoll sind, um Daten so zu beschreiben, dass sie konsistent interpretiert werden können. Problematisch bei allen Mittelwerten oder intuitiven Konstrukten der Schüler, die die Idee der Mitte aufgreifen, ist, dass Schüler diese Kennwerte nur dazu nutzen, um einzelne Datensätze zu beschreiben. Sie verwenden diese Maße nicht, um Gruppen miteinander zu vergleichen, da sie die Mittelwerte und selbst die modalen Gruppen nicht als repräsentative Zusammenfassung der Daten ansehen. “Of course, as with any average, not all students who describe a modal clump are thinking of it as a description of the group as a whole” (Konold & Higgins, 2003, S. 205). Ein Grund liegt darin, dass man im Unterricht oft den „durchschnittlichen“ oder „typischen“ Wert in einem Datensatz sucht und die Schüler da- durch diesen Mittelwert nicht als Charakteristikum des gesamten Datensatzes sehen, son- dern diesen als Charakteristikum eines einzelnen Falls oder bestenfalls einer Teilgruppe in der Verteilung interpretieren (vgl. Konold & Higgins, 2003, S. 206-207). Eine Vorausset- zung zum erfolgreichen Vergleich von Gruppen stellt damit das Wahrnehmen einer Vertei- lung als Ganzes dar, welches jüngeren Schülern eine hohe Abstraktionsfähigkeit abver- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 154 langt. Erst wenn Datensätze als Einheit angesehen werden, kann sich auch ein Verständnis der repräsentativen Eigenschaft von Mittelwerten entwickeln. 7.7 Methoden zum Vergleich zweier Datensätze Da die Schüler Probleme beim Verständnis der repräsentativen Eigenschaft von Mit- telwerten haben, stellt sich die Frage, ob man überhaupt einen Vergleich zweier Datensät- ze, also einen Gruppenvergleich, in den Klassen 1-6 durchführen kann. Schließlich werden Lageparameter wie das arithmetische Mittel oder der Median genutzt, um Gruppenverglei- che in der Statistik und Datenanalyse durchzuführen. Dazu werden im Folgenden alternati- ve Methoden vorgestellt, auf denen aufbauend auch die repräsentative Eigenschaft der konventionellen Mittelwerte entdeckt werden kann. Das Grundproblem bei Gruppenvergleichen ist die Gruppengröße: Unproblematisch ist ein Vergleich, wenn die Gruppen gleich groß sind, denn dann können die Schüler diesen anhand von absoluten Häufigkeiten in bestimmten Intervallen durchführen, was McClain und Cobb (2001, S. 108) mit dem Begriff „addititive reasoning“ umschreiben. Sind jedoch zwei Gruppen unterschiedlicher Größe zu vergleichen, so ist, wenn man von dem Gebrauch von Mittelwerten absieht, ein Vergleich anhand relativer Häufigkeiten in be- stimmten Intervallen erforderlich, was McClain und Cobb (2001, S. 108) mit „multiplicati- ve reasoning“ bezeichnen. Zwar ist eine multiplikative bzw. proportionale Argumentation beim Gruppenvergleich anzustreben, da diese die Basis statistischen Denkens darstellt, aber der Erreichung dieses Ziels sind in den unteren Klassen Grenzen gesetzt, da erst ab der 6. Jahrgangsstufe relative Häufigkeiten zur Verfügung stehen. Dennoch muss man auf interessante Gruppenvergleiche etwa zwischen den Jungen und Mädchen in einer Klasse nicht verzichten, denn es gibt alternative Methoden zur Durchführung eines Gruppenver- gleichs. Zunächst wird jedoch vorgestellt, anhand welcher Kriterien Schüler intuitiv einen Gruppenvergleich durchführen. Watson und Moritz (1999, S. 153) konfrontieren Schüler der Klassen 3, 5, 6, 7 und 9 mit dem Vergleich der Anzahl der richtigen Antworten bei einem Test zweier Schulklas- sen. Die Performanz der beiden Schulklassen ist jeweils in modifizierten Line Plots darge- stellt, der anstatt Kreuze die entsprechenden Zahlen verwendet. Im Teil (d), bei dem die Gruppengrößen ungleich sind, wird ein herkömmlicher Line Plot verwendet (vgl. Abb. 7.12). 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 155 Abb. 7.12: Graphiken aus der Studie von Watson und Moritz (1999) (Darstellung aus: Watson & Moritz, 1999, S. 151) Anhand dieser Graphiken, die die Anzahl der korrekten Antworten in einem Test darstellen, sollen die Schüler entscheiden, welche der Schulklassen bei dem Test besser abgeschnitten hat. Die Schüler verwenden dazu numerische Strategien, visuelle Strategien und eine Mischform aus numerischen und visuellen Strategien. Unter numerischen Strate- gien wird zum Beispiel die getrennte Berechnung der gesamt erreichten richtigen Antwor- ten verstanden, die dann miteinander verglichen werden. Diese additive Argumentation erfordert natürlich eine Übereinstimmung der Gruppengröße, was nicht allen Schülern be- wusst ist, und zeigt zudem, dass die Schüler die Verteilung nicht als Einheit auffassen, sondern als Sammlung einzelner Werte, die dazu da sind, um rechnerisch verarbeitet zu werden. Sind die Gruppengrößen unterschiedlich, so besteht die numerische Strategie dar- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 156 in, die Mittelwerte zu errechnen und miteinander zu vergleichen, was jedoch leider nur wenige Schüler für sinnvoll halten (vgl. Watson & Moritz, 1999, S. 153-164). Unter visu- ellen Strategien versteht man eine Argumentation basierend auf dem optischen Vergleich der beiden graphischen Darstellungen. Jüngere Schüler vergleichen oft nur einzelne As- pekte während ältere Schüler häufig mehrere Aspekte in den Daten nennen und oder an- hand der Verteilungsform eine Entscheidung treffen. Auch bei ungleicher Gruppengröße versuchen die Schüler visuell unter Berücksichtigung der Proportionen zu argumentieren. Eine andere visuelle Strategie besteht darin, den Datensatz zu halbieren und die Dichte und die Streuung der oberen und unteren 50% der Daten in den verschiedenen Gruppen zu ver- gleichen. Die Strategie des Teilens von Datensätzen, um einen statistischen Vergleich bei un- gleicher Gruppengröße durchzuführen, ist meiner Ansicht nach auch in den unteren Klas- sen anwendbar, da die Schüler bereits Vorerfahrungen mit dem Halbieren haben. Zwar könnte man ebenso den Median zum Gruppenvergleich verwenden, da dieser schließlich den Datensatz halbiert, aber ein Vergleich der jeweiligen Hälften zweier Datensätze er- scheint Schülern vermutlich nahe liegender, weil sie dann nicht nur eine einzige Kennzahl vergleichen, die sie zumeist sowieso nicht als charakteristisch für die Verteilung ansehen, sondern die gesamte Verteilung in Betracht ziehen. Zum Halbieren von Datensätzen lassen sich in der Software TinkerPlotsTM die „Dividers“ in Verbindung mit dem Befehl „Case Count“ oder „Percent“ nutzen, welcher die Teilgruppen auszählt bzw. die relativen Häu- figkeiten ermittelt. Hat man den Datensatz halbiert, kann man sowohl die „untere Spann- weite“ als auch die „obere Spannweite“ der beiden Gruppen miteinander vergleichen. Zwar basiert der statistische Vergleich damit nur auf Streuungsmaßen und gegebenenfalls auf informellen Aussagen zur „Dichte“ der Daten, aber die Methode des Halbierens ist dahin- gehend erweiterbar, dass man den Median einführt, denn dies ist schließlich genau der Wert, an welchem der Datensatz geteilt wird. Lenkt man die Aufmerksamkeit der Schüler auf diesen Halbierungswert, so können sie ein Verständnis davon entwickeln, dass dieser repräsentativ für den Datensatz ist und damit auch zum Gruppenvergleich herangezogen werden kann. Diese Vorgehensweise soll anhand eines Beispiels konkretisiert werden: Untersucht man etwa die Frage, ob Mädchen oder Jungen mehr Zeit für ihre Hausaufgaben aufwen- den, so könnten die Schüler die Datensätze mit Hilfe von „Dividern“ halbieren und die Streuung und „Dichte“ der Daten in den jeweiligen Hälften informell miteinander verglei- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 157 chen. So könnten sie zu dem Schluss kommen, dass die Mädchen tendenziell mehr Zeit für ihre Hausaufgaben aufwenden, da die untere Hälfte der Mädchen zwischen 0 und 10 Stun- den pro Woche mit Hausaufgaben verbringen aber die entsprechende Hälfte der Jungen nur zwischen 0 und 6 Stunden pro Woche Hausaufgaben machen. Versteht man unter der „un- teren Streuung“ den Abstand vom Minimum zum Median, den zwar die Schüler formal noch nicht kennen, aber informell bei der Halbierung verwenden, so kann man sagen, dass die „untere Streuung“ der Mädchen um 4 Stunden größer ist als die „untere Streuung“ der Jungen. Sieht man von den beiden männlichen Ausreißern bei 21 und 25 Stunden pro Wo- che ab, so streut auch die obere Hälfte der Mädchen stärker als die der Jungen (vgl. Abb. 7.13). Diese Aussage könnte durch den Vergleich beider Mediane untermauert werden, denn der Median der Mädchen liegt bei 10 Stunden Hausaufgaben pro Woche, wohingegen der Median der Jungen bei nur 6 Stunden pro Woche liegt. Abb. 7.13: Die Methode des Halbierens von Datensätzen zum Gruppenvergleich US Students male female 0 5 10 15 20 25 22 (46%) 26 (54%) 15 (44%) 19 (56%) G en de r HomeWork (hours/week) Circle Icon (Quelle der Daten: Datensatz US Students.tp aus TinkerPlotsTM, 2005) Die Grundidee der von mir vorgeschlagenen Vorgehensweise besteht also darin, dass man zunächst Datensätze ungleicher Gruppengröße nur über die „untere und obere Streu- ung“ vergleicht und damit das Problem der fehlenden Vorstellung von Mittelwerten als repräsentative Werte eines Datensatzes vorerst umgeht. Haben die Schüler diese Strategie 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 158 des Gruppenvergleichs anhand von Streuungsmaßen verstanden, so kann man den Median einführen und seine repräsentative Eigenschaft als Halbierungswert betonen. In Kombina- tion mit dem Vergleich der Mediane dient diese Methode ähnlich wie die der modalen Gruppe (modal clump) dazu, die Idee der Streuung und die Idee des Zentrums gleichzeitig zu betrachten. Diese Vorgehensweise fördert zudem den Übergang von der additiven zur multiplikativen Argumentation beim Gruppenvergleich, welche insbesondere beim Ver- gleich von Gruppen unterschiedlichen Umfangs notwendig ist. Zudem stellt sie zunächst eine Alternative zum Vergleich anhand von Mittelwerten dar, welche vermutlich insbeson- dere von jüngeren Schülern positiv angenommen wird, da diese meist nicht intuitiv die Repräsentativität von Mittelwerten und damit deren Eignung zum Gruppenvergleich er- kennen. Um einen genaueren Vergleich zwischen Jungen und Mädchen durchführen zu kön- nen, kann man den Datensatz auch dritteln oder vierteln. Eine Vierteilung des Datensatzes entspricht dem Arbeiten mit dem Hat Plot oder Boxplot. Insgesamt ist beim Vergleich zweier Datensätze darauf Wert zu legen, dass die Schü- ler verstehen, dass ein Vergleich zweier unterschiedlich großer Gruppen andere Strategien erfordert als ein Vergleich zweier gleich großer Gruppen. Wird also im Unterricht die nu- merische Strategie des Vergleichens von absoluten Häufigkeiten verwendet, so ist explizit darauf hinzuweisen, dass diese Strategie immer eine Übereinstimmung der Gruppengröße erfordert. Außerdem sollte versucht werden, numerische mit visuellen Strategien zu ver- knüpfen, so dass eine Hypothese, aufgestellt durch die eine Strategie, mit der anderen Stra- tegie bekräftigt werden kann. Zwar nutzen bereits einige Schüler gleichzeitig numerische und visuelle Strategien, es fällt ihnen jedoch schwer, diese miteinander in Beziehung zu setzen. Die Strategie des Teilens von Datensätzen mit Hilfe der Software TinkerPlotsTM trägt sicherlich auch zu einer Vernetzung von visuellen mit numerischen Strategien bei, da man zunächst visuell den Datensatz mit „Dividern“ in verschiedenen Teile einteilt und dann die Größe der Teilgruppen auszählen lässt. Die fortgeschrittene numerische Strategie des Vergleichs von Mittelwerten kann wie bereits erwähnt ebenfalls daraus entwickelt werden. Es bleibt festzuhalten, dass die Schüler zwar den Durchschnitt teilweise derart defi- niert haben, dass er auch zum Gruppenvergleich nützlich gewesen wäre (Durchschnitt als vernünftige Zahl, als Mittelpunkt und als mathematischer Schwerpunkt), sie die Idee des 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 159 Durchschnitts oder der Mitte jedoch trotzdem nicht intuitiv verwenden, um zwei Datensät- ze miteinander zu vergleichen. Da ein Vergleich anhand dieser Kennzahlen ohne eine Ein- sicht in deren repräsentative Eigenschaft sinnlos ist, sollten besonders in den unteren Klas- sen alternative Methoden des Gruppenvergleichs zugelassen und kritisch reflektiert wer- den. Eine kritische Diskussion von verschiedenen Strategien zum Gruppenvergleich kann also dazu beitragen, dass Schüler lernen, Charakteristika der gesamten Verteilung zu be- schreiben. Die statistische Problemstellung des Gruppenvergleichs bietet sich also an, um im Unterricht eine Entwicklung von geeigneten Vorstellungen von Repräsentativität anzu- stoßen. 7.8 Interpretation von Datensätzen im inhaltlichen Kontext Eine Gefahr bei der Beschreibung von Datensätzen mit statistischen Begriffen oder mit Alltagsbegriffen besteht darin, dass die Schüler nur noch das Aussehen der graphi- schen Darstellungen beschreiben und dabei vergessen, welche Fragestellung aus der realen Welt sie eigentlich beantworten wollen: “Too often students treat data as numbers only, forgetting that those numbers have a context and that the reason for analyzing them is to learn more about that context” (Konold & Higgins, 2003, S. 211). Dies äußert sich darin, dass Schüler Graphiken derart beschreiben, dass sie ausschließlich angeben, wo etwa die meisten Punkte in der Graphik liegen und diese Beobachtungen nicht weiter interpretieren. Es scheint, als hätten die Schüler vergessen, dass der Punkt in einem Graphen nicht nur ein Punkt oder eine Zahl ist, sondern dass dahinter ein Ereignis bzw. ein Fall aus der realen Welt steckt. Die Schüler sollen also lernen zu verstehen, dass Daten einen Modellcharakter haben, also dass sie reale Ereignisse repräsentieren, aber nicht identisch mit diesen sind. Um die Einsicht in den Modellcharakter von Daten zu fördern, ist es wie bereits in Kapitel 5 erwähnt, sinnvoll, mit Daten zu arbeiten, die selbst gesammelt wurden, da dann eine In- terpretation im Sachkontext leichter fällt (vgl. Kap. 5). Doch wie lässt sich während der Analyse der Daten anhand von Graphiken eine Beziehung zur realen Situation, die die Da- ten repräsentieren, herstellen? Eine technische Lösung der Software TinkerPlotsTM besteht darin, dass man jeden einzelnen Fall anklicken oder ganze Gruppen markieren kann und in der Kollektion identifizieren kann. Gleichzeitig wird dieser Fall bzw. diese Gruppe in allen Graphiken hervorgehoben (vgl. Konold, 2005, S. 12). Diese Funktion der Software ist för- derlich, um die Daten im Sachkontext zu interpretieren. Besonders gut lassen sich so Aus- 7. Begriffe und Methoden zur Beschreibung und Interpretation von Daten 160 reißer inhaltlich interpretieren, da man leicht auch die anderen Merkmale des Ausreißers mit in Betracht ziehen kann. Zwar hilft diese Funktion der Software, die Daten mit der realen Situation in Beziehung zu setzen, aber sie kann Schüler auch davon abhalten, einen Datensatz als Einheit wahrzunehmen und eine Gesamtaussage über diesen zu treffen, da jederzeit die Möglichkeit besteht, individuelle Fälle näher zu betrachten. Es sollte folglich darauf geachtet werden, dass die Schüler versuchen, einen Datensatz als Einheit wahrzu- nehmen und einzelne Fälle nur dann genauer betrachten, wenn sie sich davon interessante Informationen für die Datenanalyse und die Beantwortung der Fragestellung versprechen. Die technische Lösung der Software TinkerPlotsTM allein ist jedoch nicht hinrei- chend, um das Sachproblem und die konkrete Fragestellung nicht aus den Augen zu verlie- ren. Im Unterricht ist darauf zu achten, dass die Schüler dazu ermutigt werden, nicht nur von Punkten in einer Graphik zu sprechen, sondern von dem, was diese Punkte darstellen und bedeuten. 8. Die Beziehung zwischen Stichprobe und Population 161 8. Die Beziehung zwischen Stichprobe und Population Fragestellungen, die man in den Klassen 1-6 untersuchen kann, werden überwiegend durch die Analyse von Daten aus einer Vollerhebung beantwortet, da oft nur kleine Popu- lationen, wie etwa die Schulklasse, von Interesse sind. Rücken Fragestellungen jedoch grö- ßere Populationen ins Zentrum der Aufmerksamkeit, wie etwa die gesamte Schule, so ist eine Vollerhebung praktisch nur unter großem Zeitaufwand durchführbar. In solchen Fäl- len wird in der induktiven Statistik auf die Idee der Stichprobe zurückgegriffen (vgl. Ko- nold & Higgins, 2003, S. 196). In diesem Kapitel werden zunächst intuitive und formale Ideen zur Stichprobenziehung gegenübergestellt, um im Anschluss daran aufzuzeigen, welche Vorstellungen Schüler vom Begriff der Stichprobe besitzen und welche Methoden zur Ziehung von Stichproben sie intuitiv vorschlagen. Dabei wird auch erläutert, inwiefern sie den Umfang der Stichprobe für relevant halten. Abschließend werden Möglichkeiten aufgezeigt, wie man im Unterricht die anspruchsvolle Beziehung zwischen der Stichprobe und der Population thematisieren könnte, damit Schüler lernen, auf informellem Weg mög- lichst repräsentative Stichproben zu ziehen und zudem erkennen, wenn Methoden der Stichprobenziehung zu Verzerrungen führen. 8.1 Intuitive und formale Ideen zur Stichprobenziehung Die entscheidende Idee der Stichprobe liegt darin, Informationen über eine Populati- on zu gewinnen, indem man nur eine Teilmenge dieser Population untersucht (vgl. Moore, 1997, S. 3). Grundvoraussetzung für eine Verallgemeinerung von Schlüssen ist, dass die Stichprobe der Population ähnlich ist. Kurz gesagt: Stichproben müssen repräsentativ sein. Die intuitive Idee der Repräsentativität ist in der Geschichte der Statistik ein relativ „neu- er“ Ansatz. Die Ziehung einer repräsentativen Stichprobe als Alternative zur Totalerhe- bung wurde zuerst 1895 von Kiaer beim Weltkongress der Statistiker in Bern vorgeschla- gen. Kiaer sah die Stichprobe als verkleinertes Abbild der Grundgesamtheit an und wollte durch eine Quotenstichprobe Repräsentativität garantieren. Die Idee der Totalerhebung wurde also zunächst nur abgeschwächt, da man in einer Quotenstichprobe zwar nicht alle Personen, aber zumindest alle Typen von Personen befragt. Trotzdem stieß diese Idee auf Ablehnung, ebenso wie die zwei Jahre später durch ihn vorgeschlagene zufällige Stichpro- benziehung. Aufgrund der Schwierigkeit, die vage Idee der Repräsentativität formal zu 8. Die Beziehung zwischen Stichprobe und Population 162 erfassen, hat es lange gedauert, bis sich die Untersuchung von Teilmengen gegenüber der Totalerhebung durchgesetzt hat (vgl. Borovcnik, 1992, S. 115-117). Zunächst soll kurz darauf eingegangen werden, welche Vorstellungen Menschen mit dem Begriff der „Reprä- sentativität“ intuitiv verbinden und welche Bedeutung sie diesem zuschreiben, bevor ver- schiedene formale Methoden der Stichprobenziehung erläutert werden. Der Begriff der Repräsentativität ist etwa aus dem Ausdruck „Repräsentantenhaus“ abzuleiten, welches das Volk in seiner Gesamtheit vertreten soll und damit genau so zu- sammengesetzt sein sollte wie das Volk. Leitet man hieraus die Bedeutung einer repräsen- tativen Stichprobe ab, so hat man einen Mikrokosmos vor Augen, ein verkleinertes Abbild der Grundgesamtheit, ähnlich wie eine Modelleisenbahn. Eine andere Deutung einer reprä- sentativen Stichprobe bezieht sich direkt auf die Auswahlmethode der Objekte. Bei der Auswahl dürfen keine selektiven Kräfte bestimmte Untergruppen bevor- oder benachteili- gen. Eine Stichprobe wird in dieser Deutung also als repräsentativ angesehen, wenn selek- tive Kräfte fehlen (vgl. Borovcnik, 1992, S. 118-119). Da Stichproben jedoch variieren, ist es schwer, Methoden zu finden, die eine Verall- gemeinerung des Ergebnisses der untersuchten Teilmenge zulassen. Welche formalen Ver- fahren zur Auswahl von repräsentativen Stichproben existieren und greifen diese Verfah- ren die genannten intuitiven Ideen auf? Borovcnik (1992, S. 120-130) unterscheidet drei Methoden zur Stichprobenziehung, wobei die Dritte eine Mischform der beiden Erstge- nannten darstellt: 1. Quotenstichprobe 2. Zufällige Auswahl 3. Geschichtete Zufallsstichprobe Die intuitive Idee eines Mikrokosmos und des Fehlens selektiver Kräfte führt zu der Methode der Quotenstichprobe. Bei diesem Verfahren wird festgesetzt, wie die Stichprobe zusammengesetzt sein soll. Untersucht man etwa die Zielvariable Wahlverhalten, so muss man zunächst diejenigen Merkmale bestimmen, die die Zielvariable beeinflussen. In die- sem Beispiel könnte die soziale Schicht, die Region und die Religionszugehörigkeit das Wahlverhalten beeinflussen. Das Verhältnis dieser Merkmale und deren Kreuzkombinatio- nen innerhalb der Stichprobe müssen mit dem Verhältnis innerhalb der Population überein- stimmen. Unter diesen Voraussetzungen stellt die Stichprobe eine verkleinerte Kopie, ei- nen Mikrokosmos, der Grundgesamtheit dar. Ist die Stichprobe also hinsichtlich der beein- flussenden Merkmale ähnlich, so sollte sie auch hinsichtlich der eigentlichen Frage, also 8. Die Beziehung zwischen Stichprobe und Population 163 der Frage nach dem Wahlverhalten, ähnlich sein. Problematisch sind allerdings die Be- stimmung derjenigen Merkmale, die Einfluss auf die Zielvariable haben, sowie die Be- stimmung der Quoten der Kreuzkombinationen dieser Merkmale. Die Wahl der strukturie- renden Merkmale kann die Zuverlässigkeit der Ergebnisse erheblich beeinflussen und zur Quotenbestimmung benötigt man eine Vielzahl an Informationen über die Population. Ein weiterer Nachteil besteht darin, dass man kein Fehlermaß für die Übertragung von Schätz- werten, also auch kein Konfidenzintervall angeben kann. Die Methode der zufälligen Auswahl vermeidet diese Probleme und ist der Quoten- stichprobe entgegengesetzt. In der zufälligen Auswahl versucht man, jeglichen Einfluss von Informationen über die Personen auszuschalten. Man kann diese Methode am besten durch das Modell der Urnenziehung beschreiben, in der N Kugeln liegen und aus der eine Stichprobe vom Umfang n (n N) gezogen wird. Dabei wird eine bestimmte Wahrschein- lichkeitsverteilung zugrunde gelegt, wie etwa die Binomialverteilung bei der Ziehung mit Zurücklegen, oder die Hypergeometrische Verteilung, wenn man ohne Zurücklegen zieht. Da es unter allen möglichen Stichproben viele gibt, die nahezu repräsentativ sind und we- nige, die extrem sind, ist es bei diesem Verfahren sehr wahrscheinlich, eine repräsentative Stichprobe zu erhalten. Außerdem kann das Risiko, extreme Stichproben zu erhalten, mit Hilfe des ≤ n 1 -Gesetzes in Form von Konfidenzintervallen berechnet werden. Zufälliges Auswählen führt also nicht immer, aber mit hoher Wahrscheinlichkeit zu repräsentativen Stichproben und das Risiko, bestimmte Abweichungen zu überschreiten, kann ermittelt werden. Mit zunehmendem Stichprobenumfang steigt die Reliabilität, mit der die Stich- probe die Population repräsentiert. Dies ist gegenüber der Quotenstichprobe ein Vorteil, da die bewusste Auswahl wegen der unkontrollierbaren Verzerrung auch bei wachsendem Stichprobenumfang nicht repräsentativer wird. Insgesamt betrachtet baut die Zufallsstich- probe jedoch nicht auf intuitiven Ideen auf und ist somit schwieriger zu verstehen als die Idee der Quotenstichprobe. Die geschichtete Zufallsstichprobe stellt eine Mischform der beiden anderen Metho- den dar, die die Vorteile der Zufallsstichprobe mit der Idee der Quoten kombiniert. Wie bei der Quotenstichprobe, werden auf Basis der strukturierenden Merkmale Schichten einge- führt, aus denen dann zufällig gezogen wird. Innerhalb der Schichten hat jedes Element die gleiche Wahrscheinlichkeit gezogen zu werden. Dadurch wird die Streuung der Stichpro- ben verkleinert, so dass die Wahrscheinlichkeit sehr groß ist, eine repräsentative Stichpro- be zu erhalten. 8. Die Beziehung zwischen Stichprobe und Population 164 Es ist also nicht nur die Art der Ziehung sondern auch die Größe der Stichprobe für ein adäquates Generalisieren aus Stichproben von Bedeutung. Größere Stichproben sind mit höherer Wahrscheinlichkeit repräsentativ, aber die Größe des Stichprobenumfangs ist unabhängig von der Größe der Grundgesamtheit. Letzteres ist für Schüler häufig schwer zu verstehen. 8.2 Schülervorstellungen vom Begriff der Stichprobe und von Methoden der Stichprobenziehung Wenn selbst in der Geschichte der Statistik die Durchsetzung der Idee der Stichprobe gegenüber einer Totalerhebung sehr schwierig war, können dann Schüler der unteren Klas- sen diese Idee überhaupt erfassen? Und wenn dies möglich ist, welche Methoden zur Zie- hung von Stichproben sind für Schüler dann nachvollziehbar? Diese Fragen stehen im Mit- telpunkt dieses Abschnitts und sollen mit Bezugnahme auf verschiedene Untersuchungen kritisch diskutiert werden. Einige Schüler weisen die Durchführung einer Stichprobe grundsätzlich ab, da sie den Aufwand von Totalerhebungen drastisch unterschätzen. Andere haben Probleme zu verstehen, wie eine Stichprobe überhaupt nützliche Informationen über die Grundgesamt- heit geben kann (vgl. Jacobs 1999, zitiert nach Konold & Higgins, 2003, S. 196). Schüler, die es ablehnen, von der Stichprobe auf die Population zu schließen, begründen dies damit, dass man nur Aussagen über diejenigen Fälle treffen könne, die man tatsächlich untersucht hat und dass man daher die gesamte Population testen müsse (vgl. Metz, 1999, zitiert nach Konold & Higgins, 2003, S. 196). Die Idee, eine Stichprobenziehung als Alternative zur Totalerhebung zu betrachten, ist Schülern also nicht unbedingt einsichtig und scheint intui- tiv nicht erfassbar zu sein. Selbst wenn eine Stichprobenziehung akzeptiert wird, so entwi- ckeln Schüler laut Konold und Higgins (2003, S. 196) aus pragmatischen Gründen eher Methoden zur Stichprobenziehung, die die Population verzerrt darstellen. Dies ist zum Beispiel der Fall, wenn die Schüler bei einer Umfrage nur ihre Freunde befragen. In den oben angeführten Schülerargumentationen zur Ablehnung der Generalisierung aus Stich- proben zeigt sich, dass diese Schüler die Idee der Repräsentativität noch nicht verstanden haben. Die Idee der Ähnlichkeit zwischen der Stichprobe und der Population ist vermutlich für jüngere Schüler intuitiv schwer zu erfassen. 8. Die Beziehung zwischen Stichprobe und Population 165 Die Ergebnisse einer Studie von Watson und Moritz (2000) hingegen vermitteln ei- nen anderen Eindruck. In dieser Studie (Watson und Moritz 2000, S. 44) wird das Ver- ständnis von 62 Schülern der Klassen 3, 6 und 9 von dem Begriff der Stichprobe und von Methoden zur Ziehung von Stichproben untersucht. Die Studie besteht aus einem schriftli- chen Test und einem Interview, welches einige Wochen nach dem Test durchgeführt wird. Im Folgenden werden nur diejenigen Items der beiden Teile der Studie aufgeführt, welche den Schülern der Klasse 3 und 6 gestellt wurden, da sich die vorliegende Arbeit mit der Entwicklung und Förderung von Datenkompetenz in diesen Klassenstufen beschäftigt. Items des schriftlichen Tests: (Entnommen aus: Watson & Moritz, 2000, S. 51) Um das Begriffsverständnis, welches Schüler von einer Stichprobe haben, zu ermit- teln, werden die Schüler im schriftlichen Test zunächst befragt, was sie erhalten, wenn sie eine Stichprobe (sample) bekommen. In der zweiten Frage sollen die Schüler einen Zei- tungsartikel kritisch bewerten und erkennen, dass man nicht aus jeder Stichprobe Aussagen über die Population ableiten kann. 8. Die Beziehung zwischen Stichprobe und Population 166 Items des Interviews: (Entnommen aus: Watson & Moritz, 2000, S. 52) Im Interview werden die Schüler zu Beginn befragt, was sie allgemein und im Kon- text einer Untersuchung des Gewichts von Fünftklässlern unter dem Ausdruck Stichprobe (sample) verstehen. Weiterhin wird in diesem Kontext nach Gründen für die Wahl einer Stichprobe gegenüber einer Totalerhebung gefragt. Außerdem werden die Schüler dazu ermutigt, Überlegungen bezüglich der Stichprobengröße und der Methode der Stichpro- benziehung anzustellen. Durch Aufgabe 3 des Interviews soll ermittelt werden, ob Schüler intuitiv das empirische Gesetz der großen Zahlen verstehen (vgl. Watson & Moritz, 2000, S. 51-52). Bezüglich der beiden Teile der Studie ergeben sich folgende Ergebnisse: Besonders bei der zweiten Frage des Interviews zeigt sich, dass alle Drittklässler einen sehr kleinen und damit unangemessenen Stichprobenumfang von weniger als 15 Personen akzeptieren, während ältere Schüler dazu tendieren, größere Stichprobenumfänge für verlässlicher zu halten. Viele Drittklässler haben jedoch ein grundlegendes Verständnis einer Stichprobe, was sich darin äußert, dass sie diese als einen kleinen Teil, einen Versuch oder einen Test 8. Die Beziehung zwischen Stichprobe und Population 167 beschreiben (Aufgabe 1(a)). Viele nannten eigene Beispiele des Begriffs „sample“, darun- ter Probierpäckchen von Lebensmitteln, da der englische Ausdruck „sample“ auch Probe oder Muster bedeutet und damit nicht gleichbedeutend mit dem mathematischen Fachbeg- riff ist. Ob deutschsprachige Schüler ähnliche Alltagsbezüge zum Begriff der Stichprobe herstellen, bleibt zu bezweifeln. Aus dem Verständnis der Drittklässler heraus ist damit das entscheidende Charakteristikum einer Stichprobe, dass diese klein ist. Falls die Drittkläss- ler Vorschläge machen, wie man Stichproben ziehen könnte, so spiegeln sich darin erste Ideen einer geschichteten oder einer zufälligen Auswahl wieder, die jedoch in keiner Wei- se, auch nicht mit dem Argument der Repräsentativität, gerechtfertigt werden. Auch wird eine absichtliche, systematische Auswahl von Fällen vorgeschlagen, um entweder sicher- zustellen, dass alle Typen vertreten sind oder um sicherzustellen, dass allein durchschnitt- liche Werte in der Stichprobe auftauchen. (vgl. Watson & Moritz, 2000, S. 52-59). Schüler der Klasse 6 erkennen zunehmend die Notwendigkeit eines geeigneten Stich- probenumfangs, aber sie erkennen im Kontext der Aufgabe Q2 des schriftlichen Tests sel- ten unangemessenes Generalisieren aus Stichproben. Auch Jacobs (1999, zitiert nach Ko- nold & Higgins, 2003, S. 196) bestätigt, dass es Schülern besonders schwer fällt, unange- messene Methoden der Stichprobenziehung zu identifizieren, was jedoch gerade für einen kritischen Umgang mit statistischen Aussagen in den Medien erforderlich ist. Dennoch geben sie im Aufgabenteil 1(b) im Interview angemessene Methoden zur Ziehung von Stichproben zur Verteilung des Gewichts bei Fünftklässlern an, darunter eine geschichtete Zufallsstichprobe und eine zufällige Auswahl, und können dies auch logisch begründen. Einige Schüler sehen weiterhin das Ziel einer Stichprobe in der Ermittlung eines durch- schnittlichen Wertes, andere sehen es bereits darin, in angemessener Weise die Population zu repräsentieren (vgl. Watson & Moritz, 2000, S. 59-62). Allerdings zeigen einige Sechstklässler auch die typische Fehlvorstellung, dass das Verhältnis zwischen Stichpro- benumfang und Größe der Grundgesamtheit von Bedeutung für die Repräsentativität ist. Einige Schüler nehmen fälschlicherweise an, dass der Stichprobenumfang umso größer sein muss, je größer die Population ist. Aufgabe 3 des Interviews war jedoch sowohl für Drittklässler als auch für Sechst- klässler schwierig. Selbst Schüler, die den Einfluss des Stichprobenumfangs auf die Reprä- sentativität im Kontext der Aufgabe 2 (b) erkennen, hielten meist beide Stichproben für gleichwahrscheinlich und erkannten nicht, dass nach dem Gesetz der großen Zahlen kleine Stichproben mit größerer Wahrscheinlichkeit extrem ausfallen können. 8. Die Beziehung zwischen Stichprobe und Population 168 Im Gegensatz zu den eingangs aufgeführten Problemen, die Schüler mit der Idee der Stichprobenziehung und ihrer Repräsentativität haben, suggeriert die Studie von Watson und Moritz, dass das Begriffsverständnis der Stichprobe einhergeht mit der allgemeinen kognitiven Weiterentwicklung und dass Schüler im Laufe der Zeit den Begriff der Stich- probe präzisieren. Sobald Schüler in der Lage seien, die Variation der Daten innerhalb der Population anzuerkennen, versuchten sie auch, diese repräsentativ in einer Stichprobe ab- zubilden, indem sie zunächst eine gezielte, zumeist geschichtete Auswahl vorschlagen und später die Idee der zufälligen Auswahl entwickeln (vgl. Watson & Moritz, 2000, S. 63). Es bleibt jedoch zu bezweifeln, dass Schüler von sich aus auf die Idee einer zufälligen Aus- wahl kommen. Auch eine Begründung, warum Zufallsstichproben in angemessener Weise die Population repräsentieren können, entsteht sicherlich nicht durch die allgemeine kogni- tive Weiterentwicklung, sondern kann nur durch gezielte Instruktion angeregt werden. Die Geschichte der Statistik hat bereits gezeigt, dass die Idee der zufälligen Auswahl nicht in- tuitiv begründbar ist, im Gegensatz zu der Quotenstichprobe, die einige Schüler auch in Ansätzen vorschlagen. Dies wird auch durch eine Untersuchung von Schwartz, Goldman, Vye und Barron (1998, S. 233) bestätigt, die darauf hinweisen, dass der Kontext eines statistischen Prob- lems Einfluss auf die Vorstellung von einer Stichprobe ausübt. Bei ihrer Arbeit mit Fünft- und Sechstklässlern wird außerdem deutlich, dass Probleme mit der Inferenzstatistik darauf zurückzuführen sind, dass Schüler Schwierigkeiten haben, zwischen zufälligen und kausa- len Beziehungen zu unterscheiden. So kann zum Beispiel das Verständnis der Beziehung zwischen einer Stichprobe und der Grundgesamtheit im Kontext von Zufallsexperimenten von Schülern nicht unbedingt auf alltagsnähere Stichprobenziehungen, wie zum Beispiel das Durchführen einer Umfrage, übertragen werden. Aus psychologischer Perspektive be- steht nämlich bei Meinungsumfragen eine potentielle Beziehung zwischen den Charakte- ristika einer Person und ihrer Meinung. In einem Zufallsexperiment, etwa bei einer Urnen- ziehung, besteht hingegen keine Beziehung zwischen der Urne und ihrer Farbe (vgl. Schwartz et al., 1998, S. 238-241). So kommt es, dass im Kontext einer Meinungsumfrage die Schüler geschichtete Stichprobenziehungen zufälligen Ziehungen vorziehen, da sie nach ihrer Überzeugung auf diese Weise sicherstellen, dass jeder Meinungstyp mit einge- schlossen wird. Die Schüler glauben, dass eine rein zufällige Auswahl zu einer nicht- repräsentativen Stichprobe führen könnte. Sie erkennen nicht, dass dies zwar möglich, aber sehr unwahrscheinlich ist. Dabei verkennen sie bei geschichteten Stichprobenziehungen die Schwierigkeit, alle Charakteristika der Population zu identifizieren, welche die zu er- 8. Die Beziehung zwischen Stichprobe und Population 169 hebende Meinung beeinflussen könnten, darunter Alter, Bildungsgrad, etc.: “They had not realized that one takes a random sample precisely because one cannot identify and stratify all the population traits that might covary with different opinions” (Schwartz et al., 1998, S. 257). Es verlangt von Schülern eine sehr hohe Abstraktionsfähigkeit zu erkennen, dass man die Verteilung der Meinungen durch eine Zufallsstichprobe unabhängig davon erhe- ben kann, wer diese Meinungen vertritt. Es fällt ihnen also schwer, den Aspekt der Perso- nen auszublenden und sich vorzustellen, dass man direkt Meinungen zufällig erheben kann. Insgesamt zeigt sich also, dass die Zufallsstichprobe im Gegensatz zur Quotenstich- probe auf keiner Intuition aufbaut und daher sehr schwer für Schüler zu verstehen ist. Wie kann man im Unterricht der unteren Klassen eine Einsicht in die Beziehung zwischen Stichprobe und Population fördern und inwieweit können jüngere Schüler die Idee einer repräsentativen Stichprobenziehung, insbesondere durch eine zufällige Auswahl, nachvoll- ziehen? Dieser Frage wird im nächsten Abschnitt nachgegangen. 8.3 Didaktische Möglichkeiten zur Förderung der Einsicht in die Beziehung zwi- schen Stichprobe und Population Eine erste informelle Annäherung an die Beziehung zwischen Stichprobe und Popu- lation kann in offenen Gesprächen über statistische Vergleiche erfolgen. So können die Kinder begründete Hypothesen aufstellen, inwiefern die Verteilung eines bestimmten Merkmals in der Parallelklasse der Verteilung der eigenen Klasse ähnelt. Derartige Diskus- sionen bieten die erste Gelegenheit, über Repräsentativität nachzudenken und sind folglich Vorläufer des Verstehens von Schlussfolgerungen aus einer Stichprobe (vgl. NCTM, 2001, S. 18). Corwin und Friel (1990, S. 17) schlagen zur Sensibilisierung zunächst Unterrichts- ideen vor, bei denen die Schüler die Möglichkeit haben, die gezogene Stichprobe mit der Population direkt zu vergleichen. Dies ist zwar untypisch, demonstriert aber die Methode der Stichprobenziehung und den Schülern wird dadurch klar, dass Stichproben die Popula- tion repräsentieren müssen und dass die Repräsentativität durch verschiedene Faktoren, wie Umfang und Erhebungsmethode der Stichprobe, beeinflusst wird. So wird zur Einführung in das Ziehen von Stichproben vorgeschlagen, kleine Schü- lergruppen als Stichprobe der Klasse anzusehen, nachdem der Ausdruck „Stichprobe“ zu- 8. Die Beziehung zwischen Stichprobe und Population 170 nächst erläutert wurde. Untersucht man zum Beispiel die Anzahl der Rechtshänder in einer Klasse, so kann der Lehrer eine Stichprobe von 4 Personen ziehen. Die Anzahl der Rechts- händer kann durch die Schüler ermittelt werden, um anschließend auf den Anteil der Rechtshänder in der Population, also in der gesamten Klasse, zu schließen. Die gezogene Schlussfolgerung wird dann anhand der realen Daten der gesamten Klasse evaluiert. So tritt die Frage auf, was eine „gute“ Stichprobe ist und die erforderliche Ähnlichkeit zwi- schen der Stichprobe und der Grundgesamtheit kann von den Schülern erkannt werden. Auch die die Repräsentativität beeinflussenden Faktoren, wie Größe und Auswahlmethode der Stichprobe, werden den Schülern bewusst, wenn sie mit verschiedenen Stichproben- größen und Auswahlmethoden arbeiten und die Ergebnisse wiederum mit der Population direkt vergleichen können. Dabei sollte man jedoch darauf achten, dass die Schüler erken- nen, dass eine Stichprobe die Population immer nur annähern kann und dass keine „richti- ge“ oder „falsche“ Stichprobe existiert (vgl. Corwin & Friel, 1990, S. 13-20). In einem zweiten Schritt sollen die Schüler die gesamte Klasse als Stichprobe der Population aller Schulkinder in ihrem Land ansehen und die in der Klasse gesammelten Daten werden mit einer offiziellen Statistik verglichen. Dadurch erlernen die Schüler Flexibilität im Umgang mit den Begriffen der Stichprobe und der Population. Außerdem können Faktoren entlarvt werden, welche möglicherweise Nicht-Repräsentativität begünstigen, so dass Schüler Me- thoden der Stichprobenziehung kritisch zu bewerten lernen (vgl. Corwin & Friel, 1990, S. 21-22). Eine andere Idee besteht darin, die Farbverteilung von 400 zweifarbigen Plastikchips über eine Stichprobenziehung zu ermitteln. Auch hier können die Schüler Stichproben ver- schiedenen Umfangs ziehen und miteinander vergleichen, sowie mit verschiedenen Me- thoden der Stichprobenziehung experimentieren, um so angemessene Schlussfolgerungen für die Farbverteilung der Population zu ziehen. In diesem Zusammenhang bietet es sich an, die Farbverteilung der Stichprobe in Säulendiagrammen zu visualisieren, damit die Schüler in der Form der Verteilung der Stichprobe die Proportionen graphisch erkennen und abschätzen können, ob die Population eine ähnliche Farbverteilung besitzt. Genaues Hochrechnen ist nicht erforderlich, da schließlich jede Stichprobe nur die Population annä- hern kann. Eröffnet der Lehrer im Nachhinein die reale Farbverteilung der Plastikchips, so können die verschiedenen Stichproben bewertet werden (vgl. Corwin & Friel, 1990, S. 37- 43). Einen Anlass, die Repräsentativität von Stichproben zu bewerten, kann man dadurch schaffen, dass man die Schüler mit einer viel zu kleinen Stichprobe einer großen Populati- 8. Die Beziehung zwischen Stichprobe und Population 171 on, etwa im Kontext eines Datensatzes über 24 Hauskatzen, konfrontiert. Können 24 Kat- zen aus der Umgebung die Population aller Hauskatzen angemessen repräsentieren? Si- cherlich nicht, da die Stichprobe zu klein und zudem verzerrt ist. Dennoch kann nach Mög- lichkeiten gesucht werden, die Stichprobe zu optimieren. Dazu können die Schüler zu- nächst mehr Daten sammeln und diese zweite Stichprobe mit der ersten vergleichen und anschließend zusammenfassen. Sie erkennen, dass miteinander kombinierte Stichproben zwar ein besseres Bild über die Population geben können, aber insgesamt die Stichprobe immer noch nicht-repräsentativ ist, da nur Katzen aus der näheren Umgebung eingeschlos- sen wurden (vgl. Corwin & Friel, 1990, S. 47-56). Haben die Schüler die Idee der Stichprobe verstanden, können sie im Kontext von komplexeren Fragestellungen oder Projekten Pläne zur Ziehung von Stichproben entwi- ckeln und diese durchführen, um auf die Population zu schließen. So wird die Planungs- phase einer Datenanalyse hervorgehoben, welche entscheidenden Einfluss auf die Ergeb- nisse ausübt. Mirwald und Nitsch (2001, S. 21-22) schlagen zur Thematisierung der Idee der Stichprobe sowie des Begriffs „Durchschnitt“ in der Jahrgangsstufe 4 eine Vernetzung von Geometrie und Arithmetik vor, bei der fundamentale mathematische Tätigkeiten wie Schätzen, Messen, Zählen und Rechnen im Vordergrund stehen. Am Beispiel der Frage „Wie viele Gänseblümchen stehen auf einer Sommerwiese?“ sollen die Schüler zunächst eigene Vorschläge machen, wie man diese Anzahl bestimmen kann. Zumeist schlagen sie die exakteste Methode vor, nämlich die Blumen zu pflücken und zu zählen. Will man je- doch die Wiese nicht zerstören, so bleibt die Möglichkeit zur ungefähren Bestimmung der Anzahl der Gänseblümchen durch eine Stichprobe. Die Schüler stellen zunächst in Grup- penarbeit einen Stichprobenrahmen mit dem Flächeninhalt von einem Quadratmeter her, welches die Fähigkeit zum Messen voraussetzt. Danach schätzen sie die Größe der Wiese in „Meterquadrat“, die Anzahl der Gänseblümchen pro „Meterquadrat“ und die Anzahl aller Gänseblümchen auf der Wiese. Nun wird eine erste Stichprobe durchgeführt, indem die Schüler ihren Stichprobenrahmen auf eine beliebige Stelle legen und die Gänseblüm- chen im Rahmen abzählen. Dieses Verfahren wird mehrmals wiederholt und anschließend wird das arithmetische Mittel der Anzahl der Gänseblümchen pro „Meterquadrat“ ermit- telt. Nun bestimmen die Schüler den Flächeninhalt der Wiese, indem sie diese mit „Meter- quadraten“ auslegen. Das Prinzip der Flächenmessung durch Auslegen mit Einheitsquadra- ten wird damit betont. Durch Multiplikation mit der durchschnittlichen Anzahl der Gänse- blümchen pro „Meterquadrat“ erhält man einen Näherungswert für die Anzahl der Gänse- 8. Die Beziehung zwischen Stichprobe und Population 172 blümchen auf der gesamten Wiese. Da in Kleingruppen gearbeitet wird, können nicht nur die Schätzwerte mit den „tatsächlichen“ Ergebnissen verglichen werden, sondern auch die unterschiedlichen Ergebnisse der Gruppen diskutiert werden. Die Ergebnisse der verschie- denen Gruppen können auch in einem Säulendiagramm graphisch dargestellt werden, da- mit sich die Frage stellt, wie die abweichenden Werte zustande gekommen sind (vgl. Mir- wald & Nitsch, 2001, S. 21-22). Bei dieser Diskussion erkennen die Schüler, dass Stich- proben variieren können und dass sie die Population, also in diesem Fall die Anzahl aller Gänseblümchen auf der Wiese, immer nur annähern können. Vielleicht können auch Me- thoden der Stichprobenziehung entlarvt werden, die nicht geeignet scheinen. Es könnte etwa sein, dass eine Gruppe den Stichprobenrahmen immer dort platzierte, wo die wenigs- ten Blumen wachsen, damit sie nicht zu viel zählen müssen. In diesem Fall könnte bespro- chen werden, dass die Stichprobe der Population ähneln muss, wenn man aus ihr generali- sieren möchte. Außerdem könnte man sich fragen, ob es genauer ist, wenn man versucht gezielt eine repräsentative Teilfläche der Wiese als Stichprobe auszuwählen und damit auf die Bildung des arithmetischen Mittels verzichtet. So könnte den Schülern klar werden, dass sowohl das arithmetische Mittel als auch eine „gute“ Stichprobe eine repräsentative Eigenschaft besitzen. Zwar hat die zuletzt beschriebene Vorgehensweise insgesamt betrachtet geringeren Bezug zur Datenanalyse als die Vorschläge von Corwin und Friel, da Fähigkeiten aus dem Bereich der Geometrie und Arithmetik im Vordergrund stehen, aber es wird trotzdem An- lass gegeben, sich mit Grundbegriffen der Inferenzstatistik auseinanderzusetzen und den Begriff des arithmetischen Mittels hinsichtlich seiner repräsentativen Eigenschaft zu ver- tiefen. So erleben die Schüler direkt die Notwendigkeit der Repräsentativität im Kontext der Durchführung einer Stichprobe. In den aufgeführten Unterrichtsideen wird nicht deutlich, ob die Schüler von sich aus die Idee der Stichprobe einbringen, oder ob diese durch den Lehrer explizit eingeführt werden muss. Sobald Schüler jedoch überhaupt die Idee der Stichprobe akzeptieren, sollten sie Kriterien dafür entwickeln, wie eine „gute“ Stichprobe aussehen sollte. In diesem Zu- sammenhang können die Schüler dann auf die Eigenschaft der Ähnlichkeit zur Population kommen. Die zentrale Eigenschaft der Repräsentativität kann den Schülern auch durch das Bild einer Modelleisenbahn näher gebracht werden, da eine Modelleisenbahn maßstabsge- treu eine echte Eisenbahn darstellt. Die Schüler sollten dann überlegen, wie man eine größtmögliche Ähnlichkeit der Stichprobe zur Population herstellen kann und könnten auf 8. Die Beziehung zwischen Stichprobe und Population 173 die Idee der gezielten Auswahl aus Schichten kommen. Die Zufallsstichprobe müsste je- doch meines Erachtens nach vom Lehrer direkt zur Diskussion gestellt werden. Eine Be- gründung, warum Zufallsstichproben mit hoher Wahrscheinlichkeit Repräsentativität er- zeugen, ist in den unteren Klassen nicht möglich. Dieses „Phänomen“ kann allerdings im Kontext von verschiedenen Experimenten entdeckt werden, was allerdings sehr zeitauf- wändig ist. Insgesamt bleibt also festzuhalten, dass Schüler mit verschiedenen Auswahlme- thoden und Stichprobenumfängen experimentieren sollten, damit sie schrittweise eine Vor- stellung von der Idee der Repräsentativität entwickeln können. Unabhängig davon, wel- chen Zugang man zum Ziehen von Stichproben wählt, ist den Schülern bewusst zu ma- chen, dass jede Vorhersage basierend auf einer Stichprobe mit Unsicherheit behaftet ist. Jede Vorhersage stellt nur ein Wahrscheinlichkeitsurteil dar, auch wenn die Stichprobe unter Berücksichtigung aller beeinflussenden Faktoren adäquat gezogen wird. Insgesamt betrachtet ist die abstrakte Beziehung zwischen einer Stichprobe und der Grundgesamtheit schwierig für Schüler zu verstehen und eine gezielte Einführung sollte daher keinesfalls überstürzt werden. Haben die Schüler breite Vorerfahrungen mit dem Prozess der Datenanalyse gemacht, so kann etwa ab der 5. Jahrgangsstufe die Idee der Stichprobenziehung aufgegriffen werden. Da die Inferenzstatistik eine Schnittstelle zwischen Datenanalyse und Wahrschein- lichkeitsrechnung darstellt, sollte bzw. muss, will man die Methode der Zufallsstichprobe thematisieren, im Unterricht auch ein Bezug zum Begriff der Wahrscheinlichkeit herge- stellt werden. Die Relevanz von „Daten und Zufall“ wird nicht zuletzt durch die neuen Bildungsstandards für die verschiedenen Schulstufen hervorgehoben, in denen diese beiden Begriffe als eine mathematische Leitidee identifiziert werden. So kann man im Unterricht eine Stichprobenziehung auch aus wahrscheinlichkeitstheoretischer Sicht analysieren, in- dem man etwa eine Stichprobenziehung mit oder ohne Zurücklegen anhand eines konkre- ten Urnenmodells durchführt. In höheren Klassenstufen kann auch die Software Tin- kerPlotsTM zur Simulation genutzt werden, da eine Computersimulation für jüngere Schü- ler schwierig durchzuführen ist, da sie bestimmte Formeln verwenden müssten und zu- nächst verstehen lernen sollten, was diese Formeln bedeuten und was bei der Simulation konkret passiert. Bei dem konkreten Urnenmodell können Wahrscheinlichkeiten zunächst intuitiv erfasst und experimentell bestimmt werden. Zudem sammeln die Schüler durch eine Veränderung des Stichprobenumfangs erste Erfahrungen mit dem Empirischen Gesetz der großen Zahl. Dies ist nur ein Beispiel für die vielfältigen Vernetzungsmöglichkeiten zwischen Statistik/ Datenanalyse und Wahrscheinlichkeitsrechnung im Unterricht der 8. Die Beziehung zwischen Stichprobe und Population 174 Klassen 1-6. Im Rahmen dieser Arbeit kann und soll jedoch nicht näher darauf eingegan- gen werden, da eine Intention darin besteht, zu verdeutlichen, dass der Bereich der Daten- analyse für sich in den unteren Klassen bereits einen Eigenwert hat. 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 175 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 In diesem Kapitel soll untersucht werden, welche Unterrichtsmaterialien zur Daten- analyse in den Klassen 1-6 bereits existieren und ob diese dazu dienen können, die in Kapi- tel 3 definierte Datenkompetenz zu fördern. Dazu werden zunächst Bewertungskriterien entwickelt, um anschließend die mir bekannten Unterrichtsmaterialien kritisch einordnen und bewerten zu können. Interessierten Lehrkräften soll dieses Kapitel eine Orientierung geben, in welche Materialien eine Einsicht lohnenswert ist. 9.1 Entwicklung von Bewertungskriterien für Unterrichtsmaterialien Da die Förderung von Datenkompetenz kein oder nur ein sehr geringer Bestandteil der Ausbildung der zurzeit in Deutschland unterrichtenden Lehrkräfte war, sind diese be- sonders auf bereits existierende Unterrichtsmaterialien angewiesen, wenn sie ihre Schüler im Umgang mit Daten unterrichten. Will man diese Materialien jedoch reflektiert einset- zen, so bedürfen diese einer kritischen Analyse und gegebenenfalls einer Überarbeitung unter anderem zur Anpassung an die Bedürfnisse der spezifischen Lerngruppe. Im Folgen- den werden Dimensionen genannt, welche bei einer kritischen Lehrmaterialanalyse be- rücksichtigt werden sollten. Bewertungskriterien für Unterrichtsmaterialien zur Datenanalyse: 1. Aufbau der Unterrichtsmaterialien: • Werden die Lernziele klar definiert? • Wird das Vorwissen der Schüler angeführt? • Wird das benötigte Material angeführt? • Wird der Unterrichtsverlauf ausführlich dargestellt? • Werden Erfahrungen mit der Unterrichtseinheit, etwa in Form von auftretenden Problemen oder Schülerdokumenten, geschildert? 2. Begründung der Unterrichtsvorschläge: • Wird das didaktische und methodische Vorgehen logisch begründet? 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 176 • Werden Hinweise zur Differenzierung gegeben? • Wird der mathematische Hintergrund erläutert? • Werden inner- und außermathematische Bezüge hergestellt? 3. Förderung von Datenkompetenz: • Wird Datenkompetenz im umfassenden Sinn (vgl. Kap. 3) systematisch gefördert? • Wird das Thema in einem Problemlösekontext eingebettet, so dass exploratives Ar- beiten ermöglicht wird? • Werden möglichst alle Phasen einer Datenanalyse durchlaufen? Diese Kriterien sind bewusst relativ allgemein gehalten, da sie zur Bewertung ganzer Materialbände genutzt werden sollen. Will man einzelne Unterrichtssequenzen, etwa zur Einführung eines Mittelwertes, bewerten, so benötigt man spezielle Bewertungskriterien, welche in den Kapiteln 5-8 implizit herausgearbeitet worden sind. 9.2 Übersicht und Bewertung von Unterrichtsmaterialien Die mir bekannten Materialien lassen sich in zwei Kategorien einteilen: Auf der ei- nen Seite existieren Themenhefte, die den Umgang mit Daten in den unteren Klassen ex- emplarisch beleuchten und auf der anderen Seite existieren ganze Materialbände, die eine systematische Förderung von Datenkompetenz zum Ziel haben. Diese Materialien werden im Folgenden kurz vorgestellt und anhand der oben aufgestellten Kriterien bewertet. Die Grundschulzeitschrift „Mit Daten umgehen“ (Bönig & Ruwisch, 2004) heraus- gegeben von Bönig und Ruwisch im März 2004 stellt ein solches Themenheft zur Daten- analyse in den unteren Klassen dar. In einem einleitenden Artikel wird zunächst Daten- kompetenz definiert und deren Förderung im Unterricht begründet. Danach folgen 5 Arti- kel verschiedener Autoren, welche unterschiedliche Aspekte von Datenkompetenz in den Mittelpunkt stellen. Die Gewinnung von Daten durch Zufallsexperimente und das Ab- schätzen von Wahrscheinlichkeiten werden etwa in einem Artikel vorgeschlagen. Ein an- derer Artikel beschreibt, wie man in einem Projekt zur Umgestaltung der Klassenbücherei Datenkompetenz fördern kann. Der überwiegende Teil der vorgeschlagenen Unterrichts- ideen hängt jedoch stark mit dem Sachrechnen in der Grundschule zusammen, was da- 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 177 durch deutlich wird, dass der Umgang mit Sachtexten im Vordergrund steht. Der Aufbau der Unterrichtsideen ist unter Berücksichtigung des begrenzten Umfangs von Zeitschrif- tenartikeln gut gelungen. Zumeist werden die Lernziele klar definiert, das Vorwissen der Schüler und das benötigte Material werden angeführt und der Unterrichtsverlauf wird zu- mindest in Auszügen ausführlich dargestellt. Da alle Ideen bereits unterrichtspraktisch um- gesetzt worden sind, fehlt auch nicht die Schilderung von Erfahrungen mit der Unterrichts- idee. Die didaktisch-methodischen Begründungen fallen jedoch im Allgemeinen relativ kurz aus, der mathematische Hintergrund wird nicht erläutert und es werden keine Hinwei- se zur Differenzierung gegeben. Zwar werden teilweise Bezüge zu anderen Fächern und zu anderen Teilgebieten der Mathematik hergestellt, aber alles in allem wird deutlich, dass der Datenanalyse für sich im Unterricht der unteren Klassen in Deutschland nur geringe Wert- schätzung entgegengebracht wird. Datenkompetenz in einem umfassenden Sinn wird durch die in dieser Zeitschrift vorgeschlagenen Unterrichtsideen kaum systematisch gefördert. Ein weiteres Themenheft zur Datenanalyse ist „Data Exploration“ (Bloom, Carlyle, Edge, Irvin, Moses, Tana, Wiggan & Tunis, 1996) aus der Reihe „Teaching Children Ma- thematics“ vom Februar 1996. Vergleicht man dieses mit dem Themenheft der Grund- schulzeitschrift, so fällt zunächst auf, dass im englischsprachigen Material sich sowohl theoretische Artikel zum graphischen Darstellen von Daten und zum Beschreiben mit Hilfe von Mittelwerten befinden, als auch viele praxisnahe Unterrichtsbeispiele, die verschiede- ne Teilkompetenzen der Datenkompetenz in den Mittelpunkt stellen. Zum Beispiel sind darin zwei Vorschläge zur Untersuchung der Beziehung zwischen der Population und einer Stichprobe enthalten. Für den Aufbau der Unterrichtsvorschläge gilt dasselbe wie bei dem deutschen Themenheft. Allerdings werden die Unterrichtsvorschläge in „Data Explorati- on“ meist ausführlicher begründet und die mathematischen Hintergründe werden in den theoretischen Artikeln beleuchtet. Inner- und außermathematische Bezüge werden in allen Unterrichtsideen thematisiert und es wird auch versucht, möglichst alle Phasen der Daten- analyse zu durchlaufen. Damit lässt sich sagen, dass Datenkompetenz in einem umfassen- deren Sinn verstanden wird als es bisher in Deutschland der Fall ist. Themenhefte sind jedoch nur eine Quelle interessanter Materialien. Vereinzelt findet man auch in mathematikdidaktischen oder allgemeinen grundschuldidaktischen Zeitschrif- ten Artikel zur Datenanalyse in den unteren Klassen. Eine kommentierte Auswahl an deut- schen Artikeln befindet sich in den Literaturhinweisen im „Verzeichnis ausgewählter deutschsprachiger Artikel mit Unterrichtsvorschlägen zur Datenanalyse in den Klassen 1- 6“ (vgl. Abschnitt 13.3). 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 178 Neben den verschiedenen Zeitschriftenartikeln und Themenheften, die immer nur sehr kurze Unterrichtsideen zu einzelnen Teilkompetenzen der Datenkompetenz vermitteln können, existieren jedoch auch Sammelbände mit Unterrichtseinheiten, welche eine syste- matische und kontinuierliche Förderung von Datenkompetenz versprechen. Dazu gehören „Making Sense of Data”, „Navigating through Data Analysis and Probability“, „Develop- ing Data-Graph Comprehension in Grades K-8” und „Used Numbers: Real Data in the Classroom“. Im Folgenden werden auch diese Materialien hinsichtlich der aufgestellten Kriterien, besonders aber bezüglich einer systematischen Förderung von Datenkompetenz, kritisch bewertet. „Making Sense of Data“ (Lindquist, Luquire, Gardner & Shekaramiz, 1992) aus der Addenda Series für die Klassen 1-6 vom NCTM wurde als begleitendes Material zu den Curriculum and Evaluation Standards for School Mathematics aus dem Jahr 1989 und den Professional Standards for Teaching Mathematics aus dem Jahr 1991 entwickelt, in wel- chen erstmals sich über alle Klassenstufen hinweg erstreckende Standards zur Datenanaly- se und Wahrscheinlichkeit in den USA eingeführt wurden. „Making Sense of Data“ gibt vom Kindergarten bis zur 6. Jahrgangsstufe verschiedene Aktivitäten zur Datenanalyse an, welche zumeist unabhängig voneinander bearbeitet werden können. Für jede Jahrgangsstu- fe werden vorab die Lernziele benannt und für jede einzelne Unterrichtsidee kurz konkreti- siert. Zwar wird das benötigte Material angegeben, aber es wird nicht auf das Vorwissen, welches Schüler bereits haben sollten, eingegangen. Es folgt eine kurze Beschreibung der Lernsequenz, wobei zumeist keine Hinweise auf konkrete Unterrichtserfahrungen gegeben werden. Zwar werden teilweise inner- und außermathematische Vernetzungsmöglichkeiten genannt, aber der mathematische Hintergrund und das didaktisch-methodische Vorgehen werden in keinster Weise diskutiert, so dass eine Begründung der Unterrichtsideen fehlt. Ebenfalls vermisst man Vorschläge für das differenzierte Arbeiten. Viele Unterrichtsideen beziehen sich zudem nur auf einzelne Prozessphasen der Datenanalyse, so dass nur selten ein kompletter Durchlauf aller Phasen im Sinne eines Problemlösens vorgeschlagen wird. Die einzelnen Ideen sind überwiegend auf bestimmte Teilkompetenzen der Datenkompe- tenz zugeschnitten. „Navigating through Data Analysis and Probability“ aus der Navigations Series publiziert vom NCTM ist der Nachfolger der Addenda Series zur Datenanalyse, welcher die einzelnen Inhaltsstandards der NCTM-Standards 2000 erläutert, indem konkrete unter- richtspraktische Umsetzungsmöglichkeiten angegeben werden. Auf einer beigefügten CD- Rom befinden sich Kopiervorlagen, elektronische Arbeitsumgebungen sowie ergänzende, 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 179 meist theoretische Lektüre für die Lehrkraft. Die Navigations Series zum Inhaltsstandard „Datenanalyse und Wahrscheinlichkeit“ für die unteren Jahrgangstufen ist aufgeteilt in zwei Ausgaben, die sich auf die Klassen K-2 und die Klassen 3-5 beziehen. „Navigating through Data Analysis and Probability in Prekindergarten – Grade 2“ (Sheffield, Cava- nagh, Dacey, Findell, Greenes & Small, 2002) besteht aus insgesamt 3 Kapiteln, welche verschiedene Phasen einer Datenanalyse betonen, wobei im letzten Kapitel Daten durch Glücksspiele gesammelt werden, so dass die Schüler erste Erfahrungen mit dem Begriff der Wahrscheinlichkeit machen. „Navigating through Data Analysis and Probability in Grades 3-5“ (Chapin/ Koziol/ MacPherson/ Rezba, 2002) ist ähnlich gegliedert, wobei ein zusätzliches Kapitel sich mit dem Ziehen von Schlussfolgerungen basierend auf Stichpro- ben beschäftigt. In beiden Bänden werden verschiedenste Themengebiete und Aktivitäten vorgeschlagen, welche zumeist unabhängig voneinander zu behandeln sind. Es werden zu jeder Unterrichtsidee die Lernziele, das benötigte Vorwissen der Schüler und das benötigte Material angegeben. Danach folgt eine zumeist relativ kurze Beschreibung der Lernse- quenz, jedoch meist ohne Hinweise auf bisherige Erfahrungen mit diesem Unterrichtsvor- schlag. Auch die didaktische Diskussion fällt nur sehr kurz aus und das methodische Vor- gehen bleibt weitgehend unreflektiert. Didaktische Begründungen für das vorgeschlagene Vorgehen müssen durch die Erarbeitung der Texte der beigefügten CD-Rom selbst gefun- den werden, wobei sich hierbei das Problem stellt, dass sich diese Texte nicht direkt auf die vorgeschlagenen Unterrichtsideen beziehen. Andererseits besteht für den Lehrer darin auch die Chance, eine eigene didaktische Position zu entwickeln. Der mathematische Hin- tergrund wird nicht erläutert, was besonders für fachfremd unterrichtende Lehrer proble- matisch sein dürfte, aber es werden inner- und außermathematische Bezüge hergestellt. Dennoch beziehen sich viele Aktivitäten nur auf einzelne Prozessphasen der Datenanalyse. Insgesamt werden zwar Hinweise zur Weiterarbeit gegeben, aber die einzelnen Unter- richtsideen bauen nicht systematisch aufeinander auf, so dass auch dieses Material überar- beitet werden muss, wenn es zur systematischen Förderung von Datenkompetenz einge- setzt werden soll. Insgesamt gleichen die Serien des NCTM zur Erläuterung der Standards einer An- sammlung von Unterrichtsideen, die zwar versuchen, eine systematische Entwicklung von Datenkompetenz zu verfolgen, dies aber nicht konsequent umsetzen. Die hier betrachteten Bände beinhalten zwar einige gute Unterrichtsvorschläge, sind aber eher für Lehrkräfte geeignet, welche bereits theoretische oder praktische Erfahrungen mit der Entwicklung von Datenkompetenz in den unteren Klassen gesammelt haben. 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 180 Der Schwerpunkt des Materials „Developing Data-Graph Comprehension in Grades K-8” (Curcio, 2001), ebenfalls herausgegeben vom NCTM, liegt wie der Titel schon an- deutet auf dem graphischen Darstellen von Daten. Zunächst werden der mathematische Gehalt verschiedener Graphiken zur Datenanalyse und die Entwicklung des Verständnisses von diesen Darstellungen erläutert. Neben dem Herstellen konventioneller Graphiken wird auch darauf hingewiesen, dass Schüler eigene graphische Darstellungen erfinden sollten. Zudem wird auch der Einsatz von Software einschließlich einer Bewertung von Program- men diskutiert. Die Unterrichtsaktivitäten sind zwar sehr kurz dargestellt und es wird nicht angegeben, über welches Vorwissen die Schüler verfügen sollten, aber die Lernziele wer- den klar definiert, ebenso wie das benötigte Material. Die Schwierigkeitsgrade bestimmter Fragestellungen werden aufgeführt, so dass der Lehrer in diesem Material implizit Hinwei- se zu einer differenzierten Unterrichtsgestaltung erhält. Auch werden häufig Erfahrungen mit den Unterrichtsideen in Form von Schülerdokumenten aufgeführt, so dass sich der Lehrer ungefähr vorstellen kann, wie der Unterricht verläuft. Die Unterrichtsvorschläge werden zwar nicht einzeln begründet, aber die didaktische Diskussion zu Beginn des Bu- ches kompensiert dies. Zwar liegt der Schwerpunkt des Materials auf dem Aufbau von Graphikkompetenz, also einer Teilkompetenz von Datenkompetenz, aber trotzdem wird in den meisten Aktivitäten versucht, alle Phasen einer Datenanalyse zu durchlaufen, um ein reales Problem zu lösen. Insgesamt gibt dieses Material einen relativ umfassenden Einblick in das graphische Darstellen von Daten und die damit verbundene Entwicklung von Graphikkompetenz. Weiterhin ist positiv anzumerken, dass sich im Anhang eine umfassende Übersicht über Themen und Fragestellungen zur Datenanalyse befindet, welche für die Klassen K-8 ge- eignet sind. Die Serie „Used Numbers: Real Data in the Classroom“ besteht aus 6 Bänden. Der erste Band “Counting: Ourselves and Our Families” (Stone & Russell, 1990) für die Klas- sen K-1 stellt das Erheben von Daten durch Zählen und deren Analyse in den Mittelpunkt. Es wird dabei deutlich gemacht, wie man von Anfang an Datenanalyse und Arithmetik im Unterricht miteinander verknüpfen kann. „Sorting: Groups and Graphs“ (Russell & Cor- win, 1990), konzipiert für die Klassen 2-3, legt den Fokus auf das Sortieren von Daten und deren graphische Darstellung, während „Measuring: From Paces to Feet“ (Corwin & Russell, 1990) das Sammeln von Daten durch Messen hervorhebt und damit Datenanalyse und Geometrie miteinander verknüpft. Die nächsten drei Bände stellen allein die Datenana- lyse in den Mittelpunkt. In „Statistics: The Shape of the Data” (Russell & Corwin, 1989) 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 181 für die Klassen 4-6 lernen die Schüler verschiedene Darstellungsformen kennen und üben, die Gestalt von Verteilungen allmählich mit statistischen Begriffen zu beschreiben. Die beiden für die Klassen 5 und 6 konzipierten Materialien führen aufbauend auf den voran- gehenden Band in statistische Grundideen ein. „Statistics: Prediction and Sampling“ (Corwin & Friel, 1990) stellt die Idee der Stichprobenziehung in den Mittelpunkt, während „Statistics: Middles, Means and In-Betweens“ (Friel/ Mokros/ Russell, 1991) die Einfüh- rung von verschiedenen Mittelwerten thematisiert. Alle 6 Bände, mit Ausnahme des ersten Bandes, sind in drei Teile gegliedert. Die ersten Unterrichtsreihen dienen immer zur Einführung in den jeweiligen Schwerpunkt des Buches, der zweite Teil dient zur Vertiefung der erlernten Methoden und Begriffe und im letzten Teil werden Projekte vorgeschlagen, in denen die Schüler alle Phasen einer Daten- analyse durchlaufen und ihr neu erlerntes Wissen in einem Problemlösekontext aktiv an- wenden können. Insofern sind alle Materialbände in sich systematisch gegliedert. Der Aufbau der Unterrichtsmaterialien ist in jedem Band gleich. Die Lernziele des gesamten Materials sowie jeder einzelnen Einheit werden explizit dargelegt, teilweise wird auch benötigtes Vorwissen der Schüler angegeben, was jedoch meistens unnötig ist, da die Einheiten aufeinander aufbauen und folglich nacheinander behandelt werden sollten. Au- ßerdem wird das benötigte Material aufgeführt und der Unterrichtsverlauf wird ausführlich geschildert. Da alle Unterrichtsvorschläge vorab getestet wurden, werden Erfahrungen referiert und ein Einblick in Eigenproduktionen von Schülern gegeben. Die Dialogboxen geben Eindrücke von tatsächlichen Unterrichtsgesprächen und -diskussionen, auch wenn diese manchmal idealisiert erscheinen und möglicherweise Probleme verschweigen. Zu- dem wird das didaktisch-methodische Vorgehen in den Unterrichtseinheiten in Form von Teacher Notes begründet und es werden auch mathematische Hintergründe erläutert. Inner- und außermathematische Bezüge werden häufig hergestellt, letztere besonders in den Pro- jekten am Ende jedes Bandes, in denen die Schüler die Möglichkeit zum explorativen Ar- beiten in allen Prozessphasen der Datenanalyse haben. Dennoch fehlt eine Angabe konkre- ter Differenzierungsoptionen. Alles in allem ist das Material „Used Numbers: Real Data in the Classroom“ geeig- net, um Datenkompetenz in einem umfassenden Sinn zu fördern, da in allen Bänden der kritische Umgang mit Daten im Kontext eines realen Problems im Mittelpunkt steht. Es werden auch Hinweise zum Einsatz von Software gegeben, welche aber nicht systematisch verfolgt werden. Zwar ist dieses Material bereits ca. 15 Jahre alt, aber im Vergleich zu den anderen aufgeführten Titeln ist es dennoch am überzeugendsten, da es am detailliertesten 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 182 Unterrichtsreihen schildert und begründet, welche im Gegensatz zu allen anderen Materia- lien auch aufeinander aufbauen und eine systematische Förderung von Datenkompetenz in einem umfassenden Sinn verfolgen. In diesem Abschnitt wurde anhand von konkreten Unterrichtsmaterialien exempla- risch herausgearbeitet, dass ein Trend dahingehend besteht, dass das mathematische Teil- gebiet der Datenanalyse zunehmend Einzug in den Mathematikunterricht der unteren Klas- sen nimmt. Besonders den Materialien aus den USA liegt ein Konzept von Datenkompe- tenz zugrunde, welches ähnlich umfassend ist wie das in dieser Arbeit zugrunde gelegte (vgl. Kapitel 3). In Deutschland hingegen ist das Unterrichten von Datenanalyse in den unteren Klassen noch „Neuland“, was sich unter anderem in der geringen Anzahl existie- render Materialien zeigt. Abschließend sollen die Bewertungen der einzelnen Materialien noch einmal in einer kurzen Übersicht zusammengestellt werden: Zusammenfassende Übersicht über die Themenhefte: Titel Aufbau Begründung Datenkompetenzfördernd Kommentar Die Grundschul- zeitschrift: „Mit Daten umgehen“ (2004) + o - Starker Be- zug zum Sachrechnen Teaching Children Mathematics: „Data Exploration“ (1996) + + + + gut o durchschnittlich - unbefriedigend 9. Bewertung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 183 Zusammenfassende Übersicht über die Materialbände: Titel Aufbau Begründung Datenkompetenzfördernd Kommentar Making Sense of Data (1992) o - o Navigations Series (2002) + o o CD-Rom mit extra Material Developing Data-Graph Comprehension (2001) + + + Schwerpunkt Graphik- kompetenz; Liste mit geeigneten Themen und Fragestellun- gen Used Numbers (1989, 1990, 1991) + + + Aufeinander aufbauende Unterrichts- reihen; Projektidee + gut o durchschnittlich - unbefriedigend 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 184 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages Die im vorigen Kapitel vorgenommene Bewertung kann jedoch nur eine Orientie- rung geben, in welche Materialien eine Einsicht lohnenswert ist. Auch wenn einige Materi- alien durchweg positiv bewertet werden, so bedeutet dies nicht, dass die darin enthaltenen Unterrichtsreihen genau so im Unterricht eingesetzt werden können. Auch in den für gut befundenen Materialien befinden sich einige Unterrichtsideen, welche fragwürdig erschei- nen und unbedingt kritisch analysiert und gegebenenfalls überarbeitet werden sollten. Um dieses Phänomen aufzuzeigen, wird im Folgenden exemplarisch ein ausgewählter Unter- richtsvorschlag aus der Serie „Used Numbers: Real Data in the Classroom“ dargestellt, kritisch analysiert und überarbeitet. 10.1 Darstellung des Unterrichtsvorschlages „Looking at Mystery Data“ Der Unterrichtsvorschlag „Looking at Mystery Data“ aus dem Band „Statistics: The Shape of the Data” (Russell & Corwin, 1989) für die Klassen 4-6 ist eines der eher negati- ven Beispiele aus dieser Serie. Er wurde ausgewählt, weil dessen formaler Aufbau zwar typisch für Unterrichtsvorschläge dieser Serie ist, er aber inhaltlich gesehen eher ein un- gewöhnliches statistisches Vorgehen verlangt, welches ich im Folgenden näher erläutern werde. Die Grundidee der „Mystery Data“ liegt darin, dass die Schüler graphische Darstel- lungen von ihnen unbekannten Datensätzen erhalten und allein über die formale Beschrei- bung dieser Daten Theorien über mögliche Variablen entwickeln sollen, die hinter den geheimnisvollen Darstellungen stehen. Diese Vorgehensweise ist unüblich, da man ge- wöhnlich Daten erhebt und diese anschließend graphisch darstellt und im Sachkontext in- terpretiert. Bei den geheimnisvollen Datensätzen soll jedoch von der Darstellung und deren formaler Beschreibung auf die Herkunft der Daten geschlossen werden. Die Schüler sollen dabei lernen, die Gestalt von Verteilungen und das Typische im Datensatz zu beschreiben und auf dieser Basis Theorien über den Sachkontext zu entwickeln. Da die geheimnisvol- len Datensätze sowohl in einem Line Plot als auch in einem Case-Value Plot dargestellt sind, sollen die Schüler zudem den Unterschied zwischen gruppierten und ungruppierten graphischen Darstellungen untersuchen. Weiterhin sollen die Schüler Größenvorstellungen von verschiedenen Längen entwickeln, indem sie diese visualisieren oder abschätzen und dabei vertraute Richtmaße, wie etwa die eigene Körpergröße zum Vergleich, verwenden. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 185 Dazu stehen ihnen Messwerkzeuge wie Lineale oder Maßbänder zur Verfügung (vgl. Rus- sell & Corwin, 1989, S. 43-44). Diese Lernziele sollen durch folgendes Vorgehen erreicht werden: Zunächst teilt der Lehrer ein Arbeitsblatt mit einem Datensatz, visualisiert in den zwei oben benannten Dar- stellungsformen, aus und erläutert, dass es sich dabei um die Maße einer Gruppe von 24 Lebewesen handele (vgl. Abb. 10.1). Des Weiteren werden die beiden unterschiedlichen Graphiktypen kurz erklärt. Es handelt sich dabei um einen Datensatz, der die Körpergröße von 24 Basketballspielern in Inch darstellt, was jedoch die Schüler nicht wissen. Abb. 10.1: Schülerarbeitsblatt zur Mystery Data A (Darstellung aus: Russell & Corwin, 1989, S. 70) Die Schüler werden nun dazu angehalten, zunächst den Datensatz zu beschreiben, ohne dass sie bereits Vermutungen anstellen, um welche Lebewesen es sich hier handeln könnte. Bei der Beschreibung ist zudem darauf zu achten, dass die Kinder eine Vorstellung von den Größen ausbilden, indem sie die Daten mit Dingen vergleichen, deren Größe sie kennen. Erst dann können sie begründete Theorien entwickeln, welche Lebewesen hinter 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 186 den Daten stecken könnten. Die Theorien der Schüler werden gesammelt und für alle sichtbar notiert, allerdings wird die Lösung nicht verraten. In Gruppenarbeit sollen die Schüler zwei weitere, mysteriöse Datensätze beschreiben und Theorien bilden, die zu den Daten passen. „Mystery Data B“ gibt die Länge von 18 Boa Konstriktors (in Inch) an, wel- che in amerikanischen Zoos und Museen leben (vgl. Abb. 10.2). Abb. 10.2: Schülerarbeitsblatt zur Mystery Data B (Darstellung aus: Russell & Corwin, 1989, S. 71) Der andere Datensatz, „Mystery Data C“, zeigt die Körpergröße von 14 Babys in Inch, geboren in Cambridge, Massachusetts im August 1989 (vgl. Abb. 10.3). 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 187 Abb. 10.3: Schülerarbeitsblatt zur Mystery Data C (Darstellung aus: Russell & Corwin, 1989, S. 72) Für jeden Datensatz schreiben die Schüler eine „Geschichte der Daten“, welche eine Beschreibung der Daten, einen Größenvergleich mit anderen, ihnen bekannten Messwerten sowie begründete Theorien über die Daten enthält. In der abschließenden Diskussion wer- den die Geheimnisse gelüftet und die Herkunft der Daten offen gelegt. Dazu gibt der Leh- rer zunächst Hinweise zu den einzelnen Datensätzen, wie etwa zum zweiten Datensatz, dass die Lebewesen keine Menschen sind und in Zoos leben. Eine weitere Alternative zur Auflösung der Rätsel besteht darin, ein Ratespiel mit den Schülern zu spielen, bei dem die Kinder Fragen an den Lehrer stellen dürfen, welche dieser bejahen oder verneinen muss. Der zeitliche Umfang dieser Unterrichtsidee beträgt zwei Schulstunden à 45 Minuten (vgl. Russell & Corwin, 1989, S. 45). 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 188 10.2 Kritische Analyse des Unterrichtsvorschlages „Looking at Mystery Data“ Im Folgenden werde ich begründen, warum ich diesen Unterrichtsvorschlag in eini- gen Punkten für wenig sinnvoll halte: Die Grundidee, dass man von der graphischen Dar- stellung auf die Herkunft der Daten schließen soll, ist meiner Meinung nach positiv, da die Schüler dazu gezwungen sind, statistische Begriffe anzuwenden und Datensätze formal zu beschreiben, da kein Sachkontext bekannt ist, der andere, alltagsnähere Begriffe nahe legen könnte. Erst wenn die Schüler die graphischen Darstellungen verstehen und mit den statis- tischen Begriffen sicher umgehen und diese richtig interpretieren können, gelingt es, eine Verbindung zwischen der Verteilung und der dahinter stehenden Sachsituation herzustel- len. Die Grundidee des Unterrichtsvorschlags dient also dazu, dass Schüler lernen, statisti- sche Begriffe anzuwenden, um Verteilungen zu beschreiben. Die Umsetzung dieser Idee in ist allerdings dahingehend problematisch, dass die Datensätze nicht aus der unmittelbaren Lebenswelt der Schüler stammen und auch durch den Hinweis, dass es sich um eine Grup- pe von Lebewesen handele, die Variablen nicht ermittelt werden können. Zwar ist aller- dings die genaue Ermittlung der Variablen laut den Autoren nicht das Ziel, sondern ledig- lich die Aufstellung von geeigneten Theorien und Vermutungen, aber sicherlich sind viele Schüler enttäuscht und demotiviert, wenn es so gut wie unmöglich ist, die gesuchten Vari- ablen ohne konkretere Hilfe zu ermitteln. Dies ist zum Beispiel beim Datensatz „Mystery Data B“ der Fall, da dieser die Länge von Boa Konstriktors darstellt. Die Streuung dieser Daten ist sehr groß, so dass es sehr schwierig ist, eine zu den Daten passende Theorie zu entwickeln. Ohne spezielles Hintergrundwissen über Schlangen ist es unmöglich, die Her- kunft der Daten zu ermitteln. Lediglich statistische Begriffe können angewendet werden, nämlich Begriffe zur Beschreibung der Streuung, zur Beschreibung von Auffälligkeiten in Datensätzen, sowie Lagemaße. Da das eindimensionale Streudiagramm sehr flach ist, kön- nen Begriffe zur Beschreibung der Verteilungsform nicht angewendet werden (vgl. Abb. 10.2). Selbst wenn die Schüler herausfänden, dass dieser Datensatz die Länge von Schlan- gen darstellt, so kann aufgrund der Daten nicht geklärt werden, warum diese so extrem streuen, da nur ein einziges Merkmal verfügbar ist. Es könnte schließlich sein, dass die Länge von Schlangen abhängig vom Geschlecht ist, aber diese Hypothese kann nicht wei- ter untersucht werden, da schlicht die Daten fehlen und somit über die Sachsituation nichts weiter gelernt werden kann. Ähnliches gilt für die beiden anderen Datensätze, bei denen jedoch noch eher die Möglichkeit bestünde, dass die Schüler die Herkunft der Daten he- rausfinden. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 189 Außerdem ist es fragwürdig, ob die Schüler bei dieser Problemstellung tatsächlich den Unterschied zwischen Graphiken mit gruppierten und ungruppierten Daten verstehen lernen. Bei der Problemstellung der „Mystery Data“ ist der Unterschied zwischen den Gra- phiken irrelevant, da eigentlich eine Darstellung ausreicht, um den Datensatz zu beschrei- ben und um Theorien zu entwickeln. Die Schüler wählen dann sicherlich diejenige Gra- phik, die für sie am leichtesten zu verstehen ist, beschreiben diese und entwickeln allein auf Basis dieser untersuchten Graphik Theorien über die Sachsituation. Das Lernziel, den Unterschied zwischen gruppierten und ungruppierten Daten zu untersuchen, wird also da- mit nicht erfüllt, da eine Darstellungsform völlig ignoriert werden kann. Will man errei- chen, dass Schüler den Unterschied zwischen Darstellungsformen für gruppierte und un- gruppierte Daten kennen lernen, so sollte man sie schlichtweg zunächst beide Graphiken getrennt beschreiben und abschließend miteinander vergleichen lassen. Dadurch erkennen sie, welche Graphik mehr Aussagekraft hat und können später im Kontext von komplexe- ren Fragestellungen oder statistischen Projekten auf dieses Wissen zurückgreifen, um ge- eignete Darstellungsformen auszuwählen. Allein das Lernziel, Größenvorstellungen von verschiedenen Längen aufzubauen, ist meiner Ansicht nach realisierbar. Durch das Schätzen und anschließende Visualisieren der Längen mit Hilfe von verschiedenen Messwerkzeugen oder durch das Vergleichen mit der eigenen Körpergröße verinnerlichen Schüler die Längen, was von besonderer Alltagsrele- vanz ist. Die Auflösung des Rätsels in Form eines Ratespiels am Ende der Unterrichtseinheit führt meines Erachtens nach zu keinem erkenntlichen Lernzuwachs. Das reine Raten führt von den Daten weg und somit wird eher das Gegenteil des intendierten Lernziels erreicht, da die Daten in den Hintergrund rücken und die Schüler vermutlich allein auf Basis der Lehrertipps Vermutungen über die dahinter stehende Sachsituation anstellen. Insgesamt wird also deutlich, dass man durch die oben beschriebene Vorgehensweise nicht alle angeführten Lernziele erreichen kann. Will man erreichen, dass die Schüler die Möglichkeit haben, die tatsächlich verwendeten Variablen wirklich zu ermitteln, so könnte man die Idee der „Mystery Data“ dahingehend überarbeiten, das man verschiedene graphi- sche Darstellungen und Variablen vorgibt, die einander zugeordnet werden müssen. Diese Zuordnung von Variablen zu Graphiken testet das Wissen der Schüler über Verteilungen und deren Fähigkeit, graphische Darstellungen zu entschlüsseln (Graphikkompetenz). Au- ßerdem ist Sachwissen bezüglich der Daten erforderlich, um eine sinnvolle Zuordnung vornehmen zu können. Wird zudem verlangt, dass die Schüler ihre Zuordnungen begrün- 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 190 den, so könnte man erwarten, dass sie statistische Begriffe sinnvoll nutzen und in ihren Begründungen anführen. Zawojewski (1996, S. 375) stellt jedoch fest, dass die Begrün- dungen zu solchen Aufgabentypen teilweise enttäuschend ausfallen. Zum Beispiel wird häufig als Begründung schlichtweg angeführt, dass der Graph so aussähe als passe er zu der Variablen, ohne näheren Bezug auf die Verteilung der Daten zu nehmen und diese im Sachkontext zu interpretieren. Besonders wenn die Zahlenräume sehr verschieden sind, ist eine genaue Begründung in gewisser Weise auch überflüssig, da dann eine Entscheidung allein aufgrund von Streu- ungsmaßen getroffen werden kann. Man müsste folglich Datensätze wählen, die sich über annähernd gleiche Zahlenräume erstrecken, so dass eine Begründung auf Basis einer Ver- teilungsbeschreibung notwendig wird. Im Folgenden werde ich eine überarbeitete Unterrichtsidee zu mysteriösen Datensät- zen vorstellen, in der ich versuche, die Grundidee der „Mystery Data“ so umzusetzen, dass das Lernziel der Theoriebildung über die Sachsituation auf Basis der Daten erreicht werden kann. Außerdem wird die Unterrichtsidee erweitert, so dass sie in ein mehrtägiges Projekt zur Datenanalyse mündet. 10.3 Überarbeiteter Unterrichtsvorschlag Thema: Es handelt sich um eine Unterrichtseinheit zum Thema „Körpermaße“. Dies stellt zwar ein klassisches statistisches Thema dar, jedoch wird es vor dem Hintergrund eines neuen di- daktisch-methodischen Ansatzes behandelt. Grundidee: Die Grundidee, dass die Schüler graphische Darstellungen von ihnen unbekannten Daten- sätzen erhalten und allein über die formale Beschreibung dieser Daten Theorien über die Sachsituation entwickeln sollen, bleibt erhalten, allerdings wird das Thema der Unter- richtseinheit (Körpermaße) vorgegeben, so dass die Schüler eine Orientierung haben, in welchem Kontext sie nach geeigneten Variablen suchen müssen. Außerdem erhalten die Schüler die Gelegenheit, ihre aufgestellte Hypothese zu prüfen, indem sie weitere Daten sammeln sollen. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 191 Vorwissen der Schüler: Die Schüler kennen die graphische Darstellungsform des eindimensionalen Streudia- gramms und verfügen über Begriffe zur Beschreibung von statistischen Verteilungen, dar- unter Lage- und Streumaße, Begriffe zur Beschreibung der Verteilungsform und von Auf- fälligkeiten in Datensätzen. Weiterhin können sie mit Messwerkzeugen Längen messen und ihre erhobenen Daten notieren. Dieses Wissen dürfte bei systematischer Förderung von Datenkompetenz in der 6. Jahrgangsstufe erwartbar sein. Anderenfalls kann diese Un- terrichtseinheit jedoch auch in späteren Jahrgängen unter Verwendung geeigneter Daten- sätze durchgeführt werden. Lernziele/ Kompetenzen: Die Schüler sollen dabei folgende inhaltsbezogene Kompetenzen erreichen: • Die Schüler beschreiben die Gestalt einer Verteilung und das Typische im Daten- satz. Statistische Begriffe sollen angewandt und interpretiert werden. • Auf Basis der Datenbeschreibung sollen Theorien über die Herkunft der Daten/ ü- ber die Sachsituation entwickelt werden. • Daten werden durch Messen in Form von Mini-Stichproben gesammelt. • Die Schüler sollen erste, informelle Ideen bezüglich der Repräsentativität einer Stichprobe entwickeln. • Die Schüler entwickeln ihre Größenvorstellungen und Kenntnisse im metrischen Größenbereich der Längen weiter. Gegebenenfalls müssen Größen in andere Ein- heiten umgerechnet werden. Die Schüler sollen dabei folgende prozessbezogene Kompetenzen erreichen: • Die Schüler nutzen die erarbeiteten mathematischen Sachverhalte, um ihre aufge- stellten Theorien zu begründen. Sie lernen zu argumentieren. • Die Schüler kommunizieren ihre Ergebnisse in Form einer kleinen Präsentation. • Die Schüler überprüfen ihre anhand der Graphik aufgestellte Hypothese, indem sie diese mit den gesammelten Daten in Beziehung setzen. • Die Schüler gehen sachgerecht mit Messwerkzeugen, wie Lineal, Maßband, Me- termaß, etc. um. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 192 Zeitlicher Umfang: Die konzipierte Unterrichtseinheit erstreckt sich über 2 Schulstunden und mündet in ein mehrtägiges Projekt (vgl. Abschnitt 10.4). Materialien: • Geeignete Software, zum Beispiel TinkerPlotsTM, und einen Datensatz mit Kör- permaßen13 von Kinder der gleichen Altersgruppe (siehe beiliegende CD-Rom) zur Erstellung von Arbeitsblättern • Kopien der jeweiligen Arbeitsblätter für die Gruppen (siehe Anhang 4-7) und Lö- sungsblatt für Lehrer (siehe Anhang 8) • Messwerkzeuge, wie Lineal, Maßband, etc. für jede Kleingruppe • Jeweils eine Folie der Arbeitsblätter • Elektronische Arbeits- und Lernumgebungen für das anschließende Projekt (siehe Anhang 9-11 und CD-Rom) Unterrichtsverlauf: 1. Unterrichtsstunde: 1. Einstieg: Zum Einstieg gibt der Lehrer bekannt, dass sich der Mathematikunterricht in den nächsten Stunden rund um das Thema „Körpermaße“ drehen wird. Der Beg- riff wird gemeinsam geklärt, indem man in einem Brainstorming einige Beispiele für Körpermaße sammelt und diese an der Tafel notiert. 2. Gruppenarbeitsphase: Die Schüler finden sich in Gruppen à 4-6 Personen zusam- men (am besten in den Tischgruppen) und jede Schülergruppe bekommt eine ent- sprechende Anzahl Arbeitsblätter mit einem mysteriösen Datensatz. Vier Gruppen bearbeiten also vier verschiedene mysteriöse Datensätze (siehe Anhang 4-7). Die Arbeitsblätter sind so strukturiert, dass die Schüler zunächst den Datensatz mit statistischen Begriffen beschreiben müssen und dann eine erste Vermutung über die dahinter stehende Variable anstellen sollen. Dazu müssen sie ihr Vorwissen bezüg- lich des Sachkontextes mit dem aus den Daten gewonnenen Einsichten verknüpfen. Um die aufgestellte Hypothese zu überprüfen, sollen die Schüler Daten innerhalb ihrer Kleingruppe sammeln, indem sie das entsprechende Körperteil mit Hilfe der 13 Reale Datensätze aus dem Projekt „Census at School“ können unter http://www.censusatschool.ntu.ac.uk/ downgeloaded werden. Die hier verwendeten Datensätze befinden sich auf der beiliegenden CD-Rom. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 193 Messwerkzeuge messen, die Daten in einer Tabelle notieren und aufgrund dieser Mini-Stichprobe begründet entscheiden, ob ihre Hypothese verworfen werden sollte oder nicht. Die Schüler sollen durch die letzte Aufgabe (Aufgabe 5) dazu angeregt werden, erste Ideen über die Repräsentativität einer Stichprobe zu entwickeln, in- dem sie darüber nachdenken, ob es möglich ist, dass ihre eingangs aufgestellte Hypothese doch richtig ist, obwohl die Datenerhebung innerhalb der Kleingruppe eine andere Vermutung nahe legt, oder ob ihre Hypothese fälschlicherweise auf- grund der gesammelten Daten für richtig eingeschätzt werden kann. 2. Unterrichtsstunde: 1. Gruppenarbeitsphase zum Anschluss an die letzte Stunde: Die Schüler erhalten pro Arbeitsgruppe eine Folie ihres Arbeitsblatts, auf der sie die wesentlichen Ergebnis- se ihrer Arbeit festhalten sollen. 2. Präsentationsphase: Im Plenum präsentieren die Gruppen mit Hilfe der erstellten Folien ihre Ergebnisse, indem sie ihr Vorgehen schildern und ihre Ergebnisse be- gründen. 3. Unterrichtsgespräch zum Abschluss: Der Lehrer lüftet nun das Geheimnis um die vier mysteriösen Datensätze, indem er die entsprechenden Variablen angibt und die Schüler sie den Datensätzen zuordnen, falls diese nicht schon während der Präsen- tationsphase herausgefunden worden sind. Methodische Strukturierung: Damit der Begriff „Körpermaße“ allen Schülern klar wird, wird zum Einstieg in die erste Unterrichtsstunde im Plenum ein Brainstorming durchgeführt. Sobald alle Schüler verste- hen, was mit diesem Begriff gemeint ist, beginnt die Gruppenarbeit. Zwar erhält jeder Schüler ein eigenes Arbeitsblatt, aber die Sozialform der Gruppenarbeit wurde gewählt, damit sich die Schüler über die Muster und Strukturen in den Datensätzen austauschen und einander ergänzen können, um somit möglichst viele Aspekte in den Daten zu erkennen. In dieser Phase steht die mündliche Kommunikation an erster Stelle. Das Ziehen der Mini- Stichprobe erfolgt aus pragmatischen Gründen ebenfalls in der Kleingruppe. Die zweite Unterrichtsstunde beginnt mit einer Gruppenarbeitsphase, in der gemeinsam eine Folie zur Präsentation erstellt wird. Dadurch wird gleichzeitig das Wissen der Schüler aktualisiert. Bei der Präsentation ist darauf zu achten, dass alle Mitglieder der Gruppe be- teiligt sind und dass die Ergebnisse argumentativ begründet werden. Im anschließenden 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 194 Unterrichtsgespräch wird das Geheimnis um die mysteriösen Datensätze gemeinsam gelüf- tet. Didaktische Begründung: Mathematische Gegenstände dieser Unterrichtseinheit sind die Verteilungen numerischer Variablen zum Thema „Körpermaße“ und deren graphische Darstellungen. Das Thema „Körpermaße“ besitzt im Vergleich zu den Datensätzen des ursprünglichen Unterrichtsvor- schlags einen höheren Lebensweltbezug und ermöglicht damit eine effektive Verknüpfung von Sachwissen mit mathematischem Wissen. Durch die Vorgabe des Themengebiets, in dem die Schüler nach geeigneten Variablen suchen sollen, ist die Anzahl der Möglichkei- ten eingegrenzt, was die Theoriebildung über die Sachsituation vereinfacht und somit ein Entschlüsseln der gesuchten Variablen ermöglicht. Damit die Schüler jedoch nicht blind raten, sollen sie in Aufgabe 1 zunächst den Datensatz formal beschreiben und erst im zwei- ten Schritt eine Hypothese über die dahinter stehende Variable aufstellen. Die Hypothese wird aufgrund der Beschreibung der Daten und aufgrund von verinnerlichten Größenvor- stellungen der Schüler getroffen und soll durch die Erhebung weiterer Daten innerhalb der Kleingruppe geprüft werden. Vermutet eine Gruppe also, dass es sich bei ihrem Datensatz um die Unterarmlänge handelt, so messen sie die Länge ihrer eigenen Unterarme, was ei- nen korrekten Umgang mit Messwerkzeugen voraussetzt, um die Vermutung entweder zu bekräftigen oder zu verwerfen. Der Vergleich des Datensatzes mit dieser selbst erhobenen Mini-Stichprobe aus der Klasse ist möglich, da die Schüler in etwa aus der gleichen Al- tersgruppe stammen. Da diese Stichprobe allerdings sehr klein ist, kann es auch passieren, dass auf ihrer Grundlage falsche Rückschlüsse auf den mysteriösen Datensatz gezogen werden. Aufgabe 5 dient dazu, dass die Schüler sich dieser Problematik bewusst werden und gleichzeitig erste Ideen bezüglich der Repräsentativität einer Stichprobe entwickeln. Zwar ist die Einschränkung der Variablen auf den Themenbereich „Körpermaße“ eine Vereinfachung, aber dies bedeutet nicht, dass die Schüler sofort erkennen können, welche Variable sich hinter den Datensätzen verbirgt. Da sich zum Beispiel die Variablen „Fuß- länge“ (Arbeitsblatt 1) und „Länge der Handspanne“ (Arbeitsblatt 2) über annähernd glei- che Zahlenräume erstrecken, ist eine Zuordnung nicht trivial und erfordert eine Begrün- dung auf Basis einer Verteilungsbeschreibung. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 195 Lösungsprozessanalyse Am Beispiel des Arbeitsblatts 1 wird im Folgenden der Lösungsprozess, den Schüler durchlaufen sollten, genauer analysiert. Aufgabe 1 gibt den Schüler zunächst Informatio- nen zu dem vorliegenden mysteriösen Datensatz. Sie erfahren, dass es sich dabei um die Länge eines Körperteils von 48 elfjährigen Schülern handelt und werden dazu aufgefor- dert, den Datensatz mit (statistischen) Begriffen zu beschreiben (vgl. Abb. 10.4). Dabei wird erwartet, dass die Schüler mindestens ein Lagemaß und ein Streuungsmaß angeben, dass sie die Form der Verteilung beschreiben und dass sie den Ausreißer identifizieren. Eine Beschreibung könnte also folgendermaßen lauten: Die Daten erstrecken sich über eine Spannweite von 21cm. Das Maximum liegt bei 30cm, während das Minimum, wel- ches gleichzeitig ein Ausreißer ist, bei nur 9cm liegt. Sieht man von diesem Ausreißer nach unten ab, sind die Daten in etwa normalverteilt. Der Modalwert und der Median liegen bei 23cm. Als Alternative können auch intuitive, informelle Ideen, etwa bezüglich des Zent- rums, genutzt werden. Die Schüler könnten also auch eine modale Gruppe im Bereich von 20 bis 25cm angeben. Abb. 10.4: Auszug aus dem Schülerarbeitsblatt 1 Die Graphik zeigt die Länge eines Körperteils von 48 Kindern im Alter von 11 Jahren. Beschreibt den Datensatz mit den Begriffen, die ihr im Unterricht kennen gelernt habt. Einheit: cm (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) In der zweiten Aufgabe sollen die Schüler nun auf Basis der Verteilungsbeschreibung und unter Einbeziehung ihres Sachwissens über Körpermaße eine Vermutung anstellen, welche Variable hier dargestellt sein könnte. Sie müssen dabei insbesondere auf das Lagemaß und das Streumaß achten, bzw. auf die modale Gruppe, die beide Kennzahlen integriert. Um die „mittlere“ Länge zu visualisieren, könnten sie einen Papierstreifen entsprechend zu- schneiden. Mit diesem Repräsentant vor Augen könnten sie zu der Hypothese gelangen, 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 196 dass die dargestellten Daten etwa der Fußlänge entsprechen könnten. Sicherlich ist eine Diskussion des Ausreißers nötig, da dieser extrem nach unten abweicht. Fragen wie „Kann man eine Fußlänge von 9cm haben?“ oder „Handelt es sich dabei um einen Messfehler?“ sind innerhalb der Kleingruppe zu diskutieren. Um die aufgestellte Hypothese zu überprüfen, sollen die Schüler nun innerhalb ihrer Kleingruppe die Fußlänge messen und in einer Tabelle notieren (Aufgabe 3) und begrün- den, ob die gesammelten Daten die Vermutung unterstützen oder nicht (Aufgabe 4). Der Vergleich ist insofern sinnvoll, da alle Daten von Schülern selben Alters stammen. Liegen beispielsweise die Daten der Schüler alle in der oben identifizierten modalen Gruppe, so können sie ihre Vermutung als bestätigt ansehen. Liegen die meisten Daten eher außerhalb dieser Gruppe oder verteilen sich über eine andere Spannweite, so ist es nahe liegender, die Hypothese zu verwerfen. Aufgabe 5 soll dazu dienen, sich klar darüber zu werden, dass alle Aussagen basierend auf einer zudem noch sehr kleinen Stichprobe mit Unsicherheit behaftet sind. Auch wenn die gesammelten Daten über die Fußlänge zu dem mysteriösen Datensatz passen, muss dies nicht bedeuten, dass dieser auch tatsächlich die vermutete Variable darstellt. Und umge- kehrt muss ein Verwerfen der Hypothese nicht bedeuten, dass die Variable des mysteriösen Datensatzes tatsächlich nicht mit der Vermutung der Schüler übereinstimmt. Die Schüler sollen also im Idealfall erkennen, dass eine Stichprobe vom Umfang von etwa 6 Personen nicht repräsentativ genug ist und dass man daher auch falsche Rückschlüsse bezüglich des mysteriösen Datensatzes ziehen kann. Natürlich sind auch alternative Lösungen möglich. Die Schüler könnten sinnvollerweise etwa auch vermuten, dass es sich um die Länge des Unterarms handelt, da diese Variable bei Schülern dieser Altersgruppe ähnlich verteilt ist. Stellen die Schüler diese Hypothese auf und sehen diese durch ihre gesammelten Daten als bestätigt an, so ist deren Argumen- tation auf Basis der Daten natürlich als richtig anzusehen, auch wenn die Daten tatsächlich ein anderes Merkmal darstellen. Differenzierungsoptionen: Da keine homogenen Lerngruppen existieren, sind bei fast allen Aktivitäten im Unterricht Differenzierungsangebote notwendig. Leistungsstärkere Schüler sollten sich vertieft mit Aufgabe 5 beschäftigen, da die Idee der Repräsentativität schwierig zu verstehen ist. Für schwächere Schüler bietet sich Arbeitsblatt 4 (Anhang 7) mit der Variablen „Körpergröße“ an, da diese leicht herauszufinden ist und keine alternativen Lösungen existieren. Aller- 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 197 dings stellen sich hier gegebenenfalls Schwierigkeiten beim Sammeln der Daten ein, da beim Messen die Werkzeuge mehrfach angelegt werden müssen und die Ergebnisse addiert werden müssen. 10.4 Anregungen zur Weiterarbeit in Form von projektorientierten Unterricht Das Thema „Körpermaße“ eignet sich besonders gut dazu, die Korrelation zweier numerischer Variablen zu entdecken, da einige dieser Variablen auf ungefähr lineare Zu- sammenhänge führen. Schülern ist es sicherlich aufgrund ihres Alltagswissens klar, dass beispielsweise größere Menschen tendenziell auch größere Füße haben. Wie sich diese Korrelation zwischen den Variablen „Körpergröße“ und „Fußlänge“ in verschiedenen gra- phischen Darstellungen ausdrückt, können die Schüler mithilfe der Software TinkerPlotsTM selbständig explorieren. Dazu habe ich Arbeits- und Lernumgebung 10.1 (siehe CD-Rom oder Anhang 9) entwickelt. Die Schüler sollen in Aufgabe 1 zunächst Vermutungen über den Zusammenhang der beiden Attribute anstellen, wobei erwartet wird, dass sie einen „Je mehr…desto mehr“- Zusammenhang vermuten. Aufgabe 2 dient dazu, die graphische Dar- stellung des zweidimensionalen Streudiagramms kennen zu lernen. Die Schüler sollen be- schreiben, wie sich ihre Vermutung in dieser Graphik darstellt und ob sich die Vermutung bestätigen lässt oder nicht (vgl. Abb. 10.5). Danach sollen sie eine weitere Graphik herstel- len und untersuchen, wie sich der Zusammenhang zwischen den beiden Größen darin dar- stellt. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 198 Abb. 10.5: Auszug aus Arbeits- und Lernumgebung 10.1 Beschreibe die unten stehende Graphik. Wie wird darin der Zusammenhang zwischen die- sen beiden Größen deutlich? Bestätigt sich deine Vermutung? Collection 1 70 90 110 130 150 170 190 0 10 20 30 40 Fu ss lä ng e Körpergrösse Circle Icon (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) Arbeits- und Lernumgebung 10.2 (siehe CD-Rom oder Anhang 10) ist ähnlich auf- gebaut und dient zur Entdeckung des Zusammenhangs zwischen der Länge der Handspan- ne und dem Umfang des Handgelenks. Auch hier soll zunächst eine Vermutung aufgestellt werden, die dann anhand einer vorgegebenen Mehrfeldertafel (vgl. Abb. 10.6) und einer selbst hergestellten Graphik überprüft werden soll. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 199 Abb. 10.6: Auszug aus Arbeits- und Lernumgebung 10.2 Beschreibe die unten stehende Graphik. Wie wird darin der Zusammenhang zwischen die- sen beiden Größen deutlich? Bestätigt sich deine Vermutung? Collection 1 0-9,9 10-19,9 20-30 0-14,99 15-29,99 30-45 H an ds pa nn e Umfang_Handgelenk_cm Circle Icon (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) Insgesamt dienen also beide Lernumgebungen dazu, verschiedene Graphiken, wie etwa die Vierfeldertafel, das zweidimensionale Streudiagramm oder den Paired Case- Value Plot zu entdecken, die Daten zu explorieren und zu erkennen, wie die „Je mehr… desto mehr…“-Beziehung in den verschiedenen Graphiken visualisiert wird. Besonders in Arbeits- und Lernumgebung 10.3 (siehe CD-Rom oder Anhang 11) können die Schüler erste Vorerfahrungen mit linearen Zusammenhängen machen. Darin soll untersucht werden, in welchem Zusammenhang die Körpergröße und die vertikal er- reichbare Höhe (durch Arme ausstrecken und auf die Zehenspitzen stellen) stehen. Da in diesem Datensatz die vertikal erreichbare Höhe im Durchschnitt etwa 41cm größer ist als die Körpergröße, führt dies auf folgenden linearen Zusammenhang (ausgedrückt in Wort- variablen): Vertikal_err_Höhe=Körpergröße + 41. Auch hier sollen die Schüler zunächst Vermutungen anstellen, wie diese beiden Größen zusammenhängen und dann auf Basis der Datentabelle schätzen, um wieviel größer die vertikal erreichbare Höhe (durchschnittlich) ist (vgl. Abb. 10.7). Diese Differenz sollen sie dann auch rechnerisch mit oder ohne Soft- wareunterstützung ermitteln. Dazu müssen sie die Differenz der beiden Attribute bilden und einen geeigneten Mittelwert berechnen. 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 200 Abb. 10.7: Auszug aus Arbeits- und Lernumgebung 10.3 Schau dir die beiden Attribute in der Datentabelle an. Um wieviel größer ist die vertikal erreichbare Höhe? Schätze zunächst, berechne dann einen Wert. Du kannst dazu auch Tin- kerPlots verwenden! Collection 1 ... ... ... Körpergrösse Vertikal_err_Höhe F 1 2 3 4 5 6 7 8 9 10 11 1... 11 M 157 206 1 2... 10 M 139 183 2 2... 11 F 142 198 2 2... 11 M 143 2 0... 11 M 156 230 2 0... 9 F 151 181 2 0... 11 F 155 200 2 0... 11 F 163 207 2 2... 10 F 141 177 2 0... 11 M 175 227 2 0... 10 F 139 178 1 (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) Aufgabe 3 zielt auf Interpolation und Extrapolation ab, also auf Vorhersagen basie- rend auf dem Datensatz, die entweder auf Basis des rechnerisch ermittelten Wertes oder auf Basis einer Graphik durchgeführt werden kann. Dabei sollen die Schüler angeben, wel- che Höhe ein 90cm und ein 190cm großer Schüler erreichen könnte. In Aufgabe 4 sollen die Schüler nach Anleitung ein zweidimensionales Streudiagramm herstellen, die Graphik ausdrucken und mit Hilfe des Lineals eine Ausgleichsgerade einzeichnen. Anhand der Ge- raden sollen sie ihre in Aufgabe 3 ermittelten Werte überprüfen. Die Ausgleichsgerade hätte auch mit Hilfe des Drawing Tools in TinkerPlotsTM eingezeichnet werden können, aber dies ist mit der Maus meist sehr ungenau zu handhaben. Die entwickelten Arbeits- und Lernumgebungen verstehen sich als Angebote, die das Projekt einleiten. Fragestellungen der Schüler an die Daten sind ausdrücklich erwünscht und werden in der jeweils letzen Aufgabe auch motiviert. So könnten beispielsweise auch die in der 1. Unterrichtsstunde gesammelten Daten vervollständigt werden, so dass der Datensatz der Körpermaße der Klasse mit den „Census at School“-Daten der britischen Schüler verglichen werden kann. Die Schüler lernen dadurch, dass man aus größeren 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 201 Stichproben verlässlichere Schlussfolgerungen ziehen kann, als aus den Mini-Stichproben vom Umfang von 4-6 Personen. Methodische Strukturierung: In der anschließenden Projektphase werden arbeitsteilig in Kleingruppen à 2-3 Personen verschiedene Fragestellungen zum Thema „Körpermaße“ mit Hilfe der Software Tin- kerPlotsTM interaktiv bearbeitet. Es können auch mehrere Gruppen dieselben Fragestellun- gen bearbeiten. Ein Vergleich der verschiedenen Vorgehensweisen und Ergebnisse liefert interessante Einblicke in die Vielzahl der explorativen Arbeitsweisen. Zum Abschluss der Projektphase folgt eine Präsentation der Ergebnisse, indem die Gruppen ihre wesentlichen Arbeitsschritte und Ergebnisse auf Plakaten festhalten und diese ausstellen. Didaktische Begründung: Der mathematische Gegenstand des Projekts ist die Korrelation von numerischen Variab- len zum Thema „Körpermaße“, welche sich zumeist in annähernd linearen Zusammenhän- gen modellieren lässt. Da Schüler der 6. Klasse noch keine Erfahrungen mit linearen Zu- sammenhängen gemacht haben, bietet sich ein explorativer Zugang zu dieser Thematik mithilfe der Software TinkerPlotsTM an, da die Schüler darin frei mit Graphiken experi- mentieren können und die relativ gesicherte Vermutung, dass zwischen einigen Körperma- ßen „Je mehr… desto mehr“-Zuordnungen bestehen, überprüfen können. Da die Schüler aufgrund ihres Sachwissens relativ sicher davon ausgehen können, dass etwa größere Men- schen tendenziell auch größere Füße haben, können sie die Graphiken dahingehend unter- suchen, wie dieser Zusammenhang visualisiert wird. Sie lernen dadurch neue Graphiken kennen und lernen insbesondere in Arbeits- und Lernumgebung 3, dass man eine Aus- gleichsgerade an Daten in einem Streudiagramm anpassen kann und diese für Vorhersagen nutzen kann. Differenzierungsoptionen: Während der Projektarbeit in den Kleingruppen ist davon auszugehen, dass eine natürliche Differenzierung stattfindet. Dies wird durch die relativ offen gehaltenen elektronischen Arbeits- und Lernumgebungen gefördert, bei denen sich die Schüler entsprechend ihrer Fähigkeiten Graphiken zur Interpretation auswählen können. Auch weitere Fragestellungen können von den Schülern selbst ausgewählt bzw. vorgeschlagen werden. Allein Arbeits- und Lernumgebung 3 ist im Vergleich zu den anderen relativ vorstrukturiert aber gleichzei- 10. Analyse und Überarbeitung eines ausgewählten Unterrichtsvorschlages 202 tig anspruchsvoller, da sie das Berechnen von Mittelwerten mithilfe der Software sowie die Fähigkeit zur informellen Interpolation und Extrapolation erfordert. Somit ist sie eher für leistungsstärkere Schüler geeignet. Insgesamt wurde versucht, durch die Überarbeitung und Erweiterung des Unter- richtsvorschlags „Looking at Mystery Data“ (Russell & Corwin, 1989) eine systematische- re und tiefgründigere Beschäftigung mit numerischen Daten zum Thema „Körpermaße“ zu erreichen, bei dem sowohl innermathematische Bezüge zur Geometrie, insbesondere zum Messen von Längen, als auch außermathematische Bezüge zur Biologie hergestellt werden können. Die mathematischen Erkenntnisse aus dem Projekt sind auch bezüglich ihrer All- tagsrelevanz zu diskutieren, damit den Schülern deutlich wird, dass diese statistischen Zu- sammenhänge wichtige Hinweise über Konfektionsgrößen für die Textilindustrie geben. Auch wenn kein gewöhnlicher Durchlauf des Datenanalyseprozesses in dieser Unter- richtseinheit stattfindet, so wird trotzdem Datenkompetenz in einem umfassenden Sinn gefördert und ist in einen Problemlösekontext eingebettet. Es werden Datensätze beschrie- ben, Daten gesammelt, Graphiken interaktiv hergestellt, Hypothesen aufgestellt und über- prüft etc., so dass fast alle in Kapitel 3 aufgeführten Aspekte von Datenkompetenz von Relevanz sind (vgl. Kapitel 3). Dennoch ist besonders im Abschnitt 10.3 deutlich gewor- den, dass es schwierig ist, Datensätze zu finden, bei denen die Verteilungsform zur Aufde- ckung der Sachsituation von Relevanz ist. Zumeist benötigt man nur Streu- und Lagemaße, um sinnvolle Theorien über die Sachsituation zu entwickeln. Beim Design der Arbeits- und Lernumgebungen für das Projekt (vgl. Abschnitt 10.4) tritt zudem die Schwierigkeit auf, für den Unterricht geeignete Sekundärstatistiken zu finden. Es bleibt allerdings offen, inwiefern die überarbeitete Unterrichtseinheit in der Praxis wirklich erfolgreich einsetzbar ist, da die Unterrichtseinheit im Rahmen dieser Arbeit nicht in der Schule erprobt werden konnte. 11. Zusammenfassung und Ausblick 203 11. Zusammenfassung und Ausblick Ausgangspunkt dieser Arbeit ist die Frage, welchen Beitrag zur Entwicklung und Förderung von Datenkompetenz der Mathematikunterricht in den Klassen 1-6 bereits leis- ten kann und sollte. Die Ergebnisse, zu denen ich im Verlauf dieser Arbeit gekommen bin, sollen im Folgenden pointierend zusammengefasst werden. Zudem wird in Form eines kurzen Ausblicks darauf eingegangen, welche Fragen offen geblieben sind und daher wei- terer Analyse- und Forschungsarbeit bedürfen. In Kapitel 2 wird durch den Vergleich der klassischen Statistik mit der EDA heraus- gearbeitet, dass man im Schulunterricht, insbesondere auch in den unteren Jahrgangsstu- fen, einen explorativen Umgang mit Daten favorisieren sollte. Dies begründet sich zum einen in der relativen Einfachheit der Konzepte und Methoden der EDA im Vergleich zur klassischen Statistik und zum anderen in dem Prozesscharakter des Erkenntniserwerbs, welcher ein entdeckendes Lernen ermöglicht und Umwege und Fehler als Lernchancen betrachtet. In Kapitel 3 wird auf Grundlage eines explorativen Umgangs mit Daten definiert, was im Rahmen dieser Arbeit unter „Datenkompetenz“ verstanden wird. Datenkompetenz umfasst sowohl inhaltsbezogene, mathematische Teilkompetenzen, wie das Sammeln, Dar- stellen und Beschreiben von Daten, die in den unterschiedlichen Prozessphasen der Daten- analyse relevant sind, als auch prozessbezogene Kompetenzen, wie die Transformation einer Fragestellung in eine statistische Frage oder die Reflexion über die Auswahl geeigne- ter Methoden. Außerdem wird aus pragmatisch-kultureller, pädagogisch-didaktischer, for- mal bildender und lernpsychologischer Perspektive begründet, dass eine frühe Förderung von Datenkompetenz unbedingt notwendig ist und dass diese Förderung als ein den Ma- thematikunterricht durchziehendes Prinzip im Sinne eines Spiralcurriculums erfolgen soll- te. Die Idee des Spiralprinzips wird auch in den NCTM-Standards 2000 systematisch verfolgt. Der NCTM-Standard zur Datenanalyse wird in Kapitel 4 vorgestellt und mit den hessischen Curricula und den Bildungsstandards der Klassen 1-6 verglichen. Dabei stellt sich heraus, dass die Förderung von Datenkompetenz in den unteren Jahrgangsstufen einen peripheren Bestandteil der hessischen Curricula darstellt und dass sich Datenkompetenz zumeist auf die Teilkompetenzen des Sammelns und Darstellens von Daten beschränkt. Die Bildungsstandards sind zwar in dieser Hinsicht fortschrittlicher als die hessischen Lehrpläne, aber auch sie greifen nicht so weit wie die NCTM-Standards, denen ein umfas- 11. Zusammenfassung und Ausblick 204 senderer Begriff von Datenkompetenz zugrunde liegt und die eine spiralförmige Förderung anstreben. In den Kapiteln 5-8 werden Teilkompetenzen der Datenkompetenz ausführlich be- schrieben und erläutert, wie man diese im Unterricht der unteren Klassen geeignet fördern kann. In Analogie zu den Phasen einer Datenanalyse, werden in Kapitel 5 zunächst Krite- rien zur Auswahl von Themen und Datensätzen identifiziert, Schwierigkeiten bei der For- mulierung einer statistischen Fragestellung diskutiert und Methoden zur Datenerhebung dargestellt. Bezüglich der Auswahl der Themen und Datensätze hat es sich als besonders wichtig erwiesen, dass diese neben der Möglichkeit zur Entdeckung von Mustern und Strukturen inhaltlich interessant sein sollten und die Schüler diesbezüglich über Sachwis- sen verfügen müssen, welches ihnen eine Interpretation im Sachkontext erleichtert. Die Transformation einer inhaltlichen Fragestellung in eine statistische Fragestellung stellt für Schüler einen schwierigen Abstraktionsprozess dar, bei dem eine Einsicht in den Modell- charakter von Daten und eine hohe sprachliche Kompetenz zur genauen Formulierung er- forderlich sind. Nach der Aufstellung der statistischen Frage folgt die Entscheidung, wie man Daten sammelt, wobei Schüler der Klassen 1-6 im Verlauf der Zeit mit den Methoden der Befragung, Beobachtung und des Experiments und den jeweiligen Schwierigkeiten der einzelnen Verfahren vertraut werden sollten. In Kapitel 6 werden Wege aufgezeigt, wie man Schüler beim Erwerb von Graphik- kompetenz unterstützen kann. Diese ist ein besonders wichtiger Bestandteil der Daten- kompetenz, da graphische Darstellungen das Erkenntnismittel der (Explorativen) Daten- analyse darstellen. Die verschiedenen graphischen Darstellungen werden zunächst syste- matisiert und anschließend ausführlich einzeln vorgestellt. Es werden sowohl zu Graphiken univariater Daten als auch zu Graphiken bivariater Daten unterrichtspraktische Möglich- keiten zur Einführung angegeben, wobei sich als besonders wichtig herausstellt, dass dazu verschiedene Repräsentationsebenen genutzt werden. Schüler sollen jedoch nicht nur ver- schiedene Graphiken isoliert voneinander betrachten, sondern die Beziehung zwischen „verwandten“ Darstellungen entdecken, was besonders durch den Vergleich von verschie- denen Graphiken eines Merkmals und durch Transformationsübungen gelingen kann. Da- bei wird auch die Beziehung zwischen Geometrie und Statistik deutlich, da der Zusam- menhang zwischen Daten in Form von geometrischen Zusammenhängen in Graphiken abgebildet wird. Auch ist es wichtig Schülern vor Augen zu halten, dass Graphiken nicht zum Selbstzweck hergestellt werden, sondern dass diese als Mittel zur Beantwortung der statistischen Frage dienen. Bei der Diskussion von computergestützter Datenverarbeitung 11. Zusammenfassung und Ausblick 205 anhand der Software TinkerPlotsTM hat sich herausgestellt, dass diese Software sowohl als Werkzeug für Lernende als auch für Lehrende geeignet ist. Sie unterstützt Lernende beim konstruktiven Erwerb von Graphikkompetenz, da sie das Erfinden eigener, alternativer Darstellungen ermöglicht und sie hilft Lehrenden beim Design von Arbeitsumgebungen zur Datenanalyse. Bei der Untersuchung, wie sich das Verständnis graphischer Darstellun- gen entwickelt, kristallisieren sich drei Ebenen heraus. Während auf der ersten Ebene (Read the data) lediglich explizit im Graphen gegebene Informationen abgelesen werden, werden durch mathematische Operationen und Relationen auf der zweiten Ebene (Read between the data) bereits Strukturen in den Daten entdeckt, die auf der dritten Ebene (Read beyond the data) unter Einbeziehung von Hintergrundwissen zum Schlussfolgern genutzt werden. Diese Entwicklung sollte im Unterricht durch explizite Fragen, die auf bestimmte Verständnisebenen zielen, gefördert werden. In Kapitel 7 werden für die Klassen 1-6 geeignete Begriffe und Methoden zur Be- schreibung und Interpretation von Daten kritisch diskutiert und es werden auf verschiede- nen Repräsentationsebenen Möglichkeiten zur Einführung im Unterricht aufgeführt. Dabei zeigt sich, dass einige statistische Begriffe im Vergleich zu anderen leichter einzuführen sind und für Schüler auch leichter zu verstehen sind. Dazu gehören Begriffe zur Beschrei- bung von Auffälligkeiten in Daten, Begriffe zur Beschreibung der Verteilungsform und der Streuung. Lageparameter, insbesondere das arithmetische Mittel, sind aufgrund ihrer kom- plexen Eigenschaften schwieriger für Schüler zu verstehen. Insgesamt wird herausgearbei- tet, dass es bei der Einführung statistischer Begriffe in erster Linie darum geht, begriffliche Konzepte aufzubauen, anstatt lediglich prozedurales Wissen, wie etwa den Algorithmus zur Berechnung des arithmetischen Mittels, zu vermitteln. Konzeptionelles Wissen, wozu auch die geeignete Auswahl von statistischen Begriffen gehört, muss die Basis für proze- durales Wissen darstellen. Neben der Einführung konventioneller statistischer Begriffe wird auch diskutiert, wie man auf intuitiven Ideen zur „Mitte“ oder zum „Zentrum“ der Daten aufbauen kann, um später eine sinnvolle Interpretation von konventionellen Begrif- fen zu erreichen. So kann etwa die intuitive Verwendung von modalen Gruppen (modal clump) als Fundament dienen, um formale statistische Methoden und Begriffe einzuführen. Diese Vorgehensweise wird auch durch die Software TinkerPlotsTM unterstützt, welche es Schülern ermöglicht, informelle Methoden anzuwenden. Bezüglich des schwierigen Ver- gleichs zweier Datensätze, der insbesondere bei unterschiedlicher Gruppengröße zu Prob- lemen führt, müssen die Schüler lernen, dass ein Gruppenvergleich bei gleicher Gruppen- größe andere Strategien erfordert als ein Vergleich bei unterschiedlicher Gruppengröße. 11. Zusammenfassung und Ausblick 206 Besonders im letzteren Fall müssen im Unterricht alternative, informelle Strategien zuge- lassen werden, wie etwa die Strategie des Halbierens von Datensätzen, die einen Vergleich anhand der oberen und unteren Streuung in den Mittelpunkt stellt und ebenfalls mit der Software TinkerPlotsTM realisierbar ist. Abschließend wird noch einmal herausgestellt, dass eine Interpretation der Daten unbedingt im Sachkontext erfolgen muss und dass Schü- ler die zu beantwortende Fragestellung nicht aus den Augen verlieren dürfen. Da auch Fragestellungen untersucht werden, bei denen eine Totalerhebung von Da- ten schwierig ist, wird in Kapitel 8 die Beziehung zwischen einer Stichprobe und der Popu- lation beleuchtet. Es lässt sich erkennen, dass ein Verständnis dieser Beziehung für Schüler sehr anspruchsvoll ist. Dies liegt darin begründet, dass für ein adäquates Verständnis die Eigenschaft der Repräsentativität, die Größe des Stichprobenumfangs und die Art der Stichprobenziehung von Bedeutung sind. Während Schüler noch am ehesten verstehen, dass größere Stichproben auch verlässlicher sind, ist die Methode der Zufallsstichprobe schwer nachvollziehbar, da diese im Gegensatz zur Quotenstichprobe auf keiner Intuition aufbaut und auch in der Geschichte der Statistik schwer durchsetzbar war. Alles in allem geht das Begriffsverständnis einer Stichprobe nicht einher mit der kognitiven Weiterent- wicklung und bedarf daher gezielter Instruktion. Allerdings bedarf die Klärung der Frage, wie man eine Einsicht in die Inferenzstatistik fördern kann, weiterer Forschung. Um Lehrkräften einen Überblick über bereits bestehende Unterrichtsmaterialien zur Datenanalyse und eine Hilfe bei der Auswahl derselbigen zu geben, werden in Kapitel 9 Bewertungskriterien für Unterrichtsmaterialien entwickelt und angewandt, um die mir be- kannten Materialien einzuordnen. Dabei stellt sich heraus, dass in Deutschland wenige Materialien existieren, die über das traditionelle Sachrechnen hinausgehen und denen ein umfassender Begriff von Datenkompetenz zugrunde liegt. Diese Beobachtung bestätigt die Ergebnisse der Analyse der hessischen Lehrpläne in Kapitel 4, welche gezeigt haben, dass der Datenanalyse in den unteren Klassen nur ein geringer Stellenwert zugeschrieben wird. Da viele der bereits existierenden Unterrichtsvorschläge einer Überarbeitung bedür- fen, wird im letzten Kapitel abschließend ein ausgewählter Unterrichtsvorschlag exempla- risch analysiert, überarbeitet und erweitert. Dabei werden unter anderem Schwierigkeiten bei der Auswahl geeigneter Sekundärstatistiken deutlich. Zusammenfassend lässt sich folgende Tendenz im Lehren und Lernen von Statistik und Datenanalyse in den unteren Klassen identifizieren: Das Lernen von Datenanalyse wird zunehmend als ein dynamischer und längerfristiger Prozess angesehen, in welchem 11. Zusammenfassung und Ausblick 207 von intuitiven Ideen der Schüler ausgegangen wird, um tragfähige Grundvorstellungen und begriffliche Konzepte aufzubauen. Diese didaktische Orientierung am informellen Wissen der Schüler erfolgt sowohl in den ersten drei Schuljahren, in denen Datenanalyse eher in propädeutischer Form gelehrt wird, als auch in den Jahrgangsstufen 4-6, in denen eine sys- tematische Behandlung der Datenanalyse angestrebt wird. Offen bleibt, inwieweit alle angeführten Vorschläge im Unterricht wirklich effektiv die Förderung von Datenkompetenz unterstützen. Eine Aufgabe liegt also in der Entwick- lung und Erprobung von Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6, wel- che im Einklang mit den erarbeiteten didaktischen Prinzipien stehen. Insbesondere ein Vergleich zwischen Unterrichtsmaterialien mit und ohne Einbezug von Software könnte Aufschluss darüber geben, welche Vorgehensweise bei den Schülern zu einem verständi- geren Umgang mit Daten führt. Dazu müsste allerdings die Software TinkerPlotsTM in deutscher Sprache vorliegen. Neben der Entwicklung und Erprobung von Unterrichtsmaterialien sind jedoch auch praktische Maßnahmen in der Aus- und Weiterbildung von Mathematiklehrern, insbeson- dere von Mathematiklehrern im Primarbereich, nötig. Will man eine veränderte Unter- richtspraxis zugunsten verstärkter Förderung von Datenkompetenz erreichen, so muss das mathematische Teilgebiet der Datenanalyse, oder besser das gesamte Gebiet der Sto- chastik, in die Aus- und Weiterbildung aller Mathematiklehrer integriert werden. Nur so kann man ein Bewusstsein dafür schaffen, dass Datenkompetenz in einem längerfristigen, spiralförmigen Prozess aufgebaut werden muss. 12. Literaturverzeichnis 208 12. Literaturverzeichnis BAUMERT, J./ KLIEME, E./ NEUBRAND, M./ PRENZEL, M./ SCHIEFELE, U./ SCHNEIDER, W./ TILLMANN, K.-J./ WEIß, M. (2000). Internationales und nationales Rahmenkonzept für die Erfassung von mathematischer Grundbildung in PISA. Berlin: OECD PISA- Deutschland. (www.mpib-berlin.mpg.de/pisa/KurzFrameworkMaths.pdf; Zugriff: 25.11.2004) BIEHLER, R. (1982). Explorative Datenanalyse – Eine Untersuchung aus der Perspektive einer deskriptiv-empirischen Wissenschaftstheorie. IDM Materialien und Studien Band 24. Bielefeld: Universität Bielefeld. BIEHLER, R. (1985). Graphische Darstellungen. mathematica didactica, 8, 57-81. BIEHLER, R. (1995a). Explorative Datenanalyse als Impuls für fächerverbindende Daten- analyse in der Schule. Hintergründe und Besonderheiten ihrer Arbeitsweise, Kon- zepte und Methoden. Computer und Unterricht, 17, 56-66. BIEHLER, R. (1995b). Funktionales Denken und statistische Zusammenhänge. In K.P. Mül- ler (Hrsg.), Beiträge zum Mathematikunterricht. Vorträge auf der 29. Tagung für Didaktik der Mathematik vom 6. bis 10. März 1995 in Kassel (S. 98-101). Hildes- heim: Franzbecker Verlag. BIEHLER, R. (1999). Auf Entdeckungsreise in Daten. Mathematik lehren, 97, 4-5. BIEHLER, R. (2001). Statistische Kompetenz von Schülerinnen und Schülern - Konzepte und Ergebnisse empirischer Studien am Beispiel des Vergleichens von statistischen Verteilungen. In M. Borovcnik/ J. Engel/ D. Wickmann (Hrsg.), Anregungen zum Stochastikunterricht: Die NCTM-Standards 2000. Klassische und Bayessche Sichtweise im Vergleich (S. 97-114). Hildesheim, Berlin: Franzbecker Verlag. BIEHLER, R. & STEINBRING, H. (1991). Entdeckende Statistik, Stengel-und-Blätter, Box- plots: Konzepte, Begründungen und Erfahrungen eines Unterrichtsversuches. Der Mathematikunterricht, 37 (6), 5-32. BIEHLER, R./ KOMBRINK, K./ SCHWEYNOCH, S. (2003). Muffins: Medien- und Freizeitges- taltung für interessanten Stochastikunterricht. Universität Kassel. 12. Literaturverzeichnis 209 BIEHLER, R. & WEBER, W. (1995). Entdeckungsreisen im Daten-Land. Computer und Un- terricht, 17, 4-9. BLUM, W. (1996). Anwendungsbezüge im Mathematikunterricht – Trends und Perspekti- ven. In G. Kadunz, et al. (Hrsg.), Trends und Perspektiven. Schriftenreihe Didaktik der Mathematik, Band 23 (S. 15-38). Wien: Hölder-Pichler-Tempsky. BLUM, W. & VON HOFE, R. (2003). Welche Grundvorstellungen stecken in der Aufgabe? mathematik lehren, Heft 118, 14-18. BOHAN, H./ IRBY, B./ VOGEL, D. (1995). Problem Solving: Dealing with Data in the Ele- mentary School. Teaching Children Mathematics, 1 (5), 256-260. BÖNIG, D. & RUWISCH, S. (2004). Daten gewinnen, darstellen, verarbeiten und interpretie- ren. Die Grundschulzeitschrift, 18 (172), 6-9. BOROVCNIK, M. (1990). Explorative Datenanalyse - Techniken und Leitideen. Didaktik der Mathematik 18 (1), 61-80. BOROVCNIK, M. (1992). Stochastik im Wechselspiel von Intuitionen und Mathematik. Mannheim, Leipzig, Wien, Zürich: BI-Wissenschaftsverlag. BOROVCNIK, M & OSSIMITZ, G. (1987). Materialien zur Beschreibenden Statistik und Explorativen Datenanalyse. Schriftenreihe Didaktik der Mathematik, Band 11. Wien/ Stuttgart: Hölder - Pichler – Tempsky/ Teubner. BRIGHT, G. W. & FRIEL, S. N. (1998). Graphical Representations: Helping Students Inter- pret Data. In S. P Lajoie (Hrsg.), Reflections on Statistics: Learning, Teaching, and Assessment in Grades K-12 (S. 63-88). Mahwah, New Jersey: Lawrence Erlbaum. CASSEL, D. (1990). Was verstehen wir unter dem Erwartungswert? Stochastik in der Schu- le, 9 (1), 13-19. CHAPIN, S./ KOZIOL, A./ MACPHERSON, J./ REZBA, C. (2002). Navigating through Data Analysis and Probability in Grades 3-5. Principles and Standards for School Mathematics Navigations Series. Reston, VA: National Council of Teachers of Mathematics. 12. Literaturverzeichnis 210 CORTINA, J. L. (2002). Developing Instructional Conjectures About How to Support Stu- dents’ Understanding of the Arithmetic Mean as a Ratio. Paper presented at the Sixth International Conference on Teaching Statistics (ICOTS 6). Cape Town, South Africa. CORWIN, R. B. & FRIEL, S. N. (1990). Statistics: Prediction and Sampling. A unit of study for grades 5-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. CURCIO, F. R. (1987). Comprehension of Mathematical Relationships Expressed in Graphs. Journal for Research in Mathematics Education, 18 (5), 382-393. CURCIO, F. R. (2001). Developing Data-Graph Comprehension in Grades K-8. 2. Aufl. Reston, VA: National Council of Teachers of Mathematics. CURCIO, F. R. & FOLKSON, S. (1996). Exploring Data: Kindergarten Children Do It Their Way. Teaching Children Mathematics, 2 (6); 382-385. DU FEU, C. (1995). Piktogramme. Stochastik in der Schule, 15 (1), 35-42. DUNKELS, A. (1990). Stengel-Blatt-Diagramme in der Grundschule. Stochastik in der Schule, 9 (1), 4-12. FRIEL, S. N. (1998). Teaching Statistics. What’s Average? In L. J. Morrow/ M. Kenney (Hrsg.), The Teaching and Learning of Algorithms in School Mathematics (S. 208- 217). Reston, VA: National Council of Teachers of Mathematics. FRIEL, S. N./ CURCIO, F. R./ BRIGHT, G. W. (2001). Making Sense of Graphs: Critical Fac- tors Influencing Comprehension and Instructional Implications. Journal for Re- search in Mathematics Education, 32 (2), 124-158. FRIEL, S. N./ MOKROS, J.R./ RUSSELL, S. J. (1991). Statistics: Middles, Means, and In- Betweens. A unit of study for grades 5-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. GIGERENZER, G. & KRAUSS, S. (2001). Statistisches Denken oder statistische Rituale: Was soll man unterrichten? In M. Borovcnik/ J. Engel/ D. Wickmann (Hrsg.), Anregun- gen zum Stochastikunterricht: Die NCTM-Standards 2000. Klassische und Bayess- che Sichtweise im Vergleich (S. 53-62). Hildesheim, Berlin: Franzbecker Verlag. 12. Literaturverzeichnis 211 GUDER, K.-U. (2002). Wird es morgen regnen? Mittelwerte und Vorhersage. Sache - Wort - Zahl, 30 (46), 40-48. HANCOCK, C. (1995). Das Erlernen der Datenanalyse durch anderweitige Beschäftigungen. Grundlagen von Datenkompetenz („Data Literacy“) bei Schülerinnen und Schülern in den Klassen 1-7. Computer und Unterricht, 17, 33-39. HESSISCHES KULTUSMINISTERIUM (1995). Rahmenplan Grundschule. Wiesbaden. (http://grundschule.bildung.hessen.de/Rahmenplan; Zugriff: 02.10.2004) HESSISCHES KULTUSMINISTERIUM (2002a). Lehrplan Mathematik. Bildungsgang Haupt- schule. Jahrgangsstufen 5 bis 9/10. Wiesbaden. (http://lernarchiv.bildung.hessen.de/archiv/lehrplaene/hauptschule; Zugriff: 02.10.2004) HESSISCHES KULTUSMINISTERIUM (2002b). Lehrplan Mathematik. Bildungsgang Realschu- le. Jahrgangsstufen 5 bis 10. Wiesbaden. (http://lernarchiv.bildung.hessen.de/archiv/lehrplaene/realschule; Zugriff: 02.10.2004) HESSISCHES KULTUSMINISTERIUM (2002c). Lehrplan Mathematik. Gymnasialer Bildungs- gang. Jahrgangsstufen 5 bis 13. Wiesbaden. (http://lernarchiv.bildung.hessen.de/archiv/lehrplaene/gymnasium; Zugriff: 02.10.2004) HOLLINGSWORTH, C. (1995). Ein Einstieg in die Statistik mit Cuisenaire-Stäben. Stochastik in der Schule, 15 (3), 2-3. HUMENBERGER, J. & REICHEL, H.-C. (1995). Fundamentale Ideen der Angewandten Ma- thematik. Mannheim: BI Wissenschaftsverlag. HUSSAIN, M. & BOROVCNIK, M. (1995). Was ist Statistik. Stochastik in der Schule, 15 (1), 3-12. KNIEP-RIEHM, E.-M. (1995). Wie ist das eigentlich mit dem Weihnachtsfest? Anbahnen und Entfalten soziales Handlungskompetenz durch Mathematisieren bedeutsamer Fragen aus der kindlichen Lebenswelt. Computer und Unterricht, 17, 28-32. 12. Literaturverzeichnis 212 KONOLD, C. (2005). Exploring Data with TinkerPlotsTM. Emeryville, California: Key Cur- riculum Press. KONOLD, C. (2002). Teaching Concepts Rather Than Conventions. Draft Version: 1/16/02. (http://www.umass.edu/srri/serg/papers.html; Zugriff: 13.03.2005) KONOLD, C. & HIGGINS, T. L. (2001). Working With Data. Highlights of Related Research. Draft Version: 1/31/01. (http://www.umass.edu/srri/serg/papers.html; Zugriff: 15.03.2005) KONOLD, C. & HIGGINS, T. L. (2003). Reasoning About Data. In J. Kilpatrick/ W. G. Mar- tin/ D. Schifter (Hrsg.), A Research Companion to Principles and Standards for School Mathematics (S. 193-215). Reston, VA: National Council of Teachers of Mathematics. KONOLD, C., ROBINSON, A., KHALIL, K., POLLATSEK, A., WELL, A., WING, R., & MAYR, S. (2002). Students' Use of Modal Clumps to Summarize Data. Paper presented at the Sixth International Conference on Teaching Statistics (ICOTS 6). Cape Town, South Africa. (http://www.umass.edu/srri/serg/papers.html; Zugriff: 13.04.2005) KULTUSMINISTERKONFERENZ (2003). Bildungsstandards im Fach Mathematik für den Mitt- leren Schulabschluss (Jahrgangsstufe 10). Bonn. (http://www.kmk.org/schul/Bildungsstandards/bildungsstandards.htm; Zugriff: 11.10.2004) KULTUSMINISTERKONFERENZ (2004a). Vereinbarung über Bildungsstandards für den Pri- marbereich (Jahrgangsstufe 4). Bonn. (http://www.kmk.org/schul/Bildungsstandards/bildungsstandards.htm; Zugriff: 11.10.2004) KULTUSMINISTERKONFERENZ (2004b). Bildungsstandards im Fach Mathematik für den Hauptschulabschluss (Jahrgangsstufe 9). Bonn. (http://www.kmk.org/schul/Bildungsstandards/bildungsstandards.htm; Zugriff: 11.10.2004) KÜTTING, H. (1985). Stochastisches Denken in der Schule – Grundlegende Ideen und Me- thoden. Der Mathematikunterricht, 31 (4), 87-106. 12. Literaturverzeichnis 213 LANDWEHR, J. M. & WATKINS, A. E. (1995). Exploring Data. Quantitative Literacy Series. Revised Edition. Palo Alto, CA: Dale Seymour Publications. LAUTER, J. (1991). Fundament der Grundschulmathematik. Pädagogisch-didaktische As- pekte des Mathematikunterrichts in der Grundschule. Donauwörth: Ludwig Auer. LENEKE, B. (1999). Wir lernen uns kennen – ein Projekt zum Umgang mit Daten. MUP, 20(1), 17-22. LINDQUIST, M.M./ LUQUIRE, J./ GARDNER, A./ SHEKARAMIZ, S. (1992). Making Sense of Data. Curriculum and Evaluation Standards for School Mathematics Addenda Se- ries, Grades K-6. Reston, VA: National Council of Teachers of Mathematics. MCCLAIN, K. & COBB, P. (2001). Supporting Students’ Ability to Reason about Data. Edu- cational Studies in Mathematics, 45 (1-3), 103-129. MIRWALD, E. & NITSCH, B. (2001). Wie viele Gänseblümchen stehen auf unserer Som- merwiese? Grundschulunterricht, 48 (6), 21-23. MOKROS, J. & RUSSELL, S. J. (1995). Children’s Concept of Average and Representative- ness. Journal for Research in Mathematics Education, 26 (1), 20-39. MOORE, D. S. (1997). Statistics: Concepts and Controversies. 4. Aufl., New York: Free- man. NATIONAL COUNCIL OF TEACHERS OF MATHEMATICS (2001). Prinzipien und Standards für Schulmathematik: Datenanalyse und Wahrscheinlichkeit. (Übersetzt von Christine Bescherer und Joachim Engel, Ludwigsburg). In M. Borovcnik/ J. Engel/ D. Wick- mann (Hrsg.), Anregungen zum Stochastikunterricht: Die NCTM-Standards 2000. Klassische und Bayessche Sichtweise im Vergleich (S. 11-42). Hildesheim, Berlin: Franzbecker Verlag. NATIONAL COUNCIL OF TEACHERS OF MATHEMATICS (2002). Answers to Frequently Asked Questions about Principles and Standards for School Mathematics. Reston, VA: National Council of Teachers of Mathematics. (http://standards.nctm.org/; Zugriff: 05.04.2005) PEREIRA-MENDOZA, L. (1995). Graphisches Darstellen von Daten in der Grundschule: Al- gorithmus kontra Verständnis. Stochastik in der Schule, 15 (3), S. 5-12. 12. Literaturverzeichnis 214 POLLATSEK, A., LIMA, S., & WELL, A. (1981). Concept or computation: Students' miscon- ceptions of the mean. Educational Studies in Mathematics, 12, 191-204. POLLOK, B. (1995). Vielseher lesen wenig! Computer und Unterricht, 17, 21-27. RUSSELL, S.J. & CORWIN, R.B. (1989). Statistics: The Shape of the Data. A unit of study for grades 4-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. RUSSELL, S. J. & CORWIN, R.B. (1990). Sorting: Groups and Graphs. A unit of study for grades 2-3 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. RUSSELL, S. J. & MOKROS, J. (1996). What Do Children Understand about Average? Teaching Children Mathematics, 2 (6), 360-364. SCHWARTZ, D. L./ GOLDMAN, S. R./ VYE, N. J./ BARRON, B. J. (1998). Aligning Everyday and Mathematical Reasoning: The Case of Sampling Assumptions. In S. P Lajoie (Hrsg.), Reflections on Statistics: Learning, Teaching, and Assessment in Grades K-12 (S. 233-273). Mahwah, New Jersey: Lawrence Erlbaum. SCHWIRTZ, W. & BEGENAT, J. (2000). Sind größere Kinder auch schwerer? Ein Statistik- projekt in Klasse 3. Sache - Wort - Zahl, 28 (33), 45-51. SEIDEL, J. D. (1996). Gender, Ninja Turtles, and Pizza: Using a Classroom Database for Problem Solving. Teaching Children Mathematics, 3 (4), 192-199. SHEFFIELD, L.J./ CAVANAGH, M./ DACEY, L./ FINDELL, C.R./ GREENES, C.E./ SMALL, M. (2002). Navigating through Data Analysis and Probability in Prekindergarten - Grade 2. Principles and Standards for School Mathematics Navigations Series. Reston, VA: National Council of Teachers of Mathematics. SPIEGEL, H. (1982). Wie viele Streichhölzer sind in einer Streichholzschachtel? MUP, 3 (1), 3-14. SPIEGEL, H. (1985). Der Mittelwertabakus. Mathematik lehren, Heft 8, 16-18. STRAUSS, S. & BICHLER, E. (1988). The Development of Children’s Concepts of the Arithmetic Average. Journal for Research in Mathematics Education, 19 (1), 64-80. 12. Literaturverzeichnis 215 TUKEY, J. W. (1977). Exploratory Data Analysis. Reading, MA: Addison-Wesley. UCCELLINI, J. (1996). Teaching the Mean Meaningfully. Mathematics Teaching in the Middle School, 2 (3), 112-115. WATSON, J. M. & MORITZ, J. B. (2000). Developing Concepts of Sampling. Journal for Research in Mathematics Education, 31 (1), 44-70. WATSON, J. M. & MORITZ, J. B. (1999). The Beginning of Statistical Inference: Comparing Two Data Sets. Educational Studies in Mathematics, 37, 145-168. WILD, C. J. & PFANNKUCH, M. (1999). Statistical thinking in empirical enquiry (with dis- cussion). International Statistical Review, 67 (3), 221-266. WINTER, H. (1976). Erfahrungen zur Stochastik in der Grundschule (Klasse 1-6). Didaktik der Mathematik 1, 22-37. WINTER, H. (1983). Über die Entfaltung begrifflichen Denkens im Mathematikunterricht. Journal für Mathematik-Didaktik 3, 175-204. WINTER, H. & RÖSLER, J. (1995). Auf der Babystation. Mathematik lehren, Heft 70, 10-13. ZAWOJEWSKI, J. S. (1996). Polishing A Data Task: Seeking Better Assessment. Teaching Children Mathematics, 2 (6), 372-377. 12.1 Software TinkerPlotsTM. Version 1.0 (2005). Key Curriculum Press. Autoren: Konold & C., Miller, C. D. Informationen unter: http://www.keypress.com/tinkerplots/ 13. Literaturhinweise 216 13. Literaturhinweise 13.1 Verzeichnis der Unterrichtsmaterialien zur Datenanalyse in den Klassen 1-6 LINDQUIST, M.M./ LUQUIRE, J./ GARDNER, A./ SHEKARAMIZ, S. (1992). Making Sense of Data. Curriculum and Evaluation Standards for School Mathematics Addenda Se- ries, Grades K-6. Reston, VA: National Council of Teachers of Mathematics. Navigations Series SHEFFIELD, L.J./ CAVANAGH, M./ DACEY, L./ FINDELL, C.R./ GREENES, C.E./ SMALL, M. (2002). Navigating through Data Analysis and Probability in Prekindergarten - Grade 2. Principles and Standards for School Mathematics Navigations Series. Reston, VA: National Council of Teachers of Mathematics. CHAPIN, S./ KOZIOL, A./ MACPHERSON, J./ REZBA, C. (2002). Navigating through Data Analysis and Probability in Grades 3-5. Principles and Standards for School Mathematics Navigations Series. Reston, VA: National Council of Teachers of Mathematics. Used Numbers: Real Data in the Classroom STONE, A. & RUSSELL, S. J. (1990). Counting: Ourselves and Our Families. A unit of study for grades K-1 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. RUSSELL, S. J. & CORWIN, R.B. (1990). Sorting: Groups and Graphs. A unit of study for grades 2-3 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. CORWIN, R. B. & RUSSELL, S. J. (1990). Measuring: From Paces to Feet. A unit of study for grades 3-4 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. RUSSELL, S.J. & CORWIN, R. B. (1989). Statistics: The Shape of the Data. A unit of study for grades 4-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. 13. Literaturhinweise 217 CORWIN, R. B. & FRIEL, S. N. (1990). Statistics: Prediction and Sampling. A unit of study for grades 5-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. FRIEL, S. N./ MOKROS, J.R./ RUSSELL, S. J. (1991). Statistics: Middles, Means, and In- Betweens. A unit of study for grades 5-6 from USED NUMBERS: REAL DATA IN THE CLASSROOM. Palo Alto, CA: Dale Seymour Publications. Schwerpunkt Graphikkompetenz: CURCIO, F. R. (2001). Developing Data-Graph Comprehension in Grades K-8. 2. Aufl. Reston, VA: National Council of Teachers of Mathematics. 13.2 Verzeichnis der Themenhefte zur Datenanalyse in den Klassen 1-6 BÖNIG, D. & RUWISCH, S. (Hrsg.) (2004). Mit Daten umgehen. Die Grundschulzeitschrift, 18 (172) (März 2004). BLOOM, S. J./ CARLYLE, A./ EDGE, D./ IRVIN, B. B./ MOSES, B./ TANA, E./ WIGGAN, L. F./ TUNIS, H. B. (Hrsg.) (1996). Data Exploration. Teaching Children Mathematics, 2 (6) (Februar 1996). 13.3 Verzeichnis ausgewählter deutschsprachiger Artikel mit Unterrichtsvorschlä- gen zur Datenanalyse in den Klassen 1-6 Überblicksartikel: WINTER, H. & RÖSLER, J. (1995). Auf der Babystation. Mathematik lehren, Heft 70, 10-13. WINTER, H. (1989). Mein Lieblingstier. Elementarste Statistik im Schulanfang – neue Möglichkeiten für alte Ziele. Grundschule, 21 (12), 20-22. WINTER, H. (1987). Elementare Statistik. In: Mathematik entdecken. Neue Ansätze für den Unterricht in der Grundschule (S. 51-54). Frankfurt am Main: Cornelsen Scriptor. 13. Literaturhinweise 218 Graphische Darstellung von Daten: DUNKELS, A. (1990). Stengel-Blatt-Diagramme in der Grundschule. Stochastik in der Schule, 9 (1), 4-12. Allgemeine Projekte zum Umgang mit Daten: KNIEP-RIEHM, E.-M. (1995). Wie ist das eigentlich mit dem Weihnachtsfest? Anbahnen und Entfalten soziales Handlungskompetenz durch Mathematisieren bedeutsamer Fragen aus der kindlichen Lebenswelt. Computer und Unterricht, 17, 28-32. LENEKE, B. (1999). Wir lernen uns kennen – ein Projekt zum Umgang mit Daten. MUP, 20(1), 17-22. Projekt zur Entdeckung der Korrelation zweier Variablen: SCHWIRTZ, W. & BEGENAT, J. (2000). Sind größere Kinder auch schwerer? Ein Statistik- projekt in Klasse 3. Sache - Wort - Zahl, 28 (33), 45-51. Unterrichtsideen zum Mittelwerten und Inferenzstatistik: GUDER, K.-U. (2002). Wird es morgen regnen? Mittelwerte und Vorhersage. Sache - Wort - Zahl, 30 (46), 40-48. MIRWALD, E. & NITSCH, B. (2001). Wie viele Gänseblümchen stehen auf unserer Som- merwiese? Grundschulunterricht, 48 (6), 21-23. SPIEGEL, H. (1982). Wie viele Streichhölzer sind in einer Streichholzschachtel? MUP, 3 (1), 3-14. SPIEGEL, H. (1985). Der Mittelwertabakus. Mathematik lehren, Heft 8, 16-18. 14. Anhang 219 14. Anhang Anhang 1 Die Hundertstelscheibe (Hundredths Disk) (Darstellung aus: Curcio, 2001, S. 117) 14. Anhang 220 Anhang 2 Arbeits- und Lernumgebung 7.1 Collection 1 Datensatz 1 2 3 4 5 6 7 1,000 2,000 5,000 8,000 4,000 0,000 0,000 Collection 1 case 1 of 7 Attribute Value Datensatz 1,000 Collection 1 0 1 2 3 4 5 6 7 8 0 2 co un t Datensatz Circle Icon Der Datensatz besteht aus 7 Daten. 1.Verändere den obersten Datenwert mit dem Drag Value Tool und beobachte dabei den Median. Versuche deine Beobachtung zu erklären! 2. Zeichne auch das arithmetische Mittel ein und verändere wieder den obersten Datenwert. Was fällt dir auf? Kannst du deine Beobachtung begründen? 3. Überlege, was mit der Mitte der Spannweite (midrange) passiert, wenn man den obersten Datenwert ändert. Überprüfe deine Vermutung! 14. Anhang 221 Anhang 3 Arbeits- und Lernumgebung 7.2 Collection 1 Familiengrösse 1 2 3 4 5 6 4 4 4 4 4 4 Collection 1 case 1 of 6 Attribute Value Familiengrösse 4 Collection 1 1 3 5 7 9 0 2 4 6 co un t Familiengrösse Circle Icon Die Graphik zeigt die Familiengröße von 6 Familien. Alle Familien bestehen aus 4 Personen. Damit ist auch die durchschnittliche Familiengröße 4. a) Was passiert mit dem arithmetischen Mittel, wenn eine Familie aus 5 Personen besteht? Nutze das Drag Value Tool! Wie musst du die Daten verändern, damit der Durschnitt bei 4 bleibt? b) Die Familie mit 5 Personen bekommt Drillinge. Wie musst du die Daten verändern, damit die durchschnittliche Familiengröße weiterhin 4 beträgt? 14. Anhang 222 Anhang 4 Arbeitsblatt 1: Körpermaße 1.) Die Graphik zeigt die Länge eines Körperteils von 48 Kindern im Alter von 11 Jahren. Beschreibt den Datensatz mit den Begriffen, die ihr im Unterricht kennen gelernt habt. Einheit: cm (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 2.) Habt ihr eine Vermutung, was hier gemessen wurde? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 3.) Überprüft eure Vermutung, indem ihr innerhalb eurer Gruppe bei jeder Person dieses Körperteil messt. Tragt die Werte in die Tabelle ein! Name 14. Anhang 223 4.) Hat sich eure Vermutung bestätigt? Begründet eure Antwort! _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 5.) Falls ihr eure Vermutung nach der Datenerhebung in eurer Gruppe verworfen habt, könnte es trotzdem sein, dass sie gestimmt hat? Wann könnte dies so sein? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ Falls ihr eure Vermutung durch die gesammelten Daten bestätigt seht, könnte es trotzdem sein, dass diese falsch ist? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 14. Anhang 224 Anhang 5 Arbeitsblatt 2: Körpermaße 1.) Die Graphik zeigt die Länge eines Körperteils von 48 Kindern im Alter von 11 Jahren. Beschreibt den Datensatz mit den Begriffen, die ihr im Unterricht kennen gelernt habt. Einheit: cm (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 2.) Habt ihr eine Vermutung, was hier gemessen wurde? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 3.) Überprüft eure Vermutung, indem ihr innerhalb eurer Gruppe bei jeder Person dieses Körperteil messt. Tragt die Werte in die Tabelle ein! Name 14. Anhang 225 4.) Hat sich eure Vermutung bestätigt? Begründet eure Antwort! _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 5.) Falls ihr eure Vermutung nach der Datenerhebung in eurer Gruppe verworfen habt, könnte es trotzdem sein, dass sie gestimmt hat? Wann könnte dies so sein? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ Falls ihr eure Vermutung durch die gesammelten Daten bestätigt seht, könnte es trotzdem sein, dass diese falsch ist? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 14. Anhang 226 Anhang 6 Arbeitsblatt 3: Körpermaße 1.) Die Graphik zeigt die Länge eines Körperteils von 48 Kindern im Alter von 11 Jahren. Beschreibt den Datensatz mit den Begriffen, die ihr im Unterricht kennen gelernt habt. Einheit: cm (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 2.) Habt ihr eine Vermutung, was hier gemessen wurde? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 3.) Überprüft eure Vermutung, indem ihr innerhalb eurer Gruppe bei jeder Person dieses Körperteil messt. Tragt die Werte in die Tabelle ein! Name 14. Anhang 227 4.) Hat sich eure Vermutung bestätigt? Begründet eure Antwort! _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 5.) Falls ihr eure Vermutung nach der Datenerhebung in eurer Gruppe verworfen habt, könnte es trotzdem sein, dass sie gestimmt hat? Wann könnte dies so sein? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ Falls ihr eure Vermutung durch die gesammelten Daten bestätigt seht, könnte es trotzdem sein, dass diese falsch ist? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 14. Anhang 228 Anhang 7 Arbeitsblatt 4: Körpermaße 1.) Die Graphik zeigt die Länge eines Körperteils von 48 Kindern im Alter von 11 Jahren. Beschreibt den Datensatz mit den Begriffen, die ihr im Unterricht kennen gelernt habt. Einheit: cm (Quelle der Daten: http://www.censusatschool.ntu.ac.uk/ ) _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 2.) Habt ihr eine Vermutung, was hier gemessen wurde? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 3.) Überprüft eure Vermutung, indem ihr innerhalb eurer Gruppe bei jeder Person dieses Körperteil messt. Tragt die Werte in die Tabelle ein! Name 14. Anhang 229 4.) Hat sich eure Vermutung bestätigt? Begründet eure Antwort! _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 5.) Falls ihr eure Vermutung nach der Datenerhebung in eurer Gruppe verworfen habt, könnte es trotzdem sein, dass sie gestimmt hat? Wann könnte dies so sein? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ Falls ihr eure Vermutung durch die gesammelten Daten bestätigt seht, könnte es trotzdem sein, dass diese falsch ist? _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 14. Anhang 230 Anhang 8 Lösungsblatt zu den Arbeitsblättern 1-4: Arbeitsblatt 1: Lösung: Fußlänge in cm Alternative Lösung: Länge des Unterarms im cm (Ellenbogengelenk bis Handgelenk) Arbeitsblatt 2: Lösung: Länge der Handspanne in cm Alternative Lösung: Umfang des Handgelenks in cm Arbeitsblatt 3: Lösung: Umfang des Handgelenks in cm Alternative Lösung: Länge der Handspanne in cm Arbeitsblatt 4: Lösung: Körpergröße in cm Alternative Lösung: - 14. Anhang 231 Anhang 9 Arbeits- und Lernumgebung 10.1 zum Projekt „Körpermaße“ Der Datensatz zeigt die Körpermaße von 200 Kindern im Alter von 7-11 Jahren, sowie deren Alter, Geschlecht und Geburtsdatum. _ uelle der Daten: tschool.ntu.ac.uk/ ______________________________ Q http://www.censusa Download einer Stichprobe vom Um- fang 200 am 17.05.2005 Collection 1 case 1 of 200 Attribute Value Unit Geburtsdatum 18/10/1991 Gender M Alter 11 Körpergrösse 153 Fusslänge 22 Handspanne 19 Umfang_Handgelenk_mm 150 Umfang_Handgelenk_cm 15 Zusammenhang zwischen Körpergröße und Fußlänge 1.) Welchen Zusammenhang vermutet ihr zwischen Körpergröße und Fußlänge? 2.) Beschreibt die unten stehende Graphik. Wie wird darin der Zusammenhang zwischen diesen beiden Größen deutlich? Bestätigt sich darin eure Vermutung? Collection 1 70 90 110 130 150 170 190 0 10 20 30 40 Fu ss lä ng e Körpergrösse Circle Icon 3.) Stellt eine andere Graphik her und untersucht, wie der Zusammenhang zwischen den beiden Variablen darin visualisiert wird. 4.) Stellt weitere Fragen an den Datensatz und untersucht dazu geeignete Graphiken! Beispiele: Hängt die Fußlänge vom Alter ab? Haben Jungen größere Füße als Mädchen? Welcher Zusammenhang besteht zwischen der Handspanne und dem Umfang des Handge- lenks?... 14. Anhang 232 Anhang 10 Arbeits- und Lernumgebung 10.2 zum Projekt „Körpermaße“ Der Datensatz zeigt die Körpermaße von 200 Kindern im Altern von 7-11 Jahren, sowie deren Alter, Geschlecht und Ge- burtsdatum. _ uelle der Daten: tschool.ntu.ac.uk/ _________________________________ Q http://www.censusa g Download einer Stichprobe vom Umfan 200 am 17.05.2005. Collection 1 case 1 of 200 Attribute Value Geburtsdatum 18/10/1991 Gender M Alter 11 Körpergrösse 153 Fusslänge 22 Handspanne 19 Umfang_Handgelenk_mm 150 Umfang_Handgelenk_cm 15 Zusammenhang zwischen der Länge der Handspanne und dem Umfang des Handge- lenks 1.) Welchen Zusammenhang vermutet ihr zwischen der Länge der Handspanne und dem Umfang des Handgelenks? 2.) Beschreibt die unten stehende Graphik. Wie wird darin der Zusammenhang zwischen diesen beiden Größen deutlich? Bestätigt sich eure Vermutung? Collection 1 0-9,9 10-19,9 20-30 0-14,99 15-29,99 30-45 H an ds pa nn e Umfang_Handgelenk_cm Circle Icon 3.) Stellt eine Graphik her, aus der der Zusammenhang zwischen der Länge der Handspan- ne und dem Umfang des Handgelenks deutlich wird. Beschreibt die Graphik! Erklärt, ob sich eure Vermutung mit Hilfe dieser Graphik bekräftigen lässt! 4.) Stellt weitere Fragen an den Datensatz und untersucht dazu geeignete Graphiken! Beispiele: Hängt die Fußlänge vom Alter ab? Haben Jungen größere Füße als Mädchen? Welcher Zusammenhang besteht zwischen der Körpergröße und dem Umfang des Handge- lenks?... 14. Anhang 233 Anhang 11 Arbeits- und Lernumgebung 10.3 zum Projekt „Körpermaße“ Collection 1 case 1 of 200 Attribute Value Unit Geburtsdatum 14/02/1993 Alter 11 Geschlecht M Körpergrösse 157 cm Vertikal_err_Höhe 206 cm Fusslänge 13 cm Kopfumfang 45 cm Dieser Datensatz zeigt einige Körpermaße von 200 Kindern im Alter von 6-11 Jah- ren, sowie deren Alter, Geschlecht und Geburtsdatum. _ uelle der Daten: tschool.ntu.ac.uk/ _________________________________ Q http://www.censusa Download am 21.05.2005 Erläuterung zu den Attributen: " gibt die vertikal erreichte Höhe an, die Schüler durch usammenhang zwischen der Körpergröße und der vertikal erreichbaren Höhe .) Welchen Zusammenhang vermutet ihr zwischen der Körpergröße und der vertikal er- beiden Attribute in der Datentabelle an. Um wieviel größer ist die ver- Das Attribut "Verikal_err_Höhe Arm ausstrecken und auf die Zehenspitzen stellen erreichen können. Z 1 reichbaren Höhe? 2.) Schaut euch die tikal erreichbare Höhe? Schätzt zunächst, berechnet dann einen Wert. Ihr könnt dazu auch TinkerPlots verwenden! Collection 1 ... ... ... Körpergrösse Vertikal_err_Höhe F 1 2 3 4 5 6 7 8 9 10 11 1... 11 M 157 206 1 2... 10 M 139 183 2 2... 11 F 142 198 2 2... 11 M 143 2 0... 11 M 156 230 2 0... 9 F 151 181 2 0... 11 F 155 200 2 0... 11 F 163 207 2 2... 10 F 141 177 2 0... 11 M 175 227 2 0... 10 F 139 178 1 .) Welche Höhe kann ein Schüler der Größe 190 cm erreichen? Welche ein Schüler der 3 Größe 90 cm? 14. Anhang 234 4.) Zieht das Attribut "Körpergröße" auf die x-Achse und das Attribut "Vertikal_err_Höhe" .)Stellt weitere Fragen an den Datensatz und untersucht dazu geeignete Graphiken! ußlänge vom Alter ab? chen? er Körpergröße und dem Kopfumfang? auf die y-Achse. Es entsteht eine Vierfeldertafel. Zieht solange an den Feldern, bis ihr ein Streudiagramm erhaltet. Druckt diese Graphik aus und zeichnet mit dem Lineal eine Gera- de durch die Punkte. Könnt ihr mit dieser Graphik die in 3.) errechneten Werte bestätigen? 5 Beispiele: Hängt die F Haben Jungen größere Füße als Mäd Welcher Zusammenhang besteht zwischen d ... 15. Versicherung 235 15. Versicherung Ich versichere, dass ich diese Arbeit selbständig verfasst, keine anderen als die angegebe- nen Hilfsmittel verwendet und sämtliche Stellen, die benutzten Werken dem Wortlaut oder dem Sinne nach entnommen sind, mit Quellenangaben kenntlich gemacht habe. Dies gilt auch für Zeichnungen, Skizzen, Notenbeispiele und bildliche Darstellungen. (Ort, Datum) (Unterschrift)