Übrigens noch was zu eurer Unterhaltung:
Dass das (junge) Alter in Verbindung mit der Unfallhäufigkeit eine Rolle spielt, kann man an der Unfallstatistik ablesen. Sollte man meinen.
...
Was vermutlich eher an der Korrelation liegt, das es viel weniger Fahranfänger höheren Alters gibt. Um das rauslesen zu können, bräuchte man eine Statistik die Unfälle in Relation zur Fahrpraxis stellt. Wahrscheinlich sogar besser noch nicht nur nach Dauer des Führerscheinbesitzes, sondern nach gefahrenen Kilometern und/oder jährlicher Kilometerleistung.
...
Ich habe mich nur und ausschließlich darauf bezogen, das man aus dieser Statistik nicht rauslesen kann, ob junge oder ältere Fahranfänger mehr oder weniger oft Unfälle bauen.
Unfälle in Relation zur Fahrpraxis (gefahrene Kilometer) zu stellen halte ich für sinnlos wenn es darum geht zu vergleichen ob
das Alter bei Fahranfängern einen signifikanten Einfluss auf die Unfallwahrscheinlichkeit hat (das war ja der von dir angesprochene Punkt, in fett von mir markiert).
Deine unabhängige Variable (UV) ist das Alter bei Führerscheinerwerb und deine abhängige Variable (AV) ist die Unfallhäufigkeit. Wenn die von dir gewählten Personen nun signifikant unterschiedliche Fahrleistungen aufweisen dann sind die Personen nicht mehr direkt vergleichbar. Mit mehr Fahrleistung geht mehr Erfahrung einher jene die Unfallwahrscheinlichkeit tendenziell wohl eher verringert (und ich habe eben mal gegoogelt und Paper gefunden die dafür Evidenz liefern).
Die unterschiedliche Fahrleistung wird dann zur Störvariable! Kurzum: du würdest in deiner Korrelationsstudie die eine Störvariable vermeiden wollte und sie zur UV machte (Alter bei Führerscheinerwerb) selbst eine neue Störvariable wieder einführen (unterschiedliche Kilometerleistungen).
Wenn du wissen möchtest ob das Alter bei Führerscheinerwerb einen signifikanten Einfluss auf die Unfallwahrscheinlichkeit hat musst du (idealerweise) ALLE anderen Faktoren gleich halten, also auch die Kilometerleistung.
Und das ist ein Problem bei nahezu allen Korrelationsstudien. Du wirst niemals alle Störvariablen ausschließen können, ja du wirst eventuell nicht einmal alle Störvariablen erkennen bzw. finden können. Deshalb kann man Ergebnisse fast immer diskutieren; deshalb haben Studien häufig eine Limitations section am Ende die eigene Limitierungen beispielsweise in der Methode diskutiert (denn fast jede Methode hat Vor- und Nachteile).
Wenn man solche Störvariablen besser ausschließen möchte müsste man ein Experiment mit Intervention durchführen statt nur passiv zu beobachten bzw. passiv Daten zu sammeln und zu analysieren. Ein Experiment ist aufgrund offensichtlichen Gründen bei dem hier diskutierten Thema natürlich nicht möglich.