stochastik
Das benfordsche Gesetz zählt zu den universellen Verteilungsgesetzen der Stochastik. Es beschreibt eine fundamentale Gesetzmäßigkeit der Verteilung der Ziffernstrukturen der Zahlen in Datensätzen, z.B. ihrer ersten Ziffern, seien es Datensätze über Einwohnerzahlen von Städten oder über Geldbeträge in der Buchhaltung, von Naturkonstanten oder Datensätze wissenschaftlicher Beobachtungen. Kurz gefasst besagt es: "Je niedriger der zahlenmäßige Wert einer Ziffernsequenz definierter Länge an einer definierten Stelle einer Zahl ist, umso wahrscheinlicher ist ihr Auftreten. Für die Anfangsziffern in Zahlen des Zehnersystems gilt z.B.: Zahlen mit der Anfangsziffer '1' sind etwa 6,5-mal häufiger als solche mit der Anfangsziffer '9'".
1881 wurde diese Gesetzmäßigkeit von dem Mathematiker Simon Newcomb entdeckt und im "American Journal of Mathematics" publiziert. Er soll bemerkt haben, dass in den benutzten Büchern mit Logarithmustabellen, die Seiten mit Tabellen mit Eins als erster Ziffer deutlich schmutziger waren als die anderen Seiten, weil sie offenbar öfter benutzt worden seien. Die Abhandlung Newcombs blieb unbeachtet und war schon in Vergessenheit geraten, als der Physiker Frank Benford (1883–1948) diese Gesetzmäßigkeit wiederentdeckte und über sie 1938 neu publizierte. Seither wird diese Gesetzmäßigkeit nach ihm benannt. In neuerer Zeit wird durch die Bezeichnung "Newcomb-Benford's Law" (NBL) dem eigentlichen Urheber wieder Rechnung getragen. Bis vor wenigen Jahren war diese Gesetzmäßigkeit nicht einmal allen Statistikern bekannt. Da sie schon bei der Lösung zahlreicher praktischer Probleme hilfreich war, wächst ihr Bekanntheitsgrad rasch.
Im Grunde ist das NBL überhaupt nichts Neues. Es stellt vielmehr einen besonderen, früher nicht in seiner ganzen Tragweite erkannten, Aspekt der logarithmischen Funktion dar; das Phänomen kann daher ohne die logarithmische Funktion nicht erkärt werden, auch wenn dies immer wieder mit - moderatem Erfolg - versucht wird.
Der Begriff des NBL zieht einige verbreitete Irrtümer im Schlepptau:
1. Wohl bedingt durch die übliche Darstellung des NBL als aus 9 Balken bestehendes Histogramm wird suggeriert, das NBL mache eine Aussage über die Anfangsziffern von Zahlen aus dem dekadischen System (was als Teilaussage stimmen würde) und beruhe auf diskreten Funktionen. In Wahrheit macht das benfordsche Gesetz eine Aussage über beliebig lange Ziffernstrukturen in beliebigen Zahlensystemen und beruht ausschließlich auf stetigen Funktionen, wie z.B. der Dichtefunktion f(x) = 1 / xlnB mit B als der Basis des Datensatzes.
2. Induziert durch einen optisch ähnlichen Funktionsverlauf und durch die unter Punkt 1 beschriebenen präsentationsbedingten Suggestivwirkungen wurde bisweilen schon spekuliert, das NBL sei nichts als ein Spezialfall des Zipfschen Gesetzes. Diese unhaltbare Annahme ist durch drei Argumente leicht zu entkräften:
1. Erstens basiert das Zipfsche Gesetz auf diskreten Funktionen, das NBL ausschließlich auf stetigen.
2. Zweitens basiert die Verteilung des NBL auf der logarithmischen Funktion, die Verteilung des Zipfschen Gesetzes auf der Hyperbelfunktion. Von dem einen Phänomen zum anderen gelangt man bestenfalls über den Weg der Infinitesimalrechnung. Im Rahmen dieser Rechnungsart zeichnet sich nur die Funktion f(x) = exp(x) durch Identität mit ihrem Differential bzw. unbestimmten Integral aus. Da keines der beiden Phänomene explizit auf exp(x) beruht, kann das NBL kein Spezialfall des Zipfschen Gesetzes sein.
3. Drittens lässt sich die logarithmische Funktion zwar leicht als unendliche Summe von parabolischen Funktionen darstellen, aber nicht von hyperbolischen. Der Unterschied zwischen beiden Phänomenen ist daher selbst bei gewissen optischen Ähnlichkeiten und der Identität beider Funktionen im Unendlichen (vorher nicht), beachtlich.