Teil 2: Mit Bayes ins Nirwana

Spektrum_1_17
Spektrum Highlights 1/2017

Der Quantenphysiker Wolfgang Pauli wurde für seine scharfe Zunge ebenso geschätzt wie gefürchtet. Werner Heisenberg goutierte ihn als kompetenten Kritiker und pflegte zu sagen: Wenn’s der Pauli nicht verreißt, kann ich’s veröffentlichen. Fand er einen Aufsatz schlecht, nahm Pauli kein Blatt vor den Mund. Und wenn ihm etwas völlig unbrauchbar schien, griff er zu einer besonders „liebevollen“ Formulierung. Er pflegte dann zu sagen, das sei „ja noch nicht einmal falsch“.

Not even wrong

Ich weiß nicht, ob der US-amerikanische Physiker Peter Woit diese Formulierung im Hinterkopf hatte, als er einen Titel für sein Buch suchte. Jedenfalls heißt es „Not Even Wrong“ (ebenso wie sein Blog). Pauli an Schärfe in nichts nachstehend, geht er darin harsch mit der Stringtheorie ins Gericht, geißelt sie als „pseudowissenschaftlich“ und nennt sie einen „empörende[n] Versuch, das Scheitern zu kaschieren“.

Woher dieser Furor eines Physikers gegen eine physikalische Theorie? Nun, wenn es nach Woit geht, ist die Stringtheorie gar keine physikalische Theorie, nicht einmal eine naturwissenschaftliche. Denn sie erfüllt Karl Poppers Kriterium der Falsifizierbarkeit nicht: Danach muss eine Theorie durch Beobachtungen überprüft und damit auch prinzipiell widerlegt werden können. Oder, wie Popper selbst formulierte: „Ein empirisch-wissenschaftliches System muss an der Erfahrung scheitern können.“

Nun bestreitet kaum jemand, dass die Stringtheorie Poppers Kriterien verletzt, denn das ist ziemlich offensichtlich. Sie kann also alles Mögliche sein – Philosophie, Mathematik, Mythologie, Science Fiction -, aber keine naturwissenschaftliche Theorie. Und sie kann daher auch nicht den Anspruch erheben, irgendetwas Objektives über die Welt aussagen zu können.

In der Fakultät geirrt?

An sich wäre das gar kein Problem, wenn da nicht die Eitelkeit der Stringtheoretiker wäre. Sie müssten nur zu ihren Kollegen sagen: Macht’s gut Jungs, wie ziehen um zu den Mathematikern, die kennen sich mit unseren komplexen Formeln eh besser aus. Oder sie könnten einen neuen geisteswissenschaftlichen Forschungszweig gründen: naturwissenschaftlich inspirierte Mythologie – kurz Scimyth –, wo sie sich zusammen mit den Theologen und Philosophen Weltentstehungsphantasien hingeben könnten.

Das klingt jetzt vielleicht spöttisch, ist aber völlig ernst gemeint. Was ich sagen will: Es gibt bereits Fakultäten, in denen Ideen wie die der Stringtheorie ihren Platz haben. Nur sind es eben nicht die Fakultäten für Physik oder Astronomie. Jedenfalls nicht, wenn man Popper ernst nimmt. Das Problem mit der Stringtheorie ist deshalb in erster Linie ein Problem der Befindlichkeit ihrer Vertreter. Es menschelt in der Wissenschaft nämlich nicht weniger als in anderen gesellschaftlichen Bereichen. Man will keinen vermeintlichen Abstieg in „geringerwertige“ Wissenschaften antreten, das widerspricht dem eigenen Selbstbild.  Und schon gar nicht will man sich vom Kollegen, der sich weiterhin mit den harten Fakten der Physik befasst, auf dem Institutsgang belächeln lassen.

Nur so ist es zu erklären, dass Vertreter der Stringtheorie Argumente an den Haaren herbeiziehen, um Poppers Kriterien für unbrauchbar zu erklären. Diese Argumente habe ich im 1. Teil dieses Beitrags behandelt. Fazit: Es ist nicht eines dabei, das auch nur halbwegs überzeugt. Man muss es wirklich so deutlich sagen.

In diesem Teil soll es um die Alternative gehen, die Stringtheoretiker und andere für Popper anbieten. Mag die Motivation auch fragwürdig sein, den Vorschlag sollte man doch prüfen. Denn Argumente sollten immer „nackt“ und unabhängig von Personen oder Motiven bewertet werden. Der vorgeschlagene Ersatz für Popper lautet also: Satz von Bayes.

Der englische Mathematiker und Pfarrer Thomas Bayes (1701-1761) entwickelte diese nach ihm benannte Formel, die posthum 1763, lange vor Poppers Lebzeiten, veröffentlicht wurde. Dabei geht es um die Berechnung von sogenannten bedingten Wahrscheinlichkeiten, ein Problem das durchaus praktische Relevanz hat, z. B. bei Spamfiltern.

Bayes im Kleinen: Spamfilter

Angenommen Sie erhalten eine Email, die den Begriff „Potenzmittel“ enthält. Handelt es sich dabei um Spam? Das können Sie folgendermaßen untersuchen: Wir nehmen an, dass durchschnittlich jede zehnte ankommende Nachricht in Ihrem Postfach Spam ist und Sie außerdem aus Statistiken folgendes wissen: 30 Prozent aller Spammails enthalten den Begriff „Potenzmittel“. Von allen Mails (also echte Mails und Spam zusammengenommen), enthalten jedoch nur 6 Prozent diesen Begriff. Dann könnten Sie aus diesen Informationen mit Hilfe der Bayschen Formel berechnen, dass die Email mit einer Wahrscheinlichkeit von 50 Prozent Spam ist.

Diesen Prozentsatz könnten Sie nun erhöhen, indem Sie die Berechnung mit weiteren Schlüsselwörtern wiederholen. Wenn Sie in der Mail den Begriff „Belohnung“ finden und wissen, dass in 60 Prozent der Spammails mit „Potenzmittel“ auch „Belohnung“ vorkommt, während dies nur bei 40 Prozent von allen „Potenz-Mails“ der Fall ist, sagt Ihnen Bayes‘ Formel bereits mit 75 Prozent Wahrscheinlichkeit, dass es sich um Spam handelt. Und so weiter.

An diesem relativ einfachen Beispiel erkennt man bereits einige Charakteristika der Methode. Erstens: Kein Mensch würde auf diese Weise untersuchen, ob es sich bei der Mail um Spam handelt, denn es genügt, die Nachricht kurz zu überfliegen, und der Fall ist klar. Wer also in der Lage ist, einer Sache auf den Grund zu gehen, was in diesem Fall bedeutet, den Inhalt der Mail zu verstehen, braucht diese Methode nicht. Geeignet ist sie dagegen für Computer, die nur Syntax (also bestimmten Zeichenabfolgen), aber keine Semantik erfassen können. Daher die Anwendung als Spamfilter.

Zweitens: Man braucht recht viele (unsichere) Informationen (in diesem Fall statistische Daten über Spammails), um überhaupt etwas berechnen zu können. Die einzigen „harten Fakten“, die benutzt werden, sind die vorkommenden Begriffe „Potenzmittel“ und „Belohnung“. Je unsicherer die Vorinformation, desto ungenauer die Wahrscheinlichkeiten. Andererseits: Je mehr Begriffe getestet werden, desto sicherer wird das Ergebnis. Die Erfahrung zeigt: Spamfilter funktionieren ganz ordentlich, wenn auch bei weitem nicht fehlerlos.

Bayes im Großen: Parallele Welten

Nach einem ganz ähnlichen Prinzip funktioniert nun die Bayessche Statistik, mit der wissenschaftliche Theorien untersucht werden. Das läuft dann ungefähr so: Zunächst muss abgeschätzt werden, mit welcher Wahrscheinlichkeit die Theorie richtig ist. Und das tut man, indem man Wissenschaftler fragt – kein Witz! – wie überzeugend sie diese Theorie finden.

Findet beispielsweise ein Stringtheoretiker seine Theorie, in der es 10 hoch 500 Universen gibt, sehr plausibel, ordnet er ihr mal eben die „Wahrheitswahrscheinlichkeit“, sage wir, 60 Prozent zu. Dann rechnet er noch ein wenig nach und kommt zu dem Schluss, dass ein Universum wie das unsere nach dieser Theorie mit hoher Wahrscheinlichkeit eine mittelgroße Dichte an dunkler Energie haben muss. Nun schaut er nach, welche Dichte an dunkler Energie tatsächlich gemessen wurde – bisher das einzige „harte“ Faktum in diesem Verfahren – und stellt fest: Der Wert ist tatsächlich mittelgroß. Das gibt er nun in die Formeln der Bayesschen Statistik ein und erhält als neue „Wahrheitswahrscheinlichkeit“ für seine Theorie, sagen wir, 70%. Voilà.

So in etwa muss man sich die Methode wohl vorstellen, in deren „Mittelpunkt“ „eine grundlegende Verbindung zwischen dem subjektiven Begriff der Überzeugung und der harten Mathematik der Wahrscheinlichkeit“ steht, wie Robert Matthews in Spektrum der Wissenschaft (Highlights 1/17) formuliert. Was er hier als Argument für die Bayessche Methode anpreist, kommentiert der Philosoph Norbert Hinterberger lapidar so: „Besser hätte ich es auch nicht formulieren können… allerdings als Kritik!“ Matthews dagegen findet das Konzept wahnsinnig „subtil“, weil es auf „Glaubens- oder Überzeugungsgraden (degrees of belief)“ beruht und nicht auf „simpler Wahr-falsch-Logik“. Auch das kein Witz! Sind wir auf dem Weg in die Gesinnungswissenschaft?

Das Problem dabei: Wäre die gemessene Dichte an dunkler Materie sehr groß oder sehr klein und damit im Widerspruch zur Theorie, bedeutete dies in der schönen neuen bayschen Wissenschaftswelt mit Nichten das Ende der Theorie. Denn dank des hohen „Glaubensgrades“ ihrer Befürworter hätte sie immer noch eine beachtliche „Wahrheitswahrscheinlichkeit“ von vielleicht 50 Prozent. Man fühlt sich an ein Bonmot aus den naturwissenschaftlichen Praktika während des Studiums erinnert: „Wenn die Fakten nicht zur Theorie passen – Pech für die Fakten!“ Nur, dass das immer ironisch gemeint war.

Der Unterschied zwischen wahrscheinlich und wahrscheinlich wahr

Nun werfen auch Popperianer eine bewährte Theorie nicht sofort in den Papierkorb, wenn sie einen widersprechenden Befund haben. Aber sie müssen die Falsifikation ausbügeln, indem sie die Theorie modifizieren, und sind danach der Wahrheit – hoffentlich – wieder ein Stück nähergekommen. Diese lästige Arbeit sparen sich die Jünger von Bayes. Erst wenn es massenhaft widersprechenden Befunde hagelt wird die „Wahrheitswahrscheinlichkeit“ der Theorie so klein, dass sie verworfen werden muss. Bei Matthews hört sich das so an: „Verquere Anfangsüberzeugungen werden nie direkt falsifiziert, sondern letztlich unter dem Gewicht gegen sie sprechender Indizien begraben.“ Aber was ist mit den Theorien, bei denen das nicht passiert? Es ist wie beim Spamfilter: So, wie er regelmäßig Spam ins Postfach durchlässt, werden auch einige unbrauchbare Theorien nicht als solche erkannt und als „wahrscheinlich wahr“ eingestuft werden.

Dieses Beispiel zeigt auch, wie problematisch der Wahrscheinlichkeitsbegriff ist, der in der Bayesschen Statistik verwendet wird. Wenn ein Bayesscher Spamfilter berechnet, dass es sich bei einer Email zu 86 Prozent Wahrscheinlichkeit um Spam handelt, bedeutet dies ja nicht, dass die Aussage „Diese Email ist Spam!“ zu 86 Prozent wahr ist. Denn die Aussage ist weiterhin entweder zu 100 Prozent wahr oder zu 100 Prozent falsch, wie man schnell erkennt, wenn man sich die Email durchliest. 86 Prozent bedeutet lediglich, dass von 100 Emails dieser Art im Mittel etwa 86 Stück Spam sind.

In der Bayesschen Statistik und ihrer Anwendung in der theoretischen Physik wird dies aber genau so verstanden. Wahrscheinlichkeiten werden hier als „Grade vernünftiger Glaubwürdigkeit“ aufgefasst – was immer das genau heißen mag. Was es jedoch bedeuten soll, dass eine Theorie zu 65 Prozent wahr ist, bleibt das Geheimnis der Jünger von Bayes. Wahrscheinlichkeiten ergeben als Wahrheitswerte von Theorien so wenig Sinn, wie sie es bei Existenzfragen tun.

Lasst sie rechnen!

Was also tun mit der Bayesschen Statistik? Wollen die Popperianer sie verbieten oder zusammen mit der Stringtheorie in andere Fakultäten verbannen? Weder, noch – lasst sie rechnen! Wer derlei unterstellt ist einem weit verbreiteten Vorurteil zu Poppers Wissenschaftstheorie aufgesessen. Es lautet: Popper erwarte von Wissenschaftlern, dass sie den ganzen Tag Versuche durchführen, die geeignet sind, ihre eigenen Theorien zu widerlegen. Die poppersche Sichtweise behindere deshalb die Kreativität im Wissenschaftsbetrieb.

Dem ist nicht so. Um es deutlich zu sagen: Es völlig egal, wie man zu einer Hypothese kommt. Der Chemiker August Kekulé schlief vor dem Kamin ein und träumte, wie sich eine Schlange in den eigenen Schwanz biss. Dadurch kam ihm die Idee zu seiner berühmten ringförmigen Benzolformel. Er soll deshalb später immer wieder in Vorlesungen gesagt haben: „Lernen wir träumen, meine Herren, dann entdecken wir vielleicht die Wahrheit!“ „Unwissenschaftlicher“ geht es kaum, es ist aber trotzdem – auch nach Popper – erlaubt. Entscheidend ist nach Popper nämlich allein, „dass wissenschaftliches Verhalten erst mit der falsifikativen Überprüfung beginnt“ (Hinterberger). Man kann also auf beliebige Weise die verrücktesten Theorien entwickeln und dafür kann und soll man auch Bayessche Statistik verwenden. Aber wenn aus einer Theorie eine naturwissenschaftliche Theorie werden soll, muss man irgendwann damit beginnen, sie an Hand von Beobachtungen zu überprüfen. Gelingt dies nicht, dann ist die Theorie – in der Tat – noch nicht einmal falsch.

Nachts sind alle Schwäne grau

Matthews Artikel in Spektrum der Wissenschaft trägt übrigens den Titel „Manche Schwäne sind grau“. Er will damit wohl sagen, man müsse die Sache differenziert betrachten und dürfe nicht schwarz-weiß malen. Das klingt immer gut. „Grau“ soll hier wohl bedeuten, dass die Theorie „wahrscheinlich richtig“ ist – und das ist doch auch schon was, oder? Aber auch mit diesem Bild zielt Matthews einmal mehr knapp daneben, denn nicht die Schwäne selbst stehen in Poppers Gleichnis für die Theorien, sondern der Satz „Alle Schwäne sind weiß“. Ein Schwan an sich kann niemals „wissenschaftlich“ oder „richtig“ sein, sondern nur eine Aussage über einen Schwan.

Doch, um in diesem schiefen Bild zu bleiben: Wenn wir das Licht ausdrehen, indem wir eines der wenigen klaren Kriterien zur Identifikation von Wissenschaftlichkeit entfernen, wird es wieder Nacht. Und dann sind bekanntlich sowieso alle Schwäne grau.

Weitere Links zum Thema:

Frontalangriff auf die wissenschaftliche Methode (Spektrum der Wissenschaft)

Not Even Wrong (Blog von Peter Woit)

Abbildung mit freundlicher Genehmigung von Spektrum der Wissenschaft