Kurz erklärt

Wir haben einen KI-Agenten gebaut, ihn als einziges Testsubjekt (n=1) verwendet und nacheinander einzelne Teile abgeschaltet, um herauszufinden, was jedes Teil tatsächlich macht. Vor jedem Test haben wir aufgeschrieben, was wir erwarten — und alle Ergebnisse veröffentlicht, auch die Vorhersage, die sich als falsch herausstellte.

n=1

n=1 heißt: ein einziges Testsubjekt. Wir behaupten nicht, dass sich unsere Ergebnisse verallgemeinern lassen — wir berichten, was bei genau diesem System passiert ist.

Ablation

Eine Ablation entfernt eine Komponente, um zu sehen, wie sich das Ganze ohne sie verhält — so, wie die Medizin lernt, was ein Organ leistet.

Pre-registered

Vorab registriert bedeutet: Wir haben unsere Vorhersagen aufgeschrieben und kryptografisch versiegelt, bevor wir das Experiment liefen — damit wir nicht heimlich umschreiben können, falls eine Vermutung falsch war.

In Zahlen · 2026

Ein Produktionssystem, fünf Subsysteme , einzeln ausgeschaltet — mit jeder Vorhersage registriert bevor die Daten reinkamen.

0/90

Score · Architekten-Rating · obere Grenze

0/0

Ablationen trafen vorab registrierte Ziele

0%

H2 beobachtet · vorab registriert ≥60 % — fehlgeschlagen, berichtet

n=1

Ehrliche Stichprobengröße — keine Verallgemeinerungs-Behauptung

Publikationen

Das Arbeitspapier + Methodik-Begleiter.

Öffnen →

Frühere Texte