Business & Wachstum
80 % Produktionscode. Von KI geschrieben. Mit denselben alten Review-Gewohnheiten geprüft.
- KI
- Industrie
- Anthropic
- Engineering
- Policy

80 % Produktionscode. Von KI geschrieben. Mit denselben alten Review-Gewohnheiten geprüft.
Anthropic—das Unternehmen hinter Claude—hat soeben interne Zahlen veröffentlicht, die die meisten Labore privat halten. Die Schlagzeile lautet rekursive Selbstverbesserung. Die Fußnote für Ihren Schreibtisch: Generation skalierte. Verification nicht.
In einem Juni-2026-Bericht When AI Builds Itself sagt Anthropic, dass seine Codebasis jetzt überwiegend von Claude geschrieben wird. Ingenieure mergen ungefähr achtmal so viel Code pro Tag wie 2024. Das Unternehmen behauptet noch keine Sci-Fi-Autonomie. Es warnt, die Kurve habe sich steiler gebogen als die meisten Institutionen planten—und bittet die Branche um einen glaubwürdigen Pause-Knopf vor der nächsten Kurve.
Die Zahlen, die Anthropic endlich veröffentlichte
Das sind keine Marketing-Folien. Es sind operative Metriken des Teams, das Claude baut:
- **Über 80 % des gemergten Produktionscodes** bei Anthropic stammte im Mai 2026 von Claude—gegen niedrige einstellige Werte vor Claude Code im Februar 2025
- **8× tägliches Merge-Volumen** pro Ingenieur in Q2 2026 vs. 2024, nach zwei Wendepunkten: Modelle, die Code ausführen (2025), und autonome Modelle über längere Horizonte (2026)
- **52× Speedups beim Trainingscode** in einem internen Benchmark im April 2026 (Mythos Preview) vs. ~3× mit Opus 4 im Mai 2025—ein erfahrener Forscher braucht vier bis acht Stunden für 4× bei derselben Aufgabe
Zusammen ist das Bild nicht „Claude tippte schneller“. Es ist Claude, der mehr der Schleife zwischen Intent, Experiment und Merge schließt—Menschen setzen Ziele und reviewen, aber ein kleinerer Anteil der Tastendrücke.
Was rekursive Selbstverbesserung wirklich bedeutet
Rekursive Selbstverbesserung ist das Szenario, in dem ein KI-System seinen Nachfolger mit wenig menschlichem Input entwirft und baut—jede Generation hebt die nächste. Anthropic ist explizit: Diese volle Schleife ist **noch nicht** passiert.
Passiert ist etwas Engeres und dennoch Bedeutsames:
- KI schreibt den Großteil der Software beim Unternehmen, das Claude ausliefert
- KI führt Experiment-Schleifen in festen Zielen aus—Trainingscode umschreiben, benchmarken, wiederholen—schneller als erfahrene Forscher bei definierten Aufgaben
- Menschliche Rollen verschieben sich vom Tippen zu Dirigieren, Reviewen und Auswählen, welche Probleme automatisiert werden
Das ist nicht die Singularität. Es ist eine Produktionslinie, in der das schnellste Werkzeug auf der Bank auch das Produkt ist—und die Steigung der Verbesserung bei internen Aufgaben in zwölf Monaten zunahm.
Warum Anthropic eine koordinierte Pause fordert
Jack Clark und Marina Favaro vom Anthropic Institute argumentieren, die Welt sollte die **Option** haben, Frontier-KI-Entwicklung zu verlangsamen oder vorübergehend zu pausieren, damit Alignment-Forschung und gesellschaftliche Institutionen aufholen.
Ihre Sorge ist kumulatives Risiko: Werden Alignment-Fehler häufiger, aber weniger verstanden, verlieren Teams die Fähigkeit, Ausfälle zu diagnostizieren, bevor sie skalieren. Eine Pause funktioniert nur, wenn sie verifizierbar und global ist—sonst gewinnt der vorsichtigste Akteur nicht, sondern der unvorsichtigste zieht vor, während andere bremsen.
Ob Sie das alarmistisch oder überfällig finden—der Policy-Appell zählt für Käufer: Der Hersteller eines der meistgenutzten Coding-Assistenten sagt öffentlich, die aktuelle Geschwindigkeit überholt Governance-Design.
Was dies nicht ist
Skeptiker haben in einem Punkt recht: Mehr KI-geschriebener Code bei Anthropic beweist vor allem, dass Claude ein starkes Engineering-Tool in einem Labor mit Leitplanken ist—not dass Maschinen über Nacht autonom Nachfolger spawnen.
Verwechseln Sie **Beschleunigung bei begrenzten Aufgaben** nicht mit **unkontrolliertem rekursivem Gewinn**. Der Wert des Berichts ist die Trendlinie und das Eingeständnis des Labors, dass diese Trendlinie steiler wird.
Was Web-Teams mit dieser Nachricht tun sollten
Die meisten Agenturen und Produktteams trainieren keine Frontier-Modelle. Sie erben dennoch Second-Order-Effekte: schnelleres Codegen, längere autonome Sessions, Anbieter mit Features für Speed-Narrative.
Praktische Antworten sind langweilig—und das ist der Punkt:
- **Agent-Output wie Vendor-Code behandeln:** Auth, PII, Zahlungen und Env reviewen, auch wenn Generation effortless wirkt
- **Generation von Verification trennen**—derselbe Split, als KI den Engpass vom Schreiben zum Reviewen verschob
- **Dokumentieren, wer Rollback besitzt**, wenn eine Agent-Session dutzende Dateien merged
- **Hype-Kurven ignorieren; eigene Kurven tracken:** Incident-Rate, Review-Zeit, ob Juniors Diffs ohne Chat erklären können
Wenn Ihr Team bereits die Fun-and-Friction-Mischung agent-gestützter Web-Arbeit spürt, ist das die human-scale Version von Anthropics Graph. Der Unterschied: Sie spüren Prod um 2 Uhr nachts; sie auf Zivilisationsmaßstab.
Fazit
Anthropics Warnung vor rekursiver Selbstverbesserung ist kein Trailer für Robot Takeover. Es ist ein Statusbericht von der Frontier: KI ist bereits Hauptautor der Software, die KI baut, und das Unternehmen, das Ihren Coding-Assistenten liefert, glaubt, die nächste Phase kommt schneller als unsere Pause-Mechanismen.
Nutzen Sie die Schlagzeile für Strategie, nicht Panik. Halten Sie menschliche Verification bei allem, was Kunden berührt. Zweite Meinung gewünscht, wo Agent-Speed hilft oder Ihren Review-Loop überholt? Schreiben Sie uns.