Claude ausgefallen: Der große KI-Ausfall, der unser digitales Kartenhaus offenbarte
Lassen Sie mich Ihnen meinen Montagmorgen schildern. Kaffee in der Hand, bereit, einen Stapel Berichte zu bewältigen, startete ich Claude, um mir bei der Analyse komplexer Finanzdaten zu helfen. Und dann... nichts. Nur das digitale Äquivalent eines Besetztzeichens. Tausende von uns starrten auf Fehlermeldungen, aktualisierten wie wild die Seiten und spürten diese besondere Art moderner Panik, wenn der Roboter nicht antwortet. Claude war ausgefallen, und für ein paar Stunden hätten genauso gut die Hälfte der Wissensarbeiter in London versuchen können, ihre Steuererklärung mit Federkiel und Tinte zu machen.
Inzwischen haben Sie wahrscheinlich schon die Nachberichte gehört. Gegen Mittag (GMT) begannen die Systeme von Anthropic, "gehäufte Fehler" zu melden. Inoffizielle Berichte aus der Branche deuteten darauf hin, dass weltweit Tausende betroffen waren. Für eine Plattform, die sich als durchdachte, auf Sicherheit bedachte Alternative im KI-Wettrennen positioniert hat, war das ein peinlicher Moment. Aber während die Technikpresse damit beschäftigt ist, die Behebung der Störung zu verfolgen, interessiert mich mehr, was uns das über das Kartenhaus verrät, das wir da bauen. Das war nicht nur ein kleiner Server-Aussetzer; es war ein Blick in eine Zukunft, die weitaus fragiler ist, als uns die KI-Anbieter glauben machen wollen.
Die 'Bad Actors' in der Maschine
In der Welt der anspruchsvollen Fertigung gibt es ein Konzept, das jeder Betriebsleiter in- und auswendig kennt: den Bad Actor. Das ist die eine Maschine am Fließband – ein tückischer Kartonierer, ein alterndes Förderband – die für einen unverhältnismäßig großen Anteil der Ausfallzeiten verantwortlich ist. Man kann eine Fabrikhalle voller glänzender neuer Ausrüstung haben, aber wenn dieser eine Bad Actor streikt, kommt der gesamte Betrieb zum Erliegen. Achtzig Prozent eurer Probleme rühren von zwanzig Prozent eurer Anlagen her.
Nun schauen Sie sich unsere digitale Infrastruktur an. Wir haben diese weitläufigen, wunderschönen Serverfarmen gebaut und diese erstaunlichen Modelle trainiert. Aber das Claude-Ausfall-Ereignis am Montag schreit geradezu danach, dass wir noch nicht herausgefunden haben, wie wir die Bad Actors in unserer KI-Lieferkette identifizieren, geschweige denn beheben können. War es ein einzelner Schwachpunkt? Ein kaskadierender Softwarefehler? Ehrlich gesagt ist das "Warum" weniger wichtig als das "Was": Ein Kernstück der globalen kognitiven Infrastruktur hat bewiesen, dass es sich so einfach ausschalten lässt wie ein Lichtschalter. Wir vertrauen diesen Systemen alles an, von der Code-Generierung bis zur Investitionsanalyse, und dennoch steckt ihre Betriebszuverlässigkeit immer noch in der Garagenband-Startup-Phase.
Die Geschichten, die wir uns erzählen
Das bringt mich zu etwas, das mir in letzter Zeit im Kopf herumgeht, teilweise inspiriert durch ein Wiederlesen von Paul Murrays brillantem Roman The Mark and the Void: A Novel. Falls Sie ihn nicht kennen: Es ist eine schonungslose, urkomische Abrechnung mit der Finanzkrise, angesiedelt in einer Dubliner Investmentbank während der Todeszuckungen des Keltischen Tigers. Die Genialität des Buches liegt darin, wie es die Fiktionen seziert, an die wir kollektiv zu glauben beschließen – die Erzählungen, dass der Markt rational sei, dass die Modelle solide seien, dass das System stabil sei. Jeder wusste, dass die Blase da war, aber sie tanzten weiter, bis die Musik aufhörte.
Ist das nicht genau der Punkt, an dem wir mit der KI stehen? Wir statten diese Chatbots mit fast schon mythischen Eigenschaften aus. Wir erzählen uns, sie seien die ultimativen Abenteuer des Eierkartondrachen – dieses magischen Geschöpfs aus Richard Adams' Kinderbuch, das alles finden konnte, was verloren war. Wir werfen Claude, ChatGPT und Konsorten Probleme hin, erwarten, dass sie Antworten aus dem digitalen Äther zaubern, überzeugt von ihrer Allmacht. Aber wenn der Strom ausfällt, wenn die "gehäuften Fehler" in die Höhe schnellen, bleiben wir mit der unangenehmen Wahrheit zurück: Es gibt keine Magie. Es ist nur Code, und Code geht kaputt. Der Drache ist aus Pappe und grün angemalt.
Es gibt noch eine weitere literarische Parallele, die passend erscheint. In Dominic Smiths The Electric Hotel verfolgen wir Aufstieg und Fall eines Stummfilmpioniers, Claude Ballard. Er ist ein Mann, der von der Magie des Kinos verzehrt wird, nur um dann mitzuerleben, wie seine Kunstform – und sein Meisterwerk – durch Zeit, Vernachlässigung und ein einziges verheerendes Feuer zerstört werden. Der Roman ist eine eindringliche Meditation über die Zerbrechlichkeit von Kunst und Erinnerung. Und hier sind wir, ein Jahrhundert später, und bauen eine weitere Form des elektrischen Traums, genauso anfällig für einen einzelnen Schwachpunkt. Unsere digitalen Erinnerungen, unsere KI-gestützte Arbeit – puff, weg. Bis es irgendeinem Ingenieur in einem Rechenzentrum irgendwo gelingt, den Projektor wieder zu starten.
Der Geist der geschenkten Weihnachtsgeschenke
Dieser Ausfall zwingt auch zu einer Abrechnung mit dem "Service", den diese Plattformen bieten. Ich musste unwillkürlich an das alte Kinderbuch Claude der Hund: Eine Weihnachtsgeschichte denken, in dem der titelgebende Hund all seine Weihnachtsgeschenke an einen heruntergekommenen Freund verschenkt. Es ist eine Geschichte über Großzügigkeit und den wahren Geist des Schenkens. Aber in unserem Kontext, wenn Claude ausfällt, schenkt er nicht; er nimmt. Er nimmt unsere Zeit, unsere Produktivität, unser Vertrauen. Wir sind so abhängig von diesen digitalen Krücken geworden, dass wir diejenigen sind, die humpeln, wenn sie uns weggezogen werden.
Für die Unternehmen, die diese APIs überstürzt in ihre Kernabläufe integriert haben, war Montag eine kalte Dusche. Wenn Sie Ihren Kundendienst-Bot, Ihre interne Datenanalyse oder Ihr Code-Repository auf eine Plattform gebaut haben, die ohne Vorwarnung verschwinden kann, wer ist dann jetzt der Bad Actor? Ist es der fehlerhafte Server oder der CTO, der annahm, "die Cloud" sei einfach inhärent zuverlässig?
Hier ist die unbequeme Realität, der sich die Branche stellen muss:
- Belastbarkeit ist keine Selbstverständlichkeit: Wir behandeln KI-Verfügbarkeit wie Elektrizität, aber im Moment ist sie eher mit einem Premium-Kabelsender vergleichbar. Er fällt aus, wenn es regnet.
- Die Erzählung ist brüchig: Wir müssen aufhören, KI zu mythologisieren, und anfangen, sie wie kritische Infrastruktur zu behandeln. Das bedeutet Redundanzpläne, Offline-Ausweichmöglichkeiten und eine gesunde Portion Skepsis.
- Der wahre Wert ist verborgen: Die Unternehmen, die die nächste Phase dieses Wettrennens gewinnen werden, sind nicht unbedingt diejenigen mit den auffälligsten Modellen, sondern diejenigen, die Zuverlässigkeit garantieren können. Die Plattform, die läuft, wenn die anderen ausfallen, wird die sein, der die Unternehmen tatsächlich vertrauen.
Wenn sich diese Woche die Märkte öffnen, werden sich die Gespräche um Anthropics Reaktionszeit und ihre Statusseiten-Updates drehen. Aber das kluge Geld – die Leute, die die Lehren aus 2008 gezogen haben – wird die härteren Fragen stellen. Sie werden in ihren eigenen operativen Risikobewertungen nach dem The Mark and the Void suchen. Sie werden die Bad Actors in ihrem Tech-Stack identifizieren, bevor diese Schauspieler die gesamte Fabrikhalle zum stillen, eingefrorenen Stillstand bringen.
Für jetzt sind die Lichter wieder an. Claude beantwortet wieder Anfragen, tut so, als wäre nichts gewesen. Aber wir haben hinter den Vorhang geblickt. Wir haben die Leere gesehen. Und sie sah einem "504 Gateway Time-out"-Fehler an einem grauen Londoner Morgen verdammt ähnlich.