OpenAI, Inc. ist ein US-amerikanisches nicht-börsennotiertes Softwareunternehmen, das sich seit Ende 2015 mit der Erforschung vonkünstlicher Intelligenz (KI, englischArtificial Intelligence, AI) beschäftigt. Anfänglich war das Ziel von OpenAI, künstliche Intelligenz aufOpen-Source-Basis zu entwickeln. Das Unternehmen wurde vorerst alsNon-Profit geführt. 2019 wurde die gewinnorientierte TochtergesellschaftOpenAI Global, LLC gegründet, in derMicrosoft größter Investor ist. OpenAI ist vor allem bekannt für die Entwicklung dergenerativen vortrainierten Transformer (GPT) – auch generative künstliche Intelligenz, kurzGenAI, bezeichnet – und der daraus abgeleiteten Softwareprodukte wieChatGPT oderDALL-E.
Der Gründung von OpenAI im Jahr 2015 ging bereits eine lange Debatte um die Risiken von KI voraus. Die WissenschaftlerStephen Hawking undStuart Jonathan Russell etwa hatten Befürchtungen geäußert, wenn künstliche Intelligenz eines Tages die Fähigkeit erlangen könnte, sich selbst zu verbessern, dies zu einerExplosion der Intelligenz führen könnte. Durch die damit einhergehende Überlegenheit der KI sei eine Verdrängung der Spezies Mensch durchsuperintelligente künstliche Intelligenz denkbar, die keinen menschlichen Wertvorstellungen unterworfen ist.Um Risiken wie diesen bei der Entwicklung künstlicher Intelligenz entgegenzutreten, wurde Open AI, Inc. als Open-Source-Non-Profit-Organisation in der Rechtsform einerPublic Charity (501(c), Nonprofit) konzipiert. Damit sollte die Unabhängigkeit der Organisation gegenüber Geldgebern und deren Interessen sichergestellt werden; für die Forschung sollte der Freiraum geschaffen werden, sich auf lange Sicht positiv auf die Gesellschaft auswirken zu können.[3] Die Organisation wollte eine „freie Zusammenarbeit“ mit anderen Institutionen[4] und Forschern ermöglichen, indem sie ihre Patente und Forschungsergebnisse für die Öffentlichkeit zugänglich mache.[5]
Das Unternehmen OpenAI selbst äußerte 2015, dass schwer abzuschätzen sei, wie sehr die Gesellschaft von hochwertiger künstlicher Intelligenz profitieren könnte. Genauso komplex sei zu eruieren, welchen Schaden eine missbräuchliche Verwendung dieser Technologie mit sich bringen könnte.[3] Es sei nicht absehbar, wann künstliche Intelligenz auf dem Niveau sein werde, mit der menschlichen Intelligenz in Konkurrenz zu treten.[8] Der Vorstand von OpenAI sagte 2015, künstliche Intelligenz sei eine Erweiterung des individuellen menschlichen Willens. Damit sollte diese Technologie auch flächendeckend verfügbar und jedem Menschen im gleichen Maße zugänglich sein.[3]Das erklärte Fernziel von OpenAI ist die Entwicklung einer künstlichen allgemeinen Intelligenz (Artificial General Intelligence (AGI)), einer fortgeschrittenen Form der KI, die in der Lage sein soll, intellektuelle Aufgaben nicht nur auf einem menschenähnlichen, sondern potenziell darüber hinaus gehenden Niveau zu bewältigen. Ein Übertreffen der menschlichen Intelligenz durch das auf mehrere Jahrzehnte konzipierte Projekt OpenAI ist für den Vorsitzenden des Unternehmens, Sam Altman, jedenfalls denkbar.[9]
Vishal Sikka, 2014 bis 2017 Vorstandsvorsitzender vonInfosys, schrieb 2015, es sei wichtig, dass die OpenAI-Forschung „the greater good“ – das Wohl der Allgemeinheit – anstrebe.[10] Cade Metz vonWired sagte, dass Firmen wieAmazon Interesse an der Verwendung von Open-Source-Software und Open-Source-Daten hätten, um sich gegen Unternehmen wieGoogle oderFacebook zu behaupten, die über eine starke proprietäre Datenbasis verfügen. Firmen vonY Combinator teilen ihre Daten ebenfalls mit OpenAI, so Altman in einem Interview.[9] OpenAI profitierte anfangs so sehr von seinen guten Absichten und dem Image, dass es trotz schlechterer Gehälter im Vergleich zu anderen KI-Entwicklern wie Google oder Facebook zahlreiche Top-Entwickler für sich gewinnen konnte. Trotz dieser Unterschiede in der Bezahlung wechselte etwa Sutskever von Google zu OpenAI. Der Forscher Wojciech Zaremba lehnte demnach Angebote von Firmen ab, die ihm das Zwei- bis Dreifache als Gehalt angeboten hätten, um sich stattdessen OpenAI anzuschließen.[11]
Weitere Unternehmensentwicklung bis Veröffentlichung von ChatGPT
Nachdem die bis 2019 durch Spenden erworbenen finanziellen Mittel nur etwa 130 Millionen US-Dollar erreichten und nicht mehr für die Weiterentwicklung der Organisation ausreichten, wurde die gewinnorientierte TochterfirmaOpenAI Global, LLC gegründet. Dabei handelt es sich um ein Unternehmen, für dessen Investoren die Erträge begrenzt sind (englischCapped profit company). Für diese Regelung wurde die MetapherNobel Moment in Anspielung an die Stiftung derNobelpreise durchAlfred Nobel verwendet. Nobel wollte damals seine hohen Gewinne aus dem Dynamitgeschäft für einen guten Zweck einsetzen.[12] Allerdings ist die Begrenzung der zukünftig an Investoren ausbezahlten Erträge sehr hoch angesetzt, indem sie bis zum Hundertfachen der ursprünglichen Investition ansteigen dürfen.[13]Open AI, Inc., weiterhin eine Nonprofit-Organisation, übt volle Kontrollrechte (über eine zwischengeschaltete Struktur,OpenAI GP, LLC, die alsgeneral partner (vergleichbar einem Komplementär) fungiert) über die Tochterfirma aus und erhält deren allfällig überschüssige Erträge.[1]
Open AI Global verdient Geld mit Software-Produkten. Das bekannteste ist ChatGPT Plus, ein Abonnementservice für ChatGPT, der den zahlenden Nutzern Privilegien und Zusatzfunktionen gegenüber nichtzahlenden Nutzern einräumt.[14]Wichtiger Geldgeber und größter Einzelaktionär von OpenAI Global ist das UnternehmenMicrosoft; Microsoft ist jedoch nur nicht-stimmberechtigter Beobachter im Verwaltungsrat von OpenAI und hat keinerlei Kontrollrechte in OpenAI Global.[1][15]Hatte Microsoft bereits in den Jahren 2019 und 2021 jeweils eine Milliarde US-Dollar in OpenAI Global investiert, sicherte sich das Unternehmen im Januar 2023 für ein weiteres Investment in Höhe von zehn Milliarden US-Dollar die Dienste von OpenAI zur Implementierung von deren Algorithmen und Produkten in eigene Microsoft-Produkte. OpenAI benötigte die Finanzierung sowie dasCloud-Computing (Microsoft Azure) undSupercomputer von Microsoft, um die eigenen Programme betreiben zu können, bzw. die durch die eigenen Programme anfallenden riesigen Datenmengen zu verarbeiten sowie die eigene Forschung voranzutreiben.[16][17]
Im Februar 2018 verließ Elon Musk die Leitung von OpenAI, um angeblich Interessenkonflikte mit Teslas Entwicklungen im Bereich künstliche Intelligenz zu vermeiden. Er blieb zunächst weiterhin Spender und Berater der Organisation. Sam Altman fungiert alsCEO und wurde zum Gesicht von OpenAI, Brockman war alsCTO und später als Vorsitzender des Aufsichtsrats und Präsident tätig.Im November 2022 wurde der KI-Chatbot ChatGPT 3.5 freigeschaltet und binnen weniger Tage nutzten mehr als 100 Millionen User weltweit das Programm. Damit war ChatGPT die am schnellsten wachsende Plattform aller Zeiten.[18] Im Herbst 2023 wurde OpenAI mit einem Firmenwert von 80 bis 90 Milliarden US-Dollar bewertet.[19]
Dass ein Risiko mit der Entwicklung und dem Voranbringen von künstlicher Intelligenz einhergehe, bestritt Mitgründer Elon Musk in einem Interview im Jahr 2015 nicht. Wichtig sei, künstliche Intelligenz möglichst vielen Menschen zur Verfügung zu stellen, damit nicht ein kleiner Teil die Vorteile der KI allein für sich beanspruchen könne. Das sei die beste Verteidigung gegen missbräuchliche Verwendung von KI-Systemen.[7]
Die ursprüngliche Strategie von Musk und Altman, das Risiko der Schadensverursachung durch künstliche Intelligenz durch Open-Source-KI für jedermann zu reduzieren, war in der Community umstritten. Der PhilosophNick Bostrom ist einer der Skeptiker dieses Ansatzes und verdeutlicht das sinngemäß mit folgender Metapher:Wenn Sie einen Knopf haben, der Schaden in der Welt anrichten kann, würden Sie ihn nicht jedem verfügbar machen.[11]
Musk kritisierte im Februar 2023 via Twitter die Gewinnorientierung von OpenAI Global, LLC, indem er den Screenshot einer vermeintlichen Konversation von ChatGPT mit einem unbekannten Nutzer veröffentlichte, in dem die KI nach Eingabe bestimmter suggestiver Elemente und Fragen die Gründung eines profitorientierten Subunternehmens unter der Schirmherrschaft einer Non-Profit-Organisation als „hoch unethisch und illegal“ (englisch„highly unethical and illegal“) bezeichnete.[20]JüngereKI-Modelle sind weitgehendproprietär und nicht mehroffen dokumentiert, was wiederum Kritik hervorgerufen und Fragen der Machtkonzentration undTransparenz aufgeworfen hat.[21][22] Das Unternehmen sei demnach inzwischen ein gewinnorientiertes Unternehmen, dasOpen Innovation lediglich zur Einbindung fremder Open-Source-Erzeugnisse nutze.[23]
LautVox-Berichten im Mai 2024 müssten ausscheidende Angestellte einNon-Disclosure-Agreement (NDA) unterzeichnen, dessen Existenz auch an sich nicht erwähnt werden dürfe. Verstöße könnten unter anderem zum Verlust sämtlicher Unternehmensanteile führen.[24] Das Unternehmen gab später an, die NDA aufgelöst zu haben und künftig nicht mehr zu verwenden.[25]
Medienunternehmen bezichtigen OpenAI der Verletzung vonCopyrights, weil zum Trainieren der verwendeten Lernmodelle ohne Nachfrage und Lizenzierung von mehreren Unternehmen umfangreiche Inhalte verwendet wurden. Bisher wurden entsprechende Vereinbarungen mit derNachrichtenagentur AP und mit demAxel Springer SE abgeschlossen. Ausstehend sind Klagen des AutorenverbandsAuthors Guild und derNew York Times.[26][27]
Am 17. November 2023 kam es zu der überraschenden Entlassung von CEO Sam Altman durch den Verwaltungsrat des Unternehmens. Der VerwaltungsratsvorsitzendeGreg Brockman trat daraufhin zurück, da er nicht an der Entlassung beteiligt war.[28][29] Als Begründung zur Entlassung wurde angegeben, dass Sam Altman in seiner Kommunikation „nicht durchweg aufrichtig“ gewesen sei.[30] Der tiefere Hintergrund der Entlassung Altmans soll eine Kontroverse zwischen ihm und Verwaltungsratsmitglied Sutskever gewesen sein, der in der Kommerzialisierung von OpenAI ein Sicherheitsrisiko gesehen haben soll.[31] Noch am selben Tag übernahm die bisherige CTOMira Murati als neue Interims-CEO.[32] Der Verwaltungsrat von OpenAI bestand aus sechs Mitgliedern, dazu gehörten:
Helen Toner (strategische Direktorin am Center for Security and Emerging Technology derGeorgetown-Universität in Washington, D. C).
Bereits zwei Tage später wurde am Sonntag, in der Nacht zu Montag, bekannt, dass Emmett Shear (ehemaliger CEO vonTwitch) neuer Interims-CEO von OpenAI wird.[33] Nur eine Stunde zuvor war bekannt geworden, dass Altman zu Microsoft wechseln werde, zusammen mit Brockman. Microsoft als größter Aktionär von OpenAI hatte Interesse bekundet und ihm angeboten, eine neue KI-Abteilung zu leiten.[34][15] Parallel dazu hatten am Wochenende auch intensive Verhandlungen zwischen Altman und OpenAI über seine mögliche Rückkehr stattgefunden, die vorerst scheiterten.
Am 22. November 2023 verkündete OpenAI dann die Rückkehr von Sam Altman als CEO. Der Druck von Beschäftigten – in der Zwischenzeit hatten mindestens 650 von rund 770 Beschäftigten mit Kündigung und dem Wechsel zu Microsoft gedroht[34] – und Investoren von OpenAI spielte dabei eine wesentliche Rolle. Sie drängten darauf, Altman, den Mitbegründer von OpenAI, wieder in seine frühere Position einzusetzen. Als Konsequenz wurde auch der Verwaltungsrat neu formiert.[35]
Der Konflikt um die Entlassung und Wiedereinstellung von Altman war geprägt von Ideologie und Machtkämpfen.[36] Altman ist Repräsentant für die kommerzielle Ausrichtung von OpenAI, Sutskever für den Auftrag zur Schaffung „sicheren, wohlwollenden KI“ und als Kämpfer für sein Projekt besserer menschlicherKI-Ausrichtung (AI Alignment) der Produkte von OpenAI.[37] Es geht konkret auch um die Mittelzuteilung von Personal und Rechenleistungskapazitäten. Die Wiedereinsetzung von Altman als Vorsitzender (CEO), die Absetzung von Sutskever und der zwei unabhängigen Firmenexternen Helen Toner (Forscherin) und Tasha McCauley (Wissenschaftlerin der RAND Corp.) als Verwaltungsrätinnen sowie die neu gewählten Verwaltungsräte geben Hinweise auf die erfolgte Machtverschiebung.[38][39]
Am 1. März 2024 berichteten deutschsprachige Medien, dassElon Musk OpenAI und CEO Sam Altman verklage.„OpenAI sollte ein gemeinnütziges Unternehmen sein, strebe nun aber nach Profit, wirft Elon Musk dem Unternehmen vor. Er wirft den Gründern Vertragsbruch vor – und klagt“, heißt es dazu beispielsweise aufZeit online.[44][45]
OpenAI veröffentlichte daraufhin eine Replik, in welcher das Unternehmen versucht, die „For-Profit“-Strategie zu rechtfertigen. OpenAI veröffentlichte auch Auszüge aus E-Mail-Konversationen zwischen Musk, Altman, Brockman und Sutskever. Diese sollten belegen, dass auch Musk die „For-Profit“-Strategie als sinnvoll angesehen habe.[46]
Am 10. Januar 2024 hob OpenAI die bisherige Leitlinie, Modelle des Unternehmens dürften nicht zurWaffenentwicklung und immilitärischen Kontext verwendet werden, auf.[47]
Im Februar 2024 kündigte Altman an, für die weitere Unternehmensentwicklung Rekordinvestitionen in Höhe von 7Billionen US-Dollar einwerben zu wollen, was mehr als sechs Prozent des jährlichen globalenBruttoinlandsprodukts entspräche.[48] Im Zuge dessen sei auch die firmeneigene Fertigungneuromorpher Chips beabsichtigt.[49] Das Unternehmen begann im Juni 2024 mit der Einstellung entsprechenden Personals.[50] Bisherige Kooperationsverhandlungen mitTSMC,SK Hynix undSamsung sollen aufgrund mangelnden Vertrauens in das Vorhaben, zu hohen Risikos und Bedenken bezüglich dernationalen Sicherheit gescheitert sein (Stand: September 2024).[51]
Im zweiten Quartal 2024 äußerten Mitarbeiter des OpenAI-Teams für Ethik- und Alignment-Fragen (Superalignment) Misstrauen in die Absichten Altmans[52] und Sicherheitsbedenken.[25] Die Abteilung um Ilya Sutskever wurde im Mai 2024 aufgelöst.[53] Die Unternehmensführung beabsichtigt die Wandlung zur gewinnorientierten Körperschaft (For-Profit-Organisation).[54] Sie legt Investoren weiterhin nahe, eingesetztes Kapital als„Spenden“ zu erachten.[55]
Seit September 2024 buhlt das Unternehmen um die Erlaubnis zur Errichtung von 5-GW-Rechenzentren in mehreren US-Städten, was einem Strombedarf von jeweils etwa 3 Millionen Haushalten beziehungsweise dem Ertrag von 5Kernkraftwerken entspräche. Das Unternehmen rechnet mit Kosten von etwa 100 Milliarden US-Dollar je Rechenzentrum.[56] Bereits zuvor hatten Microsoft und OpenAI mit dem Programm Stargate die Errichtung eines derartigen Rechenzentrums angekündigt.[57]
Mit dem Wandel zur Gewinnorientierung wurden CEO Sam Altman erstmalig Anteile im Wert von voraussichtlich 150 Milliarden US-Dollar in Aussicht gestellt.[58] CTO Mira Murati und weitere leitende Entwickler verließen derweil das Unternehmen.[59]
Im Oktober 2024 erhielt OpenAI weitere 6,6 Milliarden USD von den bisherigen Investoren Thrive Capital und Khosla Ventures wie auch von Microsoft. Neu haben sich auchNvidia, die japanischeSoftBank und die Investitionsfirma MGX derUnited Arab Emirates beteiligt. Es ist geplant, dass Angestellten von OpenAI mit Aktienbesitz ein Angebot für Aktienrückkäufe durch die Firma gemacht werde.[60]
Nach Amtsantritt vonDonald Trump wurde das neue GemeinschaftsunternehmenStargate-Projekt angekündigt. Die Unternehmen Open AI,Oracle undSoftBank wollen zusätzliche KI-Rechenzentren mit Investitionen von mindestens 100 Milliarden USD in den USA bauen, wobei schon 10 Vorhaben inTexas im Bau sind.[61]
Ab 2016 hat OpenAI seine Plattform „OpenAI Gym“ entwickelt, die sich mitbestärkendem Lernen (englisch:reinforcement learning) befasst.[62] Der Quellcode ist in seiner aktuellen Version auf GitHub abrufbar.[63] Dabei wird ein Basissystem angestrebt, das leicht aufzusetzen ist und eine große Bandbreite an verschiedenen Entwicklungsumgebungen unterstützt. OpenAI Gym will damit eine Standardisierung für die Veröffentlichung von Ergebnissen in der Erforschung künstlicher Intelligenz anbieten, um Publikationen leichter vergleichen und reproduzieren zu können.[64][65]
Mit OpenAI Five wurde ein System miteinander kooperierender Algorithmen entwickelt. KI-Systeme agieren üblicherweise unabhängig voneinander. Hier arbeiten jetzt erstmals KI-Systeme zusammen im Team an einem gemeinsamen Ziel. In dem komplexen strategischen ComputerspielDota 2 treten Teams aus mehreren Spielern gegeneinander an. In einem Wettbewerb waren diese kooperierenden KI-Systeme den menschlichen Spielern zwar überlegen, doch es ist zu beachten, dass in diesem Wettkampf eine stark vereinfachte Version des Spiels verwendet wurde, in der nur 17 der insgesamt 115 Helden spielbar sind und einige Gegenstände sowie Illusionsrunen nicht verfügbar waren.[66] Später wurde es Spielern aus der ganzen Welt für drei Tage ermöglicht, im Rahmen der vereinfachten Version online gegen die KI zu spielen, wobei OpenAI in 7257 Spielen eine Siegesrate von 99,4 % aufwies, aber auch von vielen Teams mehrmals hintereinander besiegt wurde – von einem Team gar zehnmal in Folge.[67] Ein Wettkampf mit Menschen ohne Einschränkungen im Spiel ist nicht geplant.
GPT-2 (Generative Pretrained Transformer 2) ist das erste Produkt der GPT-Serie, die große Verbreitung und Anklang fand. GPT-2 kann englischsprachige Texte selbstständig vervollständigen. Dessen Texte können teilweise von menschengeschriebenen Texten nicht unterschieden werden. Der Unterschied zu einigen anderen automatischenTextgeneratoren bestand darin, dass die Software zur Texterzeugung keine vordefinierten Textblöcke nutzt. Sie ist auch nicht auf einen Themenbereich festgelegt, sondern kann zu jeglichem Text einige passende Sätze erzeugen.[68]DasSprachmodell basiert auf einem Modell mit 1,5 MilliardenParametern; es erlaubt zu bestimmen, wie wahrscheinlich ein bestimmter Satz in einem Kontext ist.[69] Datengrundlage für GPT-2 waren ungefähr 45 Millionen Seiten Text.
Wissenschaftler kritisierten die von OpenAI gemeldeten Durchbrüche alsClickbaiting; die reißerischen Überschriften übertrieben den von OpenAI erzielten Durchbruch.[70]Wie bei ähnlichen Systemen hatte nach Beurteilung von Fachleuten auch GPT-2 deutliche Schwierigkeiten, Inhalte zu verstehen, was mithilfe statistischer Analysen eher überdeckt wurde. Zum Beispiel wurde ein Text überEinhörner zu einem fantasievollen Text über Einhörner mit vier Hörnern. Sind die Themen ungewöhnlicher und spezieller, schienen die erzeugten Texte an Qualität zu verlieren.
GPT-3, eine Weiterentwicklung von GPT-2, wurde in Form einer wissenschaftlichen Publikation erstmals am 28. Mai 2020 vorgestellt.[71] Die darauf basierende OpenAI-API ist das erste kommerzielle Produkt von OpenAI.[72] Mit über 175 Milliarden Parametern übertrifft es bei weitem das mit 17 Milliarden Parametern vergleichbare und vormals größte T-NLG-Modell von Microsoft.
Im Dezember 2022 stellte OpenAI denChatbot ChatGPT vor, der auf dem GPT-3.5-Modell basierte, wobei die aktuelle Pro-Version auf dem GPT-4.0-Modell (ohne Bilderkennung) basiert.[73] Sie wurde entwickelt, um Benutzern das Erstellen von natürlich klingenden Konversationen in Echtzeit in Form eines Chatbots zu ermöglichen.Eine wichtige Eigenschaft von ChatGPT ist die Fähigkeit, sich an den Kontext einer Konversation anzupassen sowie sich an vorherige Themen zu erinnern und darauf basierend angemessene Antworten zu generieren. Dadurch kann sich ChatGPT an veränderte Gesprächssituationen anpassen und eine realistischere Unterhaltung simulieren.[74]Es kann den Code nahezu aller Programmiersprachen analysieren und schreiben sowie Fehler und Bugs finden, Lösungen vorschlagen und dabei seinen Lösungsweg beschreiben. Aufgrund einer zu hohen Fehleranfälligkeit wurden ChatGPT-Antworten kurz nach der Veröffentlichung aufStack Overflow gebannt.[75]
Im März 2023 wurde GPT-4 vorgestellt.[76] GPT-4 soll nun auch Bilder erkennen und dazu passende Texte schreiben können. Laut Berichterstattung vonHeise online soll GPT-4 angeblich ein halbes Jahr lang durch Sicherheitstrainings und menschliche Nachjustierungen gelaufen sein, nachdem es auf „AzureAI-Supercomputern“ trainiert habe. GPT-4 soll aber auch aufgrund der wohl „erhöhten“ Fähigkeiten neue Risiken bergen, die aber nicht im technischen Bericht des OpenAI-Teams (oder sonst) veröffentlicht wurden.[77]
Anfang des Jahres 2023 forderten Wissenschaftler und IT-Prominente in einemoffenen Brief, das Training besonders leistungsfähiger KI-Modelle, die kompetenter sind als GPT-4, für mindestens sechs Monate auszusetzen. Zu den Unterzeichnern gehörten u. a.Geoffrey Hinton,Yoshua Bengio,Steve Wozniak undElon Musk.[78][79]
GPT-4 Turbo ging im November 2023 online. Es enthielt neue Features wie „Custom GPTs“ – eine Möglichkeit für User, im System eigene Chatbots zu bauen –, basiert auf einem Datenstand von Dezember 2023 und kann bis zu 128.000Tokens (rund 96.000 Wörter in Englischer Sprache) auf einmal verarbeiten. Das vorherige GPT-4-Modell schaffte 8.192Tokens (rund 6000 Wörter in englischer Sprache).[80][81] Das Erstellen eigener Bots (GPTs) erfordert keine Programmierkenntnisse, sondern kann direkt im Dialog mit ChatGPT auf der Plattform erfolgen.[82] Dieses Angebot wurde als Vorstufe hin zu einem „GPT Store“ gesehen, analog zu den App-Stores großer Smartphone-Anbieter.[83]
Es fand zudem eine Preissenkung für die Nutzung via API statt. Der Input in das System (also die Eingabe von Text) sank von 0,03 auf 0,01 US-Dollar pro 1000 Token, während sich der Preis für den Output (die Nutzung der Ergebnisse) auf 0,03 US-Dollar halbierte.[84][85][86] Die „Custom GPTs“ waren zunächst nur für Nutzer der Bezahlversion zugänglich.
Ein mit DALL-E erstelltes Bild, nach Eingabe von „racoons playing poker, digital art“
DALL-E wurde am 5. Januar 2021 von OpenAI vorgestellt. Der Name bildet einKofferwort ausWALL·E und dem spanischen KünstlerSalvador Dalí. Das Programm beruht auf GPT-3 und kann Wörter als Input in Anordnungen vonPixeln als Output transferieren und ist damit ein sogenannterText-zu-Bild-Generator. Das System kombiniert dabeiBilderkennung undComputerlinguistik.[87] So erstellt das Programmfotorealistische Bilder allein auf Basis von Texteingaben. Im April 2022 wurde die verbesserte Version DALL-E 2 vorgestellt,[88] im Oktober folgte 2023 DALL-E 3.[89]
OpenAI hat September 2022 ein automatischesmultilingualesSpracherkennungssystem namensWhisper[90] veröffentlicht. Es basiert auf einem Encoder-Decoder-Transformer und steht alsOpen-Source-Software zur Verfügung.[91] Das System wurde auf 680.000 Stunden mehrsprachiger und multitaskfähiger überwachter Daten trainiert, die aus dem Web gesammelt wurden.[92] Die verbesserte VersionWhisper V2 wurde im Dezember 2022 veröffentlicht,Whisper V3 im November 2023.
Am 15. Februar 2024 stellte OpenAI den Text-zu-Video-Generator „Sora“ vor, der aus Textanweisungen realistisch wirkende Videos erzeugt.[99][100] Das Modell erzeugt Videos von bis zu einer Minute Länge und gewährleistet dabei eine hohe visuelle Qualität sowie eine präzise Umsetzung der Benutzervorgaben.[101] Sora nutzt eine Diffusionsmodell-Technologie und Transformer-Architektur, um auf Basis der bei anderen Produkten gewonnenen Erkenntnisse aus kleinen Datenpaketenbewegte Bilder zu generieren.
Kritiker geben zu bedenken, dass die Technologie auch für kriminelle Zwecke, wie beispielsweisePropaganda, die Verbreitung vonFake News oder Beeinflussung vorWahlkämpfen eingesetzt werden könnte. Darüber hinaus fürchten Berufsgruppen, die mitMotion-Design,Illustration oderWerbespots ihren Lebensunterhalt verdienen, von dem günstigen Bewegtbildgenerator ersetzt zu werden. Die Verfügbarkeit von Sora wurde zunächst aufSicherheitsforscher undKunstschaffende begrenzt, wie CEOSam Altman bekannt gab. Um sicherzustellen, dass Nutzer Sora-Videos als KI-generiert erkennen können, sollen diese, unter anderem beiMeta, entsprechend gekennzeichnet werden.[102]
Am 9. Dezember 2024 wurde mehreren Ländern Sora Turbo offiziell zugänglich gemacht. Sora Turbo ist laut Open AI die Weiterentwicklung des Sora-Modells, das sie im Februar 2024 vorgestellt hatten und auch deutlich schneller als das im Februar 2024 vorgestellte Modell.[103] Besitzer eines ChatGPT Plus oder ChatGPT Pro Abonnements können nun auf Sora zugreifen, sofern sie aus bestimmten Ländern kommen. Das Vereinigte Königreich, die Schweiz und der Europäische Wirtschaftsraum beispielsweise können zurzeit nicht auf die Video-KI zugreifen (Stand 12. Dezember 2024).[104]
In Kooperation mit dem UnternehmenFigure stellte OpenAI im März 2024 ihren erstenhumanoiden Roboter „Figure 01“ vor, in den Sprache und visuelle Informationen verarbeitende Modelle von OpenAI implementiert sind.[105]
Open AI hat denKI-AgentOperator im Januar 2025 vorgestellt. Er erfüllt selbständig Web-Suchaktionen wie Einkäufe oder Reservationen, nachdem der Benutzer seine Wünsche als Auftrag eingegeben hat. Gelegentlich sind dazu weitere Interaktionen zwischen Agent und Benutzer notwendig. Dieser Agent wurde trainiert, indem er Suchvorgänge von menschlichen Benutzern im Internet verfolgt und ausgewertet hat.Operator ist vorerst nur für Abonnenten vonChatGPT Pro in den USA verfügbar.[106]
Anfang Februar 2025 wurdeDeep Research als Werkzeug vorgestellt, welches eine Suche zu einem vorgegebenen Thema auf unterschiedlichen Websites selbständig durchführt und als Ergebnis einen umfassenden Bericht erstellt. Dafür wird allerdings mehr Zeit benötigt als bei einer typischen Kurzabfrage über ChatGPT.Deep Research beruht auf dem ModellOpenAIo3, welches Lösungen in logischen Schritten findet und durchbestärkendes Lernen trainiert wurde.[107]Deep Research ist verwandt mitOperator. Bei beiden handelt es sich um KI-Agents.[108]
↑Vishal Sikka: OpenAI: AI for All. In: InfyTalk.Infosys, 14. Dezember 2015, archiviert vom Original am 22. Dezember 2015; abgerufen am 22. Dezember 2015 (englisch). (Link nicht mehr vorhanden)
↑David Gray Widder, Sarah West, Meredith Whittaker:Open (For Business): Big Tech, Concentrated Power, and the Political Economy of Open AI. In:SSRN Electronic Journal. 2023,ISSN1556-5068,doi:10.2139/ssrn.4543807 (ssrn.com [abgerufen am 12. September 2023]).
↑Sascha Lobo:Kolumne von ChatGPT und Sascha Lobo: Das Ende der irrelevanten KI. In:Der Spiegel. 7. Dezember 2022,ISSN2195-1349 (spiegel.de [abgerufen am 7. Dezember 2022]).
↑Unterstützt von Elon Musk: Experten fordern Denkpause für künstliche Intelligenz. In:Der Spiegel. 29. März 2023,ISSN2195-1349 (spiegel.de [abgerufen am 6. April 2023]).
↑Alex Nichol, Heewoo Jun, Prafulla Dhariwal, Pamela Mishkin, Mark Chen:Point-E: A System for Generating 3D Point Clouds from Complex Prompts. 16. Dezember 2022,doi:10.48550/arxiv.2212.08751,arxiv:2212.08751.
↑Point·E. In: GitHub. OpenAI, 22. Dezember 2022, abgerufen am 22. Dezember 2022.