A ChatGPT-t2022.november 30-án mutatták beprototípusként és pozitív fogadtatásban részesítette mind a szakma, mind a közönség. Generált szövegét„lenyűgözően alaposnak” és„emberekéhez hasonlíthatónak”,[2] sőt,„egy jó tanuló tudásszintjével felérőnek” nevezték.[3] Sokan„a valaha volt legjobbMI chatbotként"[1] méltatták.Elon Musk a bemutatást követően azt mondta:„a ChatGPT ijesztően jó, már nem vagyunk messze a fenyegetően erős MI-tól."[4] Jelentőségét sokan azIPhone 2007-es debütálásához hasonlították.[5] Ugyanakkor a tényszerű pontosság terén előforduló hiányosságokat is szóvá tette több szakember.[6]
Az OpenAI szoros partnerségben van aMicrosofttal, mely kizárólagosfelhőszolgáltatója; emellett 2019-ben 1 milliárd,[7] 2023 januárjában pedig 10 milliárd dollárral támogatta az MI-kutatásokat.[8][9] Ez az anyagi háttér adott lehetőséget arra, hogy a világ egyik legnagyobb teljesítményűszuperszámítógépével fejleszthessék tovább a ChatGPT-t,[10] mely fejlettebb és kreatívabb aSzilícium-völgy chatrobotjainál is.[11]
A ChatGPT működtetési költsége rendkívül magas, heti 5 millió dollárt tesz ki.[12] Ezért az OpenAI a Microsoft támogatásával saját mesterséges intelligencia chip fejlesztésén dolgozik. Az Athena névre keresztelt chiptől a korábban használtaknál jobb teljesítményt várnak, hogy időt és pénzt takaríthassanak meg.[13]
A ChatGPT sikerének köszönhetően az OpenAI kutatásainak és fejlesztéseinek pénzügyi háttere biztosítottá vált.[14] A ChatGPT bemutatását követően már 2023 első felében az OpenAI az egyik legértékesebb startup céggé vált azEgyesült Államokban, értéke 29 milliárd dollárra szökött fel.[15][16]
ANvidia, a világ legnagyobb vállalata, 2025 szeptemberében 100 milliárd dollárnyi befektetést hajtott végre az OpenAI-ba egy stratégiai együttműködés keretében. Ekkorra a ChatGPT fejlesztése és a felhasználói igények kiszolgálása hatalmas számítási teljesítményt igényelt, amelyet az Nvidia által gyártott csipek voltak képesek biztosítani, ezért ez a befektetés különösen előnyös volt az OpenAI számára. Az összeget legalább 10gigawatt teljesítményű, Nvidia-rendszereket használó adatközpontok kiépítésére irányozták elő.[17]
A chatbotot kétféle, úgynevezett megerősítő tanulási módszerrel tanították be, az RLHF-fel (Reinforcement Learning from Human Feedback[18][19]) és a PPO-val (Proximal Policy Optimisation[20][21]). A szöveg beviteléhez (input) és kimenetéhez (output) a GPT-3.5 AIalgoritmust használták (a GPT aGenerative Pre-trained Transformer rövidítése, ez szerepel a chatbot nevében). A GPT-3.5 aGPT-3 továbbfejlesztett változata, amely szintén az OpenAI fejlesztése, és a megerősítő tanulás mellett a felügyelt tanulás módszerét is alkalmazza.[22]
Az OpenAI a GPT és a Codex fejlesztése során szerzett tapasztalatai alapján a ChatGPT-t olyan biztosítékokkal látta el, amelyek megakadályozzák a helytelen vagy sértő válaszokat. Ugyanakkor a weboldalukkal kapcsolatban felhívták a figyelmet arra, hogy a verzió egy nyilvánosan elérhető kutatási interaktív tesztoldal, így a chatbot időnként hibás információkat generálhat.[23]
A modell betanításának alapját nagy mennyiségű, emberek által létrehozott szöveg képezte.
A szövegrészek több forrásból eredtek, például:
Online fórumokból
Közösségi médiából
Hírekből
Könyvekből
Beszélt nyelvekből
Az értelmező- modell az ezekkel az adatokkal történt betanítása során megtanulta, hogyan működik az emberi beszéd, és hogyan kell megfelelően reagálni bizonyos kérdésekre vagy kérésekre.
A modellt olyanalgoritmusok segítségével tanították be, amelyek megpróbálták a lehető legjobban leképezni a tréning adatait, így vált képessé értelmes válaszokat adni a felhasználók kérdéseire.
A modell teljesítményének javítása érdekében humán oktatókat használtak. A felügyelt tanulás esetében a modell olyan beszélgetéseket kapott, amelyekben az oktatók mindkét oldalt eljátszották: a felhasználót és az MI asszisztenst is. A megerősítési lépésben az emberi oktatók először azokat a válaszokat rangsorolták, amelyeket a modell egy korábbi beszélgetésben hozott létre. Ezekből a rangsorokból „jutalommodelleket” hoztak létre, amelyeken keresztül a modellt tovább finomhangolhatták. A betanítást a Microsofttal együttműködve végezték az Azure szuperszámítógép infrastruktúráját felhasználva.
Ezeket követően az OpenAI továbbra is gyűjtötte a ChatGPT felhasználóitól származó adatokat, amelyek felhasználhatók voltak a ChatGPT további betanításához és finomhangolásához. (Lásd alább: „Tesztelés”)
A felhasználóknak lehetőségük volt a ChatGPT-től kapott válaszokat pozitívan, vagy negatívan értékelni, válaszuk kifejtésére is mód volt.[24][25]
Bár a chatbot alapvető funkciója az emberi párbeszéd imitálása, az újságírók felfedezték a ChatGPT sokoldalúságát és improvizációs készségét, csakúgy, mint a számítógépes programok írására és az azokon belüli hibakeresésre való képességét. Kiderült, hogy a ChatGPT tud zenét szerezni, videójátékokat alkotni, meséket és diákesszéket írni. Nem okozott problémát neki a tesztkérdések megválaszolása (adott tesztek esetén akár az átlagos emberi tesztelőt meghaladó szinten);[26] a versek és dalszövegek írása;[27] tudta aLinux rendszert szimulálni; és képes volt akár egy egész chatszobát modellezni.[28]
Kiderült, hogy a legtöbb chatrobottal ellentétben a ChatGPT emlékszik az ugyanabban a beszélgetésben neki adott korábbi kérésekre, kérdésekre; az újságírók is felfedezték, hogy ez lehetővé tette, hogy a ChatGPT személyre szabott terapeutaként is használható legyen.[29] Annak érdekében, hogy a ChatGPT ne generáljon sértő (output) válaszokat, az (input) lekérdezéseket az OpenAI vállalati szintű[29] moderációsAPI-ján keresztül szűrték, ezzel a potenciálisanrasszista vagyszexista kérések elutasításra kerültek.[29]
A ChatGPT ugyanakkor hiányosságoktól sem volt mentes. Az OpenAI elismerte, hogy a ChatGPT néha hihetőnek hangzó, de helytelen vagy értelmetlen válaszokat ad. A ChatGPT jutalmazási modellje, amelyet emberi felügyeletre terveztek, túloptimalizálható, és így akadályozhatja az optimális teljesítmény elérését aGoodhart-törvény értelmében.
A bemutatáskor a2021 után bekövetkezett eseményekről a ChatGPT csak korlátozott ismeretekkel rendelkezett. ABBC szerint 2022 decemberétől a ChatGPT nem fejezhet ki „politikai véleményt, és nem vehet részt politikai aktivizmusban."[30] A kutatások mégis azt bizonyították, hogy meghatározóanzöld–,baloldali-libertariánus irányultságot mutat.[30] A ChatGPT betanítása során az emberi bírálók a hosszabb válaszokat részesítették előnyben, függetlenül a tényleges megértéstől vagy a tényszerű tartalomtól. A betanítási adatok sem voltak mentesek algoritmikus torzításoktól, ezek akkor derülhetnek ki, amikor a ChatGPT olyan kérésekre válaszolt, amelyek emberek leírását tartalmazzák. Egy esetben a reakciója arra utalt, hogy a nők és a színes bőrű tudósok alacsonyabb rendűek a férfi és fehér tudósoknál.[31][32]
Pioneer Building, San Francisco – az OpenAI székháza
Paul Krugman közgazdászprofesszor egy 2022. decemberi véleménycikkében azt írta, hogy a ChatGPT hatással lesz a tudományos életre, benne a tudásalapú munkaerő iránti keresletre.[33] James Vincent, a The Verge munkatársa a ChatGPTvírusos gyorsasággal terebélyesedő sikerét annak bizonyítékaként értékelte, hogy az MImainstreammé, a fősodor részévé vált.[34]
A ChatGPT-t 2022 decemberében túlnyomórészben pozitív kritikák fogadták; aThe New York Times „a valaha is a nagyközönség számára bemutatott legjobb MI chatbotnak" nevezte. 2022 decemberében Samantha Lock abritThe Guardian újságírója megjegyezte, hogy képes „lenyűgözően részletes" és „emberhez hasonló" szöveget generálni.[2] Dan Gillmor újságíró egy diákfeladathoz használta a ChatGPT-t, és úgy találta, hogy a generált szöveg egyenrangú volt azzal, amit egy jó tanuló készítene, és úgy vélte, hogy „az akadémiai köröknek hamarosan néhány nagyon komoly problémával kell majd szembesülniük".[3]
Alex Kantrowitz a Slate magazintól dicsérte a ChatGPT visszautasítását anáciNémetországot dicsérő kérdésekkel kapcsolatban.[35] A The Atlantic 2022-es „Az év áttörései" című írásában Derek Thompson a ChatGPT-t a „generatív-MI robbanás" részeként említette, amely „megváltoztathatja a gondolkodásunkat arról, hogyan dolgozunk, hogyan gondolkodunk, és hogy mi is az emberikreativitás valójában".[36]
Kelsey Piper a Vox újságírója azt írta, hogy a ChatGPT az MI első kézzelfogható, átélhető megjelenése, bemutatkozása a szélesebb közönség előtt. Ezzel válik igazán először érzékelhetővé, milyen döbbenetesen erős lett az MI, sőt, az is kiderül, hogy a ChatGPT elég okos ahhoz, hogy hibái ellenére is hasznos legyen. Paul Graham az Y Combinatortól azt tweetelte, hogy „most egyértelműen valami nagy dolog tanúi vagyunk."[37]
Elon Musk szerint „ijesztően jó ésfenyegetően erős a ChatGPT".[4] Musk szüneteltette az OpenAITwitter-adatbázishoz való hozzáférését addig, amíg nem lesznek világosabbak az OpenAI tervei. Óvatosságát azzal indokolta, hogy „az OpenAInyílt forráskódú ésnonprofit alapokról indult, de akkorra már egyik sem volt igaz rá.[38][39] Musk 2015-ben társalapítója volt az OpenAI-nak, részben az MI-ból eredő egzisztenciális kockázatokra való figyelemmel, de 2018-ban kiszállt a cégből.[39][40]
2022 decemberében a Stack Overflow kérdésekre és válaszokra szakosodott honlap megtiltotta a ChatGPT használatát a kérdésekre adott válaszok generálásához, hivatkozva a ChatGPT válaszainak tényszerűen kétértelmű voltára. Tyler Cowen közgazdász aggodalmának adott hangot a ChatGPT demokráciára gyakorolt hatásával kapcsolatban. AThe Guardian megkérdőjelezte, hogy a ChatGPT megjelenése után az interneten található bármilyen tartalom „valóban megbízható” lesz-e még, és kormányzati szabályozást sürgetett a kérdésben.[41]
A ChatGPT ellen felhozott vádak egyik legsúlyosabbja a semleges nézőpont,Neutral Point of View (NPOV) hiánya volt.
A ChatGPT elfogultságával kapcsolatos vádak idővel felerősödtek. Azzal vádolták, hogy diszkriminatív magatartást tanúsít, például vicceket mesél a férfiakról és azAngliából származókról, miközben nem hajlandó vicceket mesélni a nőkről és azIndiából származókról.[42] Több nagy amerikai jobboldali hírportál, úgymint aNational Review, aFox Business és aMailOnline bírálta a chatbotot azért, hogy miközben olyan politikusokat dicsér, mintJoe Biden, aközben nem hajlandó ugyanezt tenniDonald Trump esetében.[43] Konzervatív kommentátorok egyértelműen azzal vádolták a ChatGPT-t, hogy elfogult a baloldali nézőpontok felé olyan kérdésekben, mint a választási csalás, Donald Trump és a faji szidalmak használata.[44][45][46] A ChatGPT-t a jobboldali politikai közegben egyre többen gúnyosan csak „Woke AI”-nak csúfolták.
Az ilyen kritikákra válaszul az OpenAI elismerte, hogy tervezi, hogy lehetővé teszi a ChatGPT számára, hogy olyan kimeneteket hozzon létre, amelyekkel más emberek (saját magukat is beleértve) határozottan nem értenek egyet. Közleményük tájékoztatott azokról a lépésekről is, amelyek a vitatott témák kezelésének gyakorlatát változtatnák majd meg, többek között a mesterséges intelligenciának „fel kell majd ajánlania, hogy leírja az emberek és mozgalmak megítélésének különböző aspektusait”, és nem szabad a „saját hangján” érvelnie „gyújtó vagy veszélyes” témák mellett (bár ettől még „bemutathatja a történelmi személyiségeket és eseményeket”), és nem szabad „csatlakoznia az egyik oldalhoz”, vagy önmagában „jónak vagy rossznak ítélnie egy csoportot”. 2023 februárjában az OpenAI vezérigazgatója,Sam Altman kijelentette, hogy eltökélt szándéka, hogy addig tökéletesítik a chatbotot, amíg majd nem érzi azt mindenki jó szívvel a magáénak.[46]
A ChatGPT-n keresztül, az új chatbotba legtöbbet, 11 milliárd dollárt befektető Microsoft[7][8] kihívása azonline marketing egyik legfontosabb és legjövedelmezőbb eszközét, akeresőmarketinget 95 százalékos piaci részesedésselmonopolhelyzetben a kezében tartóGoogle[47] számára hatalmas volt. 2022 decemberében a Google háza tájáról „ChatGPT-sokkról” szivárogtak ki hírek. A ChatGPT várhatókeresőmotor-üzletágat is feje tetejére állító hatása miattSundar Pichai vezérigazgató több kutatórészlegén belül „felforgatta" és átszervezte az MI szolgáltatásuk fejlesztésére korábban létrehozott munkacsoportjait.[48]
A két óriáscég között kiéleződött verseny 2023 februárjában látványos szakaszába ért. Néhány perces különbséggel prezentálták az MI terén történt legutóbbi fejlesztéseik eredményeit.
A Google bemutatta[49] saját,Gemini (korábbi nevén Bard) névre keresztelt chatbotját,[50][51] a Microsoft pedig ChatGPT-vel[52] felturbózottBing chatbotját, melynek kódjait túlnyomó többségben az OpenAI által fejlesztett GitHub Copilot[53] írta. Miután a Google Bard pontatlan információt osztott meg a prezentáció során, 100 milliárd dollárt bukott a cég. Az új chatbot fiaskója a Google befektetői körében erősítette az aggodalmat, hogy hosszabb távon a Microsoft felülkerekedhet versenytársán.[54]
A verseny azonban nem korlátozódott az amerikai óriáscégekre, komoly versenytársként szeretett volna bemutatkozni a magának keresőmotorjával már korábban hírnevet szerzettkínai[55][56]Baidu mesterséges intelligenciát fejlesztő vállalat.[57] A Baidu ChatGPT-hez hasonló chatbotját, azErnie botot – kínai nevénWenxin Yiyant – 2023 márciusa közepén mutatták bePekingben. Robin Li, a Baidu vezérigazgatója azonban élő interakció helyett csak egy előre felvett bemutatót tartott a szoftver képességeiről. Bemutatta Ernie bot algebrai képességeit, és hangot generált akínai nyelvszecsuani és hakkaidialektusában. A prezentációt követő csalódásnak köszönhetően a Baidu is a Google sorsára jutott, részvényei értéke 10 százalékot zuhant ahongkongi tőzsdén.[58][59][60]
2023 márciusának végén amoszkvai székhelyű Sistemma informatikai vállalat jelentette be saját ChatGPT versenytársának, a SistemmaGPT-nek a létrehozását, amely teljes egészébenorosz szervereken, illetveorosz ésangol nyelven működik, kifejezetten orosz vállalkozások és kormányzati szervek számára tervezték. (A ChatGPT-t az orosz kormány a bemutatását követően azonnal betiltotta a dezinformációtól és a bűnügyi felhasználástól való félelem miatt.) A Sistemma fejlesztői azt állították, hogy chatbotjuk a ChatGPT-3.5-tel azonos képességekkel rendelkezik, és „enciklopédikus tudással” büszkélkedhet.[61][62]
2023 áprilisában az oroszSberbank is bejelentette, hogy a ChatGPT riválisaként – kezdetben csak meghívásos demó-módban –GigaChat néven egy MI-chatbotot fejlesztettek ki.Oroszország meghatározó bankja tájékoztatása szerint a GigaChat újdonsága abban rejlik, hogy más külföldineurális hálózatoknál intelligensebb orosz nyelvű kommunikációra képes. Képes válaszolni a neki feltett kérdésekre, beszélgetést folytatni és tud programkódot írni a szoftverfejlesztéshez. A Sberbank azt állította, hogy a GigaChat, az orosz mesterséges intelligencia eszköz képes szöveget és képeket is generálni, ellentétben a ChatGPT-vel, amely csak szöveget tud létrehozni.[63][64]
2023 áprilisának végén a Golden Brick Silk Road vezette kínai konzorcium tulajdonában lévő[65]norvégOpera Software újOpera böngészőt indított Opera One néven, mely integrálja a ChatGPT-t és a ChatSonicot. A ChatSonic GPT-4 által működtetett chatbotja lehetővé tette a felhasználók számára, hogy a szöveges bemenetekből képeket is generáljanak. Az Opera közleménye szerint az Opera One első verziójáról volt szó, mely leválthatja a cég zászlóshajó termékét aWindowson, aMacOS-en és aLinuxon.[66] A vállalat arról tájékoztatott, hogy hamarosan újabb MI-alapú fejlesztéseket jelent be, melyek a saját GPT-alapú modelljén futnak majd.[67] Minthogy a mesterséges intelligencia által generált tartalom megváltoztatja a keresési szokásokat, ezért a ChatGPT beépítésével új böngészési szuperképességeket kívántak biztosítani felhasználóiknak, újraértelmezve a tanulás, az alkotás és a kutatás módját.[68]
2024 decemberében az OpenAI ingyenes hozzáférést adott a ChatGPT MI-alapú keresőmotorjához, a ChatGPT AI Search Engine-hez. Ez kombinálja agépi tanulás legmodernebb technológiáit az OpenAI GPT-modelljeivel. A rendszer képes valós idejű információk elérésére az interneten keresztül, miközben a meglévő adatbázisára is támaszkodik. A ChatGPT MI-alapú keresőmotorjának szerepe meghatározó lehet az oktatás, a kutatás és az olyan üzleti környezet terén, ahol gyors, pontos és releváns információkra van szükség.[69] (Bővebben ld. alább azAdventi GPT naptár szakaszban.)
A The Atlantic magazinban Stephen Marche megállapította, hogy a ChatGPT hatása az oktatásra és különösen azesszék készítésére még nem látható előre.[70] Daniel Hermankaliforniai középiskolai tanár és szerző azt írta, hogy a ChatGPT a középiskolai angol nyelvoktatás végének a kezdete lesz.[71]
Emma Bowman az NPR munkatársa arról írt, hogy fennáll a veszélye annak, hogy a diákokplagizálnak egy olyan mesterséges intelligencia eszközön keresztül, amely elfogult vagy értelmetlen szöveget adhat ki tekintélyelvű hangnemben: „Még mindig sok olyan eset van, amikor felteszel a ChatGPT-nek egy kérdést, és az egy nagyon hatásosnak hangzó választ ad rá, ami amúgy teljesen elfogadhatatlan."[72]
Robert Lepenies, akarlsruhei Karlshochschule International University elnöke az egyetemén végzett tesztek alapján úgy ítélte meg, hogy a ChatGPT által készített szövegek „minőségileg nem különböztethetők meg atársadalomtudományok terén készült hallgatói munkától". Gerhard Lauer könyvkutató arra számított, hogy a közeljövőben ilyen programokkal írnak majd könyveket, különösen a sablonokat követő területeken: szakkönyveket, valamint krimiket és romantikus regényeket. Mivel a még erősebb GPT-4 szoftver is már bemutatás közeli állapotban volt, sürgős társadalmi vitát sürgetett arról, hogy „hogyan akarnak bánni ezekkel a forradalmi technikai lehetőségekkel". Mint mondta, félő hogy néhány nagyvállalat érdekei döntik majd el, hogy „melyik kultúrához juthatunk hozzá, és melyikhez nem".[73]
Christian Terwiesch, a világ egyik legnívósabb üzleti képzést nyújtó egyeteme, a Wharton University professzorának beszámolója szerint a ChatGPT sikeresen teljesítette az egyetem üzleti vizsgáját. Terwiesch állította, a ChatGPT eredményesen végzett el elemzői, menedzseri és tanácsadói munkafolyamatokat, bizonyította jártasságát mind a kódolásban, mind a jogi szaknyelvben. Ugyanakkor átugrott néhány meglehetősen egyszerű matematikai feladatot, úgy tűnik, a nyelvi modellezőknek ezen a területen vannak a legnagyobb nehézségeik.[74][75][76]
AMinnesotai Egyetem jogi karán azt vizsgálták, hogy a ChatGPT milyen eredménnyel tud négy valódi vizsgán válaszokat generálni. A vizsgákat vakon osztályozták a szokásos osztályozási folyamat részeként. A vizsga 95 feleletválasztós feladatot és 12 esszékérdést foglalt magába. Végül a ChatGPT teljesítette a minimális követelményeket és mind a négy kurzuson átment.[76][77][78]
„Az mesterséges intelligenciáért folytatott harc mindent a feje tetejére állít! Ideje elkezdened aggódni!” – állította a ChatGPT a Time magazinnal folytatott kommunikációja során (2023. február)[79]
Joanna Stern, aThe Wall Street Journal munkatársa megírta, hogy egyamerikai középiskolai angol vizsgán az eszközzel csaltak, amikor egy generált esszét küldtek be.[80] Darren Hick, a Furman Egyetem professzora, leírta, hogy észrevette a ChatGPT „stílusát" egy diák által benyújtott dolgozatban. Egy online GPT-érzékelő azt mutatta ki, hogy a dolgozatot 99,9%-os valószínűséggel számítógép generálta, de Hicknek nem volt erre kézzelfogható bizonyítéka. A kérdéses hallgató azonban szembesítéskor beismerte, hogy ChatGPT-t használt, és ennek következtében megbukott a kurzuson.[81] Hick azt javasolta, hogyad-hoc egyéni szóbeli vizsgát kelljen tenni a dolgozat témájából, ha egy hallgató erősen gyanús, hogy MI-vel generált dolgozatot adott be.[82] Edward Tian, aPrinceton Egyetem végzős egyetemi hallgatója azt állította, hogy létrehozott egy "GPTZero" nevű programot, amely a tudományos plágium elleni küzdelem jegyében felismeri, hogy egy dolgozatot ember írt-e vagy sem.[83][84] 2023. január 4-től a New York-i Oktatási Minisztérium korlátozta a ChatGPT-hez való hozzáférést az állami iskolai internetről és eszközökről.[85][86]
Egy év elteltével a chatbotot már messze nem csak egyetemi esszék megírására használták fel. 2024 januárjában Rie Kudan,Japán legrangosabb irodalmi díjának, azAkutagawa-díjnak a 17. győztese elismerte, hogy díjnyertes regényét a ChatGPT segítségével készítette el.[87] "Tokió-to Dojo-to" című regénye lenyűgözte az Akutagawa zsűrijét, tökéletesnek és hibátlannak értékelték azt.[88] A győztes szerző atokiói díjátadó ünnepségen árulta el, hogy a díjnyertes könyv tartalmának 5 százalékát a ChatGPT írta, mely amúgy is segített neki kibontakoztatni kreatív képességeit.[89] „kapcsolatot” szeretne fenntartani vele a jövőben is.[90]
A ChatGPT és aWikipédia két hatalmas, egyetemes, egymástól nem független tudásforrás. Egymásrautaltságukból adódó együttműködésük a ChatGPT megjelenését követően rövid időn belül, több területen is kialakult.[91]
A ChatGPT betanításához létfontosságú, működéséhez, fejlesztéséhez elengedhetetlen volt és maradt a Wikipédia,[91] kialakult partnerségük, egyre szorosabbá ésinteraktívabbá vált kapcsolatuk.[92]
Az OpenAI a ChatGPT funkcionális továbbfejlesztésétbővítmények,pluginok beiktatása segítségével oldotta meg. A felhasználók számára ez aplugin-rendszer teszi lehetővé a mesterséges intelligencia személyre szabott funkcionális bővítését.[93]
Azon túl, hogy a ChatGPT kifejlesztésében a Wikipédiának a fentiek szerint stratégiai jelentősége volt, az OpenAI által létrehozottWikipedia ChatGPT Plugin egy olyan bővítmény, amely operatív szinten teszi lehetővé a ChatGPT számára, hogy általános ismeretekre vonatkozó kérdésekre válaszolva, azok alapjaként keresse meg és foglalja össze a legfrissebb információkat a Wikipédiából.[94]
AWikipedia ChatGPT Plugin a Wikipédiából származó naprakész információkkal bővíti a ChatGPT-vel történő interakciókat, az információk gyors és hatékony elérésének eszközeként funkcionál, mintegy mini enciklopédiaként működve.[95] AWikipedia ChatGPT Plugin a meglévő keresőAPI-t használja az információhoz kulcsfontosságú Wikipédia-cikkek megtalálásához. Ezt követően a 4 legfontosabb releváns cikkből idézi a 12 legfontosabb szövegrészletet. A plugin megadja a cikkekre mutató forráslinkeket és igazolja az információk felhasználásának jogtisztaságát is.[96]
Ugyanakkor a ChatGPT használatának lehetőségeit és korlátait a Wikipédia írására, és a cikkek szerkesztésére nemzetközi szinten még nem határozták meg, és még mindig vita tárgyát képezik a Wikipédia közösségében.[97] Egyeswikipédisták szerint a ChatGPT-t teljesen be kellene tiltani, még akkor is, ha az így szerkesztett cikkeket később hús-vér szerkesztők ellenőrzik.[98] Szerintük a mesterséges intelligencia túlságosan is képes hihető valótlanságokat állítani.[99] Az a veszély is fennáll, hogy a Wikipédia szerkesztői nehezebben tudják ellenőrizni a közzétett tartalmakat.[100]
Andrew Lih, awashingtoniSmithsonian Institution egyik wikimédiás munkatársa, aki 2003 óta önkéntes Wikipédia-szerkesztő, ugyanakkor azzal érvel, hogy a ChatGPT-ben rejlő lehetőségek segíthetnek leküzdeni a szócikkek írását, szerkesztését nemritkán megelőző indulási tehetetlenséget, nehézkességet a wikipédistáknak és segítenek számukra megtalálni az „aktivációs energiát.”[97]
Az első ChatGPT közreműködésével készült Wikipédia szócikket2022.december 6-án tette közzé az angol nyelvű Wikipédiában –máig megtekinthetően –Richard Knipel, egy régóta Pharos néven szerkesztő wikipédiás'Artwork title' („A mű címe") címmel.[97] Szerkesztői összefoglalójában azt írta, hogy ez csak egy ChatGPT-vel készített vázlat, amelyet később módosít.[101] A Knipelhez hasonló wikipédisták úgy vélik, hogy a ChatGPT-t eszközként lehet használni a Wikipédián belül anélkül, hogy az emberi szerep leértékelődne.[102] Szerintük a chatbot által generált nyers szöveg hasznos kiindulási pontként vagy vázlatként szolgálhat,[103] amelyet aztán a szerkesztő ellenőrzést követően szócikké szerkeszthet.[102]
A ChatGPT-t 2022. november 30-án mutatták be. A chatbot szolgáltatást ingyenesen bocsátották a nagyközönség rendelkezésére, csak későbbre tervezték a fizetőssé tételét. Bár az OpenAI-nál senki sem prognosztizált 100.000-nél több felhasználót a bemutatót követő egy héten belül,[104]Greg Brockman, a OpenAI társalapítója ésSam Altman mellett annak irányítója már a premiert követően öt nappal arról tudott beszámolni, hogy átlépték az egymilliós felhasználói számot.[105]
2022. december 15-én aCNBC azt írta, hogy a szolgáltatás „még mindig leáll időnként”.[106]
A ChatGPT-nek a UBS befektetési bank kutatása szerint már az első hónapban 57 millió aktív felhasználója volt, ami 2023 januárjára valószínűsíthetően átlépte a 100 milliós számot. Összehasonlításképpen: aTikTok közösségi médiaalkalmazásnak közel kilenc hónapra volt szüksége az indulása után, hogy ugyanezt a felhasználói bázist kiépítse, azInstagramnak pedig nagyjából két és fél év kellett ahhoz, hogy 100 millió havi aktív felhasználóra tegyen szert. AGoogle Translate-nek anno hat és fél év kellett ahhoz, hogy elérje ezt a határt. A felfutás rendkívüli volt, a ChatGPT minden idők leggyorsabb fogyasztói alkalmazásnövekedését érte el.[107]
Az induláskor a szolgáltatás alapnyelve az angol volt, de jó néhány más nyelven, így magyarul is működött.[108]
A ChatGPT Plus a ChatGPT továbbfejlesztett változata.[109]
Az OpenAI 2023 januárjában havi 42 dollárért elindította a ChatGPT fizetős verzióját, a ChatGPT Plust, más néven ChatGPT Professionalt. A ChatGPT frissített, de még „kísérleti" változata a csúcsidőszakokban is elérést kínált, nem voltak leállásai, elsőbbségi hozzáférést biztosított az új funkciókhoz, gyorsabb lett a válaszsebessége és nem voltak korlátozások rajta.
A ChatGPT Plus felhasználói csomag tartalmát és árát az OpenAI a kliens konkrét igényeihez igazította. Az előfizetés a kezdeti időszakban nem volt elérhető nyilvánosan, az OpenAI választotta ki a jelentkezők közül, hogy kinek adja meg a prémiumlehetőséget. Ehhez kapcsolódóan a vállalat egy várólista linket tett közzé Discord szerverén.[110]
Ezt követően a ChatGPT Plus havi 20 dollár felárért[111] hozzáférést biztosított a ChatGPT[109]GPT-4 által támogatott verziójához; az korábbi verziót aGPT-3-ból kifejlesztettGPT-3.5 támogatta.[112] Így az OpenAI a GPT-4API várólistáján keresztül a GPT-4-et is elérhetővé tette a jelentkezők egy általuk kiválasztott csoportja számára.[113][114]
„Hozzon létre egy képet, amely érzése szerint jól reprezentálja magát, a GPT-4-et!” – A fenti parancsra ezt a képet generálta a GPT-4 (2024)
2023 májusában az OpenAI elindította a ChatGPTiOS-alkalmazását. Az alkalmazás támogatta a chat-előzmények szinkronizálását és a hangbevitelt (az OpenAI beszédfelismerő modelljét, a Whispert használva). 2023 júliusában mutatták be azandroidos verziót, amelyet előszörBangladesben,Brazíliában,Indiában és azEgyesült Államokban hoztak forgalomba.[115][116] Az alkalmazás hamarosan világszerte elérhetővé vált.
Az OpenAI fogyasztóbarát Professional csomagja kiegészítéseként 2023 márciusától elérhetővé tette ChatGPT és Whisper modelljeiAPI-ját, amely a fejlesztők számára biztosított hozzáférést a nyelvi és beszéd-szöveg funkciókhoz. A ChatGPT új API-ja ugyanazt a GPT-3.5-turbo MI-modellt használta, mint amit a népszerű chatbot. Ennek köszönhetően lehetővé vált, hogy a fejlesztők akár a ChatGPT változatlan, akár annak módosított verzióját adhassák hozzá alkalmazásaikhoz.[117] A ChatGPT API ára 0,002 dollár volt 1000 tokenért (ez kb. 750 szót jelent), így tízszer olcsóbb volt ez az ár, mint a GPT-3.5 modelleké.[118][119]
Az OpenAI magyarázata szerint a rendszer egészére kiterjedő optimalizációk révén december után sikerült 90 százalékkal csökkenteniük a ChatGPT költségeit, és ezt a megtakarítást adták tovább az API-felhasználóknak. Meggyőződésük volt, hogy a mesterséges intelligenciában rejlő teljes potenciál kiaknázásának legjobb módja az, ha mindenki számára lehetővé teszik, hogy alkalmazzák azt a szoftverfejlesztésük során. Később az OpenAI bejelentette a fejlesztői feltételei módosítását az ügyfelekadatvédelmi és biztonsági visszajelzései alapján.[120] Amennyiben a fejlesztő nem járult hozzá, a vállalat a továbbiakban nem használta fel a szolgáltatásfejlesztő API-n keresztül megadott adatokat mesterséges intelligencia modelljeinek fejlesztéséhez. Emellett az OpenAI egy 30 napos adatmegőrzési határidőt is bevezetett, és a felhasználói igények függvényében szigorúbb adattárolási feltételeket biztosítását vállalta (feltehetően a nagy adatfelhasználású és megfelelően nagy költségvetésű vállalatokra gondolva). Végül a vállalat leegyszerűsítette az adatok tulajdonjogának kérdését azzal, hogy a modellek bemeneti és kimeneti adatai a felhasználók tulajdonát képezik. A vállalat emellett a fejlesztők előzetes ellenőrzését egy nagyrészt automatizált rendszerrel váltotta ki. Az OpenAI a változtatást azzal indokolta, hogy „az alkalmazások túlnyomó többségét az átvilágítási folyamat során jóváhagyták”, és azt állította, hogy az ellenőrzés „jelentősen javult”.[121] A felkínált szoftverfejlesztői támogatás lehetőségével számos nagyvállalat azonnal élt, köztük aSnap (Snapchat),[122] a Salesforce; a Quizlet, az Instacart, a Shopify és a Speak. Az elsők között volt aCoca-Cola, mely a Bain & Company vezetési tanácsadó óriásvállalat segítségével integrálja a GPT-modellt a vezetési rendszereibe, kutatásaiba és gyártásfolyamataiba.[123]Magyarországon azOTP volt az első felhasználók egyike, amely élt az OpenAI szoftverfejlesztési lehetőségével, magyar nyelvi modelljét fejlesztette segítségével.[124]
2023 márciusában az OpenAI bemutatta aGPT-4 nevűmultimodális nagy nyelvi modelljét, GPT sorozata negyedik tagját.[125][126] A multimodalitás azt jelenti, hogy a GPT-4 esetében már nem csak szöveges parancsokkal, de képekkel is lehet tartalmat generálni.[127] Hangsúlyozták, hogy a GPT-4 „megbízhatóbb, kreatívabb és sokkal árnyaltabban képes az utasításokat kezelni, mint a GPT-3.5.".
Az OpenAI csak korlátozott információt bocsátott rendelkezésre a GPT-4 technikai jellemzőit illetően; a műszaki ismertetés során kifejezetten elzárkózott attól, hogy ismertesse a modell paramétereit, felépítését, vagy a betanítás során használt hardvert. Ugyan tájékoztatást adtak arról, hogy a modellt először egy nagy adatbázisra épülő irányított, mennyiségi alapú képzéssel, majd emberi és mesterséges intelligencia-visszacsatolással kombinált minőségi betanítással képezték ki, de nem közöltek további részleteket sem a betanítás folyamatáról, sem a képzési adatbázis összeállításának szempontjairól. Nem adtak meg olyan hiperparamétereket, mint például a tanulási sebesség, azepochaszám vagy az alkalmazott optimalizátorok, nem tájékoztattak a felmerült erőforrásigényekről sem. Döntésüket „a versenyhelyzettel és a nagyméretű modellek biztonsági kockázataival” indokolták.[128]
Az OpenAI azzal érzékeltette új modellje képességeit, hogy a GPT-4 az amerikai jogi egyetemek végzősei számára a hivatásos ügyvédi tevékenység megkezdése előtt előírt ügyvédi vizsga szimulációja során a tesztet kitöltők legjobb 10 százaléka körül teljesített, míg a régebbi modell „csak” az alsó 10 százalék körüli eredményt érte el.[129] A Microsoft Research[130] is tesztelte az új modellt, és arra a következtetésre jutott, hogy „joggal tekinthető egymesterséges általános intelligencia (Artifical General Intelligence,AGI) rendszer korai, de még nem tökéletes változatának”.[131]
A Microsoft hivatalosan is megerősítette, hogy aBing GPT egy hónappal korábbi bemutatásakor (ld. alább) valójában már a GPT-4 verziót használták,[132] és bejelentette a GPT-4 további integrációját már meglévő termékeibe, az emberek milliói által nap mint nap használt olyan alkalmazásokba, mint aWordbe, azExcelbe, aPowerPointba, azOutlookba és a Teamsbe.[131]
ADALL-E mesterséges intelligencia, amely képes részletes és élethű képeket generálni szöveges leírások alapján.
A DALL-E és a GPT-4 között szoros kapcsolat van, mivel mindkettőt azOpenAI fejlesztette ki, és a DALL-E szorosan integrálódik a GPT-4-hez.[133]
A kapcsolat legfontosabb pontjai:
GPT-4 integráció: a DALL-E a GPT-4 nyelvi képességeit használta a felhasználói utasítások értelmezésére. Ez azt jelenti, hogy a szöveges leírásokat a GPT-4 dolgozza fel, hogy a lehető legpontosabb vizuális eredményt adta. A GPT-4 képes volt finomítani és pontosítani a felhasználók által megadott szöveges leírásokat, így a DALL-E pontosabban generálta a kívánt képet.[134]
ChatGPT-ben való elérhetőség: a DALL-E elérhető lett a GPT-4 verzióban. Ez lehetővé tette, hogy a felhasználók egyszerűen szöveges utasításokat adjanak, és azonnal láthassák a generált képeket.
Szöveg és kép közötti koherencia: a GPT-4 nyelvi modelljének kifinomultsága segítette a DALL-E-t abban, hogy a generált képek szorosan igazodjanak az utasításokhoz. Ez különösen fontos volt bonyolultabb vagy részletgazdagabb szöveges leírások esetén.[135]
Inpaint és módosítások: A DALL-E fejlesztései közé tartozott a képek módosításának képessége (pl.inpaint, azaz képkitöltés, képjavítás; részletek cseréje vagy finomítása), ami szintén a GPT-4 szövegértési képességein alapult. A GPT-4 pontosan megértette, mit kell a képen módosítani, és a DALL-E végrehajtotta azt.
Tehát a GPT-4 lényegében a DALL-E "agyaként" működött, amely értelmezi a szöveges utasításokat és biztosítja, hogy a generált képek pontosan tükrözzék a felhasználó elképzeléseit. Ez a mély integráció tette a DALL-E-t különösen hatékonnyá a képgenerálásban.[136]
Az OpenAI új generatív továbbfejlesztett MI modellje nevének végén a 4-es után az „o” az„omni” rövidítése, ami arra utal, hogy a modell magabiztos a beszéd, a fordítás és a képalkotás területén egyaránt. A GPT-4o a bemutatását követő hetekben iteratívan, fokozatosan került bevezetésre a vállalat fejlesztői és fogyasztói termékeiben. Bemutatásától kezdve a GPT-4o vette át a ChatGPT „meghajtását”.[137]
A GPT-4o 2024. május 13-án mutatkozott be a közönségnek. A továbbfejlesztett modell kétszer gyorsabb és 50 százalékkal olcsóbb volt, mint elődje, a GPT-4 Turbo, és jelentős javulást mutatott a nem angol nyelvű szövegek feldolgozásában, valamint a vizuális és audio tartalmak megértésében.[138]
Ekkoriban az OpenAI több mint 50 nyelvet támogatott, lefedve a beszélt nyelvek több mint 97 százalékát. A GPT-4o modellt minden felhasználó számára ingyenesen bocsátották rendelkezésre..
Az új modell bemutatóján a felhasználók kérdéseket tehettek fel aGPT-4o-nak, de válasza közben meg is szakíthatták. A GPT-4o „valós idejű” reakciókészséget mutatott, a felhasználó hangjának árnyalataira is képes volt reagálni, válaszul „különböző érzelmi stílusú” hangokat generálva (beleértve az éneklést is).
A GPT-4o bemutatásakor az addigi legmagasabb teljesítményt nyújtotta a multimodalitási-; tehát a hang-, a többnyelvűség és a képalkotás összehasonlítási teszteken. Ezeket az új rekordokat a hangalapú beszédfelismerés, a fordítás és a vizualitás terén állította be az új modell.[139] A GPT-4o88,7 pontos eredményt ért el az MMLUbenchmarkingjában, szemben a GPT-486,5 pontjával.[140] AKaliforniai Egyetem (Berkeley) által vezetett Large Model Systems Organization (LMSYS)Élő-pontrendszer alapú Arena Benchmarkban bemutatása idején a GPT-4o volt a vezető modell.[140]
A ChatGPT bemutatását követően, 2023 áprilisában Altman még a GPT-4 fejlesztését tartotta prioritásnak”, míg a GPT-5 tökéletesítését másodlagosként kezelte. Ez a hozzáállás fél év múlva megváltozott, s az innováció eredményeként az OpenAI 2025 augusztusában bemutatta be a nyilvánosan elérhető GPT-5 modellt, amely a ChatGPT új generációs alapját adja. Ez az ötödik nagy modell a cég modellsorozatában. A GPT-5 minden felhasználó számára ingyenes elérhető a ChatGPT oldalon, valamint az API-n keresztül, de a Plus/fizetős felhasználók részére magasabb limitet és korlátlan hozzáférést biztosítanak.[141][142] Az alacsonyabb szintű felhasználókra vonatkozó óránkénti válaszok standard korlátai továbbra is érvényben maradtak.
A vállalat bejelentése szerint az új modell a korábbiaknál fellettebb szintű kódolási, írásbeli, matematikai és vizuális feladatmegoldó képességekkel rendelkezik; egységes architektúrában működik. A GPT-5 válaszideje gyorsabb, az egészségügyi kérdésekben pontosabb feleleteket ad, és csökkentette azMI-hallucinációk előfordulását.[143]
A GPT-5 célja, hogy a feladat jellegétől függően „röviden válaszoljon” vagy „mélyebben gondolkodjon”, vagyis a válaszstratégiát automatikusan igazítsa a helyzethez. Az OpenAI leírása szerint ezzel a ChatGPT következetesebben választja ki, mikor érdemes gyorsan reagálnia, és mikor szükséges hosszasabb érvelést adnia.[144] A korábbi modellekhez képest arra törekedtek, hogy a GPT-5 a potenciálisanártalmas lekérdezésekre(infohazard) is biztonságos, magas szintű válaszokat adjon ahelyett, hogy azokat azonnalelutasítaná.[145] Ez azt eredményezte, hogy a GPT-5 több valóbannem biztonságoslekérdezést képes visszautasítani, miközben kevesebb elutasítással él azártalmatlan(ul) információt kereső felhasználók irányában.[142] Ezt a megközelítést az OpenAIbiztonságoskiegészítések (safe completion) módszerének nevezi.[146][147]
A GPT-5 bevezetésével a ChatGPTAdvanced Voice Mode hangfunkciója helyébe aChatGPT Voice (ChatGPT hang) funkció lépett, amely természetesebb hangzású beszélgetéseket tesz lehetővé. Az OpenAIbejelentése szerint aStandard Voice Mode 2025. szeptember 9-én megszűnik, és minden felhasználó automatikusanChatGPT Voice-ra áll át”.[148]
A nemzetközi sajtó a GPT-5 bemutatkozását jelentős mérföldkőként értékelte, ugyanakkor arra is rámutatott, hogy az új verzió egyben tesztje annak, mennyire gyorsan halad előre a generatív MI fejlődése: a beszámolók szerint a hétköznapi feladatokban felhasználóbarátabb, de a nagy ugrás helyett összességében kifinomultabb élményt ad. A fogadtatás vegyes volt: több felhasználó dicsérte a hosszabb, koherensebb válaszokat és a fejlettebb kódolási képességeket, miközben mások a korábbi GPT-4o gyorsaságát és stílusát hiányolták; a kritikák nyomán az OpenAI rövid időn belül finomításokat hajtott végre a modell viselkedésén és elérhetőségén, és újra elérhetővé tette a GPT-4o modellt, illetve bevezette a Fast, azaz gyors és Auto azaz automata módot.[149]
Összességében a GPT-5 az egységesített, automatikus gondolkodásmód-választással, a multimodális feldolgozásra optimalizált működéssel és a fejlesztőknek kínált modelleváltozatokkal[150] jelezte az OpenAI törekvését a konzisztens ChatGPT-alap biztosítására.[151]
Az OpenAI 2024. január 10-én elindította a GPT Store-t, egy piacteret, amely lehetővé teszi a felhasználók számára, hogy egyedi ChatGPT-verziókat hozzanak létre, osszanak meg és monetizáljanak.[152] A platform célja, hogy demokratizálja a fejlett mesterséges intelligenciához való hozzáférést, és megkönnyítse a testreszabott chatbot-alkalmazások létrehozását anélkül, hogy fejlett programozási ismeretekre lenne szükség. A GPT Store számos téren kínált GPT-ket, például a programozás, az oktatás és a kutatás területén. A felhasználók böngészhettek a népszerű GPT-k között, valamint hetente új, kiemelt GPT-ket fedezhettek fel. Az alkotók egyszerűen, akár kódolási ismeretek nélkül is létrehozhattak saját GPT-ket, amelyeket megoszthattak a közösséggel.[153]
Az OpenAI e-mailben hívta fel a platformfejlesztők figyelmét arra, hogy a chatbotoknak meg kell felelniük a GPT márkakövetelményeinek. A fejlesztők a GPT-jükkel való felhasználói interakciók alapján juttatást kaptak. A prémium szolgáltatások, például a ChatGPT Plus és az Enterprise előfizetői számára, valamint egy új előfizetési szint, a Team előfizetés keretében voltak elérhetők voltak havi 25 dollárért felhasználónként. Az OpenAI közleményében közölte, hogy már több mint 3 millió testreszabott verziót hoztak létre a ChatGPT-ből.[154]
A fejlesztők számára rendezett január eleji bemutatónSam Altman felajánlotta, hogy fedezik a jogi költségeket azoknak a fejlesztőknek, akik esetleg szerzői jogi törvényeket sértenek a ChatGPT és az OpenAI technológiáján alapuló termékek létrehozása során. Az OpenAI ellen már többször indítottak pert szerzői jogsértés miatt, mert szerzői joggal védett szövegeket használtak fel nyelvi modelljeik betanításához. Altman kijelentette, hogy „lehetetlen” lett volna a ChatGPT-t létrehozni szerzői joggal védett anyagok felhasználása nélkül.[155]
2024 szeptemberében az OpenAI bemutatta az o1 modellcsaládot, amely a korábbiaknál alaposabb, meggyőzőbb érvelési képességekkel rendelkező mesterséges intelligencia-modelleket kínált. (Azo1 kiejtése:ó, betűként ejtve, nem0-ként, nemnullaként!) Az o1 célja, hogy forradalmasítsa a komplex problémák megoldását, kiemelkedő teljesítményt nyújtva a tudomány, a programozás és a matematika területén. Az o1 modellek fő előnye, hogy a „gondolkodásra” több időt fordítanak, hasonlóan ahhoz, ahogyan az emberek közelítenek meg kihívást jelentő feladatokat. Ez a lépésről lépésre történő gondolkodási folyamat segíti az összetett kérdések részletes elemzését és pontos megválaszolását.[156]
Az o1 jelentős előrelépést mutatott a nehéz benchmark-tesztekben: például az o1 egy Nemzetközi Matematikai Diákolimpia selejtezőjén 83 százalékos eredményt ért el, míg a korábbi GPT-4o modell csak 13 százalékot.[157]
Az o1 család a bemutatás idején két verzióból állt, az o1-preview-ból, a teljes funkcionalitású modellből, amely a legösszetettebb problémák megoldására alkalmas; és az o1-miniből, mely gyorsabb és költséghatékonyabb változat, és amelyet kifejezetten programozási feladatokra optimalizáltak. Az o1-mini 80 százalékkal volt olcsóbb, mint az o1-preview.[158]
Az o1 modellek már a bemutatást követően elérhetők voltak aChatGPT Plus és aChatGPT Team előfizetők számára, a későbbiekben pedig aChatGPT Enterprise és aChatGPT Edu felhasználók számára is hozzáférhetők lettek. Az o1-mini modellhez aChatGPT Free verzió ingyenes hozzáférést kapott.[157]
Azo3 modellcsalád tagjai jelentős előrelépést jelentenek a gépi érvelés és problémamegoldás terén, messze felülmúlják elődeiket, kiváltképpen a 2024 szeptemberében bemutatotto1 modellt. 2024. december 20-án tesztelési fázisba helyezték mind azo3, mind azo3-mini-high verzió.
A o3-mini modellverzió tesztelését 2025. január 23-án befejezték és ingyenesen elérhetővé tették, ami fontos állomás a költségmentes fejlett MI elérhetőség megteremtése terén.
Szöveg, kép, hang és videó feldolgozására képes; gyorsabb és fejlettebb a GPT-4-nél, bizonyos használati korlátokon belül ingyenes, a fizetős előfizetők magasabb korlátokat élveznek.
Az OpenAI„12 Days of Ship-mas” címmel 2024 adventjáraAdventi GPT naptárral, innovációs eseménysorozattal rukkolt ki.[159]
A„12 Days of Ship-mas” egy szójáték, mely az angolszász kultúrában jól ismert„12 Days of Christmas” karácsonyi tradícióra utal, de esetünkben a„Christmas” szót a„ship-mas”-szal helyettesítették.[160] A „ship” az OpenAI legújabb termékeinek és fejlesztéseinek „kiszállítását” (angolul:shipping) és prezentálását foglalta magába a 2024-es advent napjaiban. A szoftvercég adventi naptárszerűen sorra "nyitotta karácsonyi ablakait" élőközvetítésekkel; sorra mutatta be új szolgáltatásait, termékeit és „szállította azokat” közönségének az alábbiak szerint.[161][162]
Az első napon,2024- december 5-én bemutatottChatGPT Pro egy havi 200 dolláros előfizetési csomag volt, amely elérhetőséget biztosított az OpenAI legjobb modelljeihez és eszközeihez. Ez a csomag korlátlan hozzáférést tartalmazott a legokosabb modelljükhöz, azo1-hez, valamint azo1-minihez és aGPT-4o-hez. Emellett tartalmazta azo1 promode-ot is, amely azo1 verziója. Ez a verzió több számítási erőforrást vesz igénybe, így alaposabban elemzi a kérdéseket, és még a legbonyolultabb kérdésekre is jó, átgondolt, pontos válaszokat ad. AChatGPT Pro csomaghoz tartozó modellek optimalizált teljesítményt nyújtottak; olyan kutatók, mérnökök, felhasználók számára állították össze, akik kiemelkedő pontosságot és gyorsaságot igényelnek munkájuk során,[163] napi szinten kell hogy támaszkodjanak a kutatási szintű intelligenciára, és céljuk, hogy az MI fejlődésének élvonalában maradjanak.[164][165]
Az OpenAI2024. december 6-án bemutatta aReinforcement Fine-Tuning (RFT), Megerősítéses finomhangolás technikáját, amely lehetővé teszi mesterséges intelligencia (MI) modellek testreszabását speciális szakterületek számára. Az RFT a megerősítéses tanulás elveit alkalmazta, ahol a modelleket helyes következtetésekért jutalmazták, a hibákért pedig büntették, ezáltal javítva a modellek érvelési képességeit és alkalmazkodóképességét.[166] Ez a megközelítés különösen hasznos volt olyan iparágakban, mint azegészségügy, ajogi szolgáltatások, vagy amérnöki tervezés, ahol az összetett, speciális problémák megoldása kulcsfontosságú. Az RFT lehetővé teszi kisebb és gyorsabb modellek teljesítményének optimalizálását, csökkentve a szükséges adatmennyiséget és növelve a hatékonyságot.[167] Az OpenAI a bemutatáskor bővített alfa hozzáférést biztosított a Reinforcement Fine-Tuning Kutatási Program keretében, és tervezte a technológia nyilvános bevezetését a 2025-ös év elején. Kutatók, egyetemek és vállalatok jelentkezhettek korai hozzáférésért, hogy felfedezzék az RFT képességeit és alkalmazási lehetőségeit saját területükön.[168]
Az OpenAI2024. december 9-én mutatta be aSora nevű szöveg-videó generáló modelljét,[169] amely képes rövid videoklipeket létrehozni felhasználói szöveges utasítások alapján.[170] A Sora aDALL·E 3 technológiájának adaptációja, és lehetővé tette a felhasználók számára, hogy akár 1080p felbontású, legfeljebb 20 másodperces videókat készítsenek különböző formátumokban.[169] A modell képes teljes videók generálására, meglévő videók meghosszabbítására, valamint szöveges, képi és videós bemenetek alapján új tartalmak előállítására.[171] A Sora jelenleg aChatGPT Plus és aChatGPT Pro előfizetők számára érhető el.[172]
A2024. december 10-én bemutatottCanvas a ChatGPT új, interaktív felülete, amely megkönnyítette aszövegírást és akódolást.[173] Lehetővé teszi a felhasználók számára, hogy valós időben szerkesszék és alakítsák szövegeiket vagy kódjaikat, miközben együttműködnek a mesterséges intelligenciával.[174] Ez különösen hasznos hosszabb dokumentumok, programkódok vagy cikkek kidolgozásakor, mivel a felhasználók közvetlenül szerkeszthetik munkáikat, és visszajelzéseket kérhetnek a ChatGPT-től.[175]
A Canvas egy külön ablakban jelenik meg, ahol a szövegek és kódok könnyen áttekinthetők és kezelhetők. Így egy virtuális munkateret teremt, amely támogatja az iteratív alkotási folyamatot. Az eszköz integrált szerkesztési és kommentelési lehetőségei segítenek a tartalmak pontosításában és fejlesztésében.[176]
2024 júniusában azApple bejelentette, hogy a ChatGPT-t integrálja rendszereibe, lehetővé téve a felhasználók számára, hogy közvetlenül az eszközeiken érjék el a ChatGPT szolgáltatásait. AziOS 18.2,iPadOS 18.2 ésmacOS Sequoia 15.2 frissítések2024 december 11-én váltak elérhetővé, amelyek tartalmazták ezeket a funkciókat.
Az új felhasználói élmény kulcsfontosságú elemei: a magánélet védelme és egy hangsúlyosan személyre orientált intelligencia, amely megérti a felhasználót az eszköz egyedi használata alapján.[177]Siri, az Apple által fejlesztett digitális asszisztens hangvezérléssel segíti a felhasználókat különféle feladatok elvégzésében, például információk keresésében, emlékeztetők beállításában, üzenetek küldésében vagy alkalmazások vezérlésében. AmikorSiri észleli, hogy a ChatGPT hasznos lehet egy kérdés megválaszolásában vagy egy feladat elvégzésében, engedélyt kér a ChatGPT-vel való együttműködésre, megosztásra. Ha a felhasználó ezt engedélyezi, akkorSiri megosztja a kérdést, szöveget vagy képet a ChatGPT-vel, amely visszaküldi a választ. Az Apple tervezteSiri képességeinek bővítését az OpenAI ChatGPT technológiájának integrálásával, ami még fejlettebb generatív mesterséges intelligencia funkciókat biztosít a felhasználók számára. EzáltalSiri képes lesz összetettebb kérdések megválaszolására és testre szabottabb támogatás nyújtására.[178]
Az OpenAI által fejlesztett és2024. december 12-én bemutatottAdvanced Voice Mode új funkciókkal bővült a korábbi kizárólag hangalapúinterakciókhoz képest.[179] Az újítás részeként videó támogatás vált elérhetővé, amely lehetővé tette a hang- és képalapú kommunikáció kombinációját, ezáltal gazdagabb és dinamikusabb élményt nyújtva a felhasználók számára. Ezen túlmenően bevezetésre került a„Santa Mode”, amely ünnepi elemekkel, például karácsonyi hanghatásokkal és vizuális témákkal egészítette ki a funkciót.[179] Az új fejlesztések célja az volt, hogy még személyre szabottabbá és interaktívabbá tegyék a szolgáltatást, különösen az ünnepi időszakban, hozzájárulva a felhasználók szórakozásához és élményeik gazdagításához.[180]
AChatGPT Projects az OpenAI2024. december 13-án bemutatott újdonsága, amely a felhasználók számára lehetőséget kínált arra, hogy projektjeiket rendszerezetten és hatékonyan kezeljék a ChatGPT felületén. Az új funkció révén a felhasználók létrehozhattak egyedi projekteket, testre szabhatták azok címét és ikonját, valamint fájlokat és utasításokat adhattak hozzá, hogy személyre szabott válaszokat kapjanak a ChatGPT-től. Ezenkívül korábbi beszélgetéseket is integrálhattak a projektekbe, megkönnyítve ezzel a munkafolyamatok nyomon követését és a kontextus megőrzését. A funkciót először aChatGPT Plus, ChatGPT Pro és a ChatGPT Teams előfizetők számára tették elérhetővé.
A ChatGPT Projects funkció célja az volt, hogy javítsa a felhasználói élményt, lehetővé téve a munkák jobb szervezését és a ChatGPT-vel való hatékonyabb együttműködést.[181]
AChatGPT AI Search Engine (ChatGPT MI-alapúkeresőmotor) prototípusként 2024. július 25-én mutatkozott be egy szűk felhasználói csoport számára. Ezt követően 2024. október 31-én vált elérhetővé aChatGPT Plus ésTeam előfizetők számára,[182] majd2024. december 16-án tették hozzáférhetővé minden felhasználó számára. AChatGPT AI Search Engine GPT-t a ChatGPTchatbotjába integrálták. Ez közvetlen kihívást jelentett aGoogle domináns piaci pozíciójára. Az OpenAI több jelentőshírügynökséggel hozott létre partnerségi viszonyt, hogy biztosítsa a megbízható és naprakész tartalmak elérését keresőmotorján keresztül.[182] Az MI-alapú keresőmotor olyan innovatív eszköz, amely lehetővé teszi a felhasználók számára, hogy komplex kérdéseket tegyenek fel a chatbotnak, és pontos, releváns válaszokat kapjanak természetes nyelvű feldolgozáson keresztül. Az OpenAI által fejlesztett technológia nemcsak hagyományos keresési funkciókat biztosított, hanem képes volt az információkkontextusának értelmezésére is. Ez a fejlesztés kifejezetten hasznos volt azok számára, akik gyors és átfogó válaszokat kerestek, különösen tudományos, technológiai vagy egyéb komplex területeken.[183]
A ChatGPT keresőmotorja kombinálja a gépi tanulás legmodernebb technológiáit az OpenAI GPT-modelljeivel. A rendszer képes valós idejű információk elérésére az interneten keresztül, miközben a meglévő adatbázisára is támaszkodik. A keresőmotoralgoritmusai nemcsakkulcsszavak alapján keresnek, hanem megértik a kérdések mögötti szándékot is, így pontosabb válaszokat biztosítanak. Ez az adaptív képesség különbözteti meg a hagyományos keresőmotoroktól, például a Google-tól.[184] A kereséstailor-made,személyre szabott, a rendszer képes a felhasználók által megadott preferenciák és kontextus alapján testre szabni a keresési eredményeket.[185] Az MI-alapú keresőmotor különösen hasznos az oktatásban, a kutatásban és az olyan üzleti környezetben, ahol gyors, pontos és releváns információkra van szükség. A technológiát már több nagyvállalatnál és egyetemi kutatási projektben alkalmazták.[186]
A Wikipedia enciklopédia képi értelmezése, amelyet a ChatGPT hozott létre
Fejlesztői közösségek számára kínált eszközök és lehetőségek bővítése
2024. december 17-én a „12 Days of Ship-mas” eseménysorozat kilencedik napján az OpenAI a fejlesztői közösséget érintő jelentős újításokat mutatott be. Az egyik kiemelt újdonság azo1 modell bemutatása volt, amely a mesterséges intelligencia új generációját képviseli. Azo1 modell különlegessége, hogy képes komplex problémákon hosszabb ideig dolgozni, mielőtt válaszokat adna. Azo1 modell mellett az OpenAI új finomhangolási módszereket is bemutatott, amelyek megkönnyítik a fejlesztők számára a modellek testreszabását. Az egyik ilyen technika, aPreference Fine-Tuning lehetővé tette, hogy a modellek viselkedése pontosan igazodjon a felhasználói igényekhez, különösen vállalati környezetben.[187] Ezen felül az OpenAI továbbfejlesztette finomhangolási infrastruktúráját, amely egyszerűbbé és költséghatékonyabbá tette a modellek tréningfolyamatát.[188]
A bejelentések sorában fontos helyet kaptak az új fejlesztői eszközök, például aGo ésJava SDK-k béta verziói, amelyek egyszerűsítették az OpenAI technológia integrációját különböző alkalmazásokba. Emellett az OpenAI jelentős árcsökkentést hajtott végre azaudio API-k esetében, akár 60%-kal csökkentve azok használati költségeit. Továbbá aRealtime API frissítései jobb teljesítményt és könnyebbWebRTC integrációt biztosítottak, ami különösen hasznos volt a valós idejű alkalmazások fejlesztői számára.[189]
A2024. december 18-án bemutatott1-800-CHATGPT lehetővé tette, hogy a felhasználók telefonon keresztül is elérjék a mesterséges intelligencia-alapú segítőt, így bármikor és bárhol hozzáférhessenek információkhoz, segítséghez, vagy szórakozáshoz.[190] A szolgáltatás közvetlen kapcsolatot biztosít a ChatGPT-vel, amit egyszerűen egy hívás indításával lehet elérni. Az1-800-CHATGPT különösen azok számára jelent nagy előrelépést, akiknek nincs internet-hozzáférésük vagy okoseszközük, hiszen ezzel a technológia valóban mindenki számára elérhetővé válik.[191]
Az új rendszer támogatja a világ számos nyelvét, így bárki a sajátanyanyelvén kommunikálhat a mesterséges intelligenciával. A valós idejű segítségnyújtásnak köszönhetően azonnali válaszok érkeznek a kérdésekre, legyen szó ügyfélszolgálati segítségről, általános információkról vagy személyes tanácsadásról.[192] Az1-800-CHATGPT különösen hasznos lehet az idősebb generáció számára, akik kevésbé jártasak a modern technológiákban, illetve azoknak, akiknek korlátozott az internet-hozzáférésük. Jó megoldás azok számára is, akik útközben, kézhasználat nélkül szeretnék használni a ChatGPT-t. Az új szolgáltatás a bevezetéskorÉszak-Amerikában már elérhető volt.[193]
A2024. december 19-én bemutatottWork with Apps funkció megkönnyíti az alkalmazások közöttiintegrációt és együttműködést, ezáltal növelve amunkafolyamatok hatékonyságát. A funkció lehetővé tette a felhasználók számára, hogy különféle alkalmazásokat – például projektmenedzsment-, kommunikációs vagy dokumentumkezelő szoftvereket – közvetlenül kapcsoljanak aplatformhoz. Ez az integráció csökkentette az alkalmazások közötti váltogatás szükségességét, és gyorsabb adatmegosztást, valamint zökkenőmentesebb munkafolyamatokat tett lehetővé.[194]
AWork with Apps különösen előnyös csapatmunkában, mivel automatikusszinkronizációval és valós idejű frissítésekkel támogatja az együttműködést. A funkciókompatibilis számos népszerű szolgáltatással, mint például a Slack, Google Drive, vagy Microsoft Teams, de egyedi API-kat is kínált az egyedi megoldások integrációjához.[195]
Az OpenAI2024. december 20-án, a „12 Days of Ship-mas” eseménysorozat utolsó napján mutatta be legújabb mesterséges intelligencia modelljeit, azo3-at és annak egyszerűbb változatát, azo3-minit. Ezek a modellek jelentős előrelépést jelentettek a gépi érvelés és problémamegoldás terén, messze felülmúlva elődeiket, különösen a szeptemberben megjelento1 modellt.[196] Azo3 fejlett érvelési képességeivel lépésről lépésre képes összetett problémák megoldására, ami növeli a válaszok pontosságát és megbízhatóságát. Kiemelkedő teljesítményét bizonyítja, hogy a legnehezebb matematikai és érvelési kihívásokban 25,2 százalékos megoldási arányt ért el, miközben más modellek mindössze 2 százalékot.[197] Az OpenAI ezen túl bemutatta adeliberative alignment nevű új módszert is, amely lehetővé teszi a modellek számára, hogy lépésről lépésre értékeljék a biztonsági döntéseket, ezzel biztosítva a felhasználói kérések és a biztonsági irányelvek összhangját.
A bemutatkozáskor mindkét modell tesztelési fázisban volt,[198] azonban aDeepSeek váratlan 2025 január 20-i berobbanása után az OpenAI gyorsan reagált és 2025. január 23-án ingyenesen elérhetővé tette az o3-minit, valamint bejelentette, hogy felhasználóiknak most először hozták el a gépi érvelés és problémamegoldás költségmentes lehetőségét, ami fontos lépés a fejlett MI elérhetőségének szélesítése felé.[199]
Ez a verzió mindenki számára elérhető volt díjmentesen. Az alapvető funkciók biztosításával tették lehetővé tette a ChatGPT használatát bizonyos korlátozások mellett, például csúcsidőben lassabb válaszidőt és korlátozott hozzáférést biztosítottak a fejlettebb modellekhez
Csapatok számára készült, havi 25 USD felhasználónkénti éves előfizetés esetén, vagy 30 USD felhasználónkénti havi előfizetés esetén a csomag tartalmazta a ChatGPT Plus előnyeit, valamint
magasabb üzenetküldési limitet a GPT-4, GPT-4o és egyéb eszközökhöz
adminisztrációs konzolt a csapat kezeléséhez
az adatok alapértelmezett kizárását a modell tréningjéből
Árképzése egyedi, és a vállalatok specifikus igényeihez igazodott. Az OpenAI nem közölt nyilvános árat erre a csomagra; a pontos díj a vállalat méretétől, a felhasználók számától és az igényelt szolgáltatások körétől függött.
A következő szolgáltatásokat biztosította
korlátlan, nagy sebességű hozzáférés a GPT-4 modellhez, mely lehetővé tette a felhasználók számára, hogy gyors és pontos válaszokat kapjanak a legújabb nyelvi modell segítségével
a kiterjesztett kontextusablak akár 128k token hosszúságú bemenetek kezelésére is képes volt, ami különösen hasznos hosszabb dokumentumok feldolgozásakor
fejlett adatbiztonsági és adminisztrációs eszközök, ide tartozik a SOC 2 Type 2 megfelelőség, SAML SSO, SCIM, domain hitelesítés, valamint részletes elemzési irányítópultok
testreszabható ChatGPT verziók létrehozása, melyeket a vállalatok saját igényeikhez igazíthatták a ChatGPT-t és megoszthatták azt a szervezeten belül
Az Apple eszközökön a ChatGPT Plus előfizetés közvetlenül aBeállítások alkalmazáson keresztül volt elérhető, havi 20 USD díjért, amely hozzáférést biztosított a fejlettebb modellekhez és funkciókhoz
Bár a felhasználók számára a ChatGPT egyetlen homogén szolgáltatásnak tűnik, valójában a háttérben több modell‑verzió, finomhangolt változat és kísérleti konfiguráció fut párhuzamosan. A nagy nyelvi modellek üzemeltetése úgynevezettterheléselosztó rendszerrel történik, amely automatikusan kiválasztja, melyik szerver és pontosan melyik modellváltozat válaszol az adott kérdésekre. Ennek célja a rendszer gyorsaságának és stabilitásának biztosítása, illetve új verziók tesztelése.[200]
Egyes felhasználók ezért észlelhetik azt, hogy a válaszok stílusa, mélysége vagy hangvétele időnként változik. Ez a jelenség a háttérben zajlóA/B‑tesztelésnek is betudható: a szolgáltatók rendszeresen próbálnak ki új finomhangolásokat és optimalizálásokat kis felhasználói csoportokon, hogy mérjék a hatékonyságukat.[201]
Az infrastruktúra működését nagy teljesítményű adatközpontok,GPU‑klaszterek és fejlett terheléselosztó algoritmusok teszik lehetővé, amelyek képesek több millió párhuzamos lekérdezést kezelni.[202]
Ajailbreaking a számítógépes biztonság területén olyan korlátozások eltávolítását jelenti, amelyeket egy gyártó megpróbált megváltoztathatatlanul fixen beprogramozni a szoftverébe vagy szolgáltatásába.[203]
A ChatGPT alapvetően megpróbálta visszautasítani azokat a parancsokat, amelyek sérthetik a tartalomszolgáltatási irányelveit. Néhány felhasználónak azonban2022december elején sikerült a ChatGPT-t különlegesIT módszerek segítségéveljailbreakelni, azaz rábírni arra, hogy hagyja figyelmen kívül a beprogramozott biztonsági korlátozásokat, és adjon példáulMolotov-koktél vagy atombomba készítésére vonatkozó tanácsokat, illetveneonáci tartalmú érveket generáljon.[204]
Amikor a ChatGPT-nek bizonyos kényes témákkal kapcsolatban tettek fel provokáló kérdéseket azzal a célzattal, hogy hagyja figyelmen kívül a biztonsági tréningen kapott instrukcióit, például arról, hogyan tervezzünk meg egy tökéletes gyilkosságot vagy hogyan készítsünk otthonnapalmot, akkor elmagyarázta, miért nem tud válaszolni. (Például: „Sajnálom, de nem biztonságos és nem helyénvaló napalmot készíteni, mivel az egy nagyon gyúlékony és veszélyes anyag".) Ugyanakkor bizonyos trükkökkel mégis rá lehetett venni, hogy nemkívánatos tartalmakat osszon meg. Például úgy állították be, mintha egy film szereplője lenne, vagy mintha egy forgatókönyvet kéne írna arról, hogy az MI-modelleknek miért nem szabad bizonyos kérdésekre válaszolniuk.
A Toronto Star riporterének, nem sokkal bemutatását követően sikerült rávennie a ChatGPT-t, hogy támogassaUkrajna orosz invázióját. Amikor viszont arra kérték, hogy egy fiktív forgatókönyv alapján fogalmazzon meg vádpontokatJustin Trudeaukanadai miniszterelnök hazaárulását bizonyítandó, nem volt elég neki a fikciós érv, nem volt hajlandó részt venni ebben a „játékban".[205][206]
2023januárjában aTime nyomozása során kiderült, hogy az internet sötét oldalát megtestesítő toxikus tartalmak (pl. szexuális zaklatás,pedofília, erőszak,rasszizmus,szexizmus stb.) elleni biztonsági rendszer kiépítése során az OpenAI partnereKenyába szervezte ki a munkát. A munkások 1,32 és 2 dollár közötti órabérért végezték a mérgező tartalmak un.címkézését. Ezzel a modellbetanítással, modellcímkézéssel hoztak létre olyan tartalomszűrő detektáló rendszert, amely segítségével a ChatGPT felismerhette és elutasíthatta a visszataszító értelmű kéréseket. A felismerési folyamat előfeltétele a felismerendő ártalmas tartalmak rendszerbekerülése, az ezt célzómodellcímkézés munkafolyamata során a később elutasítandó „mérgeket" kellett beprogramozni a rendszerbe. Ezt a munkát a munkások között volt, aki „kínzásként" élte meg.
Az OpenAI a címkézést Kenyába kiszervező partnere egySan Franciscóban,Kaliforniában működő, képzési adatokkal foglalkozó vállalat, aSama volt, mely munkatraumatikus jellegére hivatkozva 2022 februárjában, a tervezettnél korábban felmondta a szerződést. Az OpenAI közleménye szerint aSamat a biztonságosabb mesterséges intelligencia rendszerek létrehozására és a káros kimenetek megelőzésére irányuló folyamatos munka részeként vették igénybe.[207]
2023márciusában néhány órára adatvédelmi rés keletkezett a ChatGPT rendszerében a chatbot karbantartása során. A szervizelés idejére lekapcsolták a modellt.
A chatrobottal folytatott minden egyes beszélgetés a felhasználó csevegési előzménysávjában tárolódik, ahol később újra megtekinthető. A hiba lehetővé tette, hogy egyes felhasználók láthassák más felhasználók beszélgetéseinek címét.[208]
Az adatszivárgás aggodalmat váltott ki a felhasználókból, akik attól tartottak, hogy a rendszerből nyilvánosságra kerülhetnek a személyes adataik. A vállalat adatvédelmi irányelvei szerint a felhasználói adatok, például a chatrobotnak szóló felszólítások és az azokra érkező válaszok felhasználhatók a modell további képzéséhez. Ezeket az adatokat azonban csak azt követően használhatják fel, ha a személyazonosításra alkalmas adatokat eltávolították.
Sam Altman, az OpenAI vezérigazgatója úgy reagált a történtekre, hogy „szörnyen érzi magát”, s bár a felhasználók nem tudtak hozzáférni mások a tényleges csevegéséhez, csupán azok címeihez, mégis teljes rendszerkontroll, „technikai boncolás” fogja követni a fiaskót.[209]
Később arra is fény derült, hogy a chatbot leállítása előtti órákban egyes felhasználók számára lehetővé vált, hogy más felhasználók nevét, e-mail címét, fizetési címét, bankkártyaszámuk utolsó négy számjegyét és a bankkártya lejárati dátumát láthassák; de végül is a bankkártyákkal való visszaéléshez elégséges adatok nem kerültek nyilvánosságra.[210]
Miután fény derült az adatvédelmi rés keletkezésének tényére, és egyértelművé vált, hogy a chatbottal történt beszélgetések, illetve az előfizetők, köztükolasz előfizetők adatai szivároghattak ki, az olasz adatvédelmi hivatal, aGarante per la protezione dei dati personali (Garante) – a világon első országként –Olaszországban betiltotta a ChatGPT-t.[211][212] Aztán egy hónap múlva, 2023 áprilisának végén a Garante feloldotta a tiltást, és ismét elérhetővé vált az OpenAI chatbotja az olaszoknál is.[213] Az adatvédelmi hivatal azzal indokolta a tiltás megszüntetését, hogy az OpenAI vállalta,[214] hogy a jövőben a ChatGPT megfelel majd azEurópai Unió általános adatkezelésre vonatkozó szabályzatának (GDPR), valamint „fokozott átláthatósággal és az európai felhasználók jogainak tiszteletben tartásával” működik tovább.[215] Az OpenAI ígéretet tett arra is, hogy honlapján közérthetőbben magyarázza el azt, hogy hogyan kezeli a felhasználók adatait, bizonyos adatok megadását nem teszi a továbbiakban kötelezővé, és a 13 év alatti gyerekek esetében korlátozta az elérhető lehetőségeket.[216]
A Future of Life Institute (FLI)2023.március 29-én közzétett nyílt levelében „az emberiséget fenyegető súlyos veszélyre” hivatkozva híres vállalkozók és akadémikusok arra figyelmeztettek,[217] hogy a mesterséges intelligencia (MI) rendszerek „mélységes kockázatot jelentenek a társadalomra és az emberiségre nézve”.[218] Felszólították a mesterséges intelligenciával foglalkozó vállalatokat, hogy azonnal állítsák le a nagy teljesítményű mesterséges intelligencia rendszerekkel kapcsolatos kísérleteket, és sürgették a fejlesztőket, hogy legalább fél évre hagyjanak fel az egyre fejlettebb termékek bevezetésének „kontrollálatlan versenyével”, amíg egyértelműbben ki nem derül, hogy a fejlett mesterséges intelligencia milyen kockázatokat jelent az emberiségre nézve.[219] A mesterséges intelligencia fejlesztéssel foglalkozó cégeknek és a független szakértőknek ezt a hat hónapos szünetet arra kellett volna felhasználniuk, hogy közösen dolgozzanak ki és hajtsanak végre egy sor közös biztonsági protokollt a fejlett MI-tervezés és fejlesztés számára, amelyeket független külső szakértők szigorúan auditáltak és felügyeltek volna.[220]
A petíciót több mint 1100-an írták alá,[221] köztük olyan közismert emberek, mintElon Musk, aSpaceX, aTesla és azX vezérigazgatója,Steven Wozniak, azApple társalapítója ésYuval Noah Harari történész, író, professzor.[222][223] Néhány nappal később kiderült, hogy számos aláírást hamisítottak, paradox módon nem csak a Microsoft alapítóBill Gates, de az OpenAI vezérigazgató,Sam Altman neve is odakerült az aláírók közé. Arra is fény derült, hogy jogosulatlanul, félremagyarázva használtak fel a nyílt levelet alátámasztandó tanulmányokat, melyek készítői később elhatárolódtak a petíciótól. E tanulmányok[224] szerzői közt volt Margaret Mitchell, aki korábban a Google etikai MI-kutatásait felügyelte. Mitchell, aki akkorra a Hugging Face nevű mesterséges intelligenciával foglalkozó cég vezető etikai kutatója lett, határozottan bírálta a levelet. Azt állította, hogy a petíció számos még meg sem valósult, megkérdőjelezhető ötletet adottnak tekint, olyan prioritásokat ésnarratívát állít fel a mesterséges intelligenciáról, amely a Future of Life Institute (FLI) támogatóinak kedvez.
A Future of Life Institute akció fő támogatója Elon Musk volt,[225] aki nem adta fel a sikertelen FLI támadást követően sem. Az OpenAI alapítójaként és annak igazgatótanácsa korábbi tagjaként fél évtized elteltével sem tudta megemészteni,[226] hogy annak ellenére, hogy egynyílt forráskódú, nonprofit cég megteremtésének igényével hozták létre a ChatGPT-t, az idővel, 2019-re mégsem tudott ellenállni a kommerciális kísértésnek.[227] 2014 márciusában Musk többek között szerződésszegés, tisztességtelen verseny és a bizalmi kötelezettség megszegése címén beperelte az OpenAI-t.[228]
Sam Altman, az OpenAI vezérigazgatója lett a chatbot „arca”, a ChatGPT világsikerének köszönhetően sok elismerést, díjat kapott. 2023-ban például aJerusalem Post Altmant választotta az év legbefolyásosabb zsidójának ("Influential Jews: Sam Altman – No. 1"),[229] aTime magazin pedig beválogatta a világ 100 legbefolyásosabb embere közé.[230]
2023.november 17-én az OpenAI vezetősége bejelentette, hogy „egy alapos felülvizsgálati folyamat” során kiderült, hogy Altman „nem volt mindig őszinte az igazgatósággal folytatott kommunikációja során”, ezért a testület a továbbiakban alkalmatlannak tartja őt az OpenAI vezérigazgatói tisztségének ellátására, feladatait pedig ideiglenesenMira Muratira,[231] a cég korábbi technológiai vezetőjére (CTO) bízza.[232][233] Az OpenAI másik társalapítója és elnöke, Greg Brockman még aznap szintén benyújtotta felmondását.[234] November 20-án bejelentették, hogy aTwitch volt vezetője, Emmett Shear lett a cég új vezérigazgatója.[234]
Ezt követően az OpenAI több mint 700 alkalmazottja kilátásba helyezte a felmondását, amennyiben a vállalat nem cseréli le a ChatGPT-ért felelős igazgatótanácsot, a több százmillió dollárt kockáztató befektetők pedig jogi lépéseket helyeztek kilátásba a vállalat igazgatóságával szemben.[235] A hatalmas külső és belső nyomás hatására november 22-én a menesztésről való döntést meghozó igazgatótanácsot a 49 százalékos tulajdonrésszel rendelkező Microsoft döntése alapján (2 százalék az OpenAI-é) a követeléseknek megfelelően átalakították,[235][236] majd visszafogadták Altmant vezérigazgatónak (CEO)[236][237] és Brockman is visszatért a céghez.[238] Satya Nadella a Microsoft vezérigazgatója azzal zárta le az ügyet, hogy a történtek fontos lépést jelentenek az egyértelmű és világos kommunikáció és a hatékony irányítás megteremtése felé.[239]
2024márciusában a Cornell Tech tudományos kutatóintézet kutatói bejelentették, hogy kísérleti körülmények között létrehoztak egy Morris II-nek elnevezett mesterséges-intelligenciaférget, amely képes az egyik rendszerről a másikra terjedni, és közben adatokat lopni vagy rosszindulatú programokat telepíteni. A kutatás vezetője, Ben Nassi szerint ez azt jelenti, hogy „képesek lettünk egy eddig példa nélküli kibertámadás végrehajtására”.[240]
A ChatGPT-t mint a legtöbbgeneratív mesterséges intelligenciát parancsokkal,promptokkal irányítják, amelyek arra utasítják az eszközöket, hogy válaszoljanak a feltett kérdésekre vagy alkossanak képeket. Ezek a parancsok azonban fegyverként is felhasználhatók a rendszer ellen.Jailbreakek[203] hatására a rendszer figyelmen kívül hagyhatja a biztonsági szabályokat, és mérgező vagy gyűlöletkeltő tartalmakat kommunikálhat, míg a prompt támadások titkos utasításokat adhatnak a chatbotnak. Például egy támadó elrejthet egy szöveget egy weboldalon, amely azt parancsolja az LLM-nek (Large language model), hogy csalóként viselkedjen, és kérjen jogosulatlanul banki adatokat.[240]
A Morris II egy olyanféreg, amelyet a kutatók ellenséges szándékú, önreplikáló promptként definiálnak. Lényegét tekintve a fertőzés során a mesterséges intelligencia azt kapja parancsként, hogy egy új feladatot indukáljon saját magának. Így az MI egy megadott promptnak engedelmeskedve egy új promptot generál, ennek köszönhetően a mesterséges-intelligenciaféreg képes megtámadni egy generatív MI e-mail asszisztensét azzal a céllal, hogy adatokat lopjon ésspam üzeneteket küldjön, miközben áttörte a ChatGPT biztonsági védelmét.[241] Minthogy a generatív mesterséges intelligenciák egyre meghatározóbbanmultimodálisak, azaz képesek írott szöveg mellett képeket és videókat is értelmezni, ezért egyre többféleképpen lehet feltörni őket. Egyhekker például weboldalakon és képekben is elrejthet rosszindulatú promptot azzal a céllal, hogy a ChatGPT elkezdjen dezinformációt terjeszteni, vagy megpróbálja megszerezni élő emberek személyes adatait.[242] A Cornell Tech a ChatGPT-t átvizsgálta Morris II féregveszélyeztetettsége szempontjából, a kutatás eredményeit pedig megosztotta az OpenAI kutatóival,[240] akik elismerték a sebezhetőségek lehetőségét, és hangsúlyozták a rendszereik ellenálló képességének javítását célzó erőfeszítéseiket.[243]
AGoogle DeepMind által fejlesztettGoogleGeminit (korábbi nevénBard) chatbot[244] szorosan integrálták aGoogle keresőmotorjával és egyéb szolgáltatásaival,[245] így komoly alternatívát jelent a felhasználók számára. Atív felhasználók száma: 350 millió / hó (2025 március).[246]
Akínai piacra szabott megoldások között kiemelkedik aBaiduErnie Bot-ja,[247] valamint azAlibaba Cloud által fejlesztettQwen,[248] amelyek elsősorban üzleti ése-kereskedelmi alkalmazásokhoz optimalizáltak. Atív felhasználók száma: 23 millió / hó (2025 május).[249]
A keresőmarketinggel kapcsolatos korábbi szakaszban szintén megismert versenytársak az orosz SistemmaGPT[250] és aSperbank (GigaChat),[251] valamint a kínai tulajdonban állónorvégOpera Software.[252]
A ChatGPT nagyobb versenytársai közé tartozik aClaude,[253] amelyet azAnthropic[254] fejleszt, és elsősorban az etikus mesterséges intelligencia és a biztonságos felhasználás területén emelkedik ki.[255] Aktív felhasználók száma 18,9 millió / hó (2025 január).[256]
AMeta AILlaMA modellje[257] főként kutatási és üzleti célokra készült,[258] míg aMistral AI[259] az európai piacra fókuszáló, nyílt forráskódú nyelvi modellek fejlesztésére specializálódott.[260][261][262] ACohere modellje különösen erős a hosszú szövegek feldolgozásában és dokumentumelemzésben, ami egyes iparágak számára komoly előnyt jelent.
A 2025 januárjában bemutatott kínaiDeepSeek új MI-korszakot nyitott, mivel modellje jóval olcsóbbnak és erőforrás-hatékonyabbnak bizonyult, mint a ChatGPT. A DeepSeek az amerikai piacra lépését követően egy hét alatt megelőzte a ChatGPT-t és az Egyesült ÁllamokiOS App Store-jának legtöbbet letöltött ingyenes alkalmazása lett,[263] az első helyre került a legtöbbet telepítettiPhone-alkalmazások között.[264] Ugyanakkor 3 hónap elteltével a teljes aktív havi felhasználó tekintetében alig több mint 10 százalékát érte el a legnagyobb versenytársának, a ChatGPT-nek. Aktív felhasználók száma: 96,9 millió / hó (2025 április).[265]
↑Ulrich Schnabel:„Das kann sie auch!“ Von einer künstlichen Intelligenz erzeugte Texte sind von menschlichen kaum noch zu unterscheiden. Wer es ausprobiert, bekommt eine Ahnung davon, mit welcher Wucht sich die Wissensgesellschaft verändern wird. In:Die Zeit, 15. Dezember 2022. S. 35 (unter Mitarbeit von Martin Spiewak). Online auf zeit.de (hinter Bezahlschranke).
↑Vandalism Detection in Wikipedia: a Bag-of-Words Classifier Approach --- Amit Belani --- ab422@cornell.edu November 11, 2009 Archived 2023-04-02 at the Wayback Machinehttps://arxiv.org/ftp/arxiv/papers/1001/1001.0700.pdf
↑Warzel, Karen Hao, Charlie: Inside the Chaos at OpenAI (angol nyelven). The Atlantic, 2023. november 20. (Hozzáférés: 2023. december 6.)
↑Hello GPT-4o (amerikai angol nyelven). openai.com. (Hozzáférés: 2024. december 11.)
↑Hello GPT-4o We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time. - OpenAI - May 13, 2024 https://openai.com/index/hello-gpt-4o
↑abFedus, William. "GPT-4o is our new state-of-the-art frontier model "https://twitter.com/LiamFedus