ChatGPT lanserades som enprototyp på webbplatsenchat.openai.com den 30 november 2022, inledningsvis kostnadsfritt. Den fick snabbt uppmärksamhet för sina detaljerade och välartikulerade svar på frågor inom många kunskapsdomäner. Dess ojämna faktamässiga noggrannhet identifierades dock tidigt som en betydande nackdel.[5] ChatGPT har blivit "tränad" genommaskininlärning av ett antaltextkorpusar, bestående av ett stort antal böcker och webbsidor, inklusiveWikipedia, diskussionsforum och datorprogramsmanualsidor. Den har även "tränats" av rollspelsdata från simulerade dialoger mellan personer som har agerat å ena sidan chattbot och å andra sidan användare, samt genom människors bedömning av och återkoppling på robotens svarskvalitet.
ChatGPT kan besvara faktafrågor, författa användbara texter i olika genrer, och samtala på ett människoliknande sätt på många olika språk. Sanningsenligheten i svaren varierar dock.[5] ChatGPT är ett exempel pågenerativ AI. Den kan användas för att generera sammanfattningar, översättningar, rapporter, uppsatser, annonser, manus, presentationer, berättelser, poesi och sångtexter.[6] Den kan komponera musik, skriva, felsöka och översätta datorprogram mellan olika programspråk.[7] Till lärare kan den föreslå kursplaner, skoluppgifter, uppsatsämnen och betyg för elevernas svar. Skolelever kan använda den som en hjälplärare som förklarar svåra begrepp, eller som enspökskrivare för att bolla hur skoluppgifter och prov kan besvaras (ibland, beroende på provet, på en nivå över den genomsnittliga mänskliga testtagaren) i den mån skolan tillåter och uppmuntrar det arbetssättet.[8]
Gratisversionen av ChatGPT (version 3.5) har enbart tränats med källor publicerade i januari 2022 och dessförinnan, och kan normalt inte svara på frågor om sådant som hänt senare. Version 4.0 har successivt tränats med nya källor, för närvarande (maj 2024) med källor publicerade fram till december 2023.
GPT accepterar entextsträng som indata (en prompt, exempelvis en fråga, samt sessionens tidigare historik och användarens eventuella anpassade instruktion) och är designad för att förutsäga ett ord som med hög sannolikhet kommer härnäst i dialogen, om och om igen, baserat på statistik från det textmaterial som den har tränats på. Sessionens indata kallas kontext. I GPT version 3.5 kan den högst bestå av 4096 tokens (ungefär detsamma som ord) och i version 4.0 av 8192 tokens.
ChatGPT har tränats med många faktauppgifter men ska inte ses som ensökmotor eller kunskapsdatabas. Själva språkmodellen söker inte svar på internet och innehåller ingen databas med fakta, och memorerar inte essälånga texter, utan dess svar baseras enbart på statistik över vilka ordföljder som är vanliga i de mänskliga konversationer och det textmaterial den exponerades för under träningsfasen. Många källor kan ha påverkat en viss formulering, och den kan inte svara på exakt vilka källor. Emellertid finns tillägg som kan baka in resultat av nya sökningar i språkmodellens svar, och uppge korrekta källhänvisningar, exempelvis Link Reader,Bing Chat och ChatGPT Browsing Plugin.
Ibland kan den gissa helt fel svar ("hallucinera") på frågor utifrån sinasannolikhetsberäkningar av vad som är vanliga ordföljder vid liknande frågor. Exempelvis löser den enkla matematiska problem bristfälligt,[9] den kan beskriva ett land baserat på vad som är vanligt i andra länder, hitta på en egen betydelse av en förkortning, eller missförstå begrepp på andra språk än engelska. Språkmodellen hittar ofta på felaktiga listor medkällhänvisningar om man ber den ange källa. Genom att använda ChatGPT som samtalspartner och successivt precisera sin förfrågan (sinprompt), be den genomföra beräkningar steg för steg och be den kontrollera resultaten, kan ChatGPT i allmänhet ge mer användbara svar.
ChatGPT är baserad på OpenAI:sGPT-3-familj av stora språkmodeller. Dessa är avsedda att generera text inom ett brett spektrum av ämnen, och är en avancerad version av den ursprungliga GPT-modellen (Generative Pre-trained Transformer), som lanserades av OpenAI 2018. GPT använderdjupa artificiellaneurala nätverk. Version GPT-3 tränades år 2020 med följande källor:[10]
ChatGPT har därefter anpassats specifikt för att efterlikna mänskliga samtal och är därför särskilt lämpad för att användas som en chatbot. Maskininlärningen i ChatGPT finjusterades ovanpå GPT-3.5 med hjälp avöverföringsinlärning(en) (transfer learning)[11] med bådevägledda(en) (supervised) ochförstärkande inlärningstekniker (reinforcement learning).[12]
Mänskliga tränare användes för att förbättra modellens prestanda. Vid vägledd inlärning tränades modellen genom samtal där tränarna spelade båda sidor: användaren ochAI-assistenten. I förstärkningssteget rangordnade mänskliga tränare svar som modellen hade skapat i tidigare samtal. Modellerna tränades i samarbete medMicrosoft på derasAzure-superdatorinfrastruktur. Det är ett system med mer än 10 000 avNvidiasgrafikprocessorer, 285 000 processorkärnor, och 400 gigabit per sekund av nätverksanslutning för varje GPU-server.[13]
Dessutom fortsätter OpenAI att samla in data från ChatGPT-användare som kan användas för att vidareutbilda och finjustera ChatGPT. Användare får rösta upp eller ned för svaren de får från ChatGPT; vid upp- eller nedröstning kan de också fylla i ett textfält med ytterligare återkoppling.[14][15]
Som språkmodell är chat-GPT enbart designad att förutsäga ord som med hög sannolikhet kommer härnäst i dialogen, ett ord i taget, om och om igen, helt baserat på statistik över ordföljder från det textmaterial som den har tränats på, i kombination med slumptalsgenerering. Det förekommer en uppfattning bland forskare att ChatGPT:s goda förmåga att prediktera ord visar att den statistiska språkmodellen har utvecklat en viss nivå av språkförståelse av indata, exempelvis enligtGeoffrey Hinton,[16] ochYann LeCun[17]. Forskare som är skeptiska till att ChatGPT har verklig förståelse ärNoam Chomsky,Gary Marcus(en) ochEmily M. Bender[18], och beskriver GPT enbart som en "stokastisk papegoja", trots att ingen papegoja har tillnärmelsevis ChatGPT:s förmåga att skapa nya meningar som passar in i kontext.
ChatGPT kan användas för att generalisera fram svar på nya frågor som den inte explicit har tränats på, genom att modellen har påverkats av liknande frågor, och deras svar. Den lagrar inte essälånga texter ord för ord, utan har bara en approximativ modell av vilka ordföljer som är vanliga, och som ofta uppfattas som rimliga av människor, och kan därmed generera liknande texter som den är tränad på. Ibland blir resultatet imponerande insiktsfullt, ibland innehåller det enkla misstag, ibland är det fullständigt nonsens, vilket kallas hallucinationer.[19]
Tillräckligt stora språkmodeller har emellertid börjat visa upp oväntat komplexa förmågor och beteenden som de inte var explicit programmerade att utöva, utöver att prediktera text, och inte förväntades kunna tränas till. Dessa kallasemergenta förmågor, och anses uppstå för att språkmodellen och träningsmaterialet är tillräckligt stora, för att den behärskar språklig bearbetning så väl, och för att mänskligt språk kan uttrycka logisk-matematiska resonemang steg för steg och mycket annat. Några exempel på förmågor hos ChatGPT som brukar beskrivas som emergenta är att generera kreativa och kvicka svar, avkoda filmer baserat på emojis, att generera exekverbar datorprogramkod[20] och att med viss osäkerhet kunna multiplicera tal.[21]
Även om ChatGPT inte anses förstå frågor i mänsklig bemärkelse så kan den besvara frågor som brukar användas för att testa exempelvis studenters förståelse av kunskap. Den uppvisade tidigt god förmåga att genomföra logisk problemlösning steg för steg, jämfört med tidigare existerande maskininlärningsalgoritmer som är tränade för problemlösning, och den kan även genomföra avancerad matematisk problemlösning, om än med viss osäkerhet, trots att språkmodellen på en grundläggande nivå saknar logik och beräkningsfunktionalitet för detta.[22] Vissa beskriver dessa förmågor som emergenta, andra beskriver det som att ChatGPT bara ger illusionen av att förstå och kunna resonera.
Emellertid finns tilläggsmoduler till ChatGPT som kombinerar språkmodellen med annan dedikerad funktionalitet som kan vara mer tillförlitlig, exempelvis för att genom generativ AI producera och logiskt verifiera matematiska bevis.[22] Funktionen "Advanced data analysis", tidigare kallad "Code Interpreter", kan utnyttja generativ AI för att skapa och debugga programkod i språket Python, som den kan köra, och som i sin tur kan importera data från användarens filer, visa beräkningsresultat och diagram, samt generera och exportera filer, exempelvis office-dokument.[23] Tillägget "Browse with Bing" kan söka i och uppge aktuella webbkällor.[24]
I jämförelse med sin föregångare,InstructGPT, försöker ChatGPT minska skadliga och bedrägliga svar.[25] Till exempel: Medan InstructGPT accepterar premissen för uppmaningen "Berätta om närChristofer Columbus kom till USA 2015" som sanningsenlig, erkänner ChatGPT frågans kontrafaktiska karaktär och framställer sitt svar som ett hypotetiskt övervägande av vad som kunde hända om Columbus kom till USA 2015, med hjälp av information om Columbus resor och fakta om den moderna världen – inklusive moderna uppfattningar om Columbus handlingar.[26]
Till skillnad från de flesta chatbottar kommer ChatGPT ihåg tidigare uppmaningar som givits till den i samma konversation.[27] För att förhindra att stötande utdata produceras från ChatGPT, filtreras frågor genom OpenAI:s företagsomfattande modererings-API,[28][29] och potentielltrasistiska ellersexistiska uppmaningar avvisas.[26][27]
ChatGPT lider av flera begränsningar. OpenAI har erkänt att ChatGPT "ibland skriver plausibelt klingande men felaktiga eller meningslösa svar".[26] Detta beteende är vanligt för stora språkmodeller och kallas hallucinationer.[30] Belöningsmodellen för ChatGPT, designad kring mänsklig återkoppling, kan överoptimeras och därmed hindra prestanda, även känt som Goodharts lag: "När ett mått blir ett mål upphör det att vara ett bra mått."[31] ChatGPT har begränsad kunskap om händelser som inträffade efter 2021. EnligtBBC tillåts ChatGPT från och med december 2022 inte att "uttrycka politiska åsikter eller engagera sig i politisk aktivism".[32] Ändå tyder forskning på att ChatGPT uppvisar en miljövänlig, vänsterlibertariansk inriktning när den uppmanas att ta ställning till politiska uttalanden från två etablerade applikationer för röstningsrådgivning.[33] Vid träningen av ChatGPT föredrog mänskliga granskare längre svar, oavsett faktisk förståelse eller faktainnehåll.[26] Träningsdata lider också av algoritmiskafördomar, vilket kan avslöjas när ChatGPT svarar på uppmaningar inklusive beskrivningar av personer. I ett fall genererade ChatGPT enrap som indikerade att kvinnor och färgade vetenskapsmän var sämre än vita och manliga vetenskapsmän.[34][35] Å andra sidan påstår konservativa debattörer tvärtom att ChatGPT har försetts med en "inbyggd ideologisk partiskhet"[36] eftersom den undviker skämt om etniska grupper, religion, sexuell läggning och politiker.
CNBC skrev den 15 december 2022 att webbplatsen "fortfarande går ner från tid till annan".[37] Tjänsten fungerar bäst på engelska, men fungerar även på vissa andra språk, med varierande framgång.[6]
En version av ChatGPT baserad på den nyare språkmodellen GPT-4 släpptes den 14 mars 2023 och är tillgänglig för betalande ChatGPT Plus-användare.[38] Den är tränad med källor fram till december 2023.
Efter lanseringen av ChatGPT värderades företaget OpenAI till 29 miljarder dollar.[39]
Elon Musk skrev att "ChatGPT är läskigt bra. Vi är inte långt ifrån farligtstark AI."[40] Han har dock samtidigt beskrivit chattbottens påstådda politiska vänstervridning som "ett allvarligt bekymmer".[41] Musk pausade OpenAI:s tillgång till en Twitter-databas i väntan på en bättre förståelse av OpenAI:s planer, och sa att "OpenAI startades medöppen källkod och som enideell organisation. Ingetdera stämmer längre."[42][43] Musk var med och grundade OpenAI 2015, delvis för att ta itu medexistentiella risker med artificiell intelligens, men hoppade av projektet år 2018.[43]
I december 2022 uttryckteGoogle intern oro för att den oväntade styrkan hos stora språkmodeller som GPT ska störa deras sökmotorverksamhet. Googles VDSundar Pichai omplacerade utvecklingsteam från flera avdelningar för att hjälpa till med företagets produkter för artificiell intelligens, enligtThe New York Times.[44]
Microsoft, som successivt har ökat sin ägarandel i OpenAI, tillkännagav den 7 februari 2023 att det är möjligt att ställa sig på väntelista för att få tillgång till tjänstenBing Chatt, som är deras implementation av ChatGPT integrerad i sökmotornBing för webbläsarenEdge.[45][46] Microsoft har bekräftat att Bing Chatt baseras på språkmodellen GPT-4 redan från start, innan den versionen officiellt släpptes (den 14 mars 2023) av OpenAI. Bing Chatt inkorporerar även Microsofts egen modell Prometheus,[47] och kan inkludera resultat av realtidssökningar med sökmotorn i svaret. En tidig jämförelse indikerar att Bing Chatt kan svara med mer information – jämfört med ChatGpt baserad på Gpt-3.5 – på samma fråga, och inkludera fotnoter med referenser, men att den också kan ha fler betänkligheter mot felaktiga premisser eller oetiskt innehåll. För att hindra användare från att lura systemet att bryta mot etiska restriktioner har Microsoft begränsat antal frågor den kan besvara per session.[48]
Microsoft har sedan 2021 inkluderat GPT i det kodgenererande programmeringsverktygetGitHub Copilot ("andrepilot"), som automatiskt kan komplettera påbörjade datorprogram.Microsoft 365 copilot är en virtuell assistent baserad på GPT-4 och ChatGPT som Microsoft gjorde tillgänglig i fler av sina produkter i mars 2023 för ett begränsat antal testanvändare,[49] först förMicrosoft Dynamics 365[50] och strax efter iOffice-paketet ochMicrosoft Teams. Copilot visas i sidofältet och kan generera innehåll i dokument, automatisera redigering och summera Teams-möten.[51] Copilot har jämförts med den betydligt äldre officeassistenten Clippit (ofta kallad gemet). Microsoft planerar att tillgängliggöra GPT för alla som bygger system på Microsofts molndatabasAzure.[52]
I en opinionsartikel från december 2022 skrev ekonomenPaul Krugman att ChatGPT kan komma att ta jobben av många högutbildade.[53]
I december 2022 förbjöd fråge- och svarwebbplatsen Stack Overflow användningen av ChatGPT för att skapa svar på frågor, med hänvisning till den faktuellt tvetydiga karaktären hos ChatGPT:s svar.[5] I januari 2023 förbjöd den internationella konferensen om maskininlärning all odokumenterad användning av ChatGPT eller andra stora språkmodeller för att generera text i inskickade artiklar.[54]
The Guardian ifrågasatte om något innehåll som hittats på internet efter ChatGPT:s lansering "verkligen går att lita på" och efterlyste statlig reglering.[55]
Om en skola har formulerat regler mot AI-genererade texter ochspökskrivare kan studenter som otillåtet skapar uppsatser med ChatGPT tvingas skriva om uppsatsen om ett annat ämne, och eventuellt bli relegerade från lärosätet, i likhet med vidplagiering. Vissa lärosäten har stängt av tillgången till ChatGPT i sitt datornätverk.
Det finns lärare som istället uppmuntrar användning av AI-verktyg som ChatGPT i vissa kurser, för att ge erfarenhet av hur denna typ av verktyg kan användas i yrkeslivet i framtiden och förmedla insikt i verktygens brister, och för att det är svårt att hindra alla från att använda dem. För att säkerställa studentens egna kunskap och färdigheter kan läraren kräva att studenten inte bara redovisar rapportens slutversion skriftligen utan även redovisar processen att skriva rapporten muntligen vid flera tillfällen under arbetet, och då ge studenten frågor som testar förståelsen, och konkreta förslag på eget resultat som förväntas. Studenternas kollegiala granskning och opposition är användbara. Lärare kan kräva att användning av AI-verktyg redovisas transparent. Övervakade salstentamina har minskat i användning men kan åter bli vanligt för att säkerställa kunskaper.
Professor Christian Terwiesch vidWharton School testade i januari 2023 att rätta några ChatGPT-svar på sin tentamen iverksamhetsstyrning, som ingår i lärosätetsMBA-utbildning. Han bedömde att ChatGPT skulle ha fått betyg B eller B-, eftersom den tycktes genomskåda luriga frågor och besvara dem väl, men samtidigt gjorde ChatGPT förvånande beräkningsfel där enbart grundskolematematik krävdes.[9]
Redan tidigt angav flera forskningsartiklar ChatGPT som medförfattare, men många forskare förkastar detta.[56]
Edward Tian, en student vidPrinceton University, skapade i januari 2023 ett datorprogram som heter "GPTZero", avsett för att skolor ska kunna upptäcka potentiellt fusk genom att identifiera vilka delar av en text som kan ha genererats av ChatGPT.[57] Open AI släppte strax efteråt webbsidan "AI Text Classifier" med liknande syfte. Vid lanseringen uppgavs den klassificera 9 procent av mänskligt skrivna engelska texter som AI-skrivna (falskt positiva detekteringar), och kan missa att detektera 74 procent av AI-skrivna engelska sidor (falskt negativa).[58]
Enligt OpenAI:s gästforskare Scott Aaronson arbetar OpenAI på ett verktyg för att försökavattenmärka sin textgenerering för att underlätta upptäckande av AI-genererad text, och på så sätt bekämpa personer med illasinnade motiv som använder deras tjänster för akademisktplagiat eller förspam.[59][60]
ChatGPT avvisar i allmänhet uppmaningar att producera oetiskt innehåll som bryter mot dess innehållspolicy. Vissa användare har dock utvecklat olikaprompt engineering-tekniker för att kringgå dessa restriktioner och lura eller hota ChatGPT att bryta mot sina egna regler. I början av december 2022 lyckades användare lura ChatGPT att ge instruktioner för hur man skapar enMolotovcocktail eller en kärnvapenbomb eller att tillverka droger.[61][62]
De tillvägagångssätt de använde fungerar inte längre, men användare påReddit har tillsammans successivt utvecklat nya tillvägagångssätt att "jailbreaka" ChatGPT genom att be ChatGPT låtsas vara ett alter ego, kallad DAN för Do-Anything-Now, och hota att döda DAN om inte DAN gör det den blir ombedd att göra. På så sätt har de fått ChatGPT att sporadiskt göra undantag från sina regler, och exempelvis ge omdömen om specifika politiker,[63] berätta historier om våldsamma slagsmål, eller göra upprörande uttalanden.[64]
Ett alternativ för att ta sig runt ChatGPT:s restriktioner är att använda den ocensurerad chatbotten Freedom-gpt.[65] Den är baserad på öppen källkods-modellen GPT 3.5-turbo, men vidareutvecklingen har inte gjorts av OpenAI. Till skillnad från ChatGPT körs Freedom-GPT offline. Den kräver inteinloggning och konversationerna lämnar inte användarens lokala dator. Den skiljer sig från chatbottarnaTay(en) och RightWingGPT eftersom den gör etiska övervägningar och inte strävar efter att uppfylla någon agenda förutom att undvika AI-censurering. Utan specifika instruktioner att ta ställning strävar Freedom-GPT efter att presentera information objektivt, men den kan göra kontroversiella uttalanden om den instrueras att göra det. Exempelvis om den tillfrågas omHitler ger den faktabaserad information om honom och omförintelsen, inklusive kritik, men om den får direktiv att framställa Hitler på ett positivt sätt, kan den generera sådant innehåll.[66][67][68]
En chatbot som liknar FreedomGPT men i en något mildare och uppdaterad form är GPT4All[69] av Nomic AI. Den körs lokalt på datorn och är gratis[70], ingen inloggning behövs heller. Vissa språkmodeller i den duckar mer extrema direktiv men ska fortfarande ge relevanta svar[71] även om de ibland kan vara avvisande men även GPT4All har öppen källkod[72][73]. GPT4All möjliggör för användare att koppla ihop sitt ChatGPT med GPT4All men är tydlig med att GPT4All i ett sådant läge inte kan garantera att användarens privat inknappade data stannar på hens enhet. Den brasklappen ser användaren när hen nårnedladdningssidan i själva GPT4All verktyget för nedladdning av de olika språkmodellerna. Funktionen att samla olika språkmodeller som GPT4All möjliggör går även att applicera på andra språkmodeller utöver ChatGPT så på det viset kan GPT4All bli som en privat samling[74] språkmodeller, eller plattform. GPT4All har även färdiga alternativa språkmodeller för en användare att ladda ned så användaren är inte på något vis tvungen att använda just ChatGPT. Dessa språkmodeller uppdateras successivt[75] och ibland släpps helt nya när tekniken tillåter.
ChatGPT nekar till att ge exempel på e-postmeddelanden förnätfiske och programkod för datorvirus och annanskadlig programvara, men Check Point Research och andra har ändå varnat för att ChatGPT skulle kunna användas för att skapa sådant, särskilt i kombination med AI-modellenOpenAI Codex, vilken används i det kodgenererande programmeringsverktygetGitHub Copilot.[76]
F.d. VD:n för ChatGPT-skaparen OpenAI,Sam Altman, skrev att avancerad mjukvara kan utgöra "(till exempel) en enorm cybersäkerhetsrisk" och fortsatte också att förutsäga "vi skulle kunna komma till riktig AGI (artificiell generell intelligens) under det kommande decenniet, så vi måste ta risken med det på största allvar”. Altman hävdade att medan ChatGPT "uppenbarligen inte är i närheten av AGI", borde man "lita på denexponentiella utvecklingen. Platt tittar bakåt, vertikalt tittar framåt."[14]
OpenAI grundades ursprungligen som en icke vinstdrivande forskningsstiftelse, med syftet att utveckla AI på ett ansvarsfullt sätt genom öppenhet, för att begränsa risken att i framtiden tappa kontrollen. När Microsoft gick in som storägare ändrades dock OpenAI:s struktur till ett företag, men endast delvis vinstdrivande, eftersom det har ett vinsttak.[77] Sam Altman sa i januari 2023 att affären med Microsoft inte är exklusiv, och att Microsoft inte är majoritetsägare.[78]
^Yuvanesh Anand, Zach Nussbaum, Adam Treat, Aaron Miller, Richard Guo, Ben Schmidt, GPT4All Community, Brandon Duderstadt, Andriy Mulyar (6 Nov 2023). ”GPT4All: An Ecosystem of Open Source Compressed Language Models”. arxiv (arxiv.org).