Movatterモバイル変換


[0]ホーム

URL:


Hoppa till innehållet
Wikipedia
Sök

Deepseek

Från Wikipedia
Deepseek
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd
DeepSeek logo.svg
TypIcke börsnoterat aktiebolag
SäteKinaZhejiang, Kina
HuvudkontorHangzhou
NyckelpersonerLiang Wenfeng, vd
BranschAI-teknik
Produkterstora språkmodeller,textrobot
Historik
GrundatMaj 2023
GrundareLiang Wenfeng
Struktur
ModerbolagHigh-Flyer

Deepseek (kinesiska: 深度求索) är ett kinesisktAI-företag, vilket grundades 2023 och ägs av det kinesiskahedgefond- och AI-företagetHigh-Flyer. Deepseek lanserade i januari 2025textroboten ”Deepseek” som en gratis nedladdningsbar app påwebbutikernaApple Store ochGoogle Play på mobiltelefoner och surfplattor.

Deepseek, som är baserat iHangzhou i provinsenZhejiang, arbetar medgenerativ artificiell intelligens och utvecklarstora språkmodeller (LLM:er), vilka baseras påöppen källkod.

Bakom Deepseek står den kinesiske datoringenjören och entreprenörenLiang Wenfeng, som är medgrundare till High-Flyer och grundare av och ledare för Deepseek, som han började arbeta med som ett privat projekt vid sidan av sitt engagemang som chef för High-Flyer.

Deepseeks textrobot är en liknande AI-tjänst som de tidigare lanseradeChat GPT,Microsoft Copilot,Gemini ochLe Chat, vilka alla bygger på stora språkmodeller. Deepseeks stora språkmodell kallas Deepseek-R1, vilken offentliggjordes i en första upplaga i november 2024 och lanserades den 20 januari 2025.

Historik

[redigera |redigera wikitext]

Deepseek har sitt ursprung i utveckling avalgoritmstyrd aktieförvaltning av Liang Wenfeng och studiekamrater till honom, framför allt från 2016 inom hedgefonden High-Flyer. Efterhand använde sig fonden mer och mer av artificiell intelligens i sitt arbete, och 2021 tog dess chef Liang Wenfeng detta vidare genom att vid sidan om experimentera meddjupinlärning och att utveckla stora språkmodeller. För detta ändamål inköptes10 000GPU-mikroprocessorer av typNvidia A100 för ensuperdator innan USA införde restriktioner för export av avancerade mikroprocessorer till Kina.[1] Detta möjliggjorde för Deepseek att utveckla stora språkmodeller. Företaget Deepseek grundades 2023 med kapital från High-Flyer.

Under 2024 lanserades den stora språkmodellen Deepseek-V2. I januari 2025 lanserades Deepseek-R1, vilken fick stor uppmärksamhet och åstadkom ett betydande ras på börsen för framför allt chip-tillverkarenNvidia,[2][3] Skälet till detta var att Deepseek kunnat visa att stora språkmodeller kunde tränas med användning av mindre datorresurser än vad som till dess ansetts möjligt, vilket innebär avsevärt lägre kostnader för att ta fram dessa språkmodeller.[4]

Se också

[redigera |redigera wikitext]

Källor

[redigera |redigera wikitext]

Noter

[redigera |redigera wikitext]
  1. ^Cosmia_Nebula (2024-11-29) (på engelska). Two interviews with the founder of DeepSeek.https://www.lesswrong.com/posts/kANyEjDDFWkhSKbcK/two-interviews-with-the-founder-of-deepseek. Läst 31 januari 2025. 
  2. ^Jeffery, Björn (30 januari 2025). ”Tagna på sängen – nu ska USA slå tillbaka | Björn Jeffery”. Svenska Dagbladet.ISSN1101-2412.https://www.svd.se/a/OoXpPb/silicon-valley-blir-tagna-pa-sangen-av-kinesiska-deepseek. Läst 31 januari 2025. 
  3. ^”Chinese AI DeepSeek's Assistant Tops ChatGPT on US Apple App Store” (på engelska). The Express Tribune. 27 January 2025.https://tribune.com.pk/story/2524765/chinese-start-up-deepseek-stuns-silicon-valley-with-cutting-edge-ai-model. 
  4. ^”DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1”. GitHub.https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf. 

Externa länkar

[redigera |redigera wikitext]
Auktoritetsdata
Hämtad från ”https://sv.wikipedia.org/w/index.php?title=Deepseek&oldid=56858121
Kategorier:
Dolda kategorier:

[8]ページ先頭

©2009-2025 Movatter.jp