Deepseek is viral geworden.
De Chinese AI Lab Deepseek brak deze week in het reguliere bewustzijn nadat de chatbot -app naar de top van de Apple App Store -hitlijsten (en Google Play) steeg. De Deepseek’s AI-modellen, die zijn getraind met behulp van rekenefficiënte technieken, hebben ertoe geleid dat Wall Street-analisten-en technologen-zich afvragen of de VS zijn voorsprong in de AI-race kunnen handhaven en of de vraag naar AI-chips zal handhaven.
Maar waar kwam Deepseek vandaan en hoe is het zo snel naar internationale roem gestegen?
De diepte -oorsprong van Deepseek
Deepseek wordt ondersteund door high-flyer Capital Management, een Chinees kwantitatief hedgefonds dat AI gebruikt om haar handelsbeslissingen te informeren.
AI-enthousiaste Liang Wenfeng is in 2015 mede-oprichter van High Flyer.
In 2023 begon Highflyer Deepseek als een laboratorium dat zich toelegt op het onderzoeken van AI-tools die losstaat van de financiële activiteiten. Met hoogvlieger als een van zijn investeerders, draaide het lab af in zijn eigen bedrijf, ook wel Deepseek genoemd.
Vanaf de eerste dag bouwde Deepseek zijn eigen datacenterclusters voor modeltraining. Maar net als andere AI -bedrijven in China, is Deepseek getroffen door Amerikaanse exportverboden op hardware. Om een van zijn recentere modellen te trainen, werd het bedrijf gedwongen Nvidia H800-chips te gebruiken, een minder krachtige versie van een chip, de H100, beschikbaar voor Amerikaanse bedrijven.
Het technische team van Deepseek zou Young Skew. Het bedrijf werft naar verluidt agressief doctoraat AI -onderzoekers van top Chinese universiteiten. Deepseek huurt ook mensen in zonder enige informatica -achtergrond om de technologie te helpen een breed scala aan onderwerpen beter te begrijpen, volgens de New York Times.
De diepe modellen van Deepseek
Deepseek onthulde in november 2023 zijn eerste set modellen-Deepseek Coder, Deepseek LLM en Deepseek Chat-in november 2023. Maar het was pas in het afgelopen voorjaar, toen de startup zijn volgende-gen Deepseek-V2-familie van modellen uitbracht, dat de AI-industrie begon op te lossen.
Deepseek-V2, een algemene tekst- en beeldanalysesysteem, presteerde goed in verschillende AI-benchmarks-en was op dat moment veel goedkoper om te worden uitgevoerd dan vergelijkbare modellen. Het dwong de binnenlandse concurrentie van Deepseek, waaronder Bytedance en Alibaba, om de gebruiksprijzen voor sommige van hun modellen te verlagen en anderen volledig vrij te maken.
Deepseek-V3, gelanceerd in december 2024, voegde alleen maar bij aan de bekendheid van Deepseek.
Volgens de interne benchmarktests van Deepseek presteert Deepseek V3 beter dan zowel downloadbare, openlijk beschikbare modellen zoals meta’s lama- en “gesloten” modellen die alleen toegankelijk zijn via een API, zoals de GPT-4O van Openai.
Even indrukwekkend is het R1 “redenering” -model van Deepseek. De Deepseek is uitgebracht in januari en beweert dat R1 het O1 -model van OpenAI uitvoert op belangrijke benchmarks.
Als een redeneermodel controleert R1 effectief feiten, wat het helpt om enkele van de valkuilen te voorkomen die normaal struikelen op modellen. Redeneermodellen duren iets langer-meestal seconden tot minuten langer-om tot oplossingen te komen in vergelijking met een typisch niet-herhalingsmodel. Het voordeel is dat ze de neiging hebben om betrouwbaarder te zijn in domeinen zoals natuurkunde, wetenschap en wiskunde.
Er is echter een nadeel van R1, Deepseek V3 en Deepseek’s andere modellen. Als Chinees-ontwikkelde AI, zijn ze onderworpen aan benchmarking door de Chinese internetregelgever om ervoor te zorgen dat de antwoorden ervan “de socialistische waarden van de kern belichamen”. In Deepseek’s Chatbot -app bijvoorbeeld beantwoordt R1 geen vragen over Tiananmen Square of de autonomie van Taiwan.
Een verstorende aanpak
Als Deepseek een bedrijfsmodel heeft, is het niet duidelijk wat dat model precies is. Het bedrijf prijst zijn producten en diensten ver onder de marktwaarde – en geeft anderen gratis weg. Het neemt ook geen beleggers geld aan, ondanks een heleboel VC -rente.
De manier waarop Deepseek het vertelt, hebben efficiëntiebraak in staat gesteld om het concurrentievermogen van het extreme kosten te behouden. Sommige experts betwisten echter de cijfers die het bedrijf heeft verstrekt.
Hoe dan ook, ontwikkelaars hebben de modellen van Deepseek overgenomen, die niet open source zijn omdat de uitdrukking algemeen wordt begrepen, maar beschikbaar zijn onder toegestane licenties die commercieel gebruik mogelijk maken. Volgens Clem Delangue, de CEO van Hugging Face, een van de platforms die DeepSeek’s modellen organiseren, hebben ontwikkelaars op Hugging Face meer dan 500 “afgeleide” modellen van R1 gemaakt die 2,5 miljoen downloads hebben verzameld.
Het succes van Deepseek tegen grotere en meer gevestigde rivalen is beschreven als “Upending AI” en “overhyped”. Het succes van het bedrijf was ten minste gedeeltelijk verantwoordelijk voor het veroorzaken van de aandelenkoers van Nvidia in januari met 18% en voor het opwekken van een openbare reactie van Openai CEO Sam Altman. In maart vertelde de Amerikaanse handelsafdeling Bureaus aan medewerkers dat Deepseek volgens Reuters op hun overheidsapparatuur zal worden verbannen.
Microsoft kondigde aan dat Deepseek beschikbaar is op de Azure AI Foundry Service, het platform van Microsoft dat AI -services voor ondernemingen onder één banner samenbrengt. Op de vraag naar de impact van Deepseek op de AI-uitgaven van Meta tijdens de winstoproep van het eerste kwartaal, zei CEO Mark Zuckerberg dat de uitgaven voor AI-infrastructuur een “strategisch voordeel” zullen blijven voor meta. In maart noemde Openai Deepseek ‘door de staat gesubsidieerd’ en ‘door de staat gecontroleerd’, en beveelt de Amerikaanse regering aan om modellen uit Deepseek te verbieden.
Tijdens de winstoproep van Nvidia in het vierde kwartaal, benadrukte CEO Jensen Huang de ‘uitstekende innovatie’ van Deepseek, en zei dat het en andere ‘redeneermodellen’ geweldig zijn voor Nvidia omdat ze zoveel meer reken nodig hebben.
Tegelijkertijd verbieden sommige bedrijven Deepseek, evenals hele landen en regeringen, waaronder Zuid -Korea. De staat New York verbood ook Deepseek om op overheidsapparaten te worden gebruikt.
Wat betreft wat Deepseek’s toekomst zou kunnen inhouden, het is niet duidelijk. Verbeterde modellen zijn een gegeven. Maar de Amerikaanse regering lijkt op hun hoede te zijn voor wat zij beschouwt als schadelijke buitenlandse invloed. In maart meldde de Wall Street Journal dat de VS waarschijnlijk Deepseek op overheidsapparaten zullen verbieden.
Dit verhaal werd oorspronkelijk gepubliceerd op 28 januari 2025 en zal regelmatig worden bijgewerkt.