Deze week staat De Technoloog in het teken van -hoe kan het ook anders- DeepSeek. Het bedrijf, opgericht in juli 2023 door Liang Wenfeng, claimt betere prestaties dan GPT-4 tegen een fractie van de kosten. De timing van de aankondiging, precies tijdens de eerste campagneweek van Donald Trump, doet denken aan eerdere Chinese tech-demonstraties zoals de Huawei Mate 60 Pro lancering. Te gast is tech- en China-expert John Lin.
DeepSeek, voortgekomen uit het Chinese hedgefonds High Flyer, heeft het model ontwikkeld zonder toegang tot Nvidia's krachtigste H100-GPU's. In plaats daarvan gebruikte het bedrijf de H800-variant en ontwikkelde het eigen oplossingen voor het optimaliseren van GPU-clusters, waaronder het Fire-Flyer AI-HPC systeem. Het model maakt gebruik van reinforcement learning en distillation-technieken om de efficiëntie te verhogen.
De vraag rijst of dit een signaal is dat de Amerikaanse exportrestricties op high-end chips minder effectief zijn dan gedacht. Chinese tech-giganten als Baidu (met Ernie), Alibaba (met Qwen) en Tencent ontwikkelen ook hun eigen AI-modellen, maar deze zijn voornamelijk gericht op gebruik binnen China. DeepSeek kiest daarentegen voor een mondiale aanpak met een open-source strategie, al blijven cruciale elementen zoals trainingsdata en cloud-infrastructuur gesloten.
Deze ontwikkeling past in een breder patroon van Chinese technologische doorbraken, vergelijkbaar met de vooruitgang in elektrische auto's en de 7nm-chips van SMIC. De vraag is nu hoe Amerikaanse techbedrijven en de overheid zullen reageren op deze nieuwe realiteit in de wereldwijde AI-race.
Gast
John Lin
Video
YouTube
Hosts
Ben van der Burg & Daniël Mol
Redactie
Daniël Mol
See omnystudio.com/listener for privacy information.