🇨🇳 La Chine à la conquête des IA: voici Deepseek, sa réponse “low cost” qui pourrait battre ChatGPT

🇨🇳 La Chine à la conquête des IA: voici Deepseek, sa réponse “low cost” qui pourrait battre ChatGPT

Avec Deepseek, la Chine a dévoilé sa réponse aux IA conversationnelles occidentales qui semblaient avoir pris de l’avance sur ce nouveau marché. Un système qui aurait coûté beaucoup moins cher à développer, pour des résultats similaires. Jusqu’à ce qu’on lui pose des questions qui fâchent.

L’outil ChatGPT développé par OpenAI menait la danse dans le secteur en plein essor de l’IA, jusqu’à présent plutôt dominé par des grandes firmes occidentales. Mais voilà qu’un nouveau concurrent apparait en Chine. Deepseek, un “Chatbot” qui, depuis son apparition sur l’App Store, caracole en tête des téléchargements. Une véritable révolution, car cet outil développé par une start-up éponyme basée à Hangzhou, la “Silicon Valley” de l’est de la Chine, semble faire aussi bien que ses concurrents occidentaux. Mais cette IA aurait coûté beaucoup moins cher.

Une IA chinoise beaucoup moins chère?

DeepSeek a déclaré n’avoir dépensé que 5,6 millions de dollars pour développer son modèle, ce qui est ridiculement peu par rapport aux 13 milliards investis par Microsoft dans OpenAI. Alors que la firme de Sam Altman commence à peine à faire rentrer de l’argent – 28 millions en 2022, contre 540 millions de pertes – elle pourrait bien se faire rafler le marché par une IA “low cost”.

Ce serait là le secret derrière Deepseek qui stupéfie d’autant plus les magnats américains de la tech. Ce chatbot ne repose pas sur une mise en série des puces les plus performantes mises au point par le géant du secteur NVIDIA, mais sur des modèles plus anciens H800s, à la capacité de calcul plus réduite. Nombre d’analystes pensaient que l’avantage des États-Unis en matière de production de puces hautes performances, ainsi que leur capacité à limiter l’accès de la Chine à cette technologie, garantirait leur domination en matière d’IA. D’autant que les exportations de puces électroniques stratégiques ont été fortement régulées par l’administration Biden à partir de 2022, dans une véritable guerre commerciale pour les meilleurs processeurs.

Avec Deepseek, la technologie chinoise se montre donc aussi sous un nouveau jour, libéré des importations de puces occidentales. Du moins selon les propres dires de la société, qu’il faut bien croire sur parole quand elle prétend avoir développé son IA avec si peu de moyens. Mais ce récit a suffi à faire chuter le cours de NVIDIA de plus de 3% vendredi à Wall Street. Et la chute pourrait se stabiliser à 12% ce lundi à la fermeture des marchés, à l’heure d’écrire ces lignes. Une situation qui inquiète toute la Silicon Valley, qui craint de voir disparaître sa longueur d’avance dans les technologies de l’IA.

Tout ce que fait ChatGPT, sauf parler politique

D’autant que Deepseek, dont l’interface ressemble beaucoup à celle de ChatGPT, mais avec une baleine sympathique en guise de mascotte, promet de faire tout aussi bien que les “chatbots” occidentaux. La machine peut écrire des paroles de chansons, aider à affronter des situations de la vie quotidienne ou encore proposer une recette adaptée au contenu de son réfrigérateur. DeepSeek peut communiquer dans plusieurs langues, mais a indiqué à l’AFP qu’il maîtrisait surtout l’anglais et le chinois.

“Le nouveau modèle de DeepSeek [NDLR: le R1] est très impressionnant en ce qui concerne la manière dont ils ont réussi à créer un modèle open-source qui permet de calculer le temps d’inférence et qui est très efficace en termes de calcul”, a confirmé le PDG de Microsoft, Satya Nadella, lors du Forum économique mondial de Davos, en Suisse, mercredi dernier. “Nous devrions prendre les développements en Chine très, très au sérieux.” Ce modèle R1, testé en parallèle avec la version actuelle de ChatGPT par des tiers, a donné des réponses toujours au moins aussi satisfaisantes, selon CNBC.

L’outil chinois devient toutefois beaucoup plus frileux dès qu’il s’agit d’évoquer la politique. Interrogé sur le président Xi Jinping, il préfère éviter le sujet et propose de “parler d’autre chose”.

kinda curious how deepseek decides when to use "can't answer" and when to give propaganda

[image or embed]

— Chenchen Zhang 🤦🏻‍♀️ (@chenchenzh.bsky.social) 26 janvier 2025 à 07:36

Un “moment spoutnik”

Marc Andreessen, un investisseur et proche conseiller du président américain Donald Trump, a qualifié DeepSeek de tournant “pour l’IA”, comme l’était “Spoutnik”, en référence au lancement du satellite soviétique qui avait déclenché la course à l’espace durant la Guerre froide.

Comme ses concurrents occidentaux, tels que ChatGPT, Llama ou Claude, DeepSeek s’appuie sur un grand modèle de langage (LLM), formé à partir d’immenses quantités de textes, pour maîtriser les subtilités du langage naturel. Mais contrairement à ces rivaux, qui développent des modèles propriétaires, DeepSeek est en code source ouvert (“open source”). Cela signifie que le code de l’application est accessible à tous, permettant de comprendre son fonctionnement et de le modifier.

La Chine ambitionne de devenir leader de l’intelligence artificielle d’ici 2030, avec des investissements prévus de plusieurs dizaines de milliards d’euros dans ce domaine au cours des prochaines années.

7sur7