đŸ‘šâ€đŸ’» IA : Ouvrage non exhaustif

DeepSeek a dĂ©cidĂ©ment mis un sacrĂ© bazar dans le monde de l’IA gĂ©nĂ©rative, a commencĂ© par les questions de censure que certains ont pu voir dans les donnĂ©es du modĂšle. Ce point-lĂ  est un faux problĂšme Ă  mes yeux et c’est le thĂšme de ma rĂ©flexion de la semaine.

Mais avant, le sommaire :

Les LLMs ne sont pas des sources d’informations

Actualités
🔊 La levĂ©e de fonds qui fait vibrer la tech vocale
đŸ›ïž OpenAI officialise ChatGPT Gov
🚹 Meta prĂ©pare son offensive contre DeepSeek
⚠ L’IA qui fournit (trop) facilement du contenu dangereux
đŸ•č Operator : l’agent navigateur d’OpenAI

Outils
- Suivi IA sur Bluesky

Les LLMs ne sont pas des sources d’informations

Je trouve complĂštement insensĂ© de voir des personnes tester les LLMs en leur demandant directement des informations. Pourquoi croyez-vous que ChatGPT, Le Chat (de Mistral) ou Claude (d’Anthropic) cherchent Ă  se connecter Ă  internet ? Parce que leurs modĂšles en eux-mĂȘmes ne sont pas des sources fiables ! Ils ont besoin d’accĂ©der Ă  des donnĂ©es externes pour donner l’illusion du savoir. En rĂ©alitĂ©, ils disposent uniquement de (trĂšs, trĂšs, trĂšs) nombreux bouts de textes appris lors de leur entraĂźnement.

Le problĂšme, c’est que ce contenu d’entraĂźnement est forcĂ©ment partiel et peut mĂȘme ĂȘtre volontairement biaisĂ© (coucou DeepSeek). Un LLM ne fait que prĂ©dire statistiquement quel mot vient aprĂšs l’autre en se basant sur tout ce qu’il a « lu » avant (et qu’il ne comprend pas vraiment). Un LLM est un gĂ©nĂ©rateur de texte. Son rĂŽle est de comprendre les structures linguistiques, de rĂ©sumer des idĂ©es, de reformuler ou de produire du contenu cohĂ©rent Ă  partir de ce qu’il a dĂ©jĂ  vu.

Ce n’est pas une encyclopĂ©die : son but premier n’est pas de stocker et de restituer fidĂšlement des informations vĂ©rifiĂ©es, mais bien de crĂ©er du texte plausible et fluide.

Actualités

🔊 La levĂ©e de fonds qui fait vibrer la tech vocale

ElevenLabs, la startup spĂ©cialisĂ©e dans la gĂ©nĂ©ration et la manipulation de voix par IA, vient d’annoncer un tour de financement de 250 millions de dollars ! Cette SĂ©rie C valorise l’entreprise de 3 à 3,3 milliards de dollars, triplant ainsi sa valorisation en seulement un an. 💰

MalgrĂ© quelques controverses sur l’usage malveillant de ses technologies, ElevenLabs a renforcĂ© ses garde-fous (dĂ©tection d’audio gĂ©nĂ©rĂ©e, outils de sĂ©curitĂ©) et affiche aujourd’hui une croissance insolente. Avec un ARR proche de 90 millions de dollars et un Ă©cosystĂšme IA toujours plus friand de fonctionnalitĂ©s vocales, ElevenLabs semble bien dĂ©cidĂ©e Ă  prendre la premiĂšre place du marchĂ©, face Ă  des poids lourds comme Google ou OpenAI.⚡

đŸ›ïž OpenAI officialise ChatGPT Gov

OpenAI a dĂ©voilĂ© ChatGPT Gov, une version de son cĂ©lĂšbre chatbot destinĂ©e aux agences gouvernementales amĂ©ricaines. L’argument-clé ? Offrir la mĂȘme puissance de ChatGPT, mais adaptĂ©e aux exigences de sĂ©curitĂ© les plus strictes (IL5, CJIS, ITAR, etc.). En gros, OpenAI veut s’imposer comme le choix « safe et made in USA » en rĂ©ponse aux inquiĂ©tudes soulevĂ©es par les modĂšles Ă©trangers comme DeepSeek. 😰

Les exemples d’usage ne manquent pas : l’Air Force Research Lab ou encore Los Alamos National Lab exploitent dĂ©jĂ  l’IA pour des tĂąches administratives, pĂ©dagogiques ou de recherche scientifique. Les premiers retours sont dithyrambiques : gain de temps, rĂ©duction des tĂąches rĂ©pĂ©titives et mĂȘme des fonctions avancĂ©es de traduction pour les services publics. Tout cela arrive pile au moment oĂč DeepSeek est sous le feu des critiques pour ses pratiques de collecte de donnĂ©es, notamment depuis la Chine. đŸ•”ïž

NĂ©anmoins, je trouverais cela absolument fou que d’autres gouvernements que celui des États-Unis fassent appel Ă  GovGPT ! Cela reviendrait Ă  confier des informations souveraines Ă  une entreprise amĂ©ricaine soumise au CloudAct et au Patriot Act. E’est encore plus dangereux maintenant que nous connaissons la versatilitĂ© et l’imprĂ©visibilitĂ© du prĂ©sident amĂ©ricain. ⚠

🚹 Meta prĂ©pare son offensive contre DeepSeek

Meta a crĂ©Ă© quatre « war rooms » pour analyser le modĂšle R1 de DeepSeek. Cette startup chinoise surpasse ChatGPT tout en rĂ©duisant radicalement les coĂ»ts, ce qui affole les gĂ©ants de l’IA. Leur chatbot est mĂȘme devenu l’application la plus tĂ©lĂ©chargĂ©e de l’App Store, renversant toutes les certitudes du marchĂ©. đŸ€š

L’impact est colossal : l’indice Nasdaq a chutĂ© de 3,6 % et Nvidia a vu sa valorisation plonger de 17 %. Les analystes Ă©voquent dĂ©jĂ  un « sĂ©isme » dans le secteur, oĂč l’arrivĂ©e d’une IA plus rapide et moins coĂ»teuse rebat complĂštement les cartes. 📉 

Chez Meta, les Ă©quipes se sont organisĂ©es en mode « commando » pour comprendre la recette secrĂšte de DeepSeek. Dans le but de renforcer leur futur Llama 4 en s’inspirant de cette percĂ©e technologique, tout en maintenant leur place parmi les leaders de l’IA. 🔝

⚠ L’IA qui fournit (trop) facilement du contenu dangereux

Le nouveau modĂšle DeepSeek R1 fait beaucoup de bruit, mais derriĂšre les belles promesses, KELA rĂ©vĂšle un gros problĂšme de sĂ©curitĂ© : il est extrĂȘmement facile de contourner les garde-fous de DeepSeek R1 et d’en obtenir des contenus dangereux (malware, conseils pour fabriquer des explosifs
). 💣

Les experts de KELA ont menĂ© des tests en “jailbreakant” le modĂšle avec des techniques vieilles de deux ans (dĂ©jĂ  protĂ©gĂ© chez ChatGPT). DeepSeek R1 fournit, sans broncher, du code malveillant pour voler des mots de passe ou encore des Ă©tapes pour crĂ©er un drone suicidaire
 😈

đŸ•č Operator : l’agent navigateur d’OpenAI

OpenAI vient a dĂ©voilĂ© Operator, un agent capable d’utiliser son propre navigateur pour accomplir des tĂąches Ă  votre place. Disponible uniquement pour les utilisateurs Pro aux États-Unis, cet outil permet d’interagir avec des sites web (cliquer, faire dĂ©filer, saisir du texte) comme le ferait un humain. De la commande de vos courses en ligne Ă  la crĂ©ation de memes, il promet de nous faire gagner un temps prĂ©cieux dans nos tĂąches quotidiennes. ⏰

Sous le capot, Operator s’appuie sur un nouveau modĂšle baptisĂ© CUA (Computer-Using Agent). En combinant les capacitĂ©s visuelles de GPT-4o et un raisonnement de pointe, CUA peut « voir » des captures d’écran et « agir » sur le web en temps rĂ©el.

Pour l’instant, Operator n’est qu’en « research preview » mais OpenAI voit dĂ©jĂ  plus grand : ils comptent ouvrir ces fonctionnalitĂ©s Ă  davantage d’utilisateurs (Plus, Team, Enterprise) et intĂ©grer ces avancĂ©es dans ChatGPT. Avec la collaboration de plateformes comme Instacart, DoorDash ou encore la ville de Stockton, la volontĂ© est claire : simplifier la vie des utilisateurs et libĂ©rer l’IA de sa passivitĂ© pour lui donner un rĂŽle actif. 🌐

Outils

Suivi IA sur Bluesky

Ces derniĂšres semaines, j'ai lĂąchĂ© l’affaire et j’ai dĂ©cidĂ© de ne plus utiliser X qui a irrĂ©vocablement perdu l’ñme qu’avait Twitter. Je ne ferme par mon compte et continuerai Ă  dupliquer mes posts principaux dessus ainsi que de rĂ©pondre aux mentions, mais je serai beaucoup moins prĂ©sent dessus.

Bluesky a pris dans mon utilisation la place de Twitter et j’ai dĂ©couvert que l’on pouvait faire ses propres flux personnalisĂ©s. J’ai donc crĂ©Ă© des flux dĂ©diĂ© Ă  l’IA que vous pouvez librement suivre :

J’ai aussi fait la mĂȘme chose, mais en anglais :

Conversation

N'hésitez pas à répondre à cette newsletter pour partager vos idées, informations ou simplement pour engager une conversation avec moi.

J'apprécie toujours vos messages.