René Cotton
Posts
👨‍💻 IA : Ouvrage non exhaustif

👨‍💻 IA : Ouvrage non exhaustif

René COTTON
30th janvier 2025

DeepSeek a décidément mis un sacré bazar dans le monde de l’IA générative, a commencé par les questions de censure que certains ont pu voir dans les données du modèle. Ce point-là est un faux problème à mes yeux et c’est le thème de ma réflexion de la semaine.

Mais avant, le sommaire :

Les LLMs ne sont pas des sources d’informations

Actualités
🔊 La levée de fonds qui fait vibrer la tech vocale
🏛️ OpenAI officialise ChatGPT Gov
🚨 Meta prépare son offensive contre DeepSeek
⚠️ L’IA qui fournit (trop) facilement du contenu dangereux
🕹️ Operator : l’agent navigateur d’OpenAI

Outils
- Suivi IA sur Bluesky

Les LLMs ne sont pas des sources d’informations

Je trouve complètement insensé de voir des personnes tester les LLMs en leur demandant directement des informations. Pourquoi croyez-vous que ChatGPT, Le Chat (de Mistral) ou Claude (d’Anthropic) cherchent à se connecter à internet ? Parce que leurs modèles en eux-mêmes ne sont pas des sources fiables ! Ils ont besoin d’accéder à des données externes pour donner l’illusion du savoir. En réalité, ils disposent uniquement de (très, très, très) nombreux bouts de textes appris lors de leur entraînement.

Le problème, c’est que ce contenu d’entraînement est forcément partiel et peut même être volontairement biaisé (coucou DeepSeek). Un LLM ne fait que prédire statistiquement quel mot vient après l’autre en se basant sur tout ce qu’il a « lu » avant (et qu’il ne comprend pas vraiment). Un LLM est un générateur de texte. Son rôle est de comprendre les structures linguistiques, de résumer des idées, de reformuler ou de produire du contenu cohérent à partir de ce qu’il a déjà vu.

Ce n’est pas une encyclopédie : son but premier n’est pas de stocker et de restituer fidèlement des informations vérifiées, mais bien de créer du texte plausible et fluide.

Actualités

🔊 La levée de fonds qui fait vibrer la tech vocale

ElevenLabs, la startup spécialisée dans la génération et la manipulation de voix par IA, vient d’annoncer un tour de financement de 250 millions de dollars ! Cette Série C valorise l’entreprise de 3 à 3,3 milliards de dollars, triplant ainsi sa valorisation en seulement un an. 💰

Malgré quelques controverses sur l’usage malveillant de ses technologies, ElevenLabs a renforcé ses garde-fous (détection d’audio générée, outils de sécurité) et affiche aujourd’hui une croissance insolente. Avec un ARR proche de 90 millions de dollars et un écosystème IA toujours plus friand de fonctionnalités vocales, ElevenLabs semble bien décidée à prendre la première place du marché, face à des poids lourds comme Google ou OpenAI.⚡

🏛️ OpenAI officialise ChatGPT Gov

OpenAI a dévoilé ChatGPT Gov, une version de son célèbre chatbot destinée aux agences gouvernementales américaines. L’argument-clé ? Offrir la même puissance de ChatGPT, mais adaptée aux exigences de sécurité les plus strictes (IL5, CJIS, ITAR, etc.). En gros, OpenAI veut s’imposer comme le choix « safe et made in USA » en réponse aux inquiétudes soulevées par les modèles étrangers comme DeepSeek. 😰

Les exemples d’usage ne manquent pas : l’Air Force Research Lab ou encore Los Alamos National Lab exploitent déjà l’IA pour des tâches administratives, pédagogiques ou de recherche scientifique. Les premiers retours sont dithyrambiques : gain de temps, réduction des tâches répétitives et même des fonctions avancées de traduction pour les services publics. Tout cela arrive pile au moment où DeepSeek est sous le feu des critiques pour ses pratiques de collecte de données, notamment depuis la Chine. 🕵️

Néanmoins, je trouverais cela absolument fou que d’autres gouvernements que celui des États-Unis fassent appel à GovGPT ! Cela reviendrait à confier des informations souveraines à une entreprise américaine soumise au CloudAct et au Patriot Act. E’est encore plus dangereux maintenant que nous connaissons la versatilité et l’imprévisibilité du président américain. ⚠️

🚨 Meta prépare son offensive contre DeepSeek

Meta a créé quatre « war rooms » pour analyser le modèle R1 de DeepSeek. Cette startup chinoise surpasse ChatGPT tout en réduisant radicalement les coûts, ce qui affole les géants de l’IA. Leur chatbot est même devenu l’application la plus téléchargée de l’App Store, renversant toutes les certitudes du marché. 🤨

L’impact est colossal : l’indice Nasdaq a chuté de 3,6 % et Nvidia a vu sa valorisation plonger de 17 %. Les analystes évoquent déjà un « séisme » dans le secteur, où l’arrivée d’une IA plus rapide et moins coûteuse rebat complètement les cartes. 📉

Chez Meta, les équipes se sont organisées en mode « commando » pour comprendre la recette secrète de DeepSeek. Dans le but de renforcer leur futur Llama 4 en s’inspirant de cette percée technologique, tout en maintenant leur place parmi les leaders de l’IA. 🔝

⚠️ L’IA qui fournit (trop) facilement du contenu dangereux

Le nouveau modèle DeepSeek R1 fait beaucoup de bruit, mais derrière les belles promesses, KELA révèle un gros problème de sécurité : il est extrêmement facile de contourner les garde-fous de DeepSeek R1 et d’en obtenir des contenus dangereux (malware, conseils pour fabriquer des explosifs…). 💣

Les experts de KELA ont mené des tests en “jailbreakant” le modèle avec des techniques vieilles de deux ans (déjà protégé chez ChatGPT). DeepSeek R1 fournit, sans broncher, du code malveillant pour voler des mots de passe ou encore des étapes pour créer un drone suicidaire… 😈

🕹️ Operator : l’agent navigateur d’OpenAI

OpenAI vient a dévoilé Operator, un agent capable d’utiliser son propre navigateur pour accomplir des tâches à votre place. Disponible uniquement pour les utilisateurs Pro aux États-Unis, cet outil permet d’interagir avec des sites web (cliquer, faire défiler, saisir du texte) comme le ferait un humain. De la commande de vos courses en ligne à la création de memes, il promet de nous faire gagner un temps précieux dans nos tâches quotidiennes. ⏰

Sous le capot, Operator s’appuie sur un nouveau modèle baptisé CUA (Computer-Using Agent). En combinant les capacités visuelles de GPT-4o et un raisonnement de pointe, CUA peut « voir » des captures d’écran et « agir » sur le web en temps réel.

Pour l’instant, Operator n’est qu’en « research preview » mais OpenAI voit déjà plus grand : ils comptent ouvrir ces fonctionnalités à davantage d’utilisateurs (Plus, Team, Enterprise) et intégrer ces avancées dans ChatGPT. Avec la collaboration de plateformes comme Instacart, DoorDash ou encore la ville de Stockton, la volonté est claire : simplifier la vie des utilisateurs et libérer l’IA de sa passivité pour lui donner un rôle actif. 🌐

Outils

Suivi IA sur Bluesky

Ces dernières semaines, j'ai lâché l’affaire et j’ai décidé de ne plus utiliser X qui a irrévocablement perdu l’âme qu’avait Twitter. Je ne ferme par mon compte et continuerai à dupliquer mes posts principaux dessus ainsi que de répondre aux mentions, mais je serai beaucoup moins présent dessus.

Bluesky a pris dans mon utilisation la place de Twitter et j’ai découvert que l’on pouvait faire ses propres flux personnalisés. J’ai donc créé des flux dédié à l’IA que vous pouvez librement suivre :

Post au tour de l’IA en temps réel
https://bsky.app/profile/rene-cotton.fr/feed/aaabt6eij2ciy
Top des post au tour de l’IA sur les 24 dernières heures :
https://bsky.app/profile/rene-cotton.fr/feed/aaakllhof33ns
Top des post au tour de l’IA sur les 3 derniers jours :
https://bsky.app/profile/rene-cotton.fr/feed/aaaklqfmykqyo

J’ai aussi fait la même chose, mais en anglais :

Post au tour de l’IA en temps réel
https://bsky.app/profile/rene-cotton.fr/feed/aaaklquvmggzs
Top des post au tour de l’IA sur les 24 dernières heures :
https://bsky.app/profile/rene-cotton.fr/feed/aaaklq3xwe2ri
Top des post au tour de l’IA sur les 3 derniers jours :
https://bsky.app/profile/rene-cotton.fr/feed/aaall5nqjq7gg

Conversation

N'hésitez pas à répondre à cette newsletter pour partager vos idées, informations ou simplement pour engager une conversation avec moi.

J'apprécie toujours vos messages.