đŸ‘šâ€đŸ’» IA : Guess who's back ?

Actualités
🚀 GPT-5 est là
 mais l’atterrissage secoue
đŸ€ OpenAI redevient (un peu) Open
âšĄïž Claude Opus 4.1 booste le code (et le raisonnement)
🎼 Genie 3 transforme les prompts en mondes
đŸ§© LangExtract : texte ➜ data
đŸŽ” La gĂ©nĂ©ration de musique arrive chez ElevenLabs

Actualités

🚀 GPT-5 est là
 mais l’atterrissage secoue

OpenAI a officialisĂ© GPT-5, prĂ©sentĂ© comme un « systĂšme unifiĂ© » : un routeur en temps rĂ©el choisit entre une rĂ©ponse rapide ou un mode “thinking” plus profond, et une version GPT-5 pro est dispo pour un raisonnement Ă©tendu.).

CĂŽtĂ© promesses, OpenAI annonce de gros gains en code, Ă©criture, santĂ© et multimodal, avec des scores SOTA et moins d’hallucinations, ainsi qu’un comportement dĂ©crit comme plus « honnĂȘte ».

Mais le dĂ©ploiement a Ă©té  chahutĂ©. Sam Altman a reconnu lors d’un AMA Reddit que le routeur n’a pas correctement fonctionnĂ© au lancement, donnant l’impression d’un GPT-5 « plus bĂȘte » que 4o. Des correctifs et plus de transparence sont promis, ainsi qu’un doublement des limites pour les abonnĂ©s Plus.

Sam Altman sur le AMA Reddit

Face aux retours, OpenAI Ă©tudie aussi le retour de GPT-4o pour les abonnĂ©s Plus. Et l’équipe a dĂ» s’excuser pour la fameuse “chart crime” (un graphique trompeur pendant la keynote). Une « mĂ©ga boulette » assumĂ©e par Sam Altam sur X.

Le graphique trompeur durant la keynote.

Dans la communautĂ©, certains influents parlent d’un dĂ©calage entre la preview et la version public. Defend Intelligence (Anis Ayari) explique que sa vidĂ©o a Ă©tĂ© tournĂ©e avec un accĂšs anticipĂ© bien plus impressionnant, et explique que la version actuelle ressemble Ă  une mouture “low-cost” pour encaisser la charge — ce qui n’aurait rien Ă  voir avec ce qu’il a testĂ©.

Pour l’instant, la magie annoncĂ©e ressemble surtout Ă  un tour de passe-passe : GPT-5, c’est au mieux un 4.5 avec un routeur capricieux, un “mode thinking” parfois poussif.
La hype a dépassé le produit (encore), le retour de 4o en dit long


đŸ€ OpenAI redevient (un peu) Open

Juste avant GPT-5, OpenAI a publiĂ© gpt-oss-120b et gpt-oss-20b, deux modĂšles de raisonnement open-weight. PensĂ©s pour les workflows agentiques (outil web, exĂ©cution Python), ils exposent la chaĂźne de pensĂ©e, gĂšrent les sorties structurĂ©es et s’intĂšgrent aussi Ă  l’API Responses. CĂŽtĂ© perfs : le 120B se rapproche d’o4-mini et surpasse mĂȘme des modĂšles propriĂ©taires sur certains benchmarks (AIME, HealthBench). Le 20B tape au niveau d’o3-mini
 en beaucoup plus compact.

OpenAI annonce aussi un focus sécurité et des déploiements avec AI Sweden, Orange, Snowflake. De plus, les poids ont été publiés sur Hugging Face.

âšĄïž Claude Opus 4.1 booste le code (et le raisonnement)

Anthropic sort Claude Opus 4.1, une mise Ă  niveau d’Opus 4 qui pousse l’aiguille sur les tĂąches d’agent, le coding “rĂ©el” et le raisonnement. Au menu : 74,5 % sur SWE-bench Verified et de meilleurs rĂ©sultats en recherche/analyse de donnĂ©es avec suivi de dĂ©tails et recherche agentive. Disponible dĂšs maintenant pour les abonnĂ©s Claude (et dans Claude Code), aussi via l’API.

CĂŽtĂ© terrain, GitHub souligne des gains “partout”, avec un gros plus en refactor multi-fichiers. Rakuten Group apprĂ©cie sa prĂ©cision pour corriger sans casser le reste du code, et Windsurf parle d’une amĂ©lioration d’un Ă©cart-type sur son benchmark “junior dev” (Ă©quivalente au saut Sonnet 3.7 → Sonnet 4).

Anthropic tease de « larges amĂ©liorations » Ă  venir dans les prochaines semaines


🎼 Genie 3 transforme les prompts en mondes

DeepMind dĂ©voile Genie 3, un world model gĂ©nĂ©raliste qui gĂ©nĂšre des environnements interactifs Ă  partir d’un simple prompt
 et tu peux t’y dĂ©placer en temps rĂ©el Ă  24 fps en 720p. Des mondes dynamiques, cohĂ©rents pendant plusieurs minutes, directement sortis d’une description texte.

CĂŽtĂ© capacitĂ©s, Genie 3 montre des physiques crĂ©dibles (eau, lumiĂšre, terrains accidentĂ©s), des Ă©cosystĂšmes naturels (faune, flore, mĂ©tĂ©o) et des univers stylisĂ©s/animĂ©s dignes d’un film d’animation.

Reste que tout n’est pas magique : actions encore limitĂ©es, texte peu lisible sans description dĂ©diĂ©e, sessions interactives de quelques minutes, et pas de gĂ©ographie rĂ©elle parfaitement fidĂšle. Le modĂšle sort en accĂšs restreint Ă  un petit groupe d’acadĂ©miques et de crĂ©ateurs avant une ouverture plus large.

đŸ§© LangExtract : texte ➜ data

Google vient de lancer LangExtract, une librairie open source pour extraire des donnĂ©es structurĂ©es Ă  partir de texte libre avec des LLM comme Gemini. L’idĂ©e : tu dĂ©cris ce que tu veux avoir (avec quelques exemples), et l’outil te renvoie un JSON bien formĂ© avec ancrage prĂ©cis dans la source (offsets + surlignage) pour chaque entitĂ©. Parfait pour des usages sensibles comme des comptes-rendus mĂ©dicaux, contrats juridiques ou feedbacks clients.

Sous le capot, LangExtract combine controlled generation (pour respecter le schĂ©ma), chunking, traitement parallĂšle et passes multiples pour tenir la charge sur de gros documents. Tu peux l’intĂ©grer Ă  des modĂšles cloud (Gemini) ou Ă  des modĂšles locaux via Ollama.

🍃 Le Mistral souffle au mĂȘme en Ă©tĂ©

Mistral AI vient de dĂ©voiler Mistral Medium 3.1, une mise Ă  jour de son modĂšle multimodal “frontier” avec un boost global de perfs, un ton plus naturel dans les rĂ©ponses, et surtout des recherches web plus intelligentes. Disponible dĂšs maintenant dans Le Chat (c’est le modĂšle par dĂ©faut) et via l’API

Sous le capot, Medium 3.1 garde l’ADN de Medium 3 lancĂ© le 7 mai (dĂ©ploiements simplifiĂ©s, coĂ»t maĂźtrisĂ©), mais peaufine l’expĂ©rience et la fiabilitĂ© des rĂ©ponses — notamment grĂące aux connecteurs de web search. Le modĂšle est rĂ©fĂ©rencĂ© comme mistral-medium-2508 avec un contexte jusqu’à 128k tokens, de quoi avaler de gros dossiers sans sourciller.

đŸŽ” La gĂ©nĂ©ration de musique arrive chez ElevenLabs

ElevenLabs lance Eleven Music, son gĂ©nĂ©rateur de morceaux “studio-grade” Ă  partir de simples prompts. Tu peux contrĂŽler le genre, style et la structure, choisir avec voix ou instrumental, et mĂȘme Ă©diter les paroles ou le son par section (intro, couplets, refrain). Le modĂšle est multilingue (anglais, espagnol, français, japonais, etc.) et vise les crĂ©ateurs comme les boĂźtes mĂ©dia, la pub, le jeu vidĂ©o.

CĂŽtĂ© usage, la plupart des exploitations commerciales sont couvertes (films, TV, podcasts, rĂ©seaux sociaux, pub, gaming), avec des limites selon l’abonnement. Le service est disponible dĂšs aujourd’hui sur le web. Techniquement, Eleven parle d’un moteur propriĂ©taire entraĂźnĂ© sur des stems pour un rendu en 44,1 kHz, et Ă©voque un tarif Ă  partir de 0,50 $ / minute sur plans Business.

Conversation

Vous avez des idĂ©es Ă  partager, des suggestions Ă  proposer, des informations Ă  Ă©changer, ou vous souhaitez tout simplement discuter avec moi ?

Alors n'hĂ©sitez pas Ă  rĂ©pondre Ă  cette newsletter !