- ReneÌ Cotton
- Posts
- đšâđ» IA : Guess who's back ?
đšâđ» IA : Guess who's back ?
Actualités
đ GPT-5 est là ⊠mais lâatterrissage secoue
đ€ OpenAI redevient (un peu) Open
âĄïž Claude Opus 4.1 booste le code (et le raisonnement)
đź Genie 3 transforme les prompts en mondes
đ§© LangExtract : texte â data
đ” La gĂ©nĂ©ration de musique arrive chez ElevenLabs
Actualités
đ GPT-5 est là ⊠mais lâatterrissage secoue
OpenAI a officialisĂ© GPT-5, prĂ©sentĂ© comme un « systĂšme unifiĂ© » : un routeur en temps rĂ©el choisit entre une rĂ©ponse rapide ou un mode âthinkingâ plus profond, et une version GPT-5 pro est dispo pour un raisonnement Ă©tendu.).
CĂŽtĂ© promesses, OpenAI annonce de gros gains en code, Ă©criture, santĂ© et multimodal, avec des scores SOTA et moins dâhallucinations, ainsi quâun comportement dĂ©crit comme plus « honnĂȘte ».
Mais le dĂ©ploiement a Ă©té⊠chahutĂ©. Sam Altman a reconnu lors dâun AMA Reddit que le routeur nâa pas correctement fonctionnĂ© au lancement, donnant lâimpression dâun GPT-5 « plus bĂȘte » que 4o. Des correctifs et plus de transparence sont promis, ainsi quâun doublement des limites pour les abonnĂ©s Plus.

Sam Altman sur le AMA Reddit
Face aux retours, OpenAI Ă©tudie aussi le retour de GPT-4o pour les abonnĂ©s Plus. Et lâĂ©quipe a dĂ» sâexcuser pour la fameuse âchart crimeâ (un graphique trompeur pendant la keynote). Une « mĂ©ga boulette » assumĂ©e par Sam Altam sur X.

Le graphique trompeur durant la keynote.
Dans la communautĂ©, certains influents parlent dâun dĂ©calage entre la preview et la version public. Defend Intelligence (Anis Ayari) explique que sa vidĂ©o a Ă©tĂ© tournĂ©e avec un accĂšs anticipĂ© bien plus impressionnant, et explique que la version actuelle ressemble Ă une mouture âlow-costâ pour encaisser la charge â ce qui nâaurait rien Ă voir avec ce quâil a testĂ©.

Tweet de Defend Intelligence
Pour lâinstant, la magie annoncĂ©e ressemble surtout Ă un tour de passe-passe : GPT-5, câest au mieux un 4.5 avec un routeur capricieux, un âmode thinkingâ parfois poussif.
La hype a dĂ©passĂ© le produit (encore), le retour de 4o en dit longâŠ
đ€ OpenAI redevient (un peu) Open
Juste avant GPT-5, OpenAI a publiĂ© gpt-oss-120b et gpt-oss-20b, deux modĂšles de raisonnement open-weight. PensĂ©s pour les workflows agentiques (outil web, exĂ©cution Python), ils exposent la chaĂźne de pensĂ©e, gĂšrent les sorties structurĂ©es et sâintĂšgrent aussi Ă lâAPI Responses. CĂŽtĂ© perfs : le 120B se rapproche dâo4-mini et surpasse mĂȘme des modĂšles propriĂ©taires sur certains benchmarks (AIME, HealthBench). Le 20B tape au niveau dâo3-mini⊠en beaucoup plus compact.

OpenAI annonce aussi un focus sécurité et des déploiements avec AI Sweden, Orange, Snowflake. De plus, les poids ont été publiés sur Hugging Face.
âĄïž Claude Opus 4.1 booste le code (et le raisonnement)
Anthropic sort Claude Opus 4.1, une mise Ă niveau dâOpus 4 qui pousse lâaiguille sur les tĂąches dâagent, le coding ârĂ©elâ et le raisonnement. Au menu : 74,5 % sur SWE-bench Verified et de meilleurs rĂ©sultats en recherche/analyse de donnĂ©es avec suivi de dĂ©tails et recherche agentive. Disponible dĂšs maintenant pour les abonnĂ©s Claude (et dans Claude Code), aussi via lâAPI.

CĂŽtĂ© terrain, GitHub souligne des gains âpartoutâ, avec un gros plus en refactor multi-fichiers. Rakuten Group apprĂ©cie sa prĂ©cision pour corriger sans casser le reste du code, et Windsurf parle dâune amĂ©lioration dâun Ă©cart-type sur son benchmark âjunior devâ (Ă©quivalente au saut Sonnet 3.7 â Sonnet 4).
Anthropic tease de « larges amĂ©liorations » Ă venir dans les prochaines semainesâŠ
đź Genie 3 transforme les prompts en mondes
DeepMind dĂ©voile Genie 3, un world model gĂ©nĂ©raliste qui gĂ©nĂšre des environnements interactifs Ă partir dâun simple prompt⊠et tu peux tây dĂ©placer en temps rĂ©el Ă 24 fps en 720p. Des mondes dynamiques, cohĂ©rents pendant plusieurs minutes, directement sortis dâune description texte.

CĂŽtĂ© capacitĂ©s, Genie 3 montre des physiques crĂ©dibles (eau, lumiĂšre, terrains accidentĂ©s), des Ă©cosystĂšmes naturels (faune, flore, mĂ©tĂ©o) et des univers stylisĂ©s/animĂ©s dignes dâun film dâanimation.
Reste que tout nâest pas magique : actions encore limitĂ©es, texte peu lisible sans description dĂ©diĂ©e, sessions interactives de quelques minutes, et pas de gĂ©ographie rĂ©elle parfaitement fidĂšle. Le modĂšle sort en accĂšs restreint Ă un petit groupe dâacadĂ©miques et de crĂ©ateurs avant une ouverture plus large.
đ§© LangExtract : texte â data
Google vient de lancer LangExtract, une librairie open source pour extraire des donnĂ©es structurĂ©es Ă partir de texte libre avec des LLM comme Gemini. LâidĂ©e : tu dĂ©cris ce que tu veux avoir (avec quelques exemples), et lâoutil te renvoie un JSON bien formĂ© avec ancrage prĂ©cis dans la source (offsets + surlignage) pour chaque entitĂ©. Parfait pour des usages sensibles comme des comptes-rendus mĂ©dicaux, contrats juridiques ou feedbacks clients.

Sous le capot, LangExtract combine controlled generation (pour respecter le schĂ©ma), chunking, traitement parallĂšle et passes multiples pour tenir la charge sur de gros documents. Tu peux lâintĂ©grer Ă des modĂšles cloud (Gemini) ou Ă des modĂšles locaux via Ollama.
đ Le Mistral souffle au mĂȘme en Ă©tĂ©
Mistral AI vient de dĂ©voiler Mistral Medium 3.1, une mise Ă jour de son modĂšle multimodal âfrontierâ avec un boost global de perfs, un ton plus naturel dans les rĂ©ponses, et surtout des recherches web plus intelligentes. Disponible dĂšs maintenant dans Le Chat (câest le modĂšle par dĂ©faut) et via lâAPI

Sous le capot, Medium 3.1 garde lâADN de Medium 3 lancĂ© le 7 mai (dĂ©ploiements simplifiĂ©s, coĂ»t maĂźtrisĂ©), mais peaufine lâexpĂ©rience et la fiabilitĂ© des rĂ©ponses â notamment grĂące aux connecteurs de web search. Le modĂšle est rĂ©fĂ©rencĂ© comme mistral-medium-2508 avec un contexte jusquâĂ 128k tokens, de quoi avaler de gros dossiers sans sourciller.
đ” La gĂ©nĂ©ration de musique arrive chez ElevenLabs
ElevenLabs lance Eleven Music, son gĂ©nĂ©rateur de morceaux âstudio-gradeâ Ă partir de simples prompts. Tu peux contrĂŽler le genre, style et la structure, choisir avec voix ou instrumental, et mĂȘme Ă©diter les paroles ou le son par section (intro, couplets, refrain). Le modĂšle est multilingue (anglais, espagnol, français, japonais, etc.) et vise les crĂ©ateurs comme les boĂźtes mĂ©dia, la pub, le jeu vidĂ©o.

CĂŽtĂ© usage, la plupart des exploitations commerciales sont couvertes (films, TV, podcasts, rĂ©seaux sociaux, pub, gaming), avec des limites selon lâabonnement. Le service est disponible dĂšs aujourdâhui sur le web. Techniquement, Eleven parle dâun moteur propriĂ©taire entraĂźnĂ© sur des stems pour un rendu en 44,1 kHz, et Ă©voque un tarif Ă partir de 0,50 $ / minute sur plans Business.
Conversation
Vous avez des idées à partager, des suggestions à proposer, des informations à échanger, ou vous souhaitez tout simplement discuter avec moi�
Alors n'hĂ©sitez pas Ă rĂ©pondre Ă cette newsletterâŻ!