News IA : semaine du 24 février au 02 mars
Anthropic lance Claude 3.7 Sonnet, son IA la plus avancée
- Précision record en programmation surpassant OpenAI (toujours d’actualité avec GPT 4.5?) et DeepSeek.
- Mode de réflexion étendue : ajuste le temps de traitement selon la complexité du problème.
- Claude Code : un outil agentique qui analyse, modifie, teste et publie du code en un clic.
- Accès direct via API, et accessible aussi sur des outils comme Cursor
OpenAI dévoile GPT-4.5
- GPT-4.5, le dernier modèle d’OpenAI, se positionne comme une version améliorée de GPT-4o, avec une meilleure compréhension du langage, une intuition esthétique renforcée et une réduction des hallucinations.
- Il est conçu pour les usages quotidiens et professionnels, excelle en rédaction, en programmation et en résolution de problèmes pratiques.
- Disponible dès maintenant pour ChatGPT Pro et déployé la semaine prochaine pour ChatGPT Plus et Team.
- GPT-5 est déjà en préparation, avec une approche unifiée combinant intelligence générative et modèles de raisonnement comme o1 et o3-mini.
OpenAI déploie une version d’Advanced Voice
- Cette nouvelle version est gratuite pour tous les utilisateurs de ChatGPT
- Une conversation naturelle et fluide, similaire à GPT-4o, mais plus optimisée en coût.
- Les abonnés Plus conservent l’accès à Advanced Voice en GPT-4o avec une limite 5x plus élevée que les gratuits.
- Les abonnés Pro bénéficient d’un accès illimité à Advanced Voice, avec des limites plus élevées pour la vidéo et le partage d’écran.
OpenAI – Deep Research s’étend à tous les abonnés Plus, Team, Edu et Enterprise.
- Améliorations : images intégrées avec citations, meilleure compréhension et utilisation des fichiers uploadés.
- Limites : 10 requêtes / mois pour Plus, Team, Edu et Enterprise, 120 requêtes / mois pour les Pro users.
- OpenAI publie une system card détaillant le fonctionnement et l’évaluation de Deep Research.
- Envie de contribuer aux futurs modèles ? Un formulaire est disponible pour les experts.
OpenAI – Sora est maintenant accessible aux utilisateurs de l’UE
- Sora arrive aussi au Royaume-Uni, en Suisse, en Norvège, au Liechtenstein et en Islande.
- Disponible pour les abonnés ChatGPT Plus et Pro.
- Initialement dévoilé en février 2024, Sora avait été intégré à ChatGPT en décembre, mais restait indisponible en Europe jusqu’à aujourd’hui.
Apple annonce un investissement de 500 milliards de dollars aux États-Unis
- Une usine géante à Houston : 25 000 m² pour assembler des serveurs dédiés à Apple Intelligence, ouverture prévue en 2026.
- 20 000 nouveaux emplois : recrutements massifs en R&D, IA et ingénierie des puces pour renforcer l’expertise américaine.
- Lancement d’une Apple Manufacturing Academy à Detroit : formation gratuite pour les PME sur l’IA et les technologies avancées.
Alibaba annonce un investissement de 50 milliards d’euros dans l’IA et le cloud
- Objectifs stratégiques : renforcer l’infrastructure cloud du groupe, accélérer le développement de l’intelligence artificielle générale (AGI), avec pour ambition de rivaliser avec OpenAI, Google et Meta.
- Une montée en puissance face aux géants américains
- Alibaba s’appuie sur son modèle Qwen2.5-Max, un des plus performants en traitement du langage.
Alibaba – QwQ-Max-Preview : un premier aperçu de l’IA de demain
- Basé sur Qwen2.5-Max, il pousse encore plus loin le raisonnement avancé et les capacités multi-domaines.
- Excellence en mathématiques, code et tâches liées aux agents, pour une performance optimisée.
- Un modèle préliminaire avant la sortie officielle, avec des mises à jour en cours d’amélioration.
- Un écosystème en expansion : sortie prochaine d’une application Qwen Chat et de modèles légers comme QwQ-32B pour un usage local.
Alibaba dévoile Wan2.1, un modèle open-source de génération vidéo qui repousse les limites
- Performances de pointe : le modèle domine le classement VBench grâce à une gestion avancée des mouvements complexes et de la physique réaliste.
- Multifonctions : supporte texte-vidéo, image-vidéo et vidéo-audio, avec la première génération de texte en anglais et en chinois.
- Édition avancée : vidéo inpainting/outpainting, multi-image referencing, et conservation des structures et personnages.
- Accessibilité grand public : une version 1.3B peut tourner sur RTX 4090 (carte graphique), générant une vidéo 480P de 5 secondes en seulement 4 minutes.
Amazon présente Alexa+, un assistant IA nouvelle génération
- Conversations plus naturelles : Comprend les expressions du quotidien et les idées complexes.
- Nouvelle approche “agentique” : Alexa+ navigue sur le web et exécute des tâches de manière autonome.
- Gratuit pour les membres Prime, sinon disponible à 19,99 $/mois.
- Disponible sur Echo, mobile, web et bientôt en voiture !
ElevenLabs lance Scribe : la nouvelle référence en transcription automatique
- 99 langues prises en charge, avec un taux d’erreur record en anglais (96,7%) et italien (98,7%).
- Gestion avancée des conversations : différenciation des locuteurs et détection d’événements audio (rire, silence…).
- Accessibilité renforcée : améliore la transcription des langues sous-représentées comme le serbe ou le cantonais.
- Disponible via API ou tableau de bord ElevenLabs, avec une version temps réel en préparation.
Google lance Gemini Code Assist : l’IA gratuite pour tous les développeurs
- 180 000 complétions de code/mois, soit 90x plus que GitHub Copilot Free.
- Optimisé pour le développement : générer, corriger et expliquer du code avec un simple prompt.
- Intégration fluide dans Visual Studio Code, JetBrains & GitHub.
- Revue de code automatique sur GitHub, avec personnalisation via un guide de style.
- Gratuit et sans carte bancaire, disponible dès aujourd’hui avec un compte Google.
Salesforce et Google Cloud renforcent leur partenariat pour une IA d’entreprise plus puissante
- Agentforce + Gemini : agents plus performants grâce à l’IA multimodale et une mémoire étendue.
- Service client augmenté par l’IA : traduction vocale en temps réel, recommandations personnalisées, analyse des émotions et handoff intelligent entre agents.
- Exploitation des données en direct : intégration de Google Search et Vertex AI pour des réponses basées sur des informations actualisées.
- Interopérabilité accrue : intégrations avancées entre Slack, Google Workspace, BigQuery et Looker, optimisant la collaboration et la gestion des données.
- Infrastructure unifiée : Salesforce Data Cloud et Customer 360 déployés sur Google Cloud pour plus de sécurité et de flexibilité.
Microsoft annonce l’accès gratuit et illimité à Voice & Think Deeper dans Copilot
- Voice : conversation fluide et naturelle pour apprendre une langue, préparer un entretien ou obtenir une aide en temps réel (cuisine, organisation…).
- Think Deeper : modèle avancé pour analyser des décisions complexes (investissements, rénovation, achats stratégiques…).
- Déploiement immédiat pour tous les utilisateurs Copilot, avec possibles interruptions en cas de forte demande.
- Copilot Pro : toujours un accès prioritaire aux modèles les plus récents et aux fonctionnalités expérimentales.
Microsoft présente Phi-4-multimodal et Phi-4-mini, ses nouveaux modèles IA légers et performants
- Phi-4-multimodal traite simultanément texte, audio et images, idéal pour assistants intelligents et applications multimodales.
- Phi-4-mini est optimisé pour le texte, le raisonnement et la programmation.
- Disponibles dès maintenant sur Azure AI Foundry, Hugging Face et NVIDIA API Catalog.
Perplexity dévoile Comet, un navigateur web agentique
- Perplexity prépare le lancement de Comet, un navigateur basé sur l’IA conçu pour effectuer des recherches avancées et exécuter des tâches complexes. Comet se positionne comme un concurrent direct de Chrome, avec une approche plus interactive et autonome de la navigation web.
- Principales fonctionnalités attendues : recherche approfondie automatisée, exécution de tâches en ligne, interface optimisée pour l’interaction avec des IA
- Aucune date de sortie officielle n’a encore été annoncée, mais vous pouvez vous inscrire sur la liste d’attente pour un accès anticipé.
Perplexity introduit un nouveau mode vocal
- Réponses en temps réel aux questions posées à voix haute.
- Disponible dès maintenant sur l’application iOS.
- Déploiement en cours pour Android et Mac.
- Option de retour au mode push-to-talk dans les paramètres.
- Une expérience plus fluide et interactive pour les utilisateurs.
Perplexity annonce Deep Research sur vos fichiers internes
- Connexion directe à Google Drive, OneDrive et SharePoint.
- Accès aux données propriétaires pour des recherches plus pertinentes.
- Réponses citées basées sur vos fichiers d’entreprise et le web.
- Une IA plus intelligente et mieux ancrée dans votre écosystème.
- Disponible uniquement sur Enterprise Pro
X Ads dévoile Grok for Advertisers, une IA pour simplifier la publicité
- Prefill with Grok : crée des annonces en quelques secondes à partir de votre URL.
- Analyze Campaign with Grok : fournit des analyses et recommandations pour améliorer vos campagnes.
- Déploiement progressif pour les annonceurs, avec une priorité aux petites entreprises.
- Complémentarité avec l’intégration X Shopify et la future fonctionnalité Quick Promote.
- Objectif : faciliter et automatiser la publicité sur X grâce à l’IA.
Luma Labs enrichit Dream Machine avec une nouvelle fonctionnalité : Video to Audio
- Génération audio synchronisée pour les vidéos créées avec Dream Machine.
- Mode automatique : un seul clic pour ajouter du son.
- Mode personnalisé : possibilité d’affiner l’audio avec des prompts.
- Accessible gratuitement en bêta pour tous les utilisateurs.