L'actu IA de la semaine du 3 au 9 mars
Alibaba lance son modèle QwQ-32B
- Modèle open-weight de 32B de paramètres qui rivalise avec DeepSeek-R1 (671B).
- Amélioration continue grâce au Reinforcement Learning (RL), avec une progression notable en maths et coding.
- Stratégie de RL avancée : récompenses basées sur la vérification des résultats en mathématiques et l’exécution correcte du code.
- Capacités d’agent intégrées : permet un raisonnement adaptatif et l’utilisation d’outils intelligents.
- Disponible en open-source sous licence Apache 2.0 sur Hugging Face, ModelScope et Qwen Chat.
Anthropic propose un plan d’action IA pour les États-Unis
- Anthropic recommande une stratégie proactive face aux systèmes d’IA avancés attendus dès 2026-2027.
- Les 6 axes clés :
- Sécurité nationale : développer des capacités pour tester et évaluer les IA, locales et étrangères, sur leurs implications sécuritaires.
- Contrôle des exportations : renforcer les restrictions sur les semi-conducteurs (ex : puces H20) pour sécuriser l’accès aux infrastructures IA.
- Sécurisation des laboratoires IA : mise en place de communications classifiées et de normes de sécurité avancées.
- Énergie et infrastructures : objectif de 50 GW supplémentaires dédiés à l’IA d’ici 2027, avec simplification des processus de permis.
- Adoption de l’IA par le gouvernement : identifier les tâches automatisables et accélérer l’intégration de l’IA dans l’administration.
- Impact économique : adapter les outils statistiques et anticiper les transformations du marché du travail.
Anthropic collabore avec les laboratoires nationaux américains pour accélérer la recherche scientifique grâce à l’IA
- Le 1,000 Scientist AI Jam, organisé par le Département de l’Énergie des États-Unis (DOE), réunit des chercheurs pour évaluer l’impact de l’IA sur la recherche et la sécurité nationale.
- L’évaluation de Claude 3.7 Sonnet, premier modèle à raisonnement hybride, permettra d’analyser ses performances sur des tâches complexes.
- Anthropic travaille déjà avec la National Nuclear Security Administration (NNSA) pour tester l’IA dans des environnements classifiés.
Google Search passe en mode IA avec “AI Mode” !
- Google dévoile une nouvelle façon d’explorer l’information avec une IA plus interactive et un moteur de recherche qui comprend les requêtes complexes.
- Cette innovation s’inscrit dans la course à l’IA générative, face à Perplexity AI & ChatGPT Search.
- L’optimisation continue intégrera bientôt plus de multimédia et des liens contextuels automatiques.
Google booste Colab avec un agent IA !
- Data Science Agent intégré à Google Colab pour nettoyer, analyser et visualiser des données plus facilement.
- Utilise Gemini 2.0 et des outils de raisonnement pour améliorer l’ingénierie des données.
- Gère les fichiers CSV, JSON et .txt jusqu’à 1 Go et analyse 120K tokens par requête.
Google dévoile SpeciesNet, un modèle IA pour l’identification de la faune
- SpeciesNet analyse les images de pièges photographiques pour identifier +2000 espèces et objets.
- Entraîné sur 65 millions d’images, issues d’institutions comme le Smithsonian et la Zoological Society of London.
- Intégré à Wildlife Insights, plateforme Google pour l’analyse collaborative des données sur la biodiversité.
Google améliore Gemini avec la recherche vidéo et l’analyse d’écran en temps réel
- Screenshare : interagissez avec Gemini en partageant votre écran mobile.
- Recherche vidéo : posez des questions sur une vidéo en la filmant.
- Démo au MWC 2025, avec un exemple d’achat de vêtements.
- Une IA plus interactive, utile pour le shopping, l’assistance technique et bien plus !
HunyuanVideo-I2V : Tencent pousse l’open-source plus loin avec un modèle Image-to-Video avancé
- Tencent publie HunyuanVideo-I2V, un modèle capable de générer des vidéos haute qualité à partir d’images.
- Intègre texte + image pour une compréhension sémantique plus fine.
- Génération vidéo jusqu’à 720p et 5 secondes avec une architecture optimisée.
Hunyuan I2V maintenant compatible ComfyUI dès le lancement !
- La génération vidéo open-source franchit une nouvelle étape avec Hunyuan I2V (13B), désormais nativement pris en charge dans ComfyUI
- Qualité vidéo incroyable avec un modèle 13B bien optimisé.
- Personnalisation avancée avec LoRA training pour des effets uniques.
Microsoft Dragon Copilot : l’IA qui révolutionne la médecine
- Automatisation des tâches administratives pour que les soignants passent plus de temps avec les patients.
- Gain de 5 minutes par consultation, réduisant la charge administrative.
- Lancement en mai aux États-Unis et au Canada, expansion mondiale prévue.
Mistral OCR : la nouvelle référence en reconnaissance et compréhension de documents
- Compréhension avancée des documents complexes : tableaux, images, équations, formats LaTeX.
- Multilingue : supporte des milliers de scripts et de langues à travers le monde.
- Vitesse inégalée : traite jusqu’à 2000 pages/minute sur un seul nœud.
- Sortie structurée (JSON, Markdown, etc.) pour une intégration facile dans des workflows IA.
- Option d’auto-hébergement pour les entreprises gérant des données sensibles.
NVIDIA dévoile GEN3C : l’avenir de la génération vidéo par IA
- Une stabilité inédite : intègre un cache 3D en point cloud pour des vidéos plus nettes et cohérentes.
- Un contrôle précis de la caméra : permet des trajectoires personnalisées pour un rendu ultra-réaliste.
- Une synthèse de vues avancée : capable de générer des perspectives inédites à partir d’angles limités.
- Édition en temps réel : manipulation directe des scènes via la modification du nuage de points.
- Adaptation aux environnements dynamiques : remplit intelligemment les zones manquantes.
OpenAI lance NextGenAI : un consortium pour accélérer la recherche et l’éducation avec l’IA
- 15 institutions partenaires aux États-Unis et en Europe.
- 50M$ de financement, accès API et puissance de calcul pour chercheurs et étudiants.
- Domaines clés : santé, sciences, éducation, numérisation des bibliothèques.
- Objectif : accélérer les découvertes et préparer la prochaine génération à l’IA.
OpenAI : Priorité à la sécurité et à l’alignement de l’IA
- Approche itérative : observer les usages réels pour mieux anticiper les risques.
- Stratégie de défense en profondeur : empiler les protections pour minimiser les défaillances.
- IA sous contrôle humain : garantir une supervision efficace et alignée sur les valeurs démocratiques.
- Effort collectif : sécurité et alignement nécessitent collaboration entre industrie, recherche et gouvernements.
Opera dévoile Browser Operator : le premier agent IA intégré à un navigateur
- Un assistant IA avancé : automatise les tâches directement dans le navigateur.
- Analyse en direct : utilise les données du DOM pour une exécution ultra-rapide.
- Innovation continue : Opera a été pionnier sur les onglets, le blocage des popups et la navigation privée.
- Un marché en pleine ébullition : Perplexity et Arc préparent aussi leurs navigateurs IA.
Perplexity Voice Mode arrive sur macOS
- Recherche vocale : interagissez avec l’IA sans clavier.
- Expérience fluide : alternez entre texte et voix.
- Gagnez du temps : accédez plus vite aux informations.
- Productivité optimisée : restez concentré sans interrompre votre flux de travail.
McDonald’s intègre l’IA et l’edge computing pour moderniser ses restaurants.
- IA au drive-through : commandes vocales pour plus de rapidité et précision.
- Maintenance prédictive : détection des pannes avant qu’elles ne surviennent grâce aux capteurs connectés.
- Edge computing : analyse en temps réel des performances des restaurants.
- Générative AI pour managers : automatisation des plannings et gestion optimisée des opérations.
- Personnalisation des offres clients : promotions adaptées via l’analyse des habitudes d’achat et des conditions météo.
Nova-3 Medical : la transcription médicale la plus avancée
- Une précision inégalée : amélioration de 63,7% du taux d’erreur sur les mots (WER).
- Reconnaissance spécialisée : capture précise des termes médicaux complexes.
- Personnalisation sur mesure : ajouter jusqu’à 100 termes spécifiques.
- Conformité HIPAA : sécurité renforcée pour la gestion des données de santé.
- Intégration avec les systèmes EHR : facilite la documentation médicale en temps réel.