Agence digitale Lille | UX, web, mobile, data, IA, XR, music tech

L'actu IA de la semaine du 3 au 9 mars

Alibaba lance son modèle QwQ-32B

  • Modèle open-weight de 32B de paramètres qui rivalise avec DeepSeek-R1 (671B).
  • Amélioration continue grâce au Reinforcement Learning (RL), avec une progression notable en maths et coding.
  • Stratégie de RL avancée : récompenses basées sur la vérification des résultats en mathématiques et l’exécution correcte du code.
  • Capacités d’agent intégrées : permet un raisonnement adaptatif et l’utilisation d’outils intelligents.
  • Disponible en open-source sous licence Apache 2.0 sur Hugging Face, ModelScope et Qwen Chat.

Anthropic propose un plan d’action IA pour les États-Unis

  • Anthropic recommande une stratégie proactive face aux systèmes d’IA avancés attendus dès 2026-2027.
  • Les 6 axes clés :
    • Sécurité nationale : développer des capacités pour tester et évaluer les IA, locales et étrangères, sur leurs implications sécuritaires.
    • Contrôle des exportations : renforcer les restrictions sur les semi-conducteurs (ex : puces H20) pour sécuriser l’accès aux infrastructures IA.
    • Sécurisation des laboratoires IA : mise en place de communications classifiées et de normes de sécurité avancées.
    • Énergie et infrastructures : objectif de 50 GW supplémentaires dédiés à l’IA d’ici 2027, avec simplification des processus de permis.
    • Adoption de l’IA par le gouvernement : identifier les tâches automatisables et accélérer l’intégration de l’IA dans l’administration.
    • Impact économique : adapter les outils statistiques et anticiper les transformations du marché du travail.

Anthropic collabore avec les laboratoires nationaux américains pour accélérer la recherche scientifique grâce à l’IA

  • Le 1,000 Scientist AI Jam, organisé par le Département de l’Énergie des États-Unis (DOE), réunit des chercheurs pour évaluer l’impact de l’IA sur la recherche et la sécurité nationale.
  • L’évaluation de Claude 3.7 Sonnet, premier modèle à raisonnement hybride, permettra d’analyser ses performances sur des tâches complexes.
  • Anthropic travaille déjà avec la National Nuclear Security Administration (NNSA) pour tester l’IA dans des environnements classifiés.

Google Search passe en mode IA avec “AI Mode” !

  • Google dévoile une nouvelle façon d’explorer l’information avec une IA plus interactive et un moteur de recherche qui comprend les requêtes complexes.
  • Cette innovation s’inscrit dans la course à l’IA générative, face à Perplexity AI & ChatGPT Search.
  • L’optimisation continue intégrera bientôt plus de multimédia et des liens contextuels automatiques.

Google booste Colab avec un agent IA !

  • Data Science Agent intégré à Google Colab pour nettoyer, analyser et visualiser des données plus facilement.
  • Utilise Gemini 2.0 et des outils de raisonnement pour améliorer l’ingénierie des données.
  • Gère les fichiers CSV, JSON et .txt jusqu’à 1 Go et analyse 120K tokens par requête.

Google dévoile SpeciesNet, un modèle IA pour l’identification de la faune

  • SpeciesNet analyse les images de pièges photographiques pour identifier +2000 espèces et objets.
  • Entraîné sur 65 millions d’images, issues d’institutions comme le Smithsonian et la Zoological Society of London.
  • Intégré à Wildlife Insights, plateforme Google pour l’analyse collaborative des données sur la biodiversité.

Google améliore Gemini avec la recherche vidéo et l’analyse d’écran en temps réel

  • Screenshare : interagissez avec Gemini en partageant votre écran mobile.
  • Recherche vidéo : posez des questions sur une vidéo en la filmant.
  • Démo au MWC 2025, avec un exemple d’achat de vêtements.
  • Une IA plus interactive, utile pour le shopping, l’assistance technique et bien plus !

HunyuanVideo-I2V : Tencent pousse l’open-source plus loin avec un modèle Image-to-Video avancé

  • Tencent publie HunyuanVideo-I2V, un modèle capable de générer des vidéos haute qualité à partir d’images.
  • Intègre texte + image pour une compréhension sémantique plus fine.
  • Génération vidéo jusqu’à 720p et 5 secondes avec une architecture optimisée.

Hunyuan I2V maintenant compatible ComfyUI dès le lancement !

  • La génération vidéo open-source franchit une nouvelle étape avec Hunyuan I2V (13B), désormais nativement pris en charge dans ComfyUI
  • Qualité vidéo incroyable avec un modèle 13B bien optimisé.
  • Personnalisation avancée avec LoRA training pour des effets uniques.

Microsoft Dragon Copilot : l’IA qui révolutionne la médecine

  • Automatisation des tâches administratives pour que les soignants passent plus de temps avec les patients.
  • Gain de 5 minutes par consultation, réduisant la charge administrative.
  • Lancement en mai aux États-Unis et au Canada, expansion mondiale prévue.

Mistral OCR : la nouvelle référence en reconnaissance et compréhension de documents

  • Compréhension avancée des documents complexes : tableaux, images, équations, formats LaTeX.
  • Multilingue : supporte des milliers de scripts et de langues à travers le monde.
  • Vitesse inégalée : traite jusqu’à 2000 pages/minute sur un seul nœud.
  • Sortie structurée (JSON, Markdown, etc.) pour une intégration facile dans des workflows IA.
  • Option d’auto-hébergement pour les entreprises gérant des données sensibles.

NVIDIA dévoile GEN3C : l’avenir de la génération vidéo par IA

  • Une stabilité inédite : intègre un cache 3D en point cloud pour des vidéos plus nettes et cohérentes.
  • Un contrôle précis de la caméra : permet des trajectoires personnalisées pour un rendu ultra-réaliste.
  • Une synthèse de vues avancée : capable de générer des perspectives inédites à partir d’angles limités.
  • Édition en temps réel : manipulation directe des scènes via la modification du nuage de points.
  • Adaptation aux environnements dynamiques : remplit intelligemment les zones manquantes.

OpenAI lance NextGenAI : un consortium pour accélérer la recherche et l’éducation avec l’IA

  • 15 institutions partenaires aux États-Unis et en Europe.
  • 50M$ de financement, accès API et puissance de calcul pour chercheurs et étudiants.
  • Domaines clés : santé, sciences, éducation, numérisation des bibliothèques.
  • Objectif : accélérer les découvertes et préparer la prochaine génération à l’IA.

OpenAI : Priorité à la sécurité et à l’alignement de l’IA

  • Approche itérative : observer les usages réels pour mieux anticiper les risques.
  • Stratégie de défense en profondeur : empiler les protections pour minimiser les défaillances.
  • IA sous contrôle humain : garantir une supervision efficace et alignée sur les valeurs démocratiques.
  • Effort collectif : sécurité et alignement nécessitent collaboration entre industrie, recherche et gouvernements.

Opera dévoile Browser Operator : le premier agent IA intégré à un navigateur

  • Un assistant IA avancé : automatise les tâches directement dans le navigateur.
  • Analyse en direct : utilise les données du DOM pour une exécution ultra-rapide.
  • Innovation continue : Opera a été pionnier sur les onglets, le blocage des popups et la navigation privée.
  • Un marché en pleine ébullition : Perplexity et Arc préparent aussi leurs navigateurs IA.

Perplexity Voice Mode arrive sur macOS

  • Recherche vocale : interagissez avec l’IA sans clavier.
  • Expérience fluide : alternez entre texte et voix.
  • Gagnez du temps : accédez plus vite aux informations.
  • Productivité optimisée : restez concentré sans interrompre votre flux de travail.

McDonald’s intègre l’IA et l’edge computing pour moderniser ses restaurants.

  • IA au drive-through : commandes vocales pour plus de rapidité et précision.
  • Maintenance prédictive : détection des pannes avant qu’elles ne surviennent grâce aux capteurs connectés.
  • Edge computing : analyse en temps réel des performances des restaurants.
  • Générative AI pour managers : automatisation des plannings et gestion optimisée des opérations.
  • Personnalisation des offres clients : promotions adaptées via l’analyse des habitudes d’achat et des conditions météo.

Nova-3 Medical : la transcription médicale la plus avancée

  • Une précision inégalée : amélioration de 63,7% du taux d’erreur sur les mots (WER).
  • Reconnaissance spécialisée : capture précise des termes médicaux complexes.
  • Personnalisation sur mesure : ajouter jusqu’à 100 termes spécifiques.
  • Conformité HIPAA : sécurité renforcée pour la gestion des données de santé.
  • Intégration avec les systèmes EHR : facilite la documentation médicale en temps réel.

 

Related Post