IA Créative • 10 mai 2026

Google teste un modèle Omni vidéo audio natif avant Google I/O 2026

Google teste un nouveau modèle baptisé Omni qui génère vidéo et audio spatial dans un seul passage, en vue de Google I/O 2026 prévu du 19 au 20 mai à Mountain View (Tom’s Guide).

La promesse n’est pas seulement la qualité visuelle, mais l’alignement intrinsèque entre image et son. Une scène d’orage produit ses propres tonnerres, calés sur la pluie et la lumière. Pour les studios qui assemblent encore vidéo et son sur deux pipelines distincts, ce basculement multimodal rend caduque une partie du sound design d’appoint et déplace le travail en amont, vers la direction de la scène.


Picsart lance un CLI et un serveur MCP pour agents créatifs

Picsart a publié le 28 avril 2026 son GenAI CLI et son serveur MCP, qui exposent plus de 130 modèles d’image, vidéo et audio aux agents IA via une seule interface (Businesswire).

L’intégration native couvre Claude Code, Cursor, Codex, Windsurf, ainsi que des frameworks d’agents autonomes. Un studio peut désormais brancher Flux, Sora, Kling, Veo ou ElevenLabs depuis un même endpoint, sans recoder un connecteur par modèle. La couche programmable de la production créative, sujet exploré dans les formations IA générative de creativeai.fr, passe d’un bricolage maison à un standard outil.


Adobe Firefly synchronise la traduction et le doublage IA avec lip sync

Adobe a généralisé dans Firefly une fonction de traduction et de doublage IA qui préserve la voix d’origine et synchronise les lèvres du locuteur (Adobe).

Le modèle conserve la cadence, le timbre et la couleur acoustique de la voix initiale, puis ajuste le mouvement des lèvres image par image. Pour la production publicitaire et les contenus de marque, c’est la fin du sous-titrage de remplacement et l’arrivée d’un doublage natif, par défaut. Une vidéo n’est plus localisée après coup, elle naît multilingue, ce qui change la chronologie d’une diffusion mondiale.


Claude Design génère des prototypes interactifs sans passer par Figma

Anthropic a lancé Claude Design en avril 2026, un outil qui produit des prototypes interactifs complets à partir d’une description en langage naturel, sans ouvrir Figma ni mobiliser un designer (Creative Bloq).

L’objet n’est pas un livrable visuel, c’est une maquette cliquable. Les équipes produit peuvent tester un parcours, une composition d’écrans, un état d’erreur, sans assembler manuellement les artboards. Le prototype redevient ce qu’il devrait être, un brouillon rapide pour décider, pas un livrable de fin de cycle. La conséquence sur le métier est plus large que l’outil, le designer se déplace vers la définition du système.


Un papier arXiv mesure l’écart de perception entre humains et détecteurs d’images IA

Une équipe a publié sur arXiv le 7 mai 2026 un papier intitulé AI-Generated Images: What Humans and Machines See When They Look at the Same Image, qui compare les zones d’attention humaines et machines sur un dataset de fausses images photoréalistes (arXiv).

Les chercheurs montrent que les détecteurs s’appuient sur des artefacts statistiques, là où les humains regardent surtout les visages et les mains. L’écart n’est pas anecdotique. Il signifie qu’un modèle qui passe l’œil humain peut échouer à passer un détecteur, et inversement. Pour les directions artistiques, c’est un cadre utile pour penser la traçabilité d’un asset IA en chaîne de production.

Derniers Guides

AI Slop 2026

AI Slop : pourquoi vos contenus IA deviennent interchangeables

L’AI slop n’est pas seulement du mauvais contenu généré par intelligence artificielle. C’est le symptôme d’une création sans intention, sans vérification et sans direction humaine.

Accéder au guide

Diriger l’émotion, l’expression et le mouvement dans les images et films IA

Diriger l’émotion, l’expression et le mouvement dans les images et films IA

Diriger une émotion en IA ne consiste pas à empiler des adjectifs, mais à écrire une partition précise : les muscles du visage (système FACS), l’état affectif (modèle PAD) et la qualité du mouvement (analyse de Laban).

Accéder au guide

Gemini Omni & Google Flow

Gemini Omni & Google Flow : construire un studio créatif IA complet

Workflow, Agent, Tools, crédits, prompts et méthode pour créer un mini-studio vidéo IA avec 100 prompts prêts à l’emploi.

Accéder au guide

formations IA

Google Flow, Veo & Gemini Omni : L’Orchestration Cinématographique IA NEW

Durée : 2 jours (14h). Public : DA, réalisateurs, motion designers, équipes marketing, communication et social media

Réinventer son processus créatif avec l’IA générative

Durée : 5 jours (35h). Public : DA, graphistes, designers

Gemini & Nano Banana 2 : du brief à l’image finale

Content Factory Pilot 30 jours : construire un système éditorial IA réellement utilisable

Durée : 30 jours (accompagnement). Public : dirigeants, équipes marketing & communication

Creative Memory Sprint : construire la mémoire IA créative de votre agence

Durée : 3 à 4 semaines (accompagnement). Public : directions créatives, studios créatifs, équipes marketing


Revue quotidienne de l’IA créative

  • Siemens génère des concepts 3D à partir de contraintes physiques Siemens a présenté…

    Lire la suite

  • Dentsu crée une plateforme IA interne pour structurer l’idéation créative Dentsu a lancé…

    Lire la suite

  • Adobe et Disney entraînent Firefly Foundry sur les actifs Imagineering Adobe a annoncé…

    Lire la suite