IA Créative • 2 juillet 2026



Comfy MCP pilote les workflows génératifs depuis un agent

ComfyUI a ouvert Comfy MCP en bêta publique pour construire, exécuter et relancer ses workflows depuis Claude, Codex, Cursor ou Hermes. Le serveur donne accès aux modèles d’image, de vidéo, de 3D et d’audio disponibles dans Comfy Cloud.

MCP est un protocole qui permet à un agent d’utiliser des outils externes. Ici, le graphe de nœuds reste présent mais devient manipulable en langage naturel, partageable par URL et reproductible par un autre membre de l’équipe. La conversation devient une interface de production sans effacer le pipeline. Source : ComfyUI.

PhysRAG apporte des références physiques à la génération vidéo

L’équipe de PhysRAG a présenté une méthode qui recherche des exemples de phénomènes physiques avant de générer une vidéo. Sa base couvre notamment la mécanique, l’optique et la dynamique thermique, afin d’aider le modèle à respecter les relations observées dans le monde réel.

Les chercheurs ont filtré une collection de 80 000 vidéos pour retenir 7 000 exemples de qualité, puis injectent les références utiles dans le modèle par des requêtes apprises. La cohérence physique devient une ressource consultable, et non une propriété espérée du prompt. Source : article PhysRAG sur arXiv.

Le CMO AI Hub convertit l’expérience des marketeurs en ressource conversationnelle

Infosys, l’ANA et LIONS ont lancé le CMO AI Hub, une plateforme qui répond aux questions marketing à partir de recherches, de cas et de retours de dirigeants sélectionnés. Le service est réservé aux membres du Global CMO Growth Council.

Ce réseau représente plus de 1 200 responsables marketing. Le modèle intéressant n’est pas un chatbot généraliste, mais une mémoire professionnelle fermée, gouvernée et enrichie par ses pairs. Source : Infosys.

ElevenCreative transforme les pipelines multimédias en templates réutilisables

ElevenLabs propose ElevenCreative Templates, un système qui assemble image, vidéo, voix, musique et effets sonores dans un workflow prêt à exécuter. Le créateur définit les entrées et les sorties, puis garde le template privé, le partage à son équipe ou le publie dans la galerie.

Un même pipeline peut produire une scène produit, une planche de personnage ou des variantes publicitaires sans être reconstruit. Pour les équipes qui formalisent leurs workflows créatifs IA, la valeur se déplace du rendu vers la recette reproductible. Source : ElevenLabs.

Disco-LoRA sépare le contenu, le style et le mouvement d’une vidéo

Les chercheurs de Disco-LoRA ont présenté une méthode qui dissocie le contenu, le style visuel et le mouvement avant de les recombiner dans une génération vidéo. Le système apprend séparément les couples contenu-style et contenu-mouvement, puis aligne leurs adaptations LoRA pour limiter les interférences.

Une LoRA est une petite adaptation spécialisée ajoutée à un modèle existant. Cette séparation prépare des bibliothèques où un personnage, une direction artistique et une gestuelle peuvent être combinés comme des modules. Le contrôle vidéo se rapproche ainsi d’un assemblage de calques narratifs. Source : article Disco-LoRA sur arXiv.

Revue quotidienne de l’IA créative

  • Comfy MCP pilote les workflows génératifs depuis un agent ComfyUI a ouvert Comfy…

    Lire la suite

  • Apple relie Final Cut Pro et Pixelmator Pro dans Creator Studio Apple a…

    Lire la suite

  • Gemini génère des images à partir du contexte privé de l’utilisateur Google a…

    Lire la suite

Derniers Guides

AI Slop 2026

AI Slop : pourquoi vos contenus IA deviennent interchangeables

L’AI slop n’est pas seulement du mauvais contenu généré par intelligence artificielle. C’est le symptôme d’une création sans intention, sans vérification et sans direction humaine.

Accéder au guide

Diriger l’émotion, l’expression et le mouvement dans les images et films IA

Diriger l’émotion, l’expression et le mouvement dans les images et films IA

Diriger une émotion en IA ne consiste pas à empiler des adjectifs, mais à écrire une partition précise : les muscles du visage (système FACS), l’état affectif (modèle PAD) et la qualité du mouvement (analyse de Laban).

Accéder au guide

Gemini Omni & Google Flow

Gemini Omni & Google Flow : construire un studio créatif IA complet

Workflow, Agent, Tools, crédits, prompts et méthode pour créer un mini-studio vidéo IA avec 100 prompts prêts à l’emploi.

Accéder au guide