Anti-Prompt protège une image IA contre son animation non autorisée
Les auteurs d’Anti-Prompt injectent dans une image des perturbations imperceptibles qui provoquent des défauts visibles lors de sa conversion en vidéo guidée par texte. La méthode affaiblit les interactions entre l’image et le prompt sans dégrader la source affichée. Testée sur 2 architectures image-vers-vidéo, elle améliore aussi le transfert de la protection entre modèles. L’approche déplace ainsi la protection technique vers le fichier source. Source : publication Anti-Prompt sur arXiv
WorldDirector conserve les objets hors champ dans les mondes vidéo
Les auteurs de WorldDirector présentent un modèle vidéo qui mémorise l’identité et le mouvement d’un objet après sa sortie du cadre. Un world model est un système qui simule un environnement et son évolution. Ici, un modèle de langage coordonne trajectoires 3D et caméra avant la génération des images. Le hors-champ devient une mémoire de mise en scène, utile pour explorer un décor sans voir disparaître ses personnages. Source : publication WorldDirector sur arXiv
GMO-E2DIT décompose la retouche e-commerce en opérations vérifiables
Les chercheurs de GMO-E2DIT décrivent un agent qui transforme une demande de retouche e-commerce en une suite d’actions localisées, exécutées puis contrôlées. Un modèle vision-langage prépare les zones et les opérations, tandis qu’un éditeur masqué préserve les parties déjà validées et reprend les erreurs. Pour les équipes qui formalisent leurs workflows créatifs IA, la retouche devient un programme auditable, pas une transformation globale difficile à corriger. Source : publication GMO-E2DIT sur arXiv
KathaTrace mesure la perte de sens entre les plans d’un storyboard
Les chercheurs de KathaTrace montrent qu’une séquence visuellement cohérente peut perdre le lien narratif qui relie deux scènes. Leur protocole compare ce que le lecteur comprend depuis le texte, les images, puis les deux réunis. Les générateurs évalués affichent un écart moyen de 23,5 points entre récit textuel et récit visuel. Pour la prévisualisation, la continuité ne se limite donc plus au personnage ou au décor : elle inclut la causalité. Source : publication KathaTrace sur arXiv
AbsoluteDegradation recrée les défauts physiques des films d’archive
Les auteurs d’AbsoluteDegradation publient un pipeline modulaire qui simule grain, rayures et mouvements de caméra avant d’entraîner des modèles de restauration. Leur benchmark réunit 81 576 images haute résolution issues de films d’archive réels. En reproduisant la chaîne analogique puis sa numérisation, le système évite de réduire l’usure à un filtre aléatoire et révèle les échecs que les jeux synthétiques classiques masquent. Source : publication AbsoluteDegradation sur arXiv
Revue quotidienne de l’IA créative
-
Anti-Prompt protège une image IA contre son animation non autorisée Les auteurs d’Anti-Prompt…
-
Hugging Face et Cerebras rendent les agents vocaux open source plus réactifs Hugging…
-
Bertelsmann déploie les modèles de Runway dans ses activités média Runway a annoncé…
Derniers Guides

Comment utiliser l’IA en marketing sans perdre sa voix de marque
L’AI slop n’est pas seulement du mauvais contenu généré par intelligence artificielle. C’est le symptôme d’une création sans intention, sans vérification et sans direction humaine.

Piloter la lumière IA comme un chef opérateur
La lumière en IA ne se contrôle pas avec des adjectifs comme « cinematic », « moody » ou « dramatic lighting ». Elle se dirige comme un plan lumière : une source, une direction, une intensité, une température, un contraste et une intention narrative.
