Hugging Face et Cerebras rendent les agents vocaux open source plus réactifs
Hugging Face et Cerebras ont présenté le 1er juillet une chaîne d’IA vocale open source conçue pour soutenir une conversation en temps réel. Le système convertit la parole avec Parakeet, produit la réponse avec Gemma 4 31B, puis recrée la voix avec Qwen3TTS.
Chaque composant peut être inspecté, remplacé ou adapté. La chaîne équipe déjà plus de 9 000 robots Reachy Mini. Pour les studios, cette architecture ouvre des usages précis : personnage de marque conversationnel, installation interactive ou prototype narratif vocal, sans dépendre d’un service fermé de bout en bout. Source : Hugging Face
Reallusion construit un personnage numérique réutilisable pour toute une campagne
Reallusion a documenté le 3 juillet un workflow qui maintient le même personnage numérique dans les images, les vidéos et les performances musicales d’une campagne. Character Creator fixe l’identité, iClone prépare la pose et AI Studio génère les déclinaisons.
Le personnage peut changer de tenue, de coiffure ou de décor sans perdre son visage. Une piste créée dans Suno devient ensuite la base d’une performance synchronisée. Pour les équipes qui structurent leurs workflows créatifs IA, le point utile est la séparation des rôles : identité, mise en scène, son et génération restent contrôlables. Source : Reallusion
Image-to-LoRA transforme une référence visuelle en modèle de style instantané
Les chercheurs Zhongjie Duan et Yingda Chen ont présenté i2L, un système qui produit les poids d’un LoRA de style en une seule passe de modèle. Le procédé remplace l’entraînement séparé normalement requis pour chaque nouvelle direction visuelle.
Un LoRA est un petit module qui adapte un modèle sans le réentraîner entièrement. i2L accepte une ou plusieurs images, puis génère des poids utilisables avec Z-Image, FLUX.2 et Hidream-O1. Les auteurs mesurent de meilleurs résultats de fidélité stylistique et d’alignement au prompt que leurs références de comparaison. Source : publication i2L sur arXiv
DrawVideo donne au storyboard le contrôle d’une vidéo longue
Une équipe de recherche a présenté DrawVideo, un système qui génère une vidéo longue à partir de croquis de storyboard, de prompts d’apparence et de prompts de mouvement. Chaque plan devient une unité indépendante avant d’être assemblé dans une narration continue.
Le croquis verrouille pose et composition. Le texte règle identité, style et dynamique. Le système crée ensuite une image clé de référence, dérive les états de l’action et synthétise les intervalles. Cette architecture redonne au storyboard une fonction opératoire : il ne décrit plus seulement le film, il dirige la génération. Source : publication DrawVideo sur arXiv
Google AI Studio porte le prototypage d’applications sur iPhone
Google a lancé le 1er juillet la version iPhone d’AI Studio, son environnement de création d’applications par prompt. L’application permet d’itérer sur le code, de prévisualiser un prototype et de partager un déploiement depuis un téléphone.
La fiche iOS indique un fichier de 114,3 Mo, iOS 18 au minimum et 76 langues. Le mode Build peut aussi générer des images d’interface avec Nano Banana et modifier un écran par annotation directe. Pour les designers, le téléphone devient un carnet de prototypes exécutables, pas seulement un espace de notes. Sources : Google et fiche de lancement iOS
Revue quotidienne de l’IA créative
-
Hugging Face et Cerebras rendent les agents vocaux open source plus réactifs Hugging…
-
Bertelsmann déploie les modèles de Runway dans ses activités média Runway a annoncé…
-
Comfy MCP pilote les workflows génératifs depuis un agent ComfyUI a ouvert Comfy…
Derniers Guides

Comment utiliser l’IA en marketing sans perdre sa voix de marque
L’AI slop n’est pas seulement du mauvais contenu généré par intelligence artificielle. C’est le symptôme d’une création sans intention, sans vérification et sans direction humaine.

Piloter la lumière IA comme un chef opérateur
La lumière en IA ne se contrôle pas avec des adjectifs comme « cinematic », « moody » ou « dramatic lighting ». Elle se dirige comme un plan lumière : une source, une direction, une intensité, une température, un contraste et une intention narrative.
