Ideogram 4.0 ouvre un modèle texte-image conçu pour le design
Ideogram a publié son premier modèle texte-image en poids ouverts, sous licence commerciale. Le modèle vise explicitement les workflows de design : typographie nette, mises en page contrôlées par bounding boxes, prompts structurés en JSON.
Architecture Diffusion Transformer à 9,3 milliards de paramètres, génération native en 2K sans upscaling, score de 0,97 au benchmark X-Omni English OCR. Sur DesignArena, Ideogram 4.0 prend la première place des modèles ouverts en quelques heures, devant FLUX.2 dev et Qwen-Image, pourtant deux à trois fois plus lourds. Source : Ideogram, communiqué officiel.
xAI ouvre en API Grok Imagine 1.5, modèle image-to-video avec audio natif
xAI a mis en aperçu API le 3 juin 2026 Grok Imagine 1.5, son premier modèle image-to-video commercial, qui anime une image fixe à partir d’un prompt et génère une piste audio en parallèle, sans ligne de facturation séparée.
La tarification démarre à 0,08 dollar par seconde à 480p et 0,14 dollar à 720p, avec un coût d’entrée image de 0,01 dollar. L’inclusion de l’audio dans la génération vidéo sans surcoût reste inhabituelle parmi les API vidéo majeures. Pour les équipes qui produisent des publicités, des reels ou du contenu court, Grok Imagine 1.5 réduit la chaîne d’outils entre l’image source et le rendu sonore final. Source : Digital Applied
OpenAI réécrit la mémoire de ChatGPT avec l’architecture Dreaming V3
OpenAI a déployé le 4 juin 2026 Dreaming V3, nouvelle architecture mémoire pour ChatGPT qui synthétise automatiquement les préférences d’usage depuis des années de conversations passées, sans intervention de l’utilisateur.
Le système remplace la liste de souvenirs saisis manuellement par une mise à jour continue en arrière-plan. La consommation de calcul est réduite d’environ 5 fois, ce qui étend la mémoire personnalisée aux comptes gratuits pour la première fois. Pour les créatifs qui utilisent ChatGPT comme partenaire de réflexion, l’outil apprend les préférences de workflow, de ton et de style sans avoir besoin d’être rebriefé à chaque session. Source : Dataconomy
Reactor sort du stealth avec 59 millions de dollars pour la vidéo IA en temps réel
Reactor a annoncé le 2 juin 2026 une levée de Série A de 59 millions de dollars, menée par Lightspeed avec WndrCo de Jeffrey Katzenberg, Amplify Partners, Sky9 Capital et FPV Ventures. La société construit une infrastructure de génération vidéo en temps réel, exposée aux développeurs via une API.
Les cofondateurs Alberto Taiuti et Bryce Schmidtchen sont d’anciens leads techniques d’Apple Vision Pro. Taiuti a aussi cofondé Luma AI. Reactor revendique un temps avant première image proche de zéro, et cible média, entertainment, robotique et environnements interactifs. Source : Variety, exclusivité Reactor.
NVIDIA RTX Spark réarchitecte Adobe Premiere et Photoshop pour les PC Windows
NVIDIA et Microsoft ont présenté le 1er juin 2026 RTX Spark, nouvelle puce supercomputer pour PC Windows, avec Adobe Premiere et Photoshop réarchitecturés pour en exploiter l’accélération dans les workflows créatifs.
Les tâches IA, d’édition et de colorimétrie gagnent jusqu’à 2 fois en vitesse, et Generative Fill dans Photoshop ainsi que Generative Extend dans Premiere font partie des fonctions directement accélérées. Les premiers ordinateurs portables et PC compacts RTX Spark seront disponibles à l’automne 2026 chez ASUS, Dell, HP, Lenovo, Surface et MSI. Pour les studios créatifs sur Windows, c’est l’annonce hardware la plus directement opérationnelle de l’année. Source : NVIDIA Newsroom
Derniers Guides

AI Slop : pourquoi vos contenus IA deviennent interchangeables
L’AI slop n’est pas seulement du mauvais contenu généré par intelligence artificielle. C’est le symptôme d’une création sans intention, sans vérification et sans direction humaine.

Diriger l’émotion, l’expression et le mouvement dans les images et films IA
Diriger une émotion en IA ne consiste pas à empiler des adjectifs, mais à écrire une partition précise : les muscles du visage (système FACS), l’état affectif (modèle PAD) et la qualité du mouvement (analyse de Laban).
formations IA
Google Flow, Veo & Gemini Omni : L’Orchestration Cinématographique IA NEW
Durée : 2 jours (14h). Public : DA, réalisateurs, motion designers, équipes marketing, communication et social media
Réinventer son processus créatif avec l’IA générative
Durée : 5 jours (35h). Public : DA, graphistes, designers
Gemini & Nano Banana 2 : du brief à l’image finale
Durée : 1 jour (7h). Public : graphistes, designers, drecteurs artistiques
L’IA générative pour les créatifs : panorama et expérimentation des outils essentiels
Durée : 1 jour (7h). Public : DA, dirigeants, designers
Content Factory Pilot 30 jours : construire un système éditorial IA réellement utilisable
Durée : 30 jours (accompagnement). Public : dirigeants, équipes marketing & communication
Creative Memory Sprint : construire la mémoire IA créative de votre agence
Durée : 3 à 4 semaines (accompagnement). Public : directions créatives, studios créatifs, équipes marketing
Revue quotidienne de l’IA créative
-
Meshy lance 3D Agent Beta, un agent conversationnel dédié à la création 3D…
-
Canva Magic Layers rend les images IA éditables dans ChatGPT Canva a rendu…
-
WPP lance HEX, un studio IA dédié à la création de marque et…
