Casting IA avec Wan 2.7

L’anatomie faciale comme langage de direction. Un guide pour retrouver, à l’ère du casting synthétique, le vocabulaire précis qui permet de diriger un visage au lieu de le subir.

1. Intro. Le casting n’a pas disparu, il a changé de forme

Je me souviens d’un casting, en 2012, dans un studio photo du dixième arrondissement. Une campagne pour un parfum. Une journée entière, quarante visages défilent, l’agent parcourt ses books, le café refroidit. Puis une femme entre, elle n’est pas la plus belle, elle est la seule. Le directeur artistique pose son stylo. On sait tous qu’on vient de trouver.

Ce moment précis, cette coupure dans la journée, n’existe plus sous cette forme. Le studio a disparu, l’agent aussi, et le café je le prends devant mon écran. À la place, je génère une grille de quatre candidats synthétiques, et je recommence si aucun ne tient.

La tentation serait de raconter cette bascule comme une perte. Je pense qu’elle est autre chose. Ce qui a disparu, c’est le rituel. Ce qui reste, c’est la décision. Et la décision, en réalité, n’a jamais été aussi exigeante qu’aujourd’hui.

Parce qu’un modèle comme Wan 2.7-Image ne vous tend pas quarante visages. Il vous tend l’infini. Entre l’infini et une campagne de parfum, il faut un langage pour choisir. Ce langage existe depuis longtemps dans les studios et les agences de casting. Il porte un nom : l’anatomie. Et c’est, je crois, la nouvelle matière du directeur de casting comme du directeur artistique.

Ce guide est une tentative de restaurer ce vocabulaire. De le rendre directement exploitable dans une pratique de prompting quotidienne. Et de le relier, comme il mérite de l’être, à l’histoire du portrait dont il est le prolongement.

Je l’écris depuis ma position : plus de vingt ans de direction créative en agence, un studio génératif au quotidien, plus de cinq cents professionnels formés aux outils IA depuis 2023. Je l’écris aussi depuis ma pratique d’illustrateur sous le nom Eugène, où la question du visage est la seule qui compte vraiment.


2. Pourquoi Wan 2.7-Image parle d’anatomie et pas d’esthétique

Wan 2.7 - Attributs granulaires pour la génération humaine

Le rapport technique du laboratoire Tongyi d’Alibaba, publié au printemps 2026, liste quatre catégories d’attributs granulaires pour la génération humaine : structure osseuse, morphologie oculaire, détails cutanés, identité consistante. Ce choix de vocabulaire n’est pas neutre. Il signale une rupture que peu de commentateurs ont relevée.

Pendant plus de deux ans, les modèles d’IA générative se sont pilotés par qualificatifs. « Une femme belle », « un homme sérieux », « un visage doux », « un regard intense ». Ces qualificatifs étaient des jugements, pas des descriptions. Ils déléguaient au modèle le soin de décider ce que voulait dire « beau », « sérieux » ou « doux ». Résultat : des visages lissés, convergents, statistiquement moyens, qu’on a fini par reconnaître et nommer « visages IA ».

Wan 2.7-Image propose un autre contrat. Au lieu de juger, il demande de décrire. Au lieu de « belle », il attend « structure ovale, yeux en amande, pommettes hautes ». Au lieu de « sérieux », il attend « mâchoire carrée, orbites profondes, absence de sourire ». La différence semble technique. Elle est en réalité profondément culturelle.

Décrire un visage par son anatomie, c’est refuser de déléguer le choix esthétique à la machine. C’est reprendre la main. C’est restaurer le geste du directeur qui, en pointant un détail précis sur une fiche de casting, engage une intention.

Ce n’est pas une nouveauté. C’est le retour d’une pratique qui s’était effacée entre 2022 et 2025, sous la pression des premiers outils d’IA générative qui ne savaient traiter que des adjectifs. Avec Wan 2.7-Image, le vocabulaire du portrait revient au premier plan. Ce guide propose de l’utiliser.


3. Petite histoire du portrait comme décision

Avant de plonger dans le vocabulaire technique, je voudrais le relier à une histoire plus longue. Trois jalons rapides, parce qu’on dirige mieux un visage quand on connaît les traditions qui l’ont précédé.

3.1. Le portrait classique

Jan van Eyck
Jan van Eyck

De Van Eyck à Ingres, en passant par Vermeer, David et Manet, le portrait occidental s’est toujours construit sur une série de décisions anatomiques explicites. Le portraitiste ne copiait pas. Il composait.

Ingres allonge les cous. Vermeer accentue la rondeur d’une joue pour capter la lumière. David dessine des mâchoires plus fermes que celles de ses modèles, parce que la mâchoire ferme est, à l’époque post-révolutionnaire, une mâchoire républicaine. Chaque ajustement est une décision éditoriale au service d’un propos.

Ce qu’il faut retenir : le portrait n’a jamais été un enregistrement. Il a toujours été un montage anatomique intentionnel. Wan 2.7 ne fait qu’étendre cette tradition par d’autres moyens.

3.2. La photographie de mode

Richard Avedon
Richard Avedon

De Steichen à Penn, de Avedon à Newton, de Paolo Roversi à Peter Lindbergh, la photographie de mode a formalisé le casting comme langage. Penn photographiait les mêmes mannequins pendant des décennies parce qu’il avait besoin d’une anatomie précise pour construire ses compositions. Avedon retouchait ses tirages pour accentuer une fossette ou un creux de tempe. Newton choisissait des visages aux mâchoires rectangulaires parce qu’elles tenaient la lumière dure.

Chez Lindbergh, plus près de nous, le refus du retoucher participe du même geste. Les pores, les rides, les imperfections sont des décisions anatomiques assumées. Le photographe ne montre pas la peau comme elle est, il décide de la montrer.

Cette tradition française et allemande du portrait photographique infuse aujourd’hui une part de la pratique IA la plus intéressante. Les prompts qui fonctionnent le mieux sont ceux qui pensent comme Lindbergh plutôt que comme un filtre Instagram.

3.3. Le casting cinéma

Gena Rowlands
Gena Rowlands

Dans la tradition du casting américain, de Kazan à Kasdan, le visage est choisi avant le script. On ne cast pas un acteur pour ce qu’il va jouer, on le cast pour ce qu’il porte déjà. La mâchoire de Brando, les yeux de Gena Rowlands, la texture de peau de Bruno Ganz. Chaque visage est un pré-texte narratif.

Dans la tradition française, de Pialat à Desplechin, le casting suit une logique similaire. On choisit un visage comme on choisirait un décor : parce qu’il contient déjà une part du film à venir.

Ces trois traditions ont un point commun. Le visage est une décision qui précède l’exécution, pas un résultat qui l’accompagne. Wan 2.7, en imposant un vocabulaire anatomique, remet cette décision au centre.


4. Les quatre catégories, lues comme un vocabulaire de direction

Voici le cœur méthodologique du guide. Je reprends les quatre catégories du rapport technique, une à une. Pour chacune, je donne d’abord le vocabulaire disponible, puis je le relie à la culture du portrait, puis je propose des usages concrets en direction.

4.1. La structure osseuse

Rubens
Rubens

Le vocabulaire disponible. Ovale, ronde, carrée, rectangulaire, en cœur. Cinq options qui déterminent la silhouette globale et la mâchoire.

Ce que chaque structure raconte.

L’ovale est la structure de la Renaissance italienne. Piero della Francesca, Raphaël. Elle évoque l’équilibre, la mesure, la stabilité. Elle passe partout parce qu’elle a été élevée au rang de norme par cinq siècles de peinture. Danger : elle est l’option par défaut des modèles IA, donc celle qui produit les visages les plus convergents et les moins mémorables.

La ronde porte une charge de douceur, parfois d’enfance, parfois de bienveillance. Elle domine dans le portrait flamand du dix-septième (Hals, Rubens). Dans un casting contemporain, elle sert les personnages d’accueil, d’écoute, d’empathie. Elle peut aussi, à contre-emploi, servir une autorité non frontale.

La carrée est la structure de l’autorité occidentale classique, héritée du portrait politique napoléonien et du casting hollywoodien masculin des années 50. Elle fonctionne aussi pour les figures féminines d’autorité (Lauren Bacall, Tilda Swinton). À utiliser sans hésiter quand on cherche une présence directe, frontale, tenue.

Tilda Swindon
Tilda Swindon

La rectangulaire est plus rare et plus distinctive. Elle allonge le visage, lui donne une tension. Elle sert les caractères introvertis, les profils intellectuels, les visages qui portent une histoire. Elle photographie particulièrement bien en lumière latérale dure.

La en cœur est une structure spécifique, large aux pommettes et étroite au menton. Elle évoque la jeunesse (en couverture magazine, c’est la structure dominante des actrices de moins de trente ans) mais peut aussi porter une fragilité qui tranche avec un sujet grave.

Usage en direction. Ne jamais laisser la structure osseuse implicite dans un prompt. C’est la première décision. Elle précède tout le reste.

4.2. La morphologie oculaire

Le vocabulaire disponible. Yeux en amande, orbites profondes, yeux ronds, yeux de phénix.

Ce que chaque morphologie construit.

Les yeux en amande sont la forme la plus répandue dans la tradition picturale méditerranéenne. Ils évoquent un regard tenu, présent, légèrement contenu. Ils photographient bien en lumière douce et en lumière dure. Ils passent bien au cinéma.

Helmut Newton
Helmut Newton

Les orbites profondes creusent le regard, produisent des ombres portées sur la paupière. Elles sont la marque du portrait social américain (Walker Evans, Dorothea Lange) et de la photographie de mode allemande (Helmut Newton, Peter Lindbergh). Elles portent la gravité, l’expérience, la fatigue assumée. À privilégier pour les visages qui doivent porter une histoire.

Les yeux ronds ouvrent le visage, l’ouvrent à l’autre. Ils sont la marque du casting publicitaire familial depuis quarante ans. À utiliser quand on cherche la complicité, la disponibilité, l’adresse directe au spectateur.

Les yeux de phénix, vocabulaire issu de la tradition picturale chinoise, désignent une forme allongée aux commissures relevées. Ils portent une élégance froide, une distance, une autorité. Ils sont peu utilisés dans le casting publicitaire occidental, ce qui les rend distinctifs. Pour un projet qui cherche à se démarquer, ils sont une ressource sous-exploitée.

Usage en direction. La morphologie oculaire définit le rapport entre le visage et la caméra. Un regard n’est pas une expression, c’est une géométrie. Le reste (le sourire, le sérieux) en découle.

4.3. Les détails cutanés

Le vocabulaire disponible. Pores visibles, taches de rousseur, rides d’expression, grain.

Pourquoi la peau est le vrai lieu du réalisme.

C’est ici que se joue la distinction entre un visage crédible et un visage IA. Toutes les autres catégories peuvent être correctement prompées, si la peau est lisse, l’ensemble bascule dans l’esthétique synthétique reconnaissable.

L’erreur par défaut des modèles IA jusqu’à Wan 2.7 était le lissage. Chaque image subissait, consciemment ou non, un traitement qui effaçait les pores, unifiait les teintes, supprimait les micro-asymétries. Cette « peau IA » est devenue un signe aussi reconnaissable que l’effet HDR des années 2010.

Wan 2.7 permet de prompter activement les imperfections. Mais il ne le fait pas par défaut. Il faut les demander explicitement.

Les pores visibles donnent la texture. Ils changent la façon dont la lumière accroche. Les taches de rousseur individualisent. Elles transforment un visage convergent en visage unique. Les rides d’expression racontent. Une ride au coin de l’œil raconte une vie de sourires. Une ride entre les sourcils raconte une vie de concentration. Ces signes doivent être voulus, pas subis.

Le grain est le terme qui désigne la texture générale de la peau. Il peut être spécifié (grain fin, grain moyen, grain marqué) pour orienter le rendu vers une esthétique photographique plutôt qu’illustrative.

Usage en direction. Si vous ne deviez retenir qu’une seule règle de ce guide, retenez celle-ci : prompter activement les imperfections cutanées. C’est la différence entre un visage qu’on oublie et un visage qu’on reconnaît.

4.4. L’identité consistante

Le vocabulaire disponible. Support multi-référence par grille de neuf images (3×3), qui maintient le visage sur neuf angles ou lumières différents.

La grille 3×3 comme fiche de casting contemporaine.

Jusqu’à Wan 2.7, la consistance d’un personnage d’une image à l’autre était le problème numéro un de la production IA. Un même prompt produisait neuf visages différents. Monter une séquence était impossible.

La grille 3×3 résout techniquement ce problème. Mais elle fait plus que cela : elle restaure un objet qui avait disparu de la production, la fiche de casting. Une fiche de casting, historiquement, c’est un visage sous plusieurs angles, plusieurs lumières, avec quelques variations d’expression. C’est exactement ce que la grille 3×3 encode.

Pour un studio qui produit en IA générative, la grille 3×3 devient le vrai livrable de la phase de casting. Une fois constituée, elle est réutilisable à l’infini. Elle remplace le book.

Usage en direction. Toute production de plus de trois plans doit commencer par la construction d’une grille 3×3. Cette construction est un acte de direction, pas une étape technique. Elle consiste à décider, avant toute production, quel visage traversera l’ensemble.


5. Cinq erreurs de casting IA et leur contre-mesure anatomique

Partie opérationnelle, pensée pour les lecteurs qui feuillettent. Cinq erreurs que je rencontre en atelier chaque semaine, et leur contre-mesure précise.

ProblèmeSymptômeCauseContre-mesure
Le visage générique passe-partoutLe modèle produit une succession de visages jeunes, symétriques, lisses, interchangeables. Chaque génération ressemble à la précédente.Aucune spécification de structure osseuse. Le modèle revient à sa moyenne statistique, qui est l’ovale par défaut.Ancrer explicitement la structure osseuse dès la première ligne du prompt. « Structure osseuse rectangulaire » ou « structure osseuse en cœur » suffit à sortir de la moyenne.
Le regard absent ou mouLe personnage semble ne rien regarder, ou regarder vaguement au-dessus de la caméra. Le visage est là, le regard n’y est pas.Absence de spécification sur la morphologie oculaire et la direction du regard.Préciser les deux. « Yeux en amande, regard caméra frontal » ou « orbites profondes, regard tourné vers fenêtre hors cadre droite ». La direction du regard est aussi importante que sa géométrie.
La peau plastiqueLe visage paraît crédible au premier regard, puis quelque chose cloche. La peau est trop lisse, trop uniforme, presque cireuse.Le lissage par défaut du modèle n’est pas contré.Prompter activement les détails cutanés : « pores visibles, grain fin de peau, rides d’expression légères autour des yeux ». Et ajouter systématiquement « plastic skin, over-smoothed face, generic beauty filter » dans le Negative Prompt.
Le cast interchangeable sur plusieurs plansSur une séquence de cinq plans, le personnage a cinq visages différents. Le montage est impossible.Pas de grille 3×3 construite. Chaque prompt repart de zéro.Avant toute production en volume, construire une grille 3×3 (9 vues du personnage) et la réinjecter systématiquement comme référence dans chaque nouveau prompt.
Le biais esthétique par défautTous les personnages ont entre vingt-cinq et trente-cinq ans. Tous sourient. Tous sont symétriques. Le casting s’uniformise.Les modèles sont entraînés sur des corpus dominés par l’esthétique publicitaire occidentale des quinze dernières années.Forcer explicitement ce que le modèle évite : « femme fin cinquantaine », « pas de sourire », « asymétrie faciale subtile côté droit », « cheveux gris non teints ». Ce qui est explicitement demandé est respecté. Ce qui est laissé implicite retombe dans le biais.

6. Trois carnets de direction

Chaque carnet présente une intention de casting traduite en prompt anatomique précis. L’objectif n’est pas de reproduire les prompts tels quels, mais de voir comment une intention éditoriale se transforme en décision anatomique.

6.1. Une égérie parfum haut de gamme, à contre-emploi

L’intention. Une marque de parfum niche veut rompre avec le casting vingt-cinq ans par défaut. Elle cherche une femme qui a vécu, dont le visage contient une histoire, dont l’âge est un propos et non un accident.

La traduction anatomique. Structure osseuse rectangulaire (pour la distinction, l’autonomie). Orbites profondes (pour la gravité, l’expérience). Rides d’expression visibles autour des yeux et entre les sourcils (pour la présence du temps). Pas de sourire. Grain de peau moyen, non retouché. Cheveux gris assumés.

Le prompt.

Portrait rapproché buste, femme fin cinquantaine, structure osseuse rectangulaire prononcée, orbites profondes, yeux en amande gris-vert, rides d'expression marquées autour des yeux et entre les sourcils, peau mature avec pores visibles et taches pigmentaires naturelles, cheveux gris argentés coupés courts asymétriques, chemise blanche col ouvert, regard caméra frontal intense, pas de sourire, fond uni gris anthracite #2A2520, éclairage principal latéral gauche dur 4200K créant ombre nette côté droit, éclairage d'appoint minimal, profondeur de champ f/2.8, cadrage règle des tiers œil gauche sur ligne haute, style éditorial mode contemporain type Peter Lindbergh, film moyen format grain fin, palette #1A1A1A #2A2520 #D4A574.

Negative prompt :

plastic skin, over-smoothed face, generic beauty filter, artificial retouching, watermark, young appearance, excessive makeup.
Prompt : Portrait rapproché buste, femme fin cinquantaine, structure osseuse rectangulaire prononcée, orbites profondes, yeux en amande gris-vert, rides d'expression marquées autour des yeux et entre les sourcils, peau mature avec pores visibles et taches pigmentaires naturelles, cheveux gris argentés coupés courts asymétriques, chemise blanche col ouvert, regard caméra frontal intense, pas de sourire, fond uni gris anthracite #2A2520, éclairage principal latéral gauche dur 4200K créant ombre nette côté droit, éclairage d'appoint minimal, profondeur de champ f/2.8, cadrage règle des tiers œil gauche sur ligne haute, style éditorial mode contemporain type Peter Lindbergh, film moyen format grain fin, palette #1A1A1A #2A2520 #D4A574.

Le résultat attendu. Un visage qui tranche avec la concurrence. Une femme qu’on regarde, pas qu’on reconnaît comme une catégorie.

6.2. Un visage institutionnel pour un groupe industriel

L’intention. Un groupe industriel veut un visage récurrent pour ses communications internes. Il cherche une autorité, mais pas une autorité dure. Quelqu’un qu’on suit parce qu’on lui fait confiance, pas parce qu’on le craint.

La traduction anatomique. Structure osseuse ovale (la mesure, l’équilibre). Yeux ronds (l’ouverture, la disponibilité). Sourire léger fermé, pas dents apparentes (la bienveillance sans familiarité). Rides d’expression autour des yeux (l’expérience humaine). Grain de peau moyen, cheveux poivre et sel.

Le prompt.

Portrait plan moyen épaule, homme début cinquantaine, structure osseuse ovale, yeux ronds marron foncé, rides d'expression autour des yeux, peau avec pores visibles et grain moyen, cheveux poivre et sel courts coiffés naturellement, légère barbe de trois jours grise, chemise bleu marine #1A2332 col ouvert, sourire léger bouche fermée bienveillant, regard caméra frontal, assis dans bureau moderne épuré flou en arrière-plan, éclairage naturel fenêtre latérale droite heure dorée 3500K, profondeur de champ f/1.8 arrière-plan très flou, cadrage deux tiers droite, micro-mouvement de respiration seulement, style portrait institutionnel contemporain, film 85mm grain fin, palette #1A2332 #D4A574 #2A2520.

Negative prompt :

plastic skin, over-smoothed face, stern expression, corporate stock photo look, watermark, excessive retouching.

Le résultat attendu. Un visage réutilisable sur plusieurs années, capable de porter des contenus variés sans lasser.

6.3. Un protagoniste de court-métrage IA, sur cinq plans

L’intention. Un studio produit un court-métrage IA de cinq plans. Le personnage central doit porter l’ensemble. Sa cohérence, plan après plan, est la condition de crédibilité du film.

La traduction anatomique. Fiche complète : structure osseuse en cœur, yeux de phénix marron clair, pores visibles, tache de naissance sur la pommette droite (signe distinctif), cheveux longs noirs. Grille 3×3 construite en amont (face, profil gauche, profil droit, trois-quarts gauche, trois-quarts droit, légère contre-plongée, légère plongée, yeux fermés, demi-sourire).

Le prompt de référence (réinjecté à chaque plan).

[Image1 à Image9 comme référence multi-vues] Femme début trentaine, structure osseuse en cœur, yeux de phénix marron clair, sourcils fins, peau claire avec pores visibles et tache de naissance brun clair sur la pommette droite, cheveux longs noirs lisses, trait caractéristique : dissymétrie subtile de la bouche côté gauche légèrement plus haut, expression neutre par défaut, style photoréaliste contemporain.

Chaque plan du court-métrage reprend ce bloc de référence, puis ajoute la scène, la lumière, le cadrage, l’action.


Le résultat attendu. Une consistance d’identité supérieure à 95% sur les cinq plans, y compris sous des conditions de lumière et d’angle très différentes.


7. Bibliothèque de prompts anatomiques commentés

Huit archétypes de casting, chacun prompté et commenté. Utilisables tels quels ou comme point de départ pour vos propres bibliothèques.

7.1. L’autorité douce

Femme début soixantaine, structure osseuse ovale, yeux en amande bleu-gris, rides d'expression douces autour des yeux, peau mature avec pores visibles et grain moyen, cheveux blancs coupés courts naturellement, sourire léger bouche fermée, regard caméra frontal bienveillant, chemisier crème col mao, fond uni beige chaud #E8DFD3.

Ce qui fait la direction. L’ovale + les yeux en amande + le sourire fermé composent une autorité qui ne s’impose pas. La couleur blanche assumée des cheveux fait le reste.

7.2. Le visage adolescent post-puberté

Jeune homme dix-neuf ans, structure osseuse rectangulaire en cours d'affirmation, yeux ronds marron, peau à pores visibles, quelques imperfections cutanées légères résiduelles sur les joues, cheveux bruns mi-longs mal coiffés, absence totale de sourire, regard caméra tendu, sweat-shirt gris chiné, fond uni gris froid #3A4A5A.
Prompt : Jeune homme dix-neuf ans, structure osseuse rectangulaire en cours d'affirmation, yeux ronds marron, peau à pores visibles, quelques imperfections cutanées légères résiduelles sur les joues, cheveux bruns mi-longs mal coiffés, absence totale de sourire, regard caméra tendu, sweat-shirt gris chiné, fond uni gris froid #3A4A5A.

Ce qui fait la direction. Les « imperfections cutanées résiduelles » sont la différence entre un ado crédible et un adulte rajeuni. Ce sont elles qu’il faut oser prompter.

7.3. Le visage marqué par le travail physique

Homme début quarantaine, structure osseuse carrée, mâchoire prononcée, orbites profondes, yeux gris-bleu, peau mate tannée par l'extérieur, rides marquées au front et autour des yeux, barbe de quatre jours poivre et sel, mains abîmées visibles au cadre, chemise en jean délavée manches retroussées, fond atelier industriel flou éclairage latéral tungstène chaud 3000K.

Ce qui fait la direction. La peau tannée, les mains abîmées, la barbe non entretenue. Le corps raconte l’histoire que le visage seul ne pourrait pas porter.

7.4. Le visage intellectuel

Femme fin trentaine, structure osseuse rectangulaire, orbites profondes, yeux en amande marron foncé derrière lunettes rondes à monture fine, rides d'expression entre les sourcils, peau claire à grain fin sans maquillage visible, cheveux bruns attachés négligemment, chemise noire col roulé, regard légèrement détourné pensif, fond bibliothèque flou, éclairage fenêtre latérale douce 4500K.
Prompt : Femme fin trentaine, structure osseuse rectangulaire, orbites profondes, yeux en amande marron foncé derrière lunettes rondes à monture fine, rides d'expression entre les sourcils, peau claire à grain fin sans maquillage visible, cheveux bruns attachés négligemment, chemise noire col roulé, regard légèrement détourné pensif, fond bibliothèque flou, éclairage fenêtre latérale douce 4500K.

Ce qui fait la direction. Les rides entre les sourcils signalent la concentration habituelle. Le regard détourné refuse la séduction de la caméra.

7.5. Le visage qui rit

Homme début trentaine, structure osseuse ronde, yeux ronds marron clair plissés par le rire, rides d'expression profondes aux coins des yeux, peau claire grain moyen, cheveux bruns courts ébouriffés, barbe courte, rire franc bouche ouverte dents visibles asymétrie naturelle, chemise à carreaux col ouvert, fond extérieur lumière naturelle heure dorée 3800K.
Prompt : Homme début trentaine, structure osseuse ronde, yeux ronds marron clair plissés par le rire, rides d'expression profondes aux coins des yeux, peau claire grain moyen, cheveux bruns courts ébouriffés, barbe courte, rire franc bouche ouverte dents visibles asymétrie naturelle, chemise à carreaux col ouvert, fond extérieur lumière naturelle heure dorée 3800K.

Ce qui fait la direction. L’asymétrie naturelle du rire. Sans elle, le rire paraît posé.

7.6. Le visage qui écoute

Femme fin quarantaine, structure osseuse ovale, yeux en amande verts légèrement plissés, peau mature grain fin avec rides douces, cheveux châtains mi-longs, regard tourné vers interlocuteur hors cadre gauche trois-quarts, tête légèrement inclinée à droite, expression concentrée attentive, chemisier blanc, fond bureau contemporain flou éclairage doux.
Prompt : Femme fin quarantaine, structure osseuse ovale, yeux en amande verts légèrement plissés, peau mature grain fin avec rides douces, cheveux châtains mi-longs, regard tourné vers interlocuteur hors cadre gauche trois-quarts, tête légèrement inclinée à droite, expression concentrée attentive, chemisier blanc, fond bureau contemporain flou éclairage doux.

Ce qui fait la direction. La direction du regard et l’inclinaison de la tête. L’écoute n’est pas une expression, c’est une géométrie.

7.7. Le visage ancestral

Homme fin soixantaine, structure osseuse carrée marquée, orbites très profondes, yeux de phénix marron foncé, peau mate très texturée avec rides profondes et taches pigmentaires, cheveux blancs tirés en arrière, longue barbe blanche, regard caméra frontal grave, tunique sombre, fond uni noir profond, éclairage latéral dur unique source 3200K type peinture baroque.
Prompt : Homme fin soixantaine, structure osseuse carrée marquée, orbites très profondes, yeux de phénix marron foncé, peau mate très texturée avec rides profondes et taches pigmentaires, cheveux blancs tirés en arrière, longue barbe blanche, regard caméra frontal grave, tunique sombre, fond uni noir profond, éclairage latéral dur unique source 3200K type peinture baroque.

Ce qui fait la direction. Le vocabulaire du portrait classique réactivé par l’anatomie précise. L’éclairage baroque finit le travail.

7.8. Le visage contemporain neutre

Personne début trentaine non-genré, structure osseuse ovale équilibrée, yeux en amande marron neutre, peau claire à pores visibles grain fin, cheveux bruns mi-courts coupe nette, absence totale de maquillage visible, expression neutre ni sourire ni tristesse, regard caméra frontal, tee-shirt blanc uni, fond uni gris clair #E8DFD3 uniforme, éclairage frontal doux sans ombre marquée 5000K.

Ce qui fait la direction. C’est le visage de référence, neutre par construction. Utile comme base de fiche avant d’ajouter les spécificités d’un projet.

7.9. Principes méthodologiques

Six règles dégagées en atelier après plus de deux cents sessions de casting IA.

Commencer toujours par la structure osseuse. Elle décide de tout le reste.

Traiter la morphologie oculaire comme une géométrie, pas comme une expression. Le regard est une direction et une forme, pas un sentiment.

Prompter activement la peau. C’est la seule protection contre l’esthétique IA.

Forcer l’âge explicitement. Sans quoi tout le monde aura trente ans.

Travailler par grille 3×3 dès qu’un projet dépasse trois plans.

Tenir un carnet de casting. Chaque visage validé est une ressource réutilisable. Capitalisez.


8. La question du droit à l’image et de la ressemblance

Partie obligatoire, traitée lucidement. La personnalisation anatomique granulaire de Wan 2.7 permet de créer des visages uniques, techniquement fictifs. Juridiquement, la situation est plus nuancée.

Si un visage généré ressemble, même involontairement, à une personne réelle reconnaissable, la responsabilité civile peut être engagée en France sur le fondement du droit à l’image. Aucune jurisprudence stable n’existe à ce jour pour les visages entièrement synthétiques, mais plusieurs cas sont en cours d’instruction en 2026.

Trois précautions pratiques, à intégrer dans tout workflow professionnel.

Traçabilité des prompts. Conserver systématiquement le prompt exact qui a généré un visage final, la date, la version du modèle, la grille 3×3 utilisée. En cas de litige, cette traçabilité démontre l’intention de créer un visage original, pas de reproduire un visage existant.

Vérification contre les bases de personnalités publiques. Pour toute campagne commerciale, passer le visage final par un outil de reconnaissance inversée (TinEye, PimEyes en version professionnelle) avant publication. Si une ressemblance apparaît avec une personne reconnaissable, modifier un ou deux attributs anatomiques avant validation.

Documentation des intentions de casting. Tenir, pour chaque projet, une fiche de casting explicitant les choix anatomiques et leur motivation créative. Cette fiche est à la fois un outil de direction et, en cas de contestation, une preuve d’intention éditoriale.

Ces précautions ne remplacent pas un conseil juridique spécialisé. Elles constituent un minimum professionnel raisonnable.


9. Ce qui reste au directeur de casting

La thèse de ce guide, assumée. Le directeur de casting ne disparaît pas avec l’IA générative. Il se déplace.

Dans l’économie classique, son métier consistait à sourcer, trier, présélectionner, défendre. Il produisait du choix à partir d’un marché de visages existants.

Dans l’économie qui commence, il cesse d’être un sélectionneur et redevient un auteur d’intention. Son livrable n’est plus une liste de trois candidats pour un client. C’est une fiche anatomique directrice qui engage une lecture du projet.

Cette fiche anatomique, c’est la traduction en vocabulaire précis d’une intention éditoriale qui, elle, reste du côté humain. Pourquoi un visage rectangulaire plutôt qu’un ovale pour cette marque. Pourquoi des orbites profondes plutôt que des yeux ronds pour ce film. Pourquoi cette tache de naissance, précisément ici, sur ce personnage.

Ces décisions ne se prennent pas avec un modèle. Elles se prennent avec une culture, une lecture du brief, une connaissance de l’histoire du portrait, un goût. Un directeur de casting qui maîtrise ce vocabulaire devient plus précieux qu’il ne l’était quand il fallait téléphoner à cinq agences. Il devient le dépositaire d’un langage.

Et ce langage, aujourd’hui, n’existe pas encore sous forme structurée dans les agences. Il se transmet par l’expérience, par l’atelier, par le compagnonnage. Les studios qui le formaliseront les premiers prendront une avance significative.


10. Conclusion. Redonner un visage à la direction

Je reviens à ce casting de 2012, dans le studio du dixième. La femme qui entre et qui fait arrêter la journée. Je me suis longtemps demandé, en écrivant ce guide, ce qui se passait précisément dans cette minute.

Je crois aujourd’hui que ce qui se passait, c’était la reconnaissance. Le directeur artistique ne choisissait pas un visage. Il reconnaissait, dans ce visage, quelque chose qu’il cherchait sans le savoir. Sa culture visuelle, ses lectures, ses films, ses peintures, s’étaient sédimentés en lui jusqu’à former un pressentiment. La femme qui entrait validait ce pressentiment.

Ce que permet Wan 2.7, c’est d’inverser le flux. Au lieu d’attendre qu’un visage se présente et de le reconnaître, on décrit le pressentiment et on fait émerger le visage. C’est le même geste, dans l’autre sens.

Mais le pressentiment, lui, reste humain. Il se construit en regardant Ingres, Penn, Lindbergh, Pialat. Il se construit en tenant un carnet de casting depuis quinze ans. Il se construit en ayant passé mille heures dans des studios photo à regarder des visages.

L’IA n’entame pas cette culture. Elle la révèle, au contraire, comme ce qui fait toute la différence. Entre un directeur artistique qui connaît cette histoire et un opérateur qui génère à l’aveugle, l’écart, désormais, est visible à chaque plan.

Le casting n’a pas disparu. Il est simplement devenu ce qu’il aurait toujours dû être : une décision explicite, assumée, traçable. Une décision qui mérite son vocabulaire.


11. Annexes

11.1. Glossaire anatomique

Terme / ÉlémentDescription
Structure osseuseSilhouette globale du visage. Cinq options principales chez Wan 2.7 : ovale, ronde, carrée, rectangulaire, en cœur.
MâchoireÉlément terminal de la structure osseuse, déterminant dans la perception d’autorité ou de douceur.
PommettesSaillies osseuses sous les yeux. Peuvent être promptées comme « hautes », « basses », « discrètes », « marquées ».
OrbitesCavités osseuses accueillant les yeux. Profondeur variable (profondes, moyennes, superficielles) affectant fortement le rendu du regard en lumière latérale.
Morphologie oculaireForme globale des yeux. Principales options : en amande, ronds, en phénix, mi-clos.
Yeux en amandeForme allongée aux commissures alignées. Tradition méditerranéenne du portrait.
Yeux rondsForme arrondie aux commissures rapprochées. Tradition publicitaire familiale.
Yeux de phénixForme allongée aux commissures relevées. Tradition picturale chinoise.
Pores visiblesTexture cutanée naturelle. Marqueur principal du réalisme.
Grain de peauTexture générale de la peau. Peut être fin, moyen, marqué.
Rides d’expressionPlis cutanés produits par les expressions récurrentes (rire, concentration, sourire). Distinctes des rides d’âge.
Taches de rousseurPigmentation ponctuelle du visage. Élément d’individualisation.
AsymétrieDifférence subtile entre les deux moitiés du visage. Élément de crédibilité anatomique.
Signe distinctifTrait anatomique unique (tache de naissance, cicatrice, grain de beauté) servant à individualiser un personnage sur plusieurs plans.
Grille 3×3Arrangement de neuf images d’un même visage sous différents angles et lumières, utilisé comme référence multi-vues.
Identity driftDérive progressive de l’identité d’un personnage entre plusieurs plans générés. Phénomène contré par la grille 3×3.
Fiche de casting synthétiqueDocument structuré regroupant les spécifications anatomiques et la grille 3×3 d’un personnage synthétique, réutilisable sur toute une production.
Thousand FacesTerme désignant la fonction de personnalisation anatomique granulaire de Wan 2.7.
Casting anatomiquePratique de direction consistant à spécifier un visage par ses caractéristiques anatomiques précises plutôt que par des qualificatifs esthétiques.
Prompt anatomiquePrompt organisé autour des quatre catégories anatomiques (structure, yeux, peau, identité) plutôt qu’autour d’adjectifs.
Negative prompt anatomiqueFiltre explicite contre les défauts cutanés typiques de l’IA générative (peau plastique, lissage excessif, retouche artificielle).

11.2. Template de fiche de casting synthétique

Document à tenir pour chaque personnage synthétique récurrent. Une page.


11.4. Aller plus loin

Ce guide s’inscrit dans une série de publications de CreativeAI.fr sur la direction créative à l’ère des modèles génératifs. CreativeAI.fr propose des programmes de formation certifiés finançables OPCO, construits autour de workflows réels et de cas concrets issus de production.

Wan.video
Wan 2.7-Image Creation Guide
Tongyi Lab
TinEye



formations IA

Le studio de production 360° : de la photo statique à la vidéo dynamique avec l’IA Google

Durée : 2 jours (14h). Public : Responsables E-commerce, Directeurs Marketing / Communication.

Réinventer son processus créatif avec l’IA générative

Durée : 5 jours (35h). Public : DA, Graphistes, designers. Durée : 5 jours (35h).

Gemini & Nano Banana 2 : du brief à l’image finale

Durée : 1 jour (7h). Public : Graphistes, Designers, Directeurs Artistiques

Adobe Firefly, le studio IA complet (image, vidéo et audio)

Durée : 1 jour (7h). Public : Content creators.

Décuplez vos capacités avec l’IA : formation prompting expert, assistants & automatisation

Durée : 1 jour (7h). Public : Responsables E-commerce, Directeurs Marketing / Communication.

Prompting vidéo : de l’idée à l’écran avec l’IA générative

Durée : 2 jours (14h). Public : DA, Graphistes.

Google Flow & Veo : l’orchestration cinématographique IA

Durée : 2 jours (14h). Public : DA, Réalisateurs, Motion designers.