Whisk, le nouvel outil IA de Google pour générer des visuels uniques

[ad_1]

Google a lancé Whisk, un générateur d’images basé sur l’intelligence artificielle, dans le but de créer des visuels stylisés à partir de photos ou illustrations existantes.

Tl;dr

Whisk est un générateur d’images basé sur l’intelligence artificielle qui transforme des visuels existants en nouvelles créations.
L’outil propose une interface simple avec des styles prédéfinis et permet une exploration rapide d’idées visuelles.
Le mode avancé de Whisk utilise des descriptions générées par l’IA, mais reste limité dans ses résultats pour le moment.

Une introduction simple et accessible

Whisk est un projet Google Labs qui permet aux utilisateurs de créer des images en utilisant une image existante comme point de départ. L’outil ne vise pas à créer une réplique exacte de l’image de départ, mais plutôt à capturer son « essence », ce qui le rend plus adapté à des visualisations rapides ou à des idées créatives. En ouvrant Whisk, les utilisateurs sont accueillis par une interface minimaliste, avec quelques options de personnalisation. Cela permet de se concentrer sur l’essentiel : une interface simple, rapide et intuitive, idéale pour des explorations visuelles.

Des styles prédéfinis pour stimuler la création

L’outil propose trois styles prédéfinis pour commencer : « sticker », « enamel pin » et « plushie ». Ces choix semblent délibérés, offrant des visuels aux contours plus nets, idéaux pour des représentations simples et stylisées. Ces trois styles permettent de visualiser rapidement des concepts sans se soucier des détails complexes. Par exemple, l’image générée d’un « Wilford Brimley plushie » illustre parfaitement comment Whisk fonctionne dans son cadre actuel : un rendu visuel rapide, mais pas une reproduction exacte de l’image de départ.

L’éditeur avancé pour plus de contrôle

Whisk inclut également un mode « avancé » où les utilisateurs peuvent partir de zéro, choisir des catégories comme le sujet, la scène et le style, et affiner les détails avec du texte. Cependant, ce mode n’a pas encore donné des résultats tout à fait satisfaisants dans sa version actuelle. Par exemple, lorsqu’un utilisateur demande une image d’une scène spécifique, l’outil peut générer un résultat qui semble vaguement lié à la demande, mais avec des détails inattendus ou incohérents. Ce décalage montre les limitations de l’outil, qui ne produit pas encore de contenu prêt pour la production.

Une technologie puissante mais limitée

Le fonctionnement de Whisk repose sur deux modèles d’IA de Google : Gemini, qui génère une description détaillée de l’image d’origine, et Imagen 3, l’outil qui génère l’image basée sur cette description. Cela explique pourquoi les images générées peuvent différer considérablement de l’image d’origine. Google précise que l’outil ne se contente pas de reproduire l’apparence exacte de l’image source, mais en tire quelques caractéristiques clés. Par exemple, la hauteur, le poids ou même la couleur de la peau peuvent changer, ce qui peut être une limitation pour certains utilisateurs. Pour l’instant, Whisk est disponible uniquement aux États-Unis, mais il pourrait se développer à l’international à l’avenir.

[ad_2]
Source link

17/12/2024

8 2 minutes de lecture

Afficher plus

Tl;dr

Une introduction simple et accessible

Des styles prédéfinis pour stimuler la création

L’éditeur avancé pour plus de contrôle

Une technologie puissante mais limitée

Liverpool, la grosse exigence d’Alexander-Arnold

Ronaldo, c’est officiel

Articles similaires

Comparatif Samsung Galaxy S25 Ultra vs iPhone 17 Pro : lequel choisir en 2026 ?

Découvrez les meilleures applications mobiles pour gérer votre budget en 2026 : suivi des dépenses, économies automatiques, conseils financiers et outils gratuits pour reprendre le contrôle de vos finances.

Les grandes tendances technologiques de 2026 : intelligence artificielle, 5G et cybersécurité

Chris Pratt aurait pu incarner Superman selon James Gunn, mais un obstacle l’en a empêché

Adblock détecté