Depuis fin août 2025, Google Gemini occupe la première place des applications gratuites sur l’App Store américain, devant ChatGPT. Le catalyseur de ce basculement : le modèle Gemini 2.5 Flash Image, surnommé « nano-banana » par la communauté pendant sa phase de test anonyme sur LMArena, où il avait été identifié comme nettement supérieur aux modèles concurrents en édition d’images avant même d’être officiellement attribué à Google. Analyse d’un changement de leadership qui semblait improbable il y a encore un an.
Nano-banana : ce qui distingue le modèle
Nano-banana est un modèle de génération et d’édition d’images piloté par texte. Sa particularité tient à quatre capacités qui, combinées, creusaient l’écart avec GPT-Image-1 et Flux à sa sortie :
- Cohérence multi-tours : capable de modifier une même image via plusieurs instructions successives sans dérive visuelle (conserver le même personnage, le même éclairage, la même palette).
- Édition localisée précise : ajout ou suppression d’éléments dans une zone spécifique sans déformer le reste de l’image, via une simple instruction textuelle.
- Fusion d’images multiples : combinaison de deux ou trois photos sources pour produire une composition unique, en respectant les proportions et les éclairages de chacune.
- Vitesse d’exécution : les temps de génération sont d’environ 2 à 4 secondes par image, contre 8 à 15 secondes pour GPT-Image-1 en haute qualité.
Le modèle est disponible gratuitement dans l’application Gemini (avec des quotas) et via l’API Gemini pour les développeurs, à environ 0,039 dollar par image générée — un tarif compétitif qui a accéléré son adoption par les outils tiers.
L’écart fonctionnel avec ChatGPT
Nano-banana n’est pas la seule raison de la bascule. Plusieurs fonctionnalités de Gemini sont devenues supérieures à celles de ChatGPT sur des cas d’usage grand public :
Custom Gems
Les Custom Gems permettent de créer un assistant spécialisé sur un cas d’usage précis (rédacteur, coach, tuteur), de le partager publiquement ou de l’intégrer dans Workspace. Fonctionnalité équivalente aux GPTs d’OpenAI, mais avec une intégration plus profonde aux produits Google (Docs, Sheets, Gmail). La possibilité de partager un Gem par lien sans forcer l’interlocuteur à avoir un compte représente un avantage pratique.
Intégration Chrome
Depuis septembre 2025, Gemini est intégré nativement dans Chrome Desktop. Un clic sur l’icône ouvre une fenêtre Gemini contextuelle qui analyse la page active, synthétise l’article en cours de lecture, répond à des questions sur le contenu affiché. ChatGPT propose l’équivalent via une extension, mais avec une friction installation et une intégration moins fluide.
Accès aux applications Google
Gemini peut consulter et modifier directement Gmail, Agenda, Drive, Docs. L’utilisateur peut demander « montre-moi les emails non lus de cette semaine », « ajoute ce rendez-vous dans mon agenda », « résume ce document Drive ». ChatGPT propose des connecteurs vers Google Workspace, mais la profondeur d’intégration est moindre.
Comparatif des fonctionnalités
| Fonctionnalité | Gemini 2.5 (nano-banana) | ChatGPT (GPT-5) |
|---|---|---|
| Génération d’images | Très rapide, édition multi-tours cohérente | Qualité esthétique supérieure, moins rapide |
| Intégration navigateur | Native dans Chrome | Extension tierce |
| Assistants personnalisés | Custom Gems, partage facilité | GPTs, écosystème plus mature |
| Raisonnement complexe | Bon, parfois en retrait sur benchmarks math/code | Référence sur raisonnement, plus lent |
| Écriture longue | Bonne, ton générique par défaut | Nuances stylistiques plus fines |
| Accès écosystème Google | Gmail, Drive, Docs, Agenda natifs | Via connecteurs |
| Prix grand public | Gratuit avec quotas / 19,99 € Advanced | Gratuit avec quotas / 20 $ Plus |
Un basculement relatif, pas structurel
Le dépassement dans les classements App Store ne signifie pas que Gemini surpasse ChatGPT sur tous les tableaux. Les benchmarks techniques (MMLU, HumanEval, GPQA Diamond) maintiennent ChatGPT en tête sur les tâches de raisonnement pur, de génération de code complexe et d’écriture éditoriale nuancée.
Ce que Google a gagné, c’est l’avantage sur un cas d’usage massif : la création et l’édition d’images grand public. Ce segment attire un volume d’utilisateurs supérieur à celui du raisonnement expert, d’où l’effet App Store. L’impact se mesurera plus tard sur les revenus d’abonnements Advanced : Gemini doit transformer cette pointe de téléchargements en adoption durable face à une base ChatGPT Plus déjà installée.
Les limites et points d’interrogation
Plusieurs signaux appellent à nuancer l’enthousiasme :
- Disponibilité : certaines fonctionnalités ne sont actives qu’aux États-Unis, d’autres arrivent avec plusieurs mois de retard en Europe. En France, l’intégration Chrome est disponible mais les Custom Gems partagés publiquement sont encore limités.
- Modération : nano-banana applique un filtre moins strict que les modèles précédents de Google pour préserver la créativité, ce qui a généré quelques polémiques sur des images ambigues. Les ajustements sont en cours.
- Watermarking : Google impose un watermark invisible (SynthID) sur toutes les images générées, détectable par les plateformes partenaires. Transparence utile, mais sujet de vigilance sur la propriété intellectuelle.
- Durabilité du lead : OpenAI prépare GPT-Image-2, Anthropic a annoncé une capacité image pour Claude 4.5. La fenêtre d’avance technique peut se refermer en quelques trimestres.
Impact pour les créateurs et entreprises
Pour les équipes qui produisent du contenu visuel, l’arrivée de nano-banana à ce niveau de qualité a trois conséquences pratiques :
- Les outils de design qui s’appuient sur l’API Gemini (Canva Magic Media, Figma AI, apps indépendantes) gagnent immédiatement en capacité sans effort d’intégration supplémentaire.
- Les flux de production créative (maquettes, moodboards, tests visuels) s’accélèrent d’un facteur 3 à 5 sur les étapes d’idéation, tout en maintenant la personnalisation manuelle pour les livrables finaux.
- La concurrence sur les modèles fait baisser les prix : le coût par image générée est passé de 0,08-0,10 $ (DALL-E 3, Midjourney) à 0,03-0,04 $ chez Google. Les budgets créa s’ajustent rapidement.
L’épisode illustre surtout la rapidité à laquelle la hiérarchie évolue dans le secteur des IA génératives. Un modèle peut passer de challenger à leader en quelques mois, puis être dépassé tout aussi vite. Pour les utilisateurs et les entreprises, l’enjeu n’est plus de choisir un fournisseur unique mais de rester agile face à un écosystème qui se recompose trimestre après trimestre.

