Google

Gemini 2.x Pro : coût et marge brute par client

Gemini Pro est le palier de Google à plus forte capacité. Une tarification milieu de gamme fait que l'usage typique reste rentable, mais les power users sur des plans bon marché peuvent tout de même faire basculer un client dans le rouge.

Gemini Pro est un palier milieu de gamme où l'usage typique reste sain, mais la sortie à 10 $/Mtok fait que les power users comptent. C'est un équilibre raisonnable entre capacité et coût pour des fonctionnalités produit générales.

Entrée

$1.25 /Mtok

Sortie

$10 /Mtok

Marge par client selon l'usage et le prix du plan

Comment la marge de Gemini 2.x Pro tient à mesure que l'usage d'un client grimpe, sur les prix d'abonnement courants.

Usage / moisCoût LLM19 $/mois29 $/mois49 $/mois79 $/mois
Léger0,43 $US97.7%98.5%99.1%99.5%
Typique2,13 $US88.8%92.7%95.7%97.3%
Intense8,50 $US55.3%70.7%82.7%89.2%
Power user35,00 $US-84.2%-20.7%28.6%55.7%

Marge % par client à chaque prix de plan. Prix des tokens indicatifs, en date de 2026-06.

Sur les 2,13 $US qu'un client typique coûte avec Gemini 2.x Pro, les tokens de sortie représentent 1,50 $US (70 %) et l'entrée 0,63 $US. La sortie est tarifée à 10 $/Mtok — 8× le tarif d'entrée — donc plus votre produit génère par requête, plus vite la marge d'un client s'effrite.

Exemple chiffré

Prenez un power user sur votre plan à 49 $/mois envoyant 8 M de tokens d'entrée / 2,5 M de sortie par mois. Sur Gemini 2.x Pro, cela fait 35,00 $US en tokens — c'est positif à 28,6 % (14,00 $US) — mais ça devient mince, et un plan à 19 $ le ferait passer négatif.

Comment garder Gemini 2.x Pro rentable

  • Élaguez et mettez en cache le contexte d'entrée — longs prompts système et historique de chat renvoyé sont du coût pur et répété.
  • Plafonnez la longueur de sortie et arrêtez la génération tôt quand vous le pouvez : à environ 8× le prix d'entrée, chaque token généré en plus est là où Gemini 2.x Pro fait le plus mal.
  • Routez les requêtes faciles vers un modèle moins cher et réservez Gemini 2.x Pro aux tâches difficiles qui en ont vraiment besoin.
  • Posez une alerte de marge par client pour qu'un seul gros utilisateur ne glisse pas dans le rouge en silence.

Quand choisir Gemini 2.x Pro

Choisissez Gemini Pro quand vous voulez un modèle général équilibré dans l'écosystème Google et que l'usage par client est modéré — en gardant un œil sur les power users de vos plans les moins chers.

FAQ

Combien coûte Gemini 2.x Pro par client ?
À un usage typique de 500 k tokens d'entrée / 150 k de sortie par client et par mois, Gemini 2.x Pro coûte environ 2,13 $US par client (entrée 1.25/Mtok, sortie 10/Mtok).
Gemini 2.x Pro est-il rentable pour un SaaS IA à 49 $/mois ?
À usage typique, oui — la marge est d'environ 95,7 % (46,87 $US par client). Elle s'érode quand l'usage grimpe ; les utilisateurs intenses et les power users sont là où Gemini 2.x Pro peut devenir déficitaire.
Quelle est une bonne marge brute pour un SaaS IA utilisant Gemini 2.x Pro ?
La plupart des produits IA visent une marge brute de 60 à 80 %. Avec Gemini 2.x Pro à usage typique, vous êtes autour de 95,7 % sur un plan à 49 $ — confortable — mais votre marge globale dépend des gros utilisateurs, et c'est le chiffre à surveiller.
À partir de quel usage Gemini 2.x Pro cesse-t-il d'être rentable sur un plan à 29 $ ?
Autour de 6,8 M d'entrée / 2,0 M de sortie par mois. Au-delà, un client à 29 $ vous coûte plus qu'il ne paie.
Comment réduire le coût de Gemini 2.x Pro par client ?
Réduisez d'abord les tokens de sortie (les plus chers), mettez en cache ou élaguez le contexte d'entrée, routez les requêtes faciles vers un modèle moins cher, et surveillez le seuil de rentabilité — autour de 11,5 M d'entrée / 3,5 M de sortie, un client à 49 $ cesse d'être rentable.

Comparer ce modèle

Autres modèles

Termes clés