Décryptage du pricing SaaS IA : le calcul de marge derrière le plan à 20 $/mois

Vrais prix publics, vrais tarifs de modèles, pure arithmétique : combien d’usage un plan IA à 20 $/mois peut s’offrir avant que la marge atteigne zéro — et quoi y faire.

7 min de lecture · Mis à jour le 2026-06-16

En 2026, l’abonnement IA grand public avait son chiffre magique : 20 $ par mois. ChatGPT Plus, Claude Pro, Perplexity Pro et Cursor Pro ont tous atterri là. C’est un prix net — mais sur un plan à prix fixe de 20 $/mois, l’usage en tokens de chaque client est un coût variable que vous portez. Alors, qu’achètent vraiment ces 20 $, et à partir de quand cessent-ils d’être rentables ?

Ceci est un décryptage du prix, pas des comptes de qui que ce soit. Nous ne connaissons ni le modèle réel d’aucune entreprise, ni son usage, ni ses tarifs négociés — alors nous faisons la seule chose que les chiffres publics permettent : le calcul du seuil de rentabilité. Étant donné un prix public et le tarif public des tokens d’un modèle, combien un client peut-il consommer avant que son coût n’égale ce qu’il paie ?

Ce que 20 $ achètent en tokens

Prenez le seul côté sortie — la partie la plus chère de toute facture LLM. À 20 $/mois, le volume de sortie au point mort est simplement 20 $ ÷ le tarif de sortie du modèle :

  • Sur Claude Sonnet (15 $/Mtok en sortie) : environ 1,3 M de tokens de sortie — à peu près un million de mots de texte généré.
  • Sur GPT-4o (10 $/Mtok en sortie) : environ 2,0 M de tokens de sortie.
  • Sur un modèle de raisonnement (20 $/Mtok en sortie) : environ 1,0 M de tokens de sortie — et les modèles de raisonnement génèrent aussi de longues chaînes de pensée cachées que vous payez.
  • Sur GPT-4o mini (0,60 $/Mtok en sortie) : environ 33 M de tokens de sortie — à peu près 25× la marge de manœuvre de Claude Sonnet pour les mêmes 20 $.

Et c’est la version généreuse : elle ignore totalement les tokens d’entrée. Ajoutez les prompts, le contexte et les documents récupérés qu’un vrai produit envoie à chaque requête, et chaque seuil de rentabilité ci-dessus baisse. Un power user sur un produit de code ou un agent peut brûler 1,3 M de tokens en quelques jours, pas en un mois.

Le modèle est le levier de la marge

Cet écart est toute l’histoire : le même plan à 20 $ est environ 25× plus indulgent sur GPT-4o mini que sur Claude Sonnet. C’est pourquoi le routage de modèles — un modèle bon marché pour les requêtes faciles, le premium seulement quand il le faut — est le plus gros levier sur la survie d’un plan IA à prix fixe face à ses gros utilisateurs. Choisissez le mauvais modèle par défaut et vos clients les plus actifs deviennent vos plus grosses pertes.

La preuve : GitHub a cligné des yeux

Si le prix fixe en IA fonctionnait toujours, les plus gros acteurs le garderaient. Ils ne l’ont pas fait. En juin 2026, GitHub a fait passer Copilot à la facturation à l’usage — chaque plan inclut désormais une dotation mensuelle d’AI Credits, avec un usage payant au-delà. Quand l’entreprise derrière l’un des produits de code IA les plus efficaces de la planète ajoute un compteur d’usage à un plan de 10 à 39 $/mois, c’est le signal le plus clair à ce jour : à grande échelle, prix fixe et usage IA intense ne coexistent pas sans un mécanisme de marge.

Quoi en faire

Vous n’avez pas à abandonner le prix fixe — mais vous devez l’instrumenter. Suivez la marge brute par client pour voir les gros utilisateurs avant qu’ils ne fassent mal ; connaissez le seuil de rentabilité de chaque plan ; routez le trafic facile vers un modèle moins cher ; et ajoutez des limites d’usage ou des paliers plus élevés pour les comptes qui dépassent le seuil de rentabilité. Le prix fixe, c’est bien — un prix fixe dont vous ne voyez pas l’intérieur, non.

Faites passer votre propre prix dans le calculateur gratuit — prix du plan en entrée, modèle et usage en entrée, marge en sortie — puis connectez Stripe et votre coût LLM avec MarginWard pour surveiller automatiquement la marge de chaque client.

Méthodologie : les prix sont des prix de liste publics en date de juin 2026 (ChatGPT Plus, Claude Pro, Perplexity Pro et Cursor Pro à 20 $/mois ; GitHub Copilot Pro à 10 $, Business à 19 $, Enterprise à 39 $). Les tarifs des modèles sont des prix publics indicatifs par Mtok. Seuil de rentabilité = prix ÷ tarif de sortie (sortie seule, une borne supérieure). Aucun chiffre ici n’est une affirmation sur l’usage, le modèle ou la marge réels d’une quelconque entreprise.

Sur le même thème