OpenAI

GPT-4o mini : coût et marge brute par client

GPT-4o mini est le modèle rapide et bon marché d'OpenAI. Son faible prix au token en fait l'un des modèles les plus faciles à garder rentables par client, même à prix d'abonnement bas et usage élevé.

GPT-4o mini est assez bon marché pour que le coût par client soit presque une erreur d'arrondi à usage typique. Le risque n'est pas un seul gros utilisateur — c'est le volume : à grande échelle, même une fraction de cent par requête se cumule sur des millions d'appels.

Entrée

$0.15 /Mtok

Sortie

$0.6 /Mtok

Marge par client selon l'usage et le prix du plan

Comment la marge de GPT-4o mini tient à mesure que l'usage d'un client grimpe, sur les prix d'abonnement courants.

Usage / moisCoût LLM19 $/mois29 $/mois49 $/mois79 $/mois
Léger0,03 $US99.8%99.9%99.9%100%
Typique0,16 $US99.2%99.4%99.7%99.8%
Intense0,66 $US96.5%97.7%98.7%99.2%
Power user2,70 $US85.8%90.7%94.5%96.6%

Marge % par client à chaque prix de plan. Prix des tokens indicatifs, en date de 2026-06.

Sur les 0,17 $US qu'un client typique coûte avec GPT-4o mini, les tokens de sortie représentent 0,09 $US (53 %) et l'entrée 0,08 $US. La sortie est tarifée à 0.6 $/Mtok — 4× le tarif d'entrée — donc plus votre produit génère par requête, plus vite la marge d'un client s'effrite.

Exemple chiffré

Prenez un power user sur votre plan à 49 $/mois envoyant 8 M de tokens d'entrée / 2,5 M de sortie par mois. Sur GPT-4o mini, cela fait 2,70 $US en tokens — c'est encore confortable à 94,5 % (46,30 $US) — même un gros utilisateur vous laisse nettement dans le vert sur la plupart des prix de plan.

Comment garder GPT-4o mini rentable

  • Élaguez et mettez en cache le contexte d'entrée — longs prompts système et historique de chat renvoyé sont du coût pur et répété.
  • Plafonnez la longueur de sortie et arrêtez la génération tôt quand vous le pouvez : à environ 4× le prix d'entrée, chaque token généré en plus est là où GPT-4o mini fait le plus mal.
  • Routez les requêtes faciles vers un modèle moins cher et réservez GPT-4o mini aux tâches difficiles qui en ont vraiment besoin.
  • Posez une alerte de marge par client pour qu'un seul gros utilisateur ne glisse pas dans le rouge en silence.

Quand choisir GPT-4o mini

Choisissez GPT-4o mini pour les fonctionnalités à fort volume et sensibles à la latence, où une qualité « suffisante » garde les clients rentables. C'est le choix par défaut sûr pour les offres gratuites et tout ce que vous exécutez à chaque requête.

FAQ

Combien coûte GPT-4o mini par client ?
À un usage typique de 500 k tokens d'entrée / 150 k de sortie par client et par mois, GPT-4o mini coûte environ 0,16 $US par client (entrée 0.15/Mtok, sortie 0.6/Mtok).
GPT-4o mini est-il rentable pour un SaaS IA à 49 $/mois ?
À usage typique, oui — la marge est d'environ 99,7 % (48,84 $US par client). Elle s'érode quand l'usage grimpe ; les utilisateurs intenses et les power users sont là où GPT-4o mini peut devenir déficitaire.
Quelle est une bonne marge brute pour un SaaS IA utilisant GPT-4o mini ?
La plupart des produits IA visent une marge brute de 60 à 80 %. Avec GPT-4o mini à usage typique, vous êtes autour de 99,7 % sur un plan à 49 $ — confortable — mais votre marge globale dépend des gros utilisateurs, et c'est le chiffre à surveiller.
À partir de quel usage GPT-4o mini cesse-t-il d'être rentable sur un plan à 29 $ ?
Autour de 90,6 M d'entrée / 27,2 M de sortie par mois. Au-delà, un client à 29 $ vous coûte plus qu'il ne paie.
Comment réduire le coût de GPT-4o mini par client ?
Réduisez d'abord les tokens de sortie (les plus chers), mettez en cache ou élaguez le contexte d'entrée, routez les requêtes faciles vers un modèle moins cher, et surveillez le seuil de rentabilité — autour de 153,1 M d'entrée / 45,9 M de sortie, un client à 49 $ cesse d'être rentable.

Comparer ce modèle

Autres modèles

Termes clés