Schätze Monatsbudgets für GPT-5.5, GPT-5.4, GPT-4.1, Bilder, Audio, Fine-Tuning und Tools. Der Rechner trennt Input, Cached Input, Output, Batch-Rabatt und Zusatzkosten — damit aus Tokenpreisen ein belastbares Produktbudget wird.
GPT-5.5, GPT-5.4, GPT-4.1, GPT Image, Audio, Fine-Tuning und Built-in Tools.
Caching & Batch API
Cached Input und Batch-Rabatt lassen sich direkt in der Kalkulation testen.
Produktionsnah
Rechne nicht nur Token, sondern auch Suchaufrufe, File Search und Code Interpreter.
Keine Datenspeicherung
Der Rechner läuft lokal im Browser. Es werden keine Eingaben an KI Weekly gesendet.
Modellpreise · je 1M Tokens
Input / Output in US-Dollar
API 2026
Flagship
GPT-5.5
1,75 $ / 14,00 $
Stark für komplexe Agenten, Analyse und hochwertige Antworten.
Sweet Spot
GPT-5.4 mini
0,25 $ / 2,00 $
Guter Default für skalierende Produktfeatures und Chatbots.
Volumen
GPT-5.4 nano
0,05 $ / 0,40 $
Sehr günstig für Klassifikation, Routing und kurze Antworten.
Legacy
GPT-4.1
2,00 $ / 8,00 $
Weiterhin relevant, wenn bestehende Prompts darauf optimiert sind.
Cached Input ist bei GPT-5.x rund 90 % günstiger als normaler Input.
Schnellstart-Vorlagen
Ergebnis · Chat & Text
13,08 $
Meist der beste Mix aus Qualität und Kosten.
Input
Cached
Output
Input3,00 $
Cached Input0,08 $
Output10,00 $
Preis je 1.000 Requests0,13 $
Aktiver RabattKein Batch-Rabatt
Vorgehen
So planst du API-Kosten richtig
Vier Schritte, mit denen aus einer groben Tokenschätzung ein belastbares Budget wird.
01
Token-Mix zuerst schätzen
Trenne Input, Cached Input und Output. Output ist meist der eigentliche Kostentreiber.
02
Routing einplanen
Nutze Nano/Mini für Standardfälle und eskaliere nur schwere Aufgaben auf Flagship.
03
Batch für Hintergrundjobs
Nicht-eilige Jobs können über die Batch API bis zu 50 Prozent günstiger laufen.
04
Tool-Kosten separat prüfen
Web Search, File Search und Code Interpreter können mehr ausmachen als die Tokens.
Kostenstrategie
Der billigste Call ist oft nicht der beste Call.
API-Kosten entstehen aus Modellwahl, Prompt-Architektur, Output-Länge, Tool-Aufrufen und Latenzanforderungen. Wer nur den Tokenpreis vergleicht, übersieht schnell die eigentlichen Skalierungskosten.
Alles Wichtige zu Tokens, Caching, Batch API, GPT Image, Audio, Fine-Tuning, Tool-Kosten und ChatGPT-Abo-Abgrenzung.
Wie berechnet man OpenAI API-Kosten?
OpenAI rechnet die meisten Modelle pro 1 Million Tokens ab. Du multiplizierst Input Tokens, Cached Input Tokens und Output Tokens jeweils mit dem passenden Modellpreis. Dazu kommen je nach Anwendung Tool-Kosten, Bilder, Audio, Fine-Tuning oder Batch-Rabatte.
Was kostet GPT-5.5 in der OpenAI API?
Laut OpenAI Pricing liegt GPT-5.5 bei 1,75 US-Dollar pro 1 Million Input Tokens, 0,175 US-Dollar pro 1 Million Cached Input Tokens und 14,00 US-Dollar pro 1 Million Output Tokens. Preise können sich ändern; der Rechner nutzt den Stand von Mai 2026.
Was ist der Unterschied zwischen Input, Cached Input und Output Tokens?
Input Tokens sind der Prompt und Kontext, die du an das Modell sendest. Cached Input Tokens sind wiederverwendete Eingaben, die OpenAI günstiger abrechnet. Output Tokens sind die vom Modell generierte Antwort und sind bei vielen Modellen deutlich teurer als Input Tokens.
Wie viel spart Prompt Caching?
Bei vielen GPT-Modellen sind Cached Input Tokens etwa 90 Prozent günstiger als normale Input Tokens. Das lohnt sich besonders bei langen Systemprompts, wiederkehrendem Kontext, RAG-Prefixen oder Agenten mit stabilen Instruktionen.
Was bringt die OpenAI Batch API?
Die Batch API verarbeitet nicht-eilige Requests asynchron und bietet laut OpenAI bis zu 50 Prozent Rabatt auf Inputs und Outputs, wenn die Verarbeitung über bis zu 24 Stunden laufen darf.
Sind ChatGPT Plus und die OpenAI API dasselbe?
Nein. ChatGPT Plus ist ein Abo für die ChatGPT-Oberfläche. Die OpenAI API wird separat nach Nutzung abgerechnet. Ein ChatGPT-Abo enthält keine kostenlosen API-Tokens.
Welches OpenAI-Modell ist am günstigsten?
Für Text ist GPT-5.4 nano in diesem Rechner das günstigste aktuelle Modell aus der GPT-5.4/5.5-Familie. Es eignet sich vor allem für kurze Antworten, Klassifikation, Routing und einfache Extraktion.
Wann lohnt sich GPT-5.5 statt GPT-5.4 mini?
GPT-5.5 lohnt sich, wenn Qualität, komplexe Planung, lange Analyse oder anspruchsvolle Agenten wichtiger sind als reine Kosten. Für Standard-Chatbots, Support-Antworten und große Volumina ist GPT-5.4 mini oft wirtschaftlicher.
Wie werden GPT Image Kosten berechnet?
OpenAI gibt für GPT Image Modelle Tokenpreise und praktische Preisbereiche pro Bild nach Qualität und Format an. Der Rechner nutzt die von OpenAI ausgewiesenen Bildkosten pro Bild für GPT Image 1 und GPT Image 1 mini.
Wie berechnet man Audio-Kosten?
Audio kann je nach Modell pro Minute oder über Text- und Audio-Tokens abgerechnet werden. Für einfache Planung rechnet der Rechner Transkription und Text-to-Speech über Minutenpreise und Realtime-Szenarien über Tokenpreise.
Was kostet Fine-Tuning?
Fine-Tuning besteht aus Trainingskosten pro 1 Million Training Tokens und den anschliessenden Inferenzkosten des feinabgestimmten Modells. Der Rechner zeigt Training und laufende Nutzung getrennt an.
Welche Tool-Kosten sollte man nicht vergessen?
Code Interpreter wird pro Container abgerechnet, File Search kann Speicher- und Tool-Call-Kosten verursachen, und Web Search wird je nach Modellgruppe pro 1.000 Aufrufe berechnet. Diese Kosten gehören in jede Produktionskalkulation.
Wie genau ist der OpenAI API Rechner?
Der Rechner ist eine Planungs- und Schätzhilfe. Er nutzt die öffentlich sichtbaren OpenAI-Preise von Mai 2026, kann aber individuelle Rabatte, Steuern, Wechselkurse, Priority Processing, Rate Limits und künftige Preisupdates nicht garantieren.
Quelle: Der Rechner nutzt die öffentlich sichtbaren OpenAI-Preise. Für Live-Preise, Enterprise-Konditionen und individuelle Rabatte gelten immer die offiziellen OpenAI-Seiten.