Question 1

Wie berechnet man OpenAI API-Kosten?

Accepted Answer

OpenAI rechnet die meisten Modelle pro 1 Million Tokens ab. Du multiplizierst Input Tokens, Cached Input Tokens und Output Tokens jeweils mit dem passenden Modellpreis. Dazu kommen je nach Anwendung Tool-Kosten, Bilder, Audio, Fine-Tuning oder Batch-Rabatte.

Question 2

Was kostet GPT-5.6 in der OpenAI API?

Accepted Answer

Laut OpenAI Pricing liegt GPT-5.6 Sol bei 5,00 US-Dollar pro 1 Million Input Tokens, 0,50 US-Dollar pro 1 Million Cached Input Tokens und 30,00 US-Dollar pro 1 Million Output Tokens. GPT-5.6 Terra kostet 2,50 / 15,00 US-Dollar und GPT-5.6 Luna 1,00 / 6,00 US-Dollar (Input / Output). Preise können sich ändern, verbindlich ist immer das offizielle OpenAI Pricing.

Question 3

Was ist der Unterschied zwischen Input, Cached Input und Output Tokens?

Accepted Answer

Input Tokens sind der Prompt und Kontext, die du an das Modell sendest. Cached Input Tokens sind wiederverwendete Eingaben, die OpenAI günstiger abrechnet. Output Tokens sind die vom Modell generierte Antwort und sind bei vielen Modellen deutlich teurer als Input Tokens.

Question 4

Wie viel spart Prompt Caching?

Accepted Answer

Bei vielen GPT-Modellen sind Cached Input Tokens etwa 90 Prozent günstiger als normale Input Tokens. Das lohnt sich besonders bei langen Systemprompts, wiederkehrendem Kontext, RAG-Prefixen oder Agenten mit stabilen Instruktionen.

Question 5

Was bringt die OpenAI Batch API?

Accepted Answer

Die Batch API verarbeitet nicht-eilige Requests asynchron und bietet laut OpenAI bis zu 50 Prozent Rabatt auf Inputs und Outputs, wenn die Verarbeitung über bis zu 24 Stunden laufen darf.

Question 6

Sind ChatGPT Plus und die OpenAI API dasselbe?

Accepted Answer

Nein. ChatGPT Plus ist ein Abo für die ChatGPT-Oberfläche. Die OpenAI API wird separat nach Nutzung abgerechnet. Ein ChatGPT-Abo enthält keine kostenlosen API-Tokens.

Question 7

Welches OpenAI-Modell ist am günstigsten?

Accepted Answer

Für Text ist GPT-5.4 nano in diesem Rechner das günstigste aktuelle Modell aus der GPT-5.4/5.6-Familie. Es eignet sich vor allem für kurze Antworten, Klassifikation, Routing und einfache Extraktion.

Question 8

Wann lohnt sich GPT-5.6 Sol statt GPT-5.6 Luna?

Accepted Answer

GPT-5.6 Sol lohnt sich, wenn Qualität, komplexe Planung, lange Analyse oder anspruchsvolle Agenten wichtiger sind als reine Kosten. Für Standard-Chatbots, Support-Antworten und große Volumina ist GPT-5.6 Luna oft wirtschaftlicher.

Question 9

Wie werden GPT Image Kosten berechnet?

Accepted Answer

OpenAI gibt für GPT Image Modelle Tokenpreise und praktische Preisbereiche pro Bild nach Qualität und Format an. Der Rechner nutzt die von OpenAI ausgewiesenen Bildkosten pro Bild für GPT Image 2 und GPT Image 1 mini.

Question 10

Wie berechnet man Audio-Kosten?

Accepted Answer

Audio kann je nach Modell pro Minute oder über Text- und Audio-Tokens abgerechnet werden. Für einfache Planung rechnet der Rechner Transkription und Text-to-Speech über Minutenpreise und Realtime-Szenarien über Tokenpreise.

Question 11

Was kostet Fine-Tuning?

Accepted Answer

Fine-Tuning besteht aus Trainingskosten pro 1 Million Training Tokens und den anschliessenden Inferenzkosten des feinabgestimmten Modells. Der Rechner zeigt Training und laufende Nutzung getrennt an.

Question 12

Welche Tool-Kosten sollte man nicht vergessen?

Accepted Answer

Code Interpreter wird pro Container abgerechnet, File Search kann Speicher- und Tool-Call-Kosten verursachen, und Web Search wird je nach Modellgruppe pro 1.000 Aufrufe berechnet. Diese Kosten gehören in jede Produktionskalkulation.

Question 13

Wie genau ist der OpenAI API Rechner?

Accepted Answer

Der Rechner ist eine Planungs- und Schätzhilfe. Er nutzt die öffentlich sichtbaren OpenAI-Preise, kann aber individuelle Rabatte, Steuern, Wechselkurse, Priority Processing, Rate Limits und künftige Preisupdates nicht garantieren.

OpenAI API Rechner

So planst du API-Kosten richtig

Token-Mix zuerst schätzen

Routing einplanen

Batch für Hintergrundjobs

Tool-Kosten separat prüfen

Der billigste Call ist oft nicht der beste Call.

Häufige Fragen zu OpenAI API-Kosten