AI API Pricing 2026: GPT, Claude, Gemini — Cost per Token

AI API PricingCost per Token 2026

How much does it cost to use GPT, Claude, Gemini and other LLM APIs? Compare pricing per million tokens — input and output rates for every major model.

Last updated: July 17, 2026 • 614 APIs listed

614

APIs listed

188

With free tier

$0.019

Cheapest (input/1M)

$150.00

Most expensive (input/1M)

How to read the table: prices are per million tokens (input = what you send; output = the model's response). In English, 1,000 tokens ≈ 750 words ≈ 1 A4 page. Prices verified on each company's official pricing page.

Price per Million Tokens — Paid APIs

#	Model	Company	Input USD/1M	Output USD/1M	Context	Release
1	Mistral: Mistral Nemo	Mistral AI	$0.019	$0.030	131K	Jul 2024
2	Gemma 3n E4B Instruct	Google	$0.020	$0.040	—	Jun 2025
3	Sarvam 30B	Sarvam	$0.026	$0.110	—	Mar 2026
4	Qwen3.5 4B (Non-reasoning)	Alibaba	$0.030	$0.150	—	Mar 2026
5	Qwen3.5 4B (Reasoning)	Alibaba	$0.030	$0.150	—	Mar 2026
6	Granite 3.3 8B (Non-reasoning)	IBM	$0.030	$0.250	—	Apr 2025
7	Amazon: Nova Micro 1.0	Amazon	$0.035	$0.140	128K	—
8	Nova Micro	Amazon	$0.035	$0.140	—	Dec 2024
9	Cohere: Command R7B (12-2024)	Cohere	$0.037	$0.150	128K	—
10	Qwen: Qwen2.5 7B Instruct	Alibaba	$0.040	$0.100	33K	—
11	HyperNova 60B 2605	Multiverse Computing	$0.040	$0.140	—	May 2026
12	NVIDIA Nemotron Nano 9B V2 (Reasoning)	NVIDIA	$0.040	$0.160	—	Aug 2025
13	Sao10K: Llama 3 8B Lunaris	Sao10K	$0.040	$0.050	8K	—
14	Sarvam 105B (high)	Sarvam	$0.042	$0.170	—	Mar 2026
15	Arcee AI: Trinity Mini	Arcee AI	$0.045	$0.150	131K	—
16	Llama 3 8B Instruct	Meta	$0.045	$0.145	8K	Apr 2024
17	Granite 4.1 8B	IBM	$0.050	$0.100	—	Apr 2026
18	Llama 2 Chat 7B	Meta	$0.050	$0.250	—	Jul 2023
19	NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)	NVIDIA	$0.050	$0.200	262K	Dec 2025
20	NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)	NVIDIA	$0.050	$0.200	—	Dec 2025
21	NVIDIA Nemotron Nano 9B V2 (Non-reasoning)	NVIDIA	$0.050	$0.195	131K	Aug 2025
22	GPT-5 Nano	OpenAI	$0.050	$0.400	400K	Aug 2025
23	GPT-5 nano (minimal)	OpenAI	$0.050	$0.400	—	Aug 2025
24	gpt-oss-20b	OpenAI	$0.050	$0.200	131K	Aug 2025
25	Amazon: Nova Lite 1.0	Amazon	$0.060	$0.240	300K	—
26	Nova Lite	Amazon	$0.060	$0.240	—	Dec 2024
27	Gemma 3n 4B	Google	$0.060	$0.120	33K	May 2025
28	Granite 4.0 H Small	IBM	$0.060	$0.250	—	Sep 2025
29	MythoMax 13B	MythoMax 13B	$0.060	$0.060	4K	—
30	Baidu: ERNIE 4.5 21B A3B Thinking	Baidu	$0.070	$0.280	131K	—
31	GLM-4.7-Flash (Reasoning)	Z.ai	$0.070	$0.400	—	Jan 2026
32	ByteDance Seed: Seed 1.6 Flash	ByteDance Seed	$0.075	$0.300	262K	—
33	Gemini 2.0 Flash Lite	Google	$0.075	$0.300	1.0M	Feb 2025
34	Mistral: Mistral Small 3.2 24B	Mistral AI	$0.075	$0.200	128K	—
35	Nemotron 3 Nano Omni 30B A3B Reasoning	NVIDIA	$0.075	$0.300	—	Apr 2026
36	gpt-oss-safeguard-20b	OpenAI	$0.075	$0.300	131K	Oct 2025
37	Qwen: Qwen3 30B A3B Thinking 2507	Alibaba	$0.080	$0.400	131K	—
38	Tongyi DeepResearch 30B A3B	Tongyi DeepResearch 30B A3B	$0.090	$0.450	131K	—
39	Qwen3.5 Omni Flash	Alibaba	$0.100	$0.800	—	Mar 2026
40	Olmo 3 7B Instruct	Allen Institute for AI	$0.100	$0.200	—	Nov 2025
41	ByteDance: UI-TARS 7B	ByteDance	$0.100	$0.200	128K	—
42	Gemini 2.5 Flash Lite	Google	$0.100	$0.400	1.0M	Jun 2025
43	Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning)	Google	$0.100	$0.400	—	Sep 2025
44	Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)	Google	$0.100	$0.400	—	Sep 2025
45	Gemma 4 12B (Reasoning)	Google	$0.100	$0.300	—	Jun 2026
46	Ling 2.6 Flash	Inclusion AI	$0.100	$0.300	—	Apr 2026
47	Llama 3.1 8B Instruct	Meta	$0.100	$0.100	16K	Jul 2024
48	Llama 3.2 1B Instruct	Meta	$0.100	$0.100	60K	Sep 2024
49	Devstral Small (Jul '25)	Mistral	$0.100	$0.300	131K	Jul 2025
50	Ministral 3 3B	Mistral	$0.100	$0.100	—	Dec 2025
51	Mistral Small 3	Mistral	$0.100	$0.300	—	Jan 2025
52	Mistral Small 3.1	Mistral	$0.100	$0.300	—	Mar 2025
53	Mistral Small 3.2	Mistral	$0.100	$0.300	—	Jun 2025
54	Mistral: Mistral Small Creative	Mistral AI	$0.100	$0.300	33K	Dec 2025
55	Mistral: Voxtral Small 24B 2507	Mistral AI	$0.100	$0.300	32K	—
56	GPT-4.1 Nano	OpenAI	$0.100	$0.400	1.0M	Apr 2025
57	Reka Edge	Reka Edge	$0.100	$0.100	16K	—
58	Step 3.5 Flash	StepFun	$0.100	$0.300	—	Feb 2026
59	Step 3.5 Flash	StepFun	$0.100	$0.300	262K	Apr 2026
60	Apertus 8B Instruct	Swiss AI Initiative	$0.100	$0.200	—	Sep 2025
61	MiMo-V2-Flash (Reasoning)	Xiaomi	$0.100	$0.300	262K	Dec 2025
62	Z.ai: GLM 4 32B	Z.ai	$0.100	$0.100	128K	—
63	Mistral: Mistral 7B Instruct v0.1	Mistral AI	$0.110	$0.190	3K	—
64	Hy3-preview (Reasoning)	Tencent	$0.123	$0.430	262K	Apr 2026
65	Hy3-preview (Reasoning)	Tencent	$0.123	$0.430	262K	Apr 2026
66	Microsoft: Phi 4	Microsoft	$0.125	$0.500	16K	Dec 2024
67	Gemma 4 26B A4B	Google	$0.130	$0.400	262K	Apr 2026
68	Nous: Hermes 4 70B	Nous	$0.130	$0.400	131K	—
69	Hermes 4 - Llama-3.1 70B (Non-reasoning)	Nous Research	$0.130	$0.400	—	Aug 2025
70	Hermes 4 - Llama-3.1 70B (Reasoning)	Nous Research	$0.130	$0.400	—	Aug 2025
71	Nex AGI: DeepSeek V3.1 Nex N1	Nex AGI	$0.135	$0.500	131K	—
72	Baidu: ERNIE 4.5 VL 28B A3B	Baidu	$0.140	$0.560	30K	—
73	DeepSeek V4 Flash	DeepSeek	$0.140	$0.280	1.0M	Apr 2026
74	Gemma 4 31B	Google	$0.140	$0.400	262K	Apr 2026
75	Ling-flash-2.0	InclusionAI	$0.140	$0.570	—	Sep 2025
76	Ring-flash-2.0	InclusionAI	$0.140	$0.570	—	Sep 2025
77	NousResearch: Hermes 2 Pro - Llama-3 8B	NousResearch	$0.140	$0.140	8K	—
78	Tencent: Hunyuan A13B Instruct	Tencent	$0.140	$0.570	131K	—
79	MiMo-V2.5	Xiaomi	$0.140	$0.280	—	Apr 2026
80	Qwen: Qwen3 235B A22B Thinking 2507	Alibaba	$0.149	$1.50	131K	—
81	EssentialAI: Rnj 1 Instruct	EssentialAI	$0.150	$0.150	33K	—
82	Gemini 2.0 Flash	Google	$0.150	$0.600	1.0M	Feb 2025
83	Llama 3.2 3B Instruct	Meta	$0.150	$0.150	80K	Sep 2024
84	Ministral 3 8B	Mistral	$0.150	$0.150	—	Dec 2025
85	Mistral: Ministral 3 8B 2512	Mistral AI	$0.150	$0.150	262K	—
86	Mistral: Mistral Small 4	Mistral AI	$0.150	$0.600	262K	Mar 2026
87	GPT-4o-mini (2024-07-18)	OpenAI	$0.150	$0.600	128K	Jul 2024
88	GPT-4o-mini Search Preview	OpenAI	$0.150	$0.600	128K	Mar 2025
89	gpt-oss-120b	OpenAI	$0.150	$0.600	131K	Aug 2025
90	OpenAI: GPT-4o-mini	OpenAI	$0.150	$0.600	128K	Jul 2024
91	Solar Mini	Upstage	$0.150	$0.150	—	Jan 2024
92	TheDrummer: Rocinante 12B	TheDrummer	$0.170	$0.430	33K	—
93	GLM-4.5-Air	Z.ai	$0.170	$0.980	—	Jul 2025
94	Llama 4 Scout	Meta	$0.175	$0.625	10.0M	Apr 2025
95	Qwen: Qwen3 VL 8B Instruct	Alibaba	$0.180	$0.700	131K	Oct 2025
96	Qwen3 8B (Non-reasoning)	Alibaba	$0.180	$0.700	—	Apr 2025
97	Qwen3 8B (Reasoning)	Alibaba	$0.180	$2.10	—	Apr 2025
98	Qwen3 VL 8B (Reasoning)	Alibaba	$0.180	$2.10	—	Oct 2025
99	Arcee AI: Spotlight	Arcee AI	$0.180	$0.180	131K	—
100	Llama Guard 4 12B	Meta	$0.180	$0.180	164K	Apr 2025
101	Jamba 1.5 Mini	AI21 Labs	$0.200	$0.400	—	Aug 2024
102	Jamba 1.6 Mini	AI21 Labs	$0.200	$0.400	—	Mar 2025
103	Qwen: Qwen3 30B A3B Instruct 2507	Alibaba	$0.200	$0.800	262K	Apr 2025
104	Qwen: Qwen3 VL 30B A3B Instruct	Alibaba	$0.200	$0.800	131K	Oct 2025
105	Qwen3 30B A3B (Reasoning)	Alibaba	$0.200	$2.40	—	Apr 2025
106	Qwen3 30B A3B 2507 (Reasoning)	Alibaba	$0.200	$2.40	—	Jul 2025
107	Qwen3 30B A3B 2507 Instruct	Alibaba	$0.200	$0.800	—	Jul 2025
108	Qwen3 VL 30B A3B (Reasoning)	Alibaba	$0.200	$2.40	—	Oct 2025
109	MiniMax: MiniMax-01	MiniMax	$0.200	$1.10	1.0M	—
110	Ministral 3 14B	Mistral	$0.200	$0.200	—	Dec 2025
111	Mistral Small (Sep '24)	Mistral	$0.200	$0.600	—	Sep 2024
112	Mistral: Ministral 3 14B 2512	Mistral AI	$0.200	$0.200	262K	—
113	NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)	NVIDIA	$0.200	$0.600	—	Oct 2025
114	NVIDIA Nemotron Nano 12B v2 VL (Reasoning)	NVIDIA	$0.200	$0.600	—	Oct 2025
115	GPT-5.4 Nano	OpenAI	$0.200	$1.25	400K	Mar 2026
116	Reka Flash 3	Reka Flash 3	$0.200	$0.800	66K	Oct 2024
117	Step 3.7 Flash	StepFun	$0.200	$1.15	—	May 2026
118	Grok 4 Fast	xAI	$0.200	$0.500	2.0M	Sep 2025
119	Seed-OSS-36B-Instruct	ByteDance Seed	$0.210	$0.570	—	Aug 2025
120	Arcee AI: Trinity Large Thinking	Arcee AI	$0.220	$0.850	262K	—
121	Trinity Large Thinking	Arcee AI	$0.235	$0.875	—	Apr 2026
122	Qwen: Qwen2.5 VL 72B Instruct	Alibaba	$0.250	$0.750	32K	—
123	Qwen3 Omni 30B A3B (Reasoning)	Alibaba	$0.250	$0.970	—	Sep 2025
124	Qwen3 Omni 30B A3B Instruct	Alibaba	$0.250	$0.970	—	Sep 2025
125	Anthropic: Claude 3 Haiku	Anthropic	$0.250	$1.25	200K	Mar 2024
126	ByteDance Seed: Seed-2.0-Lite	ByteDance Seed	$0.250	$2.00	262K	—
127	Gemini 3.1 Flash Lite	Google	$0.250	$1.50	1.0M	May 2026
128	Gemini 3.1 Flash Lite Preview	Google	$0.250	$1.50	1.0M	Mar 2026
129	Google: Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)	Google	$0.250	$1.50	66K	Jun 2026
130	Inception: Mercury 2	Inception	$0.250	$0.750	128K	Feb 2026
131	Mistral 7B Instruct	Mistral	$0.250	$0.250	—	Sep 2023
132	NVIDIA Nemotron 3 Super 120B A12B (Reasoning)	NVIDIA	$0.250	$0.775	1.0M	Mar 2026
133	GPT-5 Mini	OpenAI	$0.250	$2.00	400K	Aug 2025
134	GPT-5 mini (minimal)	OpenAI	$0.250	$2.00	—	Aug 2025
135	GPT-5.1-Codex-Mini	OpenAI	$0.250	$2.00	400K	Nov 2025
136	DeepSeek V3.2 Exp	DeepSeek	$0.270	$0.410	164K	Sep 2025
137	Baidu: ERNIE 4.5 300B A47B	Baidu	$0.280	$1.10	123K	Jun 2025
138	DeepSeek V3.2	DeepSeek	$0.280	$0.420	164K	Dec 2025
139	DeepSeek V3.2 Exp (Non-reasoning)	DeepSeek	$0.280	$0.420	—	Sep 2025
140	DeepSeek V3.2 Exp (Reasoning)	DeepSeek	$0.280	$0.420	—	Dec 2025
141	Amazon: Nova 2 Lite	Amazon	$0.300	$2.50	1.0M	—
142	Nova 2.0 Lite (high)	Amazon	$0.300	$2.50	—	Oct 2025
143	Nova 2.0 Omni (low)	Amazon	$0.300	$2.50	—	Nov 2025
144	Nova 2.0 Omni (medium)	Amazon	$0.300	$2.50	—	Nov 2025
145	Nova 2.0 Omni (Non-reasoning)	Amazon	$0.300	$2.50	—	Nov 2025
146	Gemini 2.5 Flash	Google	$0.300	$2.50	1.0M	May 2025
147	Gemini 2.5 Flash Preview (Reasoning)	Google	$0.300	$2.50	—	May 2025
148	Nano Banana (Gemini 2.5 Flash Image)	Google	$0.300	$2.50	33K	Oct 2025
149	Ling-2.6-1T	Inclusion AI	$0.300	$2.50	—	Apr 2026
150	Ring-2.6-1T	InclusionAI	$0.300	$2.50	—	May 2026
151	Kwaipilot: KAT-Coder-Pro V2	Kwaipilot	$0.300	$1.20	256K	Mar 2026
152	MiniMax-M2	MiniMax	$0.300	$1.20	205K	Oct 2025
153	MiniMax-M3	MiniMax	$0.300	$1.20	1.0M	Jun 2026
154	MiniMax: MiniMax M2-her	MiniMax	$0.300	$1.20	66K	—
155	MiniMax: MiniMax M2.1	MiniMax	$0.300	$1.20	197K	Dec 2025
156	MiniMax: MiniMax M2.5	MiniMax	$0.300	$1.20	197K	Feb 2026
157	MiniMax: MiniMax M2.7	MiniMax	$0.300	$1.20	197K	Mar 2026
158	Mistral: Codestral 2508	Mistral AI	$0.300	$0.900	256K	—
159	Nous: Hermes 3 70B Instruct	Nous	$0.300	$0.300	131K	—
160	TheDrummer: Cydonia 24B V4.1	TheDrummer	$0.300	$0.500	131K	—
161	Grok 3 Mini	xAI	$0.300	$0.500	131K	Feb 2025
162	Grok 3 Mini Beta	xAI	$0.300	$0.500	131K	Apr 2025
163	GLM-4.6V (Non-reasoning)	Z.ai	$0.300	$0.900	—	Dec 2025
164	GLM-4.6V (Reasoning)	Z.ai	$0.300	$0.900	—	Dec 2025
165	Llama 3.2 11B Vision Instruct	Meta	$0.345	$0.345	131K	Sep 2024
166	Qwen3 14B (Non-reasoning)	Alibaba	$0.350	$1.40	—	Apr 2025
167	Qwen3 14B (Reasoning)	Alibaba	$0.350	$4.20	—	Apr 2025
168	Llama 4 Maverick	Meta	$0.350	$0.850	1.0M	Apr 2025
169	Mistral: Mistral Small 3.1 24B	Mistral AI	$0.350	$0.560	128K	—
170	DeepSeek V3	DeepSeek	$0.360	$0.890	131K	Dec 2024
171	Qwen3.5 Omni Plus	Alibaba	$0.400	$4.80	—	Mar 2026
172	Qwen3.7 Plus	Alibaba	$0.400	$1.60	—	Jun 2026
173	MiniMax: MiniMax M1	MiniMax	$0.400	$2.20	1.0M	—
174	Mistral: Devstral 2 2512	Mistral AI	$0.400	$2.00	262K	—
175	Mistral: Devstral Medium	Mistral AI	$0.400	$2.00	131K	Jul 2025
176	Mistral: Mistral Medium 3	Mistral AI	$0.400	$2.00	131K	May 2025
177	Mistral: Mistral Medium 3.1	Mistral AI	$0.400	$2.00	131K	Aug 2025
178	Llama Nemotron Super 49B v1.5 (Non-reasoning)	NVIDIA	$0.400	$0.400	—	Jul 2025
179	Llama Nemotron Super 49B v1.5 (Reasoning)	NVIDIA	$0.400	$0.400	—	Jul 2025
180	GPT-4.1 Mini	OpenAI	$0.400	$1.60	1.0M	Apr 2025
181	TheDrummer: UnslopNemo 12B	TheDrummer	$0.400	$0.400	33K	—
182	Baidu: ERNIE 4.5 VL 424B A47B	Baidu	$0.420	$1.25	123K	—
183	DeepSeek V4 Pro	DeepSeek	$0.435	$0.870	1.0M	Apr 2026
184	Xiaomi: MiMo-V2.5-Pro	Xiaomi	$0.435	$0.870	1.0M	Apr 2026
185	Qwen: Qwen3 Coder 30B A3B Instruct	Alibaba	$0.450	$2.25	160K	Jul 2025
186	Mistral: Mixtral 8x7B Instruct	Mistral AI	$0.450	$0.700	33K	Dec 2023
187	ReMM SLERP 13B	ReMM SLERP 13B	$0.450	$0.650	6K	—
188	Qwen2.5 72B Instruct	Alibaba	$0.475	$0.495	33K	Sep 2024
189	Llama Guard 3 8B	Meta	$0.480	$0.030	131K	Feb 2025
190	Qwen: Qwen3 Next 80B A3B Instruct	Alibaba	$0.500	$2.00	262K	Sep 2025
191	Qwen3 Next 80B A3B (Reasoning)	Alibaba	$0.500	$6.00	—	Sep 2025
192	Arcee AI: Coder Large	Arcee AI	$0.500	$0.800	33K	—
193	Command-R (Mar '24)	Cohere	$0.500	$1.50	—	Mar 2024
194	Gemini 3 Flash Preview (Non-reasoning)	Google	$0.500	$3.00	—	Dec 2025
195	Gemini 3 Flash Preview (Reasoning)	Google	$0.500	$3.00	—	Dec 2025
196	Google: Nano Banana 2 (Gemini 3.1 Flash Image)	Google	$0.500	$3.00	131K	Jun 2026
197	Nano Banana 2 (Gemini 3.1 Flash Image Preview)	Google	$0.500	$3.00	131K	Feb 2026
198	Magistral Small 1.2	Mistral	$0.500	$1.50	—	Sep 2025
199	Nex-N2-Pro	Nex AGI	$0.500	$2.50	262K	Jun 2026
200	GPT-3.5 Turbo	OpenAI	$0.500	$1.50	16K	May 2023
201	GPT-3.5 Turbo	OpenAI	$0.500	$1.50	—	Nov 2022
202	MiniMax M1 80k	MiniMax	$0.550	$2.20	—	Jun 2025
203	TheDrummer: Skyfall 36B V2	TheDrummer	$0.550	$0.800	33K	—
204	GLM-4.6 (Reasoning)	Z.ai	$0.550	$2.20	—	Sep 2025
205	Llama 3.1 70B Instruct	Meta	$0.560	$0.560	131K	Jul 2024
206	MoonshotAI: Kimi K2 0711	MoonshotAI	$0.570	$2.30	131K	—
207	GLM-4.6 (Non-reasoning)	Z.ai	$0.575	$2.20	—	Sep 2025
208	Llama 3.3 70B Instruct	Meta	$0.580	$0.710	131K	Dec 2024
209	Kimi K2	Moonshot AI	$0.585	$2.40	131K	Jul 2025
210	DeepSeek V3.1	DeepSeek	$0.590	$1.69	164K	Aug 2025
211	Kimi K2 Thinking	Kimi	$0.600	$2.50	262K	Nov 2025
212	MoonshotAI: Kimi K2 0905	MoonshotAI	$0.600	$2.50	262K	Sep 2025
213	MoonshotAI: Kimi K2.5	MoonshotAI	$0.600	$3.00	262K	Jan 2026
214	Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)	NVIDIA	$0.600	$1.80	—	Apr 2025
215	GPT Audio Mini	OpenAI	$0.600	$2.40	128K	Jan 2026
216	Writer: Palmyra X5	Writer	$0.600	$6.00	1.0M	—
217	GLM-4.5V (Non-reasoning)	Z.ai	$0.600	$1.80	—	Aug 2025
218	GLM-4.5V (Reasoning)	Z.ai	$0.600	$1.80	—	Aug 2025
219	GLM-4.7 (Reasoning)	Z.ai	$0.600	$2.20	—	Dec 2025
220	WizardLM-2 8x22B	Microsoft	$0.620	$0.620	66K	—
221	Gemma 2 27B	Google	$0.650	$0.650	8K	Jul 2024
222	Llama 3 70B Instruct	Meta	$0.650	$2.75	8K	Apr 2024
223	Sao10K: Llama 3.3 Euryale 70B	Sao10K	$0.650	$0.750	131K	—
224	QwQ 32B	Alibaba	$0.660	$1.00	—	Mar 2025
225	Nemotron 3 Ultra 550B A55B (Reasoning)	NVIDIA	$0.675	$2.67	1.0M	Jun 2026
226	Qwen: Qwen3 235B A22B Instruct 2507	Alibaba	$0.700	$2.80	262K	Jul 2025
227	Qwen: Qwen3 VL 235B A22B Instruct	Alibaba	$0.700	$2.80	262K	Sep 2025
228	Qwen: Qwen3 VL 32B Instruct	Alibaba	$0.700	$2.80	131K	Oct 2025
229	Qwen3 235B A22B (Reasoning)	Alibaba	$0.700	$8.40	—	Apr 2025
230	Qwen3 32B (Non-reasoning)	Alibaba	$0.700	$2.80	—	Apr 2025
231	Qwen3 32B (Reasoning)	Alibaba	$0.700	$8.40	—	Apr 2025
232	Qwen3 VL 235B A22B (Reasoning)	Alibaba	$0.700	$8.40	—	Sep 2025
233	Qwen3 VL 32B (Reasoning)	Alibaba	$0.700	$8.40	—	Oct 2025
234	DeepSeek: R1	DeepSeek	$0.700	$2.50	164K	May 2025
235	R1 Distill Llama 70B	DeepSeek	$0.700	$1.05	128K	Jan 2025
236	Hermes 3 - Llama-3.1 70B	Nous Research	$0.700	$0.700	—	Aug 2024
237	Arcee AI: Virtuoso Large	Arcee AI	$0.750	$1.20	131K	—
238	Mancer: Weaver (alpha)	Mancer	$0.750	$1.00	8K	—
239	GPT-5.4 Mini	OpenAI	$0.750	$4.50	400K	Mar 2026
240	AionLabs: Aion-2.0	AionLabs	$0.800	$1.60	131K	—
241	AionLabs: Aion-RP 1.0 (8B)	AionLabs	$0.800	$1.60	33K	—
242	AlfredPros: CodeLLaMa 7B Instruct Solidity	AlfredPros	$0.800	$1.20	4K	—
243	Amazon: Nova Pro 1.0	Amazon	$0.800	$3.20	300K	—
244	Nova Pro	Amazon	$0.800	$3.20	—	Dec 2024
245	Claude 3.5 Haiku	Anthropic	$0.800	$4.00	200K	Oct 2024
246	Morph: Morph V3 Fast	Morph	$0.800	$1.20	82K	—
247	Apertus 70B Instruct	Swiss AI Initiative	$0.820	$2.92	—	Sep 2025
248	Relace: Relace Apply 3	Relace	$0.850	$1.25	256K	—
249	Sao10K: Llama 3.1 Euryale 70B v2.2	Sao10K	$0.850	$0.850	131K	—
250	Arcee AI: Maestro Reasoning	Arcee AI	$0.900	$3.30	131K	—
251	Morph: Morph V3 Large	Morph	$0.900	$1.90	262K	—
252	Kimi K2.7 Code	Kimi	$0.950	$4.00	—	Jun 2026
253	MoonshotAI: Kimi K2.6	MoonshotAI	$0.950	$4.00	262K	Apr 2026
254	Claude 4.5 Haiku (Reasoning)	Anthropic	$1.00	$5.00	—	Oct 2025
255	Claude Haiku 4.5	Anthropic	$1.00	$5.00	200K	Oct 2025
256	Mistral Small (Feb '24)	Mistral	$1.00	$3.00	—	Feb 2024
257	Nous: Hermes 3 405B Instruct	Nous	$1.00	$1.00	131K	—
258	Nous: Hermes 4 405B	Nous	$1.00	$3.00	131K	—
259	Hermes 4 - Llama-3.1 405B (Non-reasoning)	Nous Research	$1.00	$3.00	—	Aug 2025
260	Hermes 4 - Llama-3.1 405B (Reasoning)	Nous Research	$1.00	$3.00	—	Aug 2025
261	GPT-5.6 Luna (high)	OpenAI	$1.00	$6.00	—	Jul 2026
262	GPT-5.6 Luna (low)	OpenAI	$1.00	$6.00	—	Jul 2026
263	GPT-5.6 Luna (max)	OpenAI	$1.00	$6.00	1.1M	Jul 2026
264	GPT-5.6 Luna (medium)	OpenAI	$1.00	$6.00	—	Jul 2026
265	GPT-5.6 Luna (Non-reasoning)	OpenAI	$1.00	$6.00	—	Jul 2026
266	GPT-5.6 Luna (xhigh)	OpenAI	$1.00	$6.00	—	Jul 2026
267	OpenAI: GPT-5.6 Luna Pro	OpenAI	$1.00	$6.00	1.1M	Jul 2026
268	Relace: Relace Search	Relace	$1.00	$3.00	256K	—
269	Grok Build 0.1 0616	xAI	$1.00	$2.00	—	—
270	xAI: Grok Build 0.1	xAI	$1.00	$2.00	256K	May 2026
271	GLM-5 (Non-reasoning)	Z.ai	$1.00	$3.20	—	Feb 2026
272	GLM-5 (Reasoning)	Z.ai	$1.00	$3.20	203K	Feb 2026
273	o3 Mini	OpenAI	$1.10	$4.40	200K	Jan 2025
274	o3 Mini High	OpenAI	$1.10	$4.40	200K	Jan 2025
275	o4 Mini	OpenAI	$1.10	$4.40	200K	Apr 2025
276	o4 Mini High	OpenAI	$1.10	$4.40	200K	Apr 2025
277	DeepSeek V3 0324	DeepSeek	$1.14	$1.25	—	Mar 2025
278	Qwen3 Max (Preview)	Alibaba	$1.20	$6.00	—	Sep 2025
279	Qwen3 Max Thinking (Preview)	Alibaba	$1.20	$6.00	—	Nov 2025
280	Llama 3.1 Nemotron 70B Instruct	NVIDIA	$1.20	$1.20	131K	Oct 2024
281	Nova 2.0 Pro Preview (medium)	Amazon	$1.25	$10.00	—	Nov 2025
282	Cogito v2.1 (Reasoning)	Deep Cogito	$1.25	$1.25	—	Nov 2025
283	Deep Cogito: Cogito v2.1 671B	Deep Cogito	$1.25	$1.25	128K	—
284	Gemini 2.5 Pro	Google	$1.25	$10.00	1.0M	Jun 2025
285	Gemini 2.5 Pro Preview (May' 25)	Google	$1.25	$10.00	—	May 2025
286	Gemini 2.5 Pro Preview 05-06	Google	$1.25	$10.00	1.0M	May 2025
287	Gemini 2.5 Pro Preview 06-05	Google	$1.25	$10.00	1.0M	Jun 2025
288	Muse Spark 1.1 (xhigh)	Meta	$1.25	$4.25	—	Jul 2026
289	GPT-5	OpenAI	$1.25	$10.00	400K	Aug 2025
290	GPT-5 (ChatGPT)	OpenAI	$1.25	$10.00	—	Aug 2025
291	GPT-5 (minimal)	OpenAI	$1.25	$10.00	—	Aug 2025
292	GPT-5 Chat	OpenAI	$1.25	$10.00	128K	Aug 2025
293	GPT-5 Codex	OpenAI	$1.25	$10.00	400K	Sep 2025
294	GPT-5.1	OpenAI	$1.25	$10.00	400K	Nov 2025
295	GPT-5.1 Chat	OpenAI	$1.25	$10.00	128K	Nov 2025
296	GPT-5.1-Codex	OpenAI	$1.25	$10.00	400K	Nov 2025
297	GPT-5.1-Codex-Max	OpenAI	$1.25	$10.00	400K	Dec 2025
298	Grok 4.20 Multi-Agent	xAI	$1.25	$2.50	2.0M	Mar 2026
299	Grok 4.3	xAI	$1.25	$2.50	1.0M	Apr 2026
300	Qwen3.6 Max Preview	Alibaba	$1.30	$7.80	—	Apr 2026
301	DeepSeek R1 (Jan '25)	DeepSeek	$1.35	$4.20	—	May 2025
302	Llama 3.2 Instruct 90B (Vision)	Meta	$1.38	$1.38	—	Sep 2024
303	GLM-5.1 (Non-reasoning)	Z.ai	$1.40	$4.40	—	Apr 2026
304	GLM-5.1 (Reasoning)	Z.ai	$1.40	$4.40	—	Apr 2026
305	GLM-5.2 (max)	Z.ai	$1.40	$4.40	—	Jun 2026
306	Sao10k: Llama 3 Euryale 70B v2.1	Sao10k	$1.48	$1.48	8K	—
307	Qwen3 Coder 480B A35B Instruct	Alibaba	$1.50	$7.50	—	Jul 2025
308	Gemini 3.5 Flash (minimal)	Google	$1.50	$9.00	—	May 2026
309	Google: Gemini 3.5 Flash	Google	$1.50	$9.00	1.0M	May 2026
310	Mistral: Mistral Medium 3.5	Mistral AI	$1.50	$7.50	262K	Apr 2026
311	DeepSeek V3.1 Terminus	DeepSeek	$1.64	$2.75	131K	Sep 2025
312	GPT-5.2	OpenAI	$1.75	$14.00	400K	Dec 2025
313	GPT-5.2-Codex	OpenAI	$1.75	$14.00	400K	Dec 2025
314	GPT-5.3 Chat	OpenAI	$1.75	$14.00	128K	Mar 2026
315	GPT-5.3-Codex	OpenAI	$1.75	$14.00	400K	Feb 2026
316	Inkling	Thinking Machines	$1.87	$4.68	—	Jul 2026
317	AI21: Jamba Large 1.7	AI21 Labs	$2.00	$8.00	256K	Jul 2025
318	Jamba 1.5 Large	AI21 Labs	$2.00	$8.00	—	Aug 2024
319	Jamba 1.6 Large	AI21 Labs	$2.00	$8.00	—	Mar 2025
320	Claude Sonnet 5	anthropic	$2.00	$10.00	1.0M	Jun 2026
321	Gemini 3 Pro Preview (high)	Google	$2.00	$12.00	—	Nov 2025
322	Gemini 3 Pro Preview (low)	Google	$2.00	$12.00	—	Nov 2025
323	Gemini 3.1 Pro Preview	Google	$2.00	$12.00	1.0M	Feb 2026
324	Gemini 3.1 Pro Preview Custom Tools	Google	$2.00	$12.00	1.0M	Feb 2026
325	Google: Nano Banana Pro (Gemini 3 Pro Image)	Google	$2.00	$12.00	66K	Jun 2026
326	Nano Banana Pro (Gemini 3 Pro Image Preview)	Google	$2.00	$12.00	66K	Nov 2025
327	Mistral Large 2 (Jul '24)	Mistral	$2.00	$6.00	131K	Jul 2024
328	Mistral Large 2 (Nov '24)	Mistral	$2.00	$6.00	—	Nov 2024
329	Magistral Medium 1.2	Mistral AI	$2.00	$5.00	—	Sep 2025
330	Mistral Large	Mistral AI	$2.00	$6.00	128K	Feb 2024
331	Mistral: Mixtral 8x22B Instruct	Mistral AI	$2.00	$6.00	66K	—
332	Mistral: Pixtral Large 2411	Mistral AI	$2.00	$6.00	131K	Nov 2024
333	GPT-4.1	OpenAI	$2.00	$8.00	1.0M	Apr 2025
334	o3	OpenAI	$2.00	$8.00	200K	Apr 2025
335	o4 Mini Deep Research	OpenAI	$2.00	$8.00	200K	Oct 2025
336	Perplexity: Sonar Deep Research	Perplexity	$2.00	$8.00	128K	—
337	Grok 4.5	xai	$2.00	$6.00	500K	Jul 2026
338	Grok 4.20	xAI	$2.00	$6.00	2.0M	Apr 2026
339	Grok 4.20 0309 (Reasoning)	xAI	$2.00	$6.00	—	Mar 2026
340	Qwen3.7 Max	Alibaba	$2.50	$7.50	—	May 2026
341	Amazon: Nova Premier 1.0	Amazon	$2.50	$12.50	1.0M	Apr 2025
342	Cohere: Command R+ (08-2024)	Cohere	$2.50	$10.00	128K	—
343	Inflection: Inflection 3 Pi	Inflection	$2.50	$10.00	8K	—
344	Inflection: Inflection 3 Productivity	Inflection	$2.50	$10.00	8K	—
345	GPT Audio	OpenAI	$2.50	$10.00	128K	Jan 2026
346	GPT-4o (2024-08-06)	OpenAI	$2.50	$10.00	128K	Aug 2024
347	GPT-4o (2024-11-20)	OpenAI	$2.50	$10.00	128K	Nov 2024
348	GPT-4o Audio	OpenAI	$2.50	$10.00	128K	Aug 2025
349	GPT-4o Search Preview	OpenAI	$2.50	$10.00	128K	Mar 2025
350	GPT-5 Image Mini	OpenAI	$2.50	$2.00	400K	Oct 2025
351	GPT-5.4	OpenAI	$2.50	$15.00	1.1M	Mar 2026
352	GPT-5.6 Terra (high)	OpenAI	$2.50	$15.00	—	Jul 2026
353	GPT-5.6 Terra (low)	OpenAI	$2.50	$15.00	—	Jul 2026
354	GPT-5.6 Terra (max)	OpenAI	$2.50	$15.00	1.1M	Jul 2026
355	GPT-5.6 Terra (medium)	OpenAI	$2.50	$15.00	—	Jul 2026
356	GPT-5.6 Terra (Non-reasoning)	OpenAI	$2.50	$15.00	—	Jul 2026
357	GPT-5.6 Terra (xhigh)	OpenAI	$2.50	$15.00	—	Jul 2026
358	OpenAI: GPT-4o	OpenAI	$2.50	$10.00	128K	Nov 2024
359	OpenAI: GPT-5.6 Terra Pro	OpenAI	$2.50	$15.00	1.1M	Jul 2026
360	Llama 3.1 Instruct 405B	Meta	$2.75	$6.50	—	Jul 2024
361	Mistral Medium	Mistral	$2.75	$8.10	—	Dec 2023
362	Claude 3 Sonnet	Anthropic	$3.00	$15.00	—	Mar 2024
363	Claude 3.5 Sonnet (June '24)	Anthropic	$3.00	$15.00	—	Jun 2024
364	Claude 3.5 Sonnet (Oct '24)	Anthropic	$3.00	$15.00	—	Oct 2024
365	Claude 3.7 Sonnet	Anthropic	$3.00	$15.00	200K	Feb 2025
366	Claude 4 Sonnet (Reasoning)	Anthropic	$3.00	$15.00	—	May 2025
367	Claude 4.5 Sonnet (Non-reasoning)	Anthropic	$3.00	$15.00	—	Sep 2025
368	Claude 4.5 Sonnet (Reasoning)	Anthropic	$3.00	$15.00	—	Sep 2025
369	Claude Sonnet 4	Anthropic	$3.00	$15.00	1.0M	May 2025
370	Claude Sonnet 4.5	Anthropic	$3.00	$15.00	1.0M	Sep 2025
371	Claude Sonnet 4.6	Anthropic	$3.00	$15.00	1.0M	Feb 2026
372	Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	$3.00	$15.00	—	Feb 2026
373	Claude Sonnet 4.6 (Non-reasoning, Low Effort)	Anthropic	$3.00	$15.00	—	Feb 2026
374	Command-R+ (Apr '24)	Cohere	$3.00	$15.00	—	Apr 2024
375	Kimi K3	Kimi	$3.00	$15.00	—	Jul 2026
376	Magnum v4 72B	Magnum v4 72B	$3.00	$5.00	16K	—
377	OpenAI: GPT-3.5 Turbo 16k	OpenAI	$3.00	$4.00	16K	Aug 2023
378	Perplexity: Sonar Pro Search	Perplexity	$3.00	$15.00	200K	—
379	Sao10K: Llama 3.1 70B Hanami x1	Sao10K	$3.00	$3.00	16K	—
380	Grok 3 Beta	xAI	$3.00	$15.00	131K	Apr 2025
381	Goliath 120B	Goliath 120B	$3.75	$7.50	6K	—
382	AionLabs: Aion-1.0	AionLabs	$4.00	$8.00	131K	—
383	Mistral Large 3	Mistral	$4.00	$12.00	—	Feb 2024
384	Grok 3	xAI	$4.00	$20.00	131K	Feb 2025
385	Claude Opus 4.5	Anthropic	$5.00	$25.00	200K	Nov 2025
386	Claude Opus 4.5 (Reasoning)	Anthropic	$5.00	$25.00	—	Nov 2025
387	Claude Opus 4.6	Anthropic	$5.00	$25.00	1.0M	Feb 2026
388	Claude Opus 4.6 (Adaptive Reasoning, Max Effort)	Anthropic	$5.00	$25.00	—	Feb 2026
389	Claude Opus 4.7	Anthropic	$5.00	$25.00	1.0M	Apr 2026
390	Claude Opus 4.8 (Adaptive Reasoning, Max Effort)	Anthropic	$5.00	$25.00	1.0M	May 2026
391	GPT Chat Latest	OpenAI	$5.00	$30.00	400K	May 2026
392	GPT-5.5	OpenAI	$5.00	$30.00	1.1M	Apr 2026
393	GPT-5.5 Instant (June 2026)	OpenAI	$5.00	$30.00	—	Jun 2026
394	GPT-5.5 Instant (May 2026)	OpenAI	$5.00	$30.00	—	May 2026
395	GPT-5.6 Sol (high)	OpenAI	$5.00	$30.00	—	Jul 2026
396	GPT-5.6 Sol (low)	OpenAI	$5.00	$30.00	—	Jul 2026
397	GPT-5.6 Sol (max)	OpenAI	$5.00	$30.00	1.1M	Jul 2026
398	GPT-5.6 Sol (medium)	OpenAI	$5.00	$30.00	—	Jul 2026
399	GPT-5.6 Sol (Non-reasoning)	OpenAI	$5.00	$30.00	—	Jul 2026
400	GPT-5.6 Sol (xhigh)	OpenAI	$5.00	$30.00	—	Jul 2026
401	OpenAI: GPT-4o (2024-05-13)	OpenAI	$5.00	$15.00	128K	May 2024
402	OpenAI: GPT-5.6 Sol Pro	OpenAI	$5.00	$30.00	1.1M	Jul 2026
403	Grok 4	xAI	$5.50	$27.50	256K	Jul 2025
404	GPT-5.4 Image 2	OpenAI	$8.00	$15.00	272K	Apr 2026
405	Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)	Anthropic	$10.00	$50.00	1.0M	Jun 2026
406	GPT-4 Turbo	OpenAI	$10.00	$30.00	128K	Nov 2023
407	GPT-4 Turbo Preview	OpenAI	$10.00	$30.00	128K	Jan 2024
408	GPT-5 Image	OpenAI	$10.00	$10.00	400K	Oct 2025
409	o3 Deep Research	OpenAI	$10.00	$40.00	200K	Oct 2025
410	OpenAI: GPT-4 Turbo (older v1106)	OpenAI	$10.00	$30.00	128K	Nov 2023
411	Claude 3 Opus	Anthropic	$15.00	$75.00	—	Mar 2024
412	Claude 4 Opus (Reasoning)	Anthropic	$15.00	$75.00	—	May 2025
413	Claude 4.1 Opus (Non-reasoning)	Anthropic	$15.00	$75.00	—	Aug 2025
414	Claude 4.1 Opus (Reasoning)	Anthropic	$15.00	$75.00	—	Aug 2025
415	Claude Opus 4	Anthropic	$15.00	$75.00	200K	May 2025
416	Claude Opus 4.1	Anthropic	$15.00	$75.00	200K	Aug 2025
417	GPT-5 Pro	OpenAI	$15.00	$120.00	400K	Oct 2025
418	o1	OpenAI	$15.00	$60.00	200K	Dec 2024
419	o1-preview	OpenAI	$16.50	$66.00	—	Sep 2024
420	o3 Pro	OpenAI	$20.00	$80.00	200K	Jun 2025
421	GPT-5.2 Pro	OpenAI	$21.00	$168.00	400K	Dec 2025
422	Claude Opus 4.6 (Fast)	Anthropic	$30.00	$150.00	1.0M	Apr 2026
423	Claude Opus 4.7 (Fast)	Anthropic	$30.00	$150.00	1.0M	May 2026
424	GPT-5.4 Pro	OpenAI	$30.00	$180.00	1.1M	Mar 2026
425	OpenAI: GPT-4	OpenAI	$30.00	$60.00	8K	Mar 2023
426	o1-pro	OpenAI	$150.00	$600.00	200K	Mar 2025

AI API Pricing Guide

How Token-Based Pricing Works

Most LLM APIs charge per token processed, split into two categories: input tokens (the text you send — your prompt, context, and history) and outputtokens (the model's generated response). Output pricing is typically 2–4× higher than input, as generation requires more compute.

In English, 1,000 tokens correspond to roughly 750 words. A full A4 page of text contains between 600 and 900 tokens.

Real-World Monthly Cost Example

Consider a company using the GPT-4o API to process 100 emails per day, with an average prompt of 800 tokens and a 300-token response. That's 110,000 tokens/day × 30 days = 3.3 million tokens/month. At $2.50/M input tokens and $10/M output:

Input: 2.4M tokens × $2.50/M = $6.00/mo
Output: 0.9M tokens × $10/M = $9.00/mo
Total: $15.00/mo

The same volume with Claude Haiku (~$0.25/M input) would cost only ~$1.73/mo — a significant saving when maximum quality isn't critical.

Strategies to Reduce API Costs

1. Pick the right model for each task: simple text classification can use Gemini Flash or Claude Haiku; reserve GPT-4o or Claude Opus for tasks that truly need advanced reasoning.

2. Compress your prompts: avoid repeating unnecessary context. Well-implemented RAG systems send only the relevant passages, not the entire document.

3. Cache responses: if the same prompt is sent repeatedly (e.g., product categorization), store results and reuse them. Providers like Anthropic offer prompt caching at a discount.

4. Use open-source models via third-party APIs: Groq, Together AI, and Fireworks serve models like Llama and Qwen at $0.01–$0.20/M tokens — 10–100× cheaper than proprietary frontier models.

Frequently Asked Questions about API Costs

How much does the GPT-4o API cost per token?

The GPT-4o API costs $2.50 per million input tokens and $10.00 per million output tokens (2026 pricing). For a business sending 1 million tokens per day, the monthly cost would be approximately $75 for input alone. Output tokens are 4× more expensive, so optimizing prompt length has a significant impact on cost.

What is the cheapest AI API available?

Open source models like Qwen, Llama and Gemma can be accessed via third-party APIs (Groq, Together AI, Fireworks) for fractions of a cent per million tokens — as low as $0.01–$0.10/M tokens. Among proprietary APIs, Gemini Flash and Claude Haiku are the most affordable at $0.08–$0.25/M input tokens.

What are tokens and how do I estimate my project cost?

Tokens are text units that LLMs process — in English, 1 token ≈ 4 characters. A standard A4 page has ~600–800 tokens. To estimate cost: (input tokens + output tokens) × price/1M tokens. Example: 500-token prompt + 300-token response = 800 tokens × model price.

Should I use the API or subscribe to ChatGPT Plus/Claude Pro?

For moderate personal use, a subscription ($20/month) is usually more economical. For heavy usage or product integration, the API is more flexible and scalable. The breakeven point typically occurs when your API token consumption exceeds the equivalent value of the monthly subscription.

How have AI API prices changed over time?

Prices have dropped dramatically: GPT-4 cost $30/M tokens in 2023; equivalent models now cost $2–5/M. The trend is continuous decline as competition increases. We update this table weekly — always verify official pricing before committing your budget.