💎 Custo-Benefício

Melhor Custo-Benefício em IARanking Score AA ÷ Preço 2026

Qual modelo de IA entrega mais inteligência por dólar gasto? Ranking calculado por AA Intelligence Index ÷ preço/1M tokens — modelos com alta qualidade e baixo custo de API ficam no topo. 30 modelos ranqueados.

Fórmula: (AA Intelligence Index × 10) ÷ preço_input/1M tokens. Fonte: Artificial Analysis, atualizado a cada 6h.

Top 5 — Melhor Custo-Benefício

Ranking Completo

30 modelos com AA Intelligence Index e preço disponíveis.

#ModeloEmpresaScore AA$/1M in$/1M outtok/sScore C/B
1Qwen3.5 0.8B (Reasoning)Alibaba10.5$$0.01$$0.05
10,500
2Qwen3.5 0.8B (Non-reasoning)Alibaba9.9$$0.01$$0.05105
9,900
3Qwen3.5 4B (Non-reasoning)Alibaba27.1$$0.03$$0.15195
9,033
4Qwen3.5 2B (Reasoning)Alibaba16.3$$0.02$$0.10
8,150
5Qwen3.5 4B (Reasoning)Alibaba22.6$$0.03$$0.15160
7,533
6GPT-5 NanoOpenAI26.8$$0.05$$0.40166
5,360
7NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)NVIDIA24.3$$0.06$$0.22139
4,418
8gpt-oss-20bOpenAI24.5$$0.06$$0.20273
4,083
9NVIDIA Nemotron Nano 9B V2 (Reasoning)NVIDIA14.8$$0.04$$0.16121
3,700
10LFM2-24B-A2BLiquidAI10.5$$0.03$$0.12135
3,500
11DeepSeek V4 FlashDeepSeek46.5$$0.14$$0.28
3,321
12Gemma 3n E4B InstructGoogle6.4$$0.02$$0.0449
3,200
13Amazon: Nova Micro 1.0Amazon10.3$$0.04$$0.14
2,943
14Nova MicroAmazon10.3$$0.04$$0.14357
2,943
15Nemotron 3 Nano Omni 30B A3B ReasoningNVIDIA21.4$$0.07$$0.30301
2,853
16Gemma 4 31BGoogle39.2$$0.14$$0.4019
2,800
17GPT-5 nano (minimal)OpenAI13.8$$0.05$$0.40163
2,760
18NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)NVIDIA13.2$$0.05$$0.2091
2,640
19NVIDIA Nemotron Nano 9B V2 (Non-reasoning)NVIDIA13.2$$0.05$$0.20139
2,640
20Ling 2.6 FlashInclusion AI26.2$$0.10$$0.30
2,620
21Qwen3.5 Omni FlashAlibaba25.9$$0.10$$0.80250
2,590
22Granite 4.1 8BIBM12.4$$0.05$$0.10113
2,480
23Gemma 4 26B A4B Google31.2$$0.13$$0.4088
2,400
24Granite 3.3 8B (Non-reasoning)IBM7.0$$0.03$$0.25446
2,333
25gpt-oss-120bOpenAI33.3$$0.15$$0.60429
2,220
26GPT-5.4 NanoOpenAI44.0$$0.20$$1.25153
2,200
27Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Google21.6$$0.10$$0.40
2,160
28Amazon: Nova Lite 1.0Amazon12.7$$0.06$$0.24204
2,117
29Nova LiteAmazon12.7$$0.06$$0.24219
2,117
30Mistral: Mistral Small 3.2 24BMistral AI15.1$$0.07$$0.20
2,013

Score C/B = (AA Intelligence Index × 10) ÷ preço_input/1M. Maior = melhor custo-benefício.Ver metodologia →

Como Interpretar o Ranking de Custo-Benefício

O ranking de custo-benefício não é um substituto para o ranking de qualidade absoluta. Um modelo no topo desta lista não é necessariamente “melhor” — é o que entrega mais qualidade relativa ao seu custo. Para projetos onde a qualidade máxima é crítica (diagnóstico médico, análise jurídica, código de produção), use oranking por inteligência absoluta.

Quando Custo-Benefício É o Critério Principal

Custo-benefício deve ser o critério dominante quando: (1) volume de tokens é alto (chatbots de WhatsApp com centenas de mensagens/dia); (2) a tarefa tem critérios de qualidade definidos e mensuráveis (respostas corretas em FAQs, extração de dados estruturados); (3) você tem múltiplos modelos passando no critério de qualidade mínimo. Nesses casos, o modelo mais barato que passa é a escolha correta — pagar a mais não adiciona valor.

O Custo Real: Além do Preço por Token

O preço por token é só parte do custo total. Inclua também: (1) custo de latência — modelos mais baratos tendem a ser mais lentos, impactando a experiência em tempo real; (2) custo de prompt engineering — modelos com menos capacidade requerem prompts mais elaborados; (3) custo de erros — um modelo barato que erra 10% mais pode custar mais em revisão humana; (4) custo de integração — APIs com menor documentação aumentam o custo de desenvolvimento.

Perguntas Frequentes

Como é calculado o custo-benefício?

(AA Intelligence Index × 10) ÷ preço_input/1M tokens. O Intelligence Index mede raciocínio + código + contexto de 0 a 100 (Artificial Analysis, atualizado a cada 6h); multiplicar por 10 escala a métrica; dividir pelo preço normaliza por custo. Maior score = mais inteligência por dólar.

Qual o modelo mais barato com boa qualidade?

Qwen3.5 0.8B (Reasoning) lidera em 2026 com Score AA 10.5 por $0.01/1M tokens. Modelos com alto AA Intelligence Index e baixo preço ficam no topo desta lista.

Vale pagar mais por um modelo mais caro?

Depende da tarefa. Para volume alto e tarefas simples, modelos baratos entregam 80% da qualidade por 10% do custo. Para análise complexa, o ganho de qualidade pode justificar o preço maior.