Claude Haiku 4.5 vs Gemini 2.5 Pro — Preços comparativos
Preços de API e detalhes do tokenizador lado a lado para Claude Haiku 4.5 (Anthropic) e Gemini 2.5 Pro (Google).
Preços comparativos
| Característica | Claude Haiku 4.5 | Gemini 2.5 Pro |
|---|---|---|
| Provedor | Anthropic | |
| Entrada (por 1M tokens) | $0.800 | $1.25 |
| Saída (por 1M tokens) | $4.00 | $10.00 |
| Cache de contexto | Sim — 90% de desconto em tokens em cache | Não |
| Desconto de API em lote | Não disponível | Não disponível |
| Janela de contexto | 200K tokens | 1M tokens |
| Tokenizador | Anthropic tokenizer | Gemini tokenizer |
Exemplo do mundo real
1.000 requisições de API por mês, cada uma com 500 tokens de entrada e 200 tokens de saída (500K de entrada + 200K de saída no total).
Claude Haiku 4.5
$1.2000
Entrada: $0.4000 +Saída: $0.8000
Gemini 2.5 Pro
$2.6250
Entrada: $0.6250 +Saída: $2.0000
Claude Haiku 4.5 é 54% mais barato para esta carga de trabalho — economizando $1.4250 por mês neste volume.
Perguntas frequentes
- Claude Haiku 4.5 é mais barato que Gemini 2.5 Pro?
- Sim, Claude Haiku 4.5 é mais barato para a carga de trabalho típica acima. Com $0.800/1M de entrada e $4.00/1M de tokens de saída, custa $1.2000 versus $2.6250 para Gemini 2.5 Pro — uma diferença de 54%. Os custos escalam linearmente, então cargas de trabalho maiores ampliam essa diferença.
- Qual é a janela de contexto de Claude Haiku 4.5 vs Gemini 2.5 Pro?
- Claude Haiku 4.5 suporta uma janela de contexto de 200K tokens. Gemini 2.5 Pro suporta uma janela de contexto de 1M tokens. Uma janela de contexto maior permite incluir mais texto — documentos, histórico de conversa ou código — em uma única chamada de API.
- Claude Haiku 4.5 ou Gemini 2.5 Pro suportam cache de contexto ou descontos em lote?
- Claude Haiku 4.5 supports context caching (90% off repeated tokens). It does not offer a batch API discount. Gemini 2.5 Pro does not support context caching. It does not offer a batch API discount.
Calcule custos para seu prompt real
Cole seu prompt na calculadora e obtenha contagens exatas de tokens usando o tokenizador real de cada modelo — tudo no seu navegador.
Abrir calculadora