Elasticsearch Serverless

Pague somente pelo que usar, sem complicações de infraestrutura. Descubra a arte do possível com pesquisa de IA, ferramentas prontas para RAG e recursos de análise de dados.

Conheça grátis

Detalhamento de preços
	Detalhes dos preços Ingestão* Por VCU/hora A partir de US$ 0,14 Busca* Por VCU/hora A partir de US$ 0,09 Machine learning Por VCU/hora A partir de US$0,07 Armazenamento e Retenção Por GB retido por mês A partir de US$ 0,047 Egress Por GB transferido por mês A partir de US$0.05 por GB Os perfis vetoriais recebem 50 GB gratuitos Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground e AI Assistant* US$ 4,50 por milhão de tokens de entrada US$ 21 por milhão de tokens de saída Elastic Inference Service Por milhão de tokens A partir de US$ 0,08 O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho. Fluxos de trabalho Por execução 10.000 execuções grátis; depois, por apenas US$ 0,0108 Agent Builder Por execução 1.000 execuções grátis; depois, por apenas US$ 0,025
Ingestão*Por VCU-hora	A partir de US$ 0,14
Search*Por VCU-hora	A partir de US$0,09
Machine Learningpor VCU-hora	A partir de US$ 0,07
Armazenamento e RetençãoPor GB retido por mês	A partir de US$ 0,047
SaídaPor GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos	A partir de $0,05
Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground, Agent Builder e AI Assistant	US$ 4,50 por milhão de tokens de entrada US$ 21 por milhão de tokens de saída
Elastic Inference ServicePor milhão de tokens O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho.	A partir de US$ 0,08
Fluxo de trabalhoPor execução	10.000 execuções grátis, depois por apenas $0,0108
Agent BuilderPor execução	1.000 execuções grátis, depois por apenas US$ 0,025

*Esses preços entram em vigor em 1º de dezembro de 2024. Os preços dos fluxos de trabalho e do Agent Builder entram em vigor em 1º de maio de 2026. Visite nossa página de detalhes de preços na nuvem para obter mais informações sobre preços.

A medição de ingestão e retenção é baseada no volume de dados não compactados, normalizados e totalmente enriquecidos que você ingere no seu projeto serverless. Os volumes medidos serão muito maiores do que o tamanho dos dados "brutos" ou compactados "em trânsito."

Saiba mais

Tour do Elasticsearch Serverless

Integre facilmente seus dados ao Elasticsearch — independentemente de serem dados de aplicativos personalizados ou dados de aplicativos de terceiros.

Executar demonstração

Pacote de suporte

Suporte limitado está incluído na assinatura Standard; todos os outros preços de suporte são baseados na porcentagem do seu consumo. Para obter mais informações sobre o que está incluído em cada nível de suporte, acesse elastic.co/support.

Pacote de suporte
Nível de assinatura* do Elastic Cloud da organização	Padrão	Ouro	Platina	Empresarial
Suporte e faturamento total
Nível de suporte	Limitado	Base	Aprimorado	Premium
% de cobrança	Incluso	5%	10%	15%

*O nível de assinatura é selecionado durante a inscrição

Componentes de precificação do Elasticsearch Serverless

O Elasticsearch Serverless cobra separadamente por computação (VCUs com 1 GB de RAM) e armazenamento (GB), oferecendo preços escaláveis e orientados ao desempenho para atender às suas metas de latência e taxa de transferência.

Saiba mais

Unidade de Computação Virtual (VCU)
Existem três tipos especializados de VCU disponíveis para realizar tarefas específicas.
Ingestão VCUs: gerenciar a indexação de dados no Search AI Lake.
VCUs de buscar: Gerenciam buscas conduzidas pelo usuário, regras de alertas, agregação, transformações e consultas geoespaciais contra dados no Search AI Lake.
VCUs de Machine Learning: gerenciar inferência, cargas de trabalho ELSER e trabalhos de Machine Learning.
Uso de tokens
Utilização do Elastic Managed Large Language Model por milhão de tokens de entrada e saída: acesse recursos de IA prontos para uso sem precisar implantar nem operar um modelo de linguagem de grande porte (LLM).
Utilização dos modelos de IA da Jina cobrada por milhão de tokens: Use os modelos de IA da Jina em GPUs para busca semântica e casos de uso de reclassificação.
Provisionamento adaptativo de recursos
Os recursos de ingestão e computação de ML são dimensionados automaticamente para atender às demandas de carga de trabalho.

Os recursos de computação Search se ajustam dinamicamente às cargas de trabalho, garantindo desempenho e capacidade de resposta consistentes. Com as configurações flexíveis do Search Power, você tem controle sobre as alocações de recursos para atender às suas necessidades de desempenho. Uma base de recursos de busca está sempre provisionada para manter seus dados imediatamente consultáveis; períodos ociosos são cobrados a uma taxa reduzida.
Armazenamento e retenção
O Elasticsearch Serverless usa armazenamentos de objetos para armazenamento persistente no Search AI Lake.
Todos os dados, independentemente do tipo, atualidade e frequência de uso, podem ser acessados no Search AI Lake. O tamanho do Search AI Lake pode ser controlado com políticas de retenção de dados manuais ou gerenciadas.
O armazenamento é medido em GB.
Busque projetos sem mover seus dados
Independentemente de seus dados estarem separados por locatário, unidade de negócios ou região geográfica, você pode consultar instantaneamente projetos do Elastic Cloud Serverless como se fossem um só.
A utilização de VCUs (Unidades de Controle de Voz) para pesquisa pode aumentar neste projeto para suportar consultas federadas. Durante a fase de pré-visualização técnica, a transferência de dados CPS entre projetos não será cobrada.
Pesquisa e automação inteligentes
Crie e interaja com agentes de IA que entendem seus dados para melhorar a precisão e o desempenho e tomar medidas usando fluxos de trabalho.

A utilização do agente de IA é medida por meio de execuções do Agent Builder e execuções de fluxo de trabalho.

O mesmo Elasticsearch, só que mais fácil

Redimensionamento flexível para cargas de trabalho variáveis
O redimensionamento automático garante uma alocação transparente de recursos, sem a necessidade de ajustes manuais.
Disponibilidade de busca garantida
Os recursos de busca são redimensionados independentemente dos recursos de indexação para fornecer desempenho consistente e acesso ininterrupto aos dados.
Otimizações para melhorar o desempenho da busca
Aproveite as configurações integradas da plataforma Elasticsearch Serverless para otimizar o tempo de resposta e a experiência do usuário final para diferentes tipos de dados e casos de uso.
Crie experiências de busca com IA generativa
Forneça resultados de busca personalizados e eficientes com busca vetorial e modelos de linguagem treinados.
Crie ambientes de desenvolvimento e teste rapidamente
Simplifique os processos de desenvolvimento e implantação de software com o Elasticsearch Serverless.
Criado para confiabilidade
Com um Acordo de Nível de Serviço (SLA) de 99,95% de tempo de atividade mensal, o Elastic Cloud Serverless garante um alto padrão de disponibilidade, para que você possa focar suas aplicações com confiança.

Perguntas frequentes

Experimente o Elasticsearch Serverless gratuitamente

O que é o Elasticsearch Serverless?

Projetos serverless utilizam os componentes de núcleo da Elastic Stack, como Elasticsearch e Kibana, e são baseados na arquitetura Search AI Lake da Elastic, que separa computação e armazenamento. As operações de busca e indexação são separadas, o que oferece flexibilidade para redimensionar suas cargas de trabalho enquanto garante um alto nível de desempenho.

Aproveite os seguintes benefícios com o Elasticsearch Serverless:

Sem gestão. A Elastic gerencia o cluster subjacente da Elastic, então você pode focar seus dados. Em projetos serverless, a Elastic é responsável por atualizações automáticas, backups de dados e continuidade do negócio.
Autoescalável. Para atender aos seus requisitos de desempenho, o sistema se ajusta automaticamente às suas cargas de trabalho.
Armazenamento de dados otimizado. Seus dados são armazenados no Search Lake do seu projeto, que serve como um armazenamento econômico e eficiente. Uma camada de alto desempenho está disponível sobre o Search Lake para os dados mais consultados.
Pague pelo desempenho que você precisa. Pague pelos recursos de ingestão, busca e ML separadamente conforme necessário pelas cargas de trabalho que você executa.

Qual é a diferença entre o Elastic Cloud Serverless e o Elastic Cloud Hosted?

O Elastic Cloud é uma plataforma poderosa que atende a muitas necessidades de computação. Projetos serverless são criados especificamente para casos de uso, ao mesmo tempo em que oferecem uma experiência totalmente gerenciada com redimensionamento automático. Essa especialização e esse modelo operacional são o que diferencia o serverless hoje.

Como devo decidir se devo escolher o Elasticsearch Serverless ou o Elastic Stack Hosted?

O Elasticsearch Serverless está atualmente disponível em regiões selecionadas de provedores de serviços de nuvem, com alguns recursos ainda a serem disponibilizados no futuro. Estamos totalmente comprometidos em expandir nossos serviços serverless para mais regiões e provedores de serviços de nuvem. Recomendamos que você consulte a documentação para conferir a compatibilidade técnica, como segurança, conformidade e disponibilidade.

Como posso começar a usar o Elasticsearch Serverless?

É fácil começar a usar o Elasticsearch Serverless:

Crie projetos Elasticsearch Serverless no Console da Nuvem.
Escolha o tipo de projeto otimizado para o seu caso de uso que melhor atenda às suas necessidades.
Comece a aproveitar uma experiência de projeto otimizada para o seu caso de uso.

Posso migrar dados entre o Elasticsearch Serverless e o Elastic Cloud Hosted?

Recomendamos o envio de dados diretamente da sua aplicação ou usando clientes do Connector. Para o envio de dados em uma instância Elasticsearch existente, recomendamos o uso do Logstash para migrar grandes volumes.

Quais são as configurações do Search Power?

As configurações do Search Power permitem gerenciar os recursos computacionais para otimizar o desempenho da busca (taxa de transferência e latência) e controlar os custos. Existem três configurações de Search Power para projetos Elasticsearch Serverless. A configuração Performant já vem ativada e proporciona uma experiência de busca eficiente para dados de todos os tamanhos. É possível escolher uma das seguintes configurações:

Sob demanda: dimensionamento automático com base na carga de dados e de busca, com uma linha de base mínima mais baixa para o uso de recursos. Essa flexibilidade resulta em latência de consulta mais variável e taxa de transferência máxima reduzida.

Performant: oferece latência consistentemente baixa e dimensiona automaticamente para acomodar volumes de consultas moderadamente altos.

Alta disponibilidade: otimizado para cenários de alta disponibilidade, com escalonamento automático para manter a latência das consultas mesmo em volumes muito altos de consultas.

Quanto vou pagar*?

No Elasticsearch Serverless, você paga pelos recursos usados para lidar com suas cargas de trabalho e necessidades de desempenho. Temos alguns exemplos para dar uma ideia do que você pode pagar e de como pensar nos custos.

Exemplo 1 - ambiente de desenvolvimento com 2 GB de dados buscáveis, 1% de utilização de ingestão (15 minutos por dia), 8% de utilização de busca (2 horas por dia)

Sob demanda: US$ 24/mês
Desempenho: US$ 27/mês

Exemplo 2 - ambiente de produção com 20 GB de dados buscáveis, 5% de utilização de ingestão (1 hora por dia), 33% de utilização de busca (8 horas por dia)

Sob demanda: US$ 190/mês
Desempenho: US$ 210/mês

*As estimativas de preços fornecidas nos exemplos são apenas para fins ilustrativos. Os custos reais podem variar com base em fatores como tipo de dado, complexidade de consulta, padrões de tráfego, duração de uso e configurações específicas. Essas estimativas têm como objetivo ajudar você a entender possíveis cenários de preços, mas não devem ser usadas como custo final. Para cálculos precisos de custos, recomendamos monitorar seu uso.

Por que sou cobrado por VCUs do Search mesmo quando não estou rodando consultas?

O Elasticsearch Serverless mantém uma linha de base dos recursos de busca provisionados para seu projeto, para que seus dados permaneçam pesquisáveis sem atrasos desnecessários na primeira consulta após um período ocioso. Durante a busca ativa, você é cobrado pelos recursos completos utilizados; durante períodos ociosos, a cobrança cai para uma taxa reduzida, vinculada ao tamanho do seu conjunto de dados pronto para busca e à sua configuração do Search Power.

Para reduzir custos ociosos, você pode mudar o Search Power de Desempenho (padrão) para Sob demanda, o que reduz a linha de base ao custo de mais latência variável de consulta. As VCUs de ingestão, por outro lado, escalam totalmente para zero quando não há atividade de ingestão ocorrendo.

Como o Elastic Inference Service é cobrado?

A utilização é cobrada estritamente com base no volume de dados processados, medido em milhões de tokens. Este modelo baseado no uso permite que você redimensione os custos linearmente com sua capacidade de processamento, garantindo que você pague apenas pelos tokens efetivamente processados, e não por infraestrutura ou capacidade ociosa.

Como é feita a cobrança do Agent Builder?

O Agent Builder é cobrado com base nas execuções do Agent Builder. Uma execução é medida por cada interação concluída com um agente de IA (por exemplo, uma entrada e saída de chat). Interações mais complexas, medidas pelo número de tokens de entrada usados, serão contabilizadas como execuções adicionais (cada unidade de 50.000 tokens de entrada conta como uma execução adicional).

Exemplo 1: mensagem enviada ao agente de IA e o agente retorna uma resposta com sucesso. A interação usa 42.000 tokens de entrada, então isso equivale a 1 execução do agente.

Exemplo 2: mensagem enviada ao agente de IA e o agente retorna uma resposta com sucesso. A interação usa 325.000 tokens de entrada, então isso equivale a 7 execuções.

Exemplo 3: mensagem enviada ao agente de IA e o agente encontra um erro e não retorna uma resposta. Nenhuma execução é contabilizada.

Descubra tudo o que você pode fazer com o Elastic Cloud Serverless

Demonstração interativa
Veja o que o serverless oferece.
Confira a demonstração ao vivo
Documentação
Aprenda a criar, gerenciar e executar projetos serverless
Leia a documentação
Avaliação gratuita
Comece com pelos simples, orientados por solução e baseados no uso.
Iniciar avaliação gratuita

Engenharia de contexto

Banco de dados vetorial

Aplicativos baseados em busca

Logs

Proteção contra ameaças

Fluxos de trabalho

Elasticsearch

Kibana (Discover, Dashboards)

Elastic Agent Builder

AutoOps

Linguagem de consulta com barras verticais

Modelos de busca Jina AI

Elastic Cloud Serverless

Elastic Cloud Hosted

Elasticsearch autogerenciado

Busca para e-commerce

Busca para suporte ao cliente

Apps focados em buscas

Analítica de logs

Monitoramento de infraestrutura

Monitoramento da experiência digital

Monitoramento de desempenho do app

AIOps

Observabilidade do LLM

SIEM de última geração

Fluxos de trabalho para segurança

XDR e segurança de endpoint

IA para segurança

10x o valor dos seus dados

Provedor de serviços em nuvem

Ecossistema Elastic AI

Programa Search AI Partner

AV-Comparatives

Forrester Wave™ XDR

Líder do Magic Quadrant da Gartner

IDC MarketScape

Busca

Segurança

Observabilidade

Começar

Galeria de demonstrações

Downloads

Integrações

Documentos

Elastic Search Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Comunidade

Eventos

Webinars

Discussão

Treinamento

Suporte

Consultoria

Elasticsearch Serverless

Detalhes dos preços

Tour do Elasticsearch Serverless

Pacote de suporte

Componentes de precificação do Elasticsearch Serverless

Unidade de Computação Virtual (VCU)

Uso de tokens

Provisionamento adaptativo de recursos

Armazenamento e retenção

Busque projetos sem mover seus dados

Pesquisa e automação inteligentes

O mesmo Elasticsearch, só que mais fácil

Redimensionamento flexível para cargas de trabalho variáveis

Disponibilidade de busca garantida

Otimizações para melhorar o desempenho da busca

Crie experiências de busca com IA generativa

Crie ambientes de desenvolvimento e teste rapidamente

Criado para confiabilidade