Elasticsearch Serverless
Pague somente pelo que usar, sem complicações de infraestrutura. Descubra a arte do possível com pesquisa de IA, ferramentas prontas para RAG e recursos de análise de dados.
Detalhes dos preçosIngestão*
A partir de US$ 0,14
Por VCU/hora Busca*
A partir de US$ 0,09
Por VCU/hora Machine learning
A partir de US$0,07
Por VCU/hora Armazenamento e Retenção
A partir de US$ 0,047
Por GB retido por mês Egress
A partir de US$0.05 por GB
Por GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos
Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground e AI Assistant
US$ 4,50 por milhão de tokens de entradaUS$ 21 por milhão de tokens de saída Elastic Inference Service
A partir de US$ 0,08
Por milhão de tokens O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho.
Complemento Serverless Plus (opcional)
Grátis durante um período promocional, depois 10% do gasto do projeto
Inclui os seguintes recursos avançados de conectividade e segurança:
** Esse recurso ainda não está disponível. |
|
| Ingestão*Por VCU-hora | A partir de US$ 0,14 |
| Search*Por VCU-hora | A partir de US$0,09 |
| Machine Learningpor VCU-hora | A partir de US$ 0,07 |
| Armazenamento e RetençãoPor GB retido por mês | A partir de US$ 0,047 |
| SaídaPor GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos |
A partir de $0,05
|
| Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground, Agent Builder e AI Assistant |
US$ 4,50
por milhão de tokens de entrada
US$ 21
por milhão de tokens de saída
|
| Elastic Inference ServicePor milhão de tokens O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho. |
A partir de US$ 0,08
|
| Complemento Serverless Plus (opcional) Inclui os seguintes recursos avançados de conectividade e segurança:
|
Grátis durante um período promocional, depois 10% do gasto do projeto |
*Esses preços entram em vigor em 1º de dezembro de 2024. Visite nossa página de detalhes de preços na nuvem para obter mais informações sobre preços.
** Esse recurso ainda não está disponível.
A medição de ingestão e retenção é baseada no volume de dados não compactados, normalizados e totalmente enriquecidos que você ingere no seu projeto serverless. Os volumes medidos serão muito maiores do que o tamanho dos dados "brutos" ou compactados "em trânsito."
Pacote de suporte
Suporte limitado está incluído na assinatura Standard; todos os outros preços de suporte são baseados na porcentagem do seu consumo. Para obter mais informações sobre o que está incluído em cada nível de suporte, acesse elastic.co/support.
| Nível de assinatura* do Elastic Cloud da organização | Padrão | Ouro | Platina | Empresarial |
|---|---|---|---|---|
| Suporte e faturamento total | ||||
| Nível de suporte | Limitado | Base | Aprimorado | Premium |
| % de cobrança | Incluso | 5% | 10% | 15% |
*O nível de assinatura é selecionado durante a inscrição
Componentes de precificação do Elasticsearch Serverless
O Elasticsearch Serverless cobra separadamente por computação (VCUs com 1 GB de RAM) e armazenamento (GB), oferecendo preços escaláveis e orientados ao desempenho para atender às suas metas de latência e taxa de transferência.
Unidade de Computação Virtual (VCU)
Há três tipos especializados de VCU disponíveis para executar tarefas específicas.
VCUs de ingestão: lidam com a indexação de dados no Search AI Lake.
Busca VCUs: lide com pesquisas orientadas pelo usuário, regras de alerta, agregações, transformações e consultas geoespaciais contra dados no Search AI Lake.
VCUs de machine learning: gerenciam a inferência, as cargas de trabalho do ELSER e os trabalhos de machine learning.
Uso de tokens
Utilização do Elastic Managed Large Language Model por milhão de tokens de entrada e saída: acesse recursos de IA prontos para uso sem precisar implantar nem operar um modelo de linguagem de grande porte (LLM).
Utilização dos modelos de IA da Jina cobrada por milhão de tokens: Use os modelos de IA da Jina em GPUs para busca semântica e casos de uso de reclassificação.
Provisionamento adaptativo de recursos
Os recursos de computação para ingestão e ML se ampliam automaticamente para atender às demandas da carga de trabalho.
Os recursos de computação Search se ajustam dinamicamente às cargas de trabalho, garantindo desempenho e capacidade de resposta consistentes. Com as configurações flexíveis do Search Power, você tem controle sobre as alocações de recursos para atender às suas necessidades de desempenho.
Armazenamento e retenção
O Elasticsearch Serverless usa armazenamentos de objetos para armazenamento persistente no Search AI Lake.
Todos os dados, independentemente do tipo, atualidade e frequência de uso, podem ser acessados no Search AI Lake. O tamanho do Search AI Lake pode ser controlado com políticas de retenção de dados manuais ou gerenciadas.
O armazenamento é medido em GB.
Configurações
Duas configurações de infraestrutura estão disponíveis para o Elasticsearch Serverless: geral e vetorial (somente API).
A opção geral é usada como padrão em todos os novos projetos e é adequada para a maioria dos casos de uso.
A opção vetorial aloca mais VCUs ao seu projeto para um desempenho superior, mas também acarreta mais custos devido à maior alocação de VCUs. Essa opção é recomendada apenas para projetos que usam mapeamentos de campos dense_vector com int4 ou int8, com alta dimensionalidade.
Perguntas frequentes
O que é o Elasticsearch Serverless?
O que é o Elasticsearch Serverless?
Projetos serverless utilizam os componentes de núcleo da Elastic Stack, como Elasticsearch e Kibana, e são baseados na arquitetura Search AI Lake da Elastic, que separa computação e armazenamento. As operações de busca e indexação são separadas, o que oferece flexibilidade para redimensionar suas cargas de trabalho enquanto garante um alto nível de desempenho.
Aproveite os seguintes benefícios com o Elasticsearch Serverless:
- Sem gestão. A Elastic gerencia o cluster subjacente da Elastic, então você pode focar seus dados. Em projetos serverless, a Elastic é responsável por atualizações automáticas, backups de dados e continuidade do negócio.
- Autoescalável. Para atender aos seus requisitos de desempenho, o sistema se ajusta automaticamente às suas cargas de trabalho.
- Armazenamento de dados otimizado. Seus dados são armazenados no Search Lake do seu projeto, que serve como um armazenamento econômico e eficiente. Uma camada de alto desempenho está disponível sobre o Search Lake para os dados mais consultados.
- Pague pelo desempenho que você precisa. Pague pelos recursos de ingestão, busca e ML separadamente conforme necessário pelas cargas de trabalho que você executa.
Qual é a diferença entre o Elastic Cloud Serverless e o Elastic Cloud Hosted?
Qual é a diferença entre o Elastic Cloud Serverless e o Elastic Cloud Hosted?
O Elastic Cloud é uma plataforma poderosa que atende a muitas necessidades de computação. Projetos serverless são criados especificamente para casos de uso, ao mesmo tempo em que oferecem uma experiência totalmente gerenciada com redimensionamento automático. Essa especialização e esse modelo operacional são o que diferencia o serverless hoje.
Como devo decidir se devo escolher o Elasticsearch Serverless ou o Elastic Stack Hosted?
Como devo decidir se devo escolher o Elasticsearch Serverless ou o Elastic Stack Hosted?
O Elasticsearch Serverless está atualmente disponível em regiões selecionadas de provedores de serviços de nuvem, com alguns recursos ainda a serem disponibilizados no futuro. Estamos totalmente comprometidos em expandir nossos serviços serverless para mais regiões e provedores de serviços de nuvem. Recomendamos que você consulte a documentação para conferir a compatibilidade técnica, como segurança, conformidade e disponibilidade.
Como posso começar a usar o Elasticsearch Serverless?
Como posso começar a usar o Elasticsearch Serverless?
É fácil começar a usar o Elasticsearch Serverless:
- Crie projetos Elasticsearch Serverless no Console da Nuvem.
- Escolha o tipo de projeto otimizado para o seu caso de uso que melhor atenda às suas necessidades.
- Comece a aproveitar uma experiência de projeto otimizada para o seu caso de uso.
Posso migrar dados entre o Elasticsearch Serverless e o Elastic Cloud Hosted?
Posso migrar dados entre o Elasticsearch Serverless e o Elastic Cloud Hosted?
Recomendamos o envio de dados diretamente da sua aplicação ou usando clientes Connector. Para o envio de dados em uma instância Elasticsearch existente, recomendamos o uso do Logstash para migrar grandes volumes.
Quais são as configurações do Search Power?
Quais são as configurações do Search Power?
As configurações do Search Power permitem gerenciar os recursos computacionais para otimizar o desempenho da busca (taxa de transferência e latência) e controlar os custos. Existem três configurações de Search Power para projetos Elasticsearch Serverless. A configuração "Performant" já vem ativada e proporciona uma experiência de busca eficiente para dados de todos os tamanhos. É possível escolher uma das seguintes configurações:
Sob demanda: Dimensionamento automático com base na carga de dados e de busca, com uma linha de base mínima mais baixa para o uso de recursos. Essa flexibilidade resulta em latência de consulta mais variável e taxa de transferência máxima reduzida.
Desempenho eficiente: Oferece latência consistentemente baixa e dimensiona automaticamente para acomodar volumes de consultas moderadamente altos.
Alta taxa de transferência: Otimizado para cenários de alta taxa de transferência, com escalonamento automático para manter a latência das consultas mesmo em volumes muito altos de consultas.
Quanto vou pagar*?
Quanto vou pagar*?
No Elasticsearch Serverless, você paga pelos recursos usados para lidar com suas cargas de trabalho e necessidades de desempenho. Temos alguns exemplos para dar uma ideia do que você pode pagar e de como pensar nos custos.
Exemplo 1 - ambiente de desenvolvimento com 2 GB de dados buscáveis, 1% de utilização de ingestão (15 minutos por dia), 8% de utilização de busca (2 horas por dia)
- Sob demanda: US$ 24/mês
- Desempenho: US$ 27/mês
Exemplo 2 - ambiente de produção com 20 GB de dados buscáveis, 5% de utilização de ingestão (1 hora por dia), 33% de utilização de busca (8 horas por dia)
- Sob demanda: US$ 190/mês
- Desempenho: US$ 210/mês
*As estimativas de preços fornecidas nos exemplos são apenas para fins ilustrativos. Os custos reais podem variar com base em fatores como tipo de dado, complexidade de consulta, padrões de tráfego, duração de uso e configurações específicas. Essas estimativas têm como objetivo ajudar você a entender possíveis cenários de preços, mas não devem ser usadas como custo final. Para cálculos precisos de custos, recomendamos monitorar seu uso.
Quando devo usar o perfil de uso geral em vez do perfil otimizado para vetores?
Quando devo usar o perfil de uso geral em vez do perfil otimizado para vetores?
O perfil Finalidade Geral oferece um ótimo desempenho pelo preço, especialmente para a maioria dos casos de uso de busca. É o perfil adequado para busca de texto completo, busca semântica usando ELSER ou embeddings de vetores esparsos, vetores esparsos e vetores densos usando compressão como BBQ (padrão no serverless). Recomendamos o uso da instância Finalidade Geral para a maioria dos casos de uso de busca.
Recomendamos usar o perfil Otimizado para Vetores somente para vetores densos não compactados quando você desejar melhor desempenho. Embora o custo por VCU seja o mesmo para os perfis Finalidade Geral e Otimizado para Vetores, o perfil Otimizado para Vetores oferece uma quantidade maior de RAM para dados buscáveis, o que leva a um consumo maior de VCUs e é mais caro, porém proporciona um desempenho significativamente melhor para dados vetoriais não compactados.
Como o Elastic Inference Service é cobrado?
Como o Elastic Inference Service é cobrado?
A utilização é cobrada estritamente com base no volume de dados processados, medido em milhões de tokens. Este modelo baseado no uso permite que você redimensione os custos linearmente com sua capacidade de processamento, garantindo que você pague apenas pelos tokens efetivamente processados, e não por infraestrutura ou capacidade ociosa.
Descubra tudo o que você pode fazer com o Elastic Cloud Serverless



Avaliação gratuita
Comece com pelos simples, orientados por solução e baseados no uso.