Integre a busca com IA em suas aplicações

O Elasticsearch Relevance Engine™ (ESRE) foi projetado para alimentar aplicações de busca baseadas em inteligência artificial. Use o ESRE para aplicar busca semântica com relevância superior pronta para uso (sem adaptação de domínio), integrar com grandes modelos de linguagem (LLMs) externos, implementar busca híbrida e usar modelos transformadores de terceiros ou os seus próprios.

Começar

Veja como é fácil começar a configurar o Elasticsearch Relevance Engine.

Assista ao vídeo de início rápido

Crie aplicações avançadas baseadas em RAG usando ESRE.

Inscreva-se no treinamento

Use dados privados internos como contexto com as funcionalidades de modelos de IA generativa para fornecer respostas confiáveis e atualizadas para as consultas dos usuários.

Assista ao vídeo

IA para todos os desenvolvedores

Aprimore a busca com IA

Ofereça funcionalidades avançadas de relevância para IA em sua aplicação com ESRE independentemente do seu nível de experiência. O ESRE tem um conjunto de recursos para ajudar você a começar ou aperfeiçoar sua experiência com AI. Você tem a flexibilidade e o controle para implantar apps de busca com machine learning e IA generativa da forma que achar melhor.

Veja uma demonstração do produto

Sua primeira vez na busca semântica?
Incluir a busca semântica em sua aplicação não deve requerer um nível profundo de experiência. Obtenha a melhor busca semântica da categoria pronta para usar com o modelo Elastic Learned Sparse Encoder. Com uma implantação simplificada, comece a fornecer rapidamente a busca semântica sem esforços de treinamento e manutenção de um modelo de machine learning.
Já conhece bem vetores de embeddings e de busca?
Converta dados não estruturados em embeddings vetoriais e busque-os com eficiência usando a busca de vizinho mais próximo aproximado. Combine seus próprios dados específicos de domínio em janelas de contexto para melhorar a relevância dos resultados semelhantes aos humanos dos LLMs.
Use seus próprios modelos transformadores
Use a biblioteca Python do Eland para aproveitar seu próprio modelo de machine learning treinado ou use um modelo de terceiros de um repositório público como o HuggingFace. Escolha entre uma ampla variedade de arquiteturas compatíveis que atendem às suas necessidades.

Elasticsearch Relevance Engine

Elasticsearch - Gerador multifuncional de busca vetorial

Gere embeddings. Armazene, busque e gerencie vetores. Aproveite a busca semântica com o modelo de machine learning Learned Sparse Encoder da Elastic. Faça a ingestão de todos os tipos de dados. Integre com grandes modelos de linguagem em rápida evolução.

Classificação híbrida do RRF
RRF (Reciprocal Rank Fusion) é um método para combinar classificações de documentos de vários sistemas de recuperação. Em um futuro próximo, o RRF oferecerá suporte para a combinação de resultados de modelos vetoriais esparsos como o BM25 e o modelo de recuperação da Elastic, gerando o melhor método de classificação zero-shot da categoria. A classificação híbrida com RRF permite ajustar os resultados da busca de vários recuperadores com menos esforço.
Aprenda a usar o RRF para busca híbrida
Elastic Learned Sparse Encoder
Nosso novo modelo oferece busca semântica altamente relevante e pronta para uso, sem adaptação de domínio. Está disponível com um clique na configuração de sua aplicação de busca. O Elastic Learned Sparse Encoder expande as consultas com palavras-chave relacionadas e pontuações de relevância, para que sejam facilmente interpretáveis e estejam prontas para uso imediato.
Leia o post
Geração aumentada de recuperação
Forneça aos LLMs informações específicas de negócios usando seus dados privados (não apenas dados treinados publicamente). Use o Elasticsearch para obter janelas de contexto de alta relevância que se baseiam nos seus dados proprietários para melhorar a saída e a relevância do LLM. Acesse a IA generativa com APIs e plugins integrados ao LLM de sua escolha.
Saiba mais sobre geração aumentada de recuperação
Banco de dados vetorial
Tenha uma experiência de busca vetorial completa — não se trata apenas de armazenar e buscar embeddings, você pode criá-los! Capture o significado e o contexto dos seus dados não estruturados, incluindo texto e imagens, com embeddings para recuperação densa. Proteja seus embeddings no nível dos documentos para garantir que os dados estejam em boas mãos.
Saiba mais sobre bancos de dados vetoriais
Use seus próprios modelos transformadores
Use seu próprio modelo transformador proprietário para o Elastic. Ou carregue modelos pré-treinados de repositórios de terceiros, como o hub de modelos da HuggingFace — com suporte para uma variedade de arquiteturas compatíveis, como BERT, BART, ELECTRA e muitas outras.
Leia o post do blog sobre BYOM
Integrações de dados e bibliotecas de ingestão
Ferramentas conhecidas como Elastic Agent ou Logstash para indexar seus dados. Uma lista cada vez maior de integrações (como Confluence, S3 ou Google Drive). Conectores de banco de dados nativos (como MySQL, MongoDB). Um rastreador da web para fontes online. Para dados de apps customizados, APIs do Kibana ou crie seu próprio conector com frameworks conhecidos.
Assista ao webinar sobre ingestão

“Estou entusiasmado com os benefícios que podemos trazer para os clientes com nossos investimentos para aproveitar o Elasticsearch no RelativityOne. Estamos experimentando o ESRE agora e estamos empolgados com seu potencial para fornecer resultados de busca poderosos e ampliados por IA aos nossos clientes.”

Chris BrownDiretor de produto, Relativity

Amostras de código

Comece a criar a busca vetorial

Use uma única API para importar um modelo de embedding, gerar embeddings e escrever consultas de busca em escala usando a busca de vizinho mais próximo aproximado.

Ver o guia de busca vetorial

Importar um modelo da HuggingFace para o Elasticsearch
Gerar embeddings no Elasticsearch
Indexar embeddings no Elasticsearch
Busca semântica em escala

docker run -it --rm elastic/eland \
eland_import_hub_model \
--cloud-id $CLOUD_ID \
-u <username> -p <password> \
--hub-model-id sentence-transformers/msmarco-MiniLM-L-12-v3 \
--task-type text_embedding \
--start

Frequently asked questions

What is Elasticsearch Relevance Engine?

Elasticsearch Relevance Engine is a set of features that help developers build AI search applications and includes:

Industry leading advanced relevance ranking features, including traditional keyword search with BM25, a foundation of relevant, hybrid search for all domains.
Full vector database capabilities – including the ability to create embeddings, in addition to storage and retrieval of vectors.
Elastic Learned Sparse Encoder – our new machine learning model for semantic search across a range of domains Hybrid ranking (RRF) for pairing vector and textual search capabilities for optimal search relevance across a variety of domains.
Support to integrate 3rd-party transformer models such as OpenAI GPT-3 and 4 via APIs
A full suite of data ingestion tools such as database connectors, 3rd-party data integrations, web crawler, and APIs to create custom connectors
Developer tools to build search applications across all types of data: text, images, time-series, geo, multimedia, and more.

What can I build with Elasticsearch Relevance Engine?

Elasticsearch is a leading search technology for websites (like ecommerce product and discovery) and internal information (such as customer success knowledge bases and enterprise search). With ESRE, we're providing a toolkit to build AI powered search experiences. Enable users to express their queries in natural language, in the form of a question or a description of the kind of information they seek. Combine this natural language capability with Generative AI to further enhance these models’ abilities with context from your own, private or proprietary data.

Are Elasticsearch and Elasticsearch Relevance Engine the same thing?

Yes, capabilities included with Elasticsearch Relevance Engine are designed and integrated at the _search api within Elasticsearch. Developers can use the Elastic API or familiar tools, such as Kibana, to interact with capabilities that make up Elasticsearch Relevance Engine together with Elasticsearch for a seamless experience..

What is Elastic Learned Sparse Encoder?

Elastic Learned Sparse Encoder is a model built by Elastic for high relevance semantic search across a variety of domains. Currently, an English-only machine learning model, it captures the relationships between meanings and words for information retrieval. Interested in benchmark tests with our new retrieval model? Read this blog to learn more.

What is a transformer, and is Elastic Learned Sparse Encoder a transformer model?

A transformer is a deep neural network architecture which serves as the basis for LLMs. Transformers consist of various components and can be composed of encoders, decoders and many “deep” neural network layers with many millions (or even billions) of parameters. They are typically trained on very large corpora of text like data on the Internet, and can be fine-tuned to perform a variety of NLP tasks. Our new retrieval model uses a transformer architecture but consists only of an encoder designed specifically for semantic search across a wide variety of domains.

How do I get started with Elasticsearch Relevance Engine? Do I need to purchase Elasticsearch Relevance Engine separately?

All of Elasticsearch Relevance Engine’s capabilities come with Elastic Enterprise Search Platinum and Enterprise plans, as part of the 8.8 release. You can easily get started with embeddings and vector search, and try out the retrieval model model. Check out a demo of Elastic Learned Sparse Encoder's capabilities. If you have an Elasticsearch license, Elasticsearch Relevance Engine is included as part of your purchase.

Engenharia de contexto

Banco de dados vetorial

Aplicativos baseados em busca

Logs

Proteção contra ameaças

Fluxos de trabalho

Elasticsearch

Kibana (Discover, Dashboards)

Elastic Agent Builder

AutoOps

Linguagem de consulta com barras verticais

Modelos de busca Jina AI

Elastic Cloud Serverless

Elastic Cloud Hosted

Elasticsearch autogerenciado

Busca para e-commerce

Busca para suporte ao cliente

Apps focados em buscas

Analítica de logs

Monitoramento de infraestrutura

Monitoramento da experiência digital

Monitoramento de desempenho do app

AIOps

Observabilidade do LLM

SIEM de última geração

Fluxos de trabalho para segurança

XDR e segurança de endpoint

IA para segurança

10x o valor dos seus dados

Provedor de serviços em nuvem

Ecossistema Elastic AI

Programa Search AI Partner

AV-Comparatives

Forrester Wave™ XDR

Líder do Magic Quadrant da Gartner

IDC MarketScape

Busca

Segurança

Observabilidade

Começar

Galeria de demonstrações

Downloads

Integrações

Documentos

Elastic Search Labs

Elastic Security Labs

Elastic Observability Labs

Blog

Comunidade

Eventos

Webinars

Discussão

Treinamento

Suporte

Consultoria

Integre a busca com IA em suas aplicações

IA para todos os desenvolvedores

Aprimore a busca com IA

Sua primeira vez na busca semântica?

Já conhece bem vetores de embeddings e de busca?

Use seus próprios modelos transformadores

Elasticsearch Relevance Engine

Elasticsearch - Gerador multifuncional de busca vetorial

Classificação híbrida do RRF

Elastic Learned Sparse Encoder

Geração aumentada de recuperação

Banco de dados vetorial

Use seus próprios modelos transformadores

Integrações de dados e bibliotecas de ingestão

Chris BrownDiretor de produto, Relativity

Amostras de código

Comece a criar a busca vetorial

Importar um modelo da HuggingFace para o Elasticsearch

Gerar embeddings no Elasticsearch

Indexar embeddings no Elasticsearch

Busca semântica em escala

Frequently asked questions

What is Elasticsearch Relevance Engine?

What can I build with Elasticsearch Relevance Engine?

Are Elasticsearch and Elasticsearch Relevance Engine the same thing?