A Retool acaba de publicar seu primeiro relatório sobre o estado da IA e vale a pena lê-lo. Com base no relatório extremamente popular sobre o estado das ferramentas internas, a pesquisa sobre o estado da IA mediu o pulso de mais de 1.500 profissionais de tecnologia, abrangendo engenharia de software, liderança, gerentes de produto, designers e muito mais, provenientes de uma variedade de setores. O objetivo da pesquisa é entender como esse pessoal da tecnologia usa e constrói com inteligência artificial (IA).
Como parte da pesquisa, a Retool investigou quais ferramentas eram populares, incluindo os bancos de dados vetoriais usados com mais frequência com IA. A pesquisa descobriu que o MongoDB Atlas Vector Search comandou o .NET Promoter Score (NPS) mais alto e foi o segundo banco de dados de vetores mais usado - apenas cinco meses após seu lançamento. Isso o coloca à frente de soluções concorrentes que já existem há anos.
Nesta postagem do blog, examinaremos o aumento fenomenal dos bancos de dados vetoriais e como os desenvolvedores estão usando soluções como o Atlas Vector Search para criar aplicativos com tecnologia de IA. Também abordaremos outros destaques importantes do relatório Retool.
Confira nossa página de recursos de IA para saber mais sobre como criar aplicativos baseados em IA com MongoDB.
Adoção de banco de dados vetorial: fora do Charts (bem, quase...)
Da curiosidade matemática ao superpoder por trás da IA generativa e dos LLMs, os embeddings de vetores e os bancos de dados que os managed percorreram um longo caminho em muito pouco tempo.
Confira as tendências dos DB-Engines em modelos de banco de dados nos últimos 12 meses e você verá que os bancos de dados vetoriais estão muito acima de todos os outros em termos de mudança de popularidade. Basta observar a trajetória “para cima e para a direita” da linha rosa nos Charts abaixo.
Mas por que os bancos de dados vetoriais se tornaram tão populares?
Eles são um componente-chave em um novo padrão de arquitetura chamado geração aumentada de recuperação – também conhecido como RAG – uma combinação potente que combina os recursos de raciocínio de LLMs de uso geral pré-treinados e os alimenta com dados específicos da empresa em tempo real. Os resultados são aplicativos baseados em IA que atendem exclusivamente aos negócios, seja criando novos produtos, reimaginando as experiências do cliente ou elevando a produtividade e a eficiência internas a níveis sem precedentes.
Os embeddings vetoriais são um dos componentes fundamentais necessários para desbloquear o poder do RAG. Os modelos de incorporação de vetores codificam dados corporativos, sejam eles texto, código, vídeo, imagens, fluxos de áudio ou tabelas, como vetores. Esses vetores são então armazenados, indexados e consultados em um banco de dados de vetores ou mecanismo de busca de vetores, fornecendo os dados de entrada relevantes como contexto para o LLM escolhido. O resultado são aplicativos de IA baseados em dados e conhecimentos corporativos relevantes para os negócios, precisos, confiáveis e atualizados.
Como mostra a pesquisa Retool, o cenário dos bancos de dados vetoriais ainda é em grande parte inexplorado. Atualmente, menos de 20% dos entrevistados usam bancos de dados vetoriais, mas com a tendência crescente de personalização de modelos e infraestrutura de IA, a adoção certamente crescerá.
Por que os desenvolvedores estão adotando o Atlas Vector Search?
A pesquisa State of AI da Retool apresenta alguns excelentes bancos de dados vetoriais que abriram caminho nos últimos dois anos, especialmente em aplicações que exigem pesquisa semântica sensível ao contexto. Pense em catálogos de produtos ou descoberta de conteúdo.
No entanto, o desafio que os desenvolvedores enfrentam ao usar esses bancos de dados vetoriais é que eles precisam integrá-los a outros bancos de dados na pilha de tecnologia de seus aplicativos.
Cada camada adicional de banco de dados na pilha de tecnologia de aplicativos adiciona outra fonte de complexidade, latência e sobrecarga operacional. Isso significa que eles têm outro banco de dados para adquirir, aprender, integrar (para desenvolvimento, teste e produção), proteger e certificar, dimensionar, monitorar e fazer backup, e tudo isso enquanto mantêm os dados sincronizados entre esses vários sistemas.
O MongoDB adota uma abordagem diferente que evita totalmente esses desafios:
-
Os desenvolvedores armazenam e pesquisam incorporações de vetores nativos no mesmo sistema que usam como banco de dados operacional.
-
Usando a arquitetura distribuída do MongoDB, eles podem isolar essas diferentes cargas de trabalho enquanto mantêm os dados totalmente sincronizados.
-
Os nós de pesquisa fornecem computação dedicada e isolamento de carga de trabalho que é vital para cargas de trabalho de pesquisa vetorial com uso intensivo de memória, permitindo assim melhor desempenho e maior disponibilidade
-
Com o esquema de documento flexível e dinâmico do MongoDB, os desenvolvedores podem modelar e desenvolver relacionamentos entre vetores, metadados e dados de aplicativos de uma forma que outros bancos de dados não conseguem.
-
Eles podem processar e filtrar dados vetoriais e operacionais da maneira que o aplicativo precisar, com uma API de consulta expressiva e drivers que suportam todas as linguagens de programação mais populares.
-
O uso da plataforma de dados de desenvolvedor MongoDB Atlas totalmente managed permite que os desenvolvedores alcancem a escala, a segurança e o desempenho que os usuários de seus aplicativos esperam.
O que essa abordagem unificada MEAN para os desenvolvedores? Ciclos de desenvolvimento mais rápidos, aplicativos de maior desempenho, proporcionando menor latência com dados mais atualizados, juntamente com menores custos e despesas operacionais. Resultados que são refletidos na melhor pontuação NPS do MongoDB.
Saravana Kumar, CEO, Kovai discutindo o desenvolvimento do assistente de IA de sua empresaAtlas Vector Search é robusto, econômico e extremamente rápido!
Confira nossa série de blog Construindo IA com MongoDB (vá para a seção Primeiros passos para ver as edições anteriores). Aqui você verá o Atlas Vector Search usado para aplicativos baseados em GenAI, abrangendo IA de conversação com chatbots e voicebots, copilotos, inteligência de ameaças e segurança cibernética, gerenciamento de contratos, resposta a perguntas, conformidade de saúde e assistentes de tratamento, descoberta e monetização de conteúdo, e mais.
Pierce Lamb, engenheiro de software sênior da equipe de dados e aprendizado de máquina da VISO TRUSTO MongoDB já armazenava metadados sobre artefatos em nosso sistema. Com a introdução do Atlas Vector Search, agora temos um banco de dados abrangente de metadados vetoriais que foi testado em batalha ao longo de uma década e que resolve nossas densas necessidades de recuperação. Não há necessidade de implantar um novo banco de dados que teríamos que managed e aprender. Nossos vetores e metadados de artefatos podem ser armazenados um ao lado do outro.
O que você pode aprender sobre o estado da IA no relatório Retool?
Além de revelar os bancos de dados de vetores mais populares, a pesquisa abrange a IA sob diversas perspectivas. Começa explorando as percepções dos entrevistados sobre IA. (Sem surpresa, o C-suite é mais otimista do que os colaboradores individuais.) Em seguida, explora as prioridades de investimento, o impacto da IA nas futuras perspectivas de emprego e como provavelmente afectará os programadores e as competências de que necessitarão no futuro.
A pesquisa explora então o nível de adoção e maturidade da IA. Mais de 75% dos entrevistados afirmam que as suas empresas estão a envidar esforços para começar a utilizar a IA, com cerca de metade a dizer que estes ainda são projetos iniciais e orientados principalmente para aplicações internas. A pesquisa prossegue examinando quais são esses aplicativos e quão úteis os entrevistados consideram que eles são para os negócios. Ele descobre que quase todo mundo usa IA no trabalho, quer tenham permissão ou não, e então identifica os principais pontos problemáticos. Não é nenhuma surpresa que a precisão, a segurança e as alucinações do modelo estejam no topo dessa lista.
A pesquisa termina explorando os principais modelos em uso. Mais uma vez, não é surpresa que as ofertas de IA aberta estejam liderando o caminho, mas também indica uma intenção crescente de usar modelos de código aberto juntamente com infraestrutura e ferramentas de IA para personalização no futuro.
Você pode se aprofundar em todos os detalhes da pesquisa lendo o relatório.
Introdução ao Atlas Vector Search
Quer dar uma olhada em nossa oferta de pesquisa de vetores? Acesse nossa página de produto Atlas Vector Search. Lá você encontrará links para tutoriais, documentação e integrações importantes do ecossistema de IA para que possa mergulhar diretamente na construção de seus próprios aplicativos com tecnologia genAI.
Se você quiser saber mais sobre as possibilidades de alto nível da pesquisa vetorial, baixe nosso whitepaper Incorporação de IA generativa.