Retool vient de publier son tout premier rapport sur l'état de l'IA, qui vaut la peine d'être lu. Inspirée du rapport State of Internal Tools, très populaire, l'enquête State of AI a pris le pouls de plus de 1 500 techniciens issus de divers secteurs d'activité : ingénieurs logiciels, dirigeants, chefs de produit, concepteurs, etc. L'objectif de l'enquête est de comprendre comment ces passionnés de technologie utilisent et construisent avec l'intelligence artificielle (IA).
Dans le cadre de l'enquête, Retool a étudié les outils les plus populaires, notamment les bases de données vectorielles les plus fréquemment utilisées dans le domaine de l'IA. L'enquête a révélé que MongoDB Atlas Vector Search affichait le meilleur score de promotion (NPS) sur .NET et était la deuxième base de données vectorielles la plus utilisée, cinq mois seulement après sa mise en service. Il devance ainsi les solutions concurrentes qui existent depuis des années.
Dans cet article de blog, nous examinerons l'essor phénoménal des bases de données vectorielles et la façon dont les développeurs utilisent des solutions telles qu'Atlas Vector Search pour créer des applications alimentées par l'IA. Nous aborderons également d'autres points essentiels du rapport Retool.
Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB.
Adoption d'une base de données vectorielle : Sur le site Charts (enfin presque...)
De curiosité mathématique à superpuissance derrière l'IA générative et les LLM, les vector embeddings et les bases de données qui les managed ont parcouru un long chemin en très peu de temps.
Consultez les tendances de DB-moteur dans les modèles de bases de données au cours des 12 derniers mois et vous verrez que les bases de données vectorielles dépassent de loin toutes les autres en termes de popularité. Il suffit de regarder la trajectoire "vers le haut et vers la droite" de la ligne rose dans le site Charts ci-dessous.
Mais pourquoi les bases de données vectorielles sont-elles devenues si populaires ?
Ils constituent un élément clé d'un nouveau modèle architectural appelé "génération augmentée par la recherche" ( RAG). Il s'agit d'un mélange puissant qui combine les capacités de raisonnement de LLM préformés et polyvalents et les alimente en temps réel avec des données spécifiques à l'entreprise. Les résultats sont des applications alimentées par l'IA qui servent de manière unique l'entreprise - qu'il s'agisse de créer de nouveaux produits, de réimaginer l'expérience client ou de porter la productivité et l'efficacité internes à des niveaux sans précédent.
Les encastrements vectoriels sont l'un des composants fondamentaux nécessaires pour libérer la puissance de RAG. Les modèles d'intégration vectorielle codent les données de l'entreprise, qu'il s'agisse de texte, de code, de vidéo, d'images, de flux audio ou de tableaux, sous forme de vecteurs. Ces vecteurs sont ensuite stockés, indexés et interrogés dans une base de données vectorielles ou un moteur de recherche vectoriel, fournissant les données d'entrée pertinentes en tant que contexte pour le LLM choisi. Il en résulte des applications d'IA fondées sur les données et les connaissances de l'entreprise qui sont pertinentes pour l'activité, exactes, fiables et à jour.
Comme le montre l'enquête Retool, le paysage des bases de données vectorielles est encore largement vierge. Moins de 20 % des personnes interrogées utilisent des bases de données vectorielles aujourd'hui, mais avec la tendance croissante à la personnalisation des modèles et de l'infrastructure d'IA, l'adoption est assurée de croître.
Pourquoi les développeurs adoptent-ils Atlas Vector Search ?
L'étude de Retool sur l'état de l'IA présente quelques grandes bases de données vectorielles qui ont ouvert la voie au cours des deux dernières années, en particulier pour les applications nécessitant une recherche sémantique contextuelle. Pensez aux catalogues de produits ou à la découverte de contenu.
Cependant, le défi auquel les développeurs sont confrontés lorsqu'ils utilisent ces bases de données vectorielles est qu'ils doivent les intégrer avec d'autres bases de données dans la pile technologique de leur application.
Chaque couche de base de données supplémentaire dans la pile technologique de l'application ajoute encore une autre source de complexité, de latence et de frais généraux opérationnels. Cela signifie qu'ils doivent se procurer une autre base de données, l'apprendre, l'intégrer (pour le développement, les tests et la production), la sécuriser et la certifier, la répartir, la surveiller et la sauvegarder, tout en maintenant la synchronisation des données entre ces multiples systèmes.
MongoDB adopte une approche différente qui évite totalement ces problèmes :
-
Les développeurs stockent et recherchent les encastrements vectoriels natifs dans le même système que celui qu'ils utilisent comme base de données opérationnelle.
-
Grâce à l'architecture distribuée de MongoDB, ils peuvent isoler ces différentes charges de travail tout en gardant les données entièrement synchronisées.
-
Search Nodes fournissent un calcul dédié et une isolation de la charge de travail, ce qui est vital pour les charges de travail de recherche vectorielle à forte intensité de mémoire, permettant ainsi d'améliorer les performances et la disponibilité.
-
Grâce au schéma de document flexible et dynamique de MongoDB, les développeurs peuvent modéliser et faire évoluer les relations entre les vecteurs, les métadonnées et les données d'application comme d'autres bases de données ne peuvent le faire.
-
Ils peuvent traiter et filtrer les données vectorielles et opérationnelles selon les besoins de l'application grâce à une API d'interrogation expressive et à des pilotes qui prennent en charge tous les langages de programmation les plus courants.
-
L'utilisation de la plateforme de données de développement MongoDB Atlas entièrement gérée permet aux développeurs d'obtenir le répartir, la sécurité et la performance que les utilisateurs de leurs applications attendent.
Que signifie cette approche unifiée MEAN pour les développeurs ? Cycles de développement plus rapides, application plus performante offrant une latence plus faible avec des données plus fraîches, associée à une réduction des frais généraux et des coûts d'exploitation. Des résultats qui se reflètent dans le score NPS de MongoDB, le meilleur de sa catégorie.
Saravana Kumar, CEO, Kovai parle du développement de l'assistant d'intelligence artificielle de son entrepriseAtlas Vector Search est robuste, rentable et extrêmement rapide !
Consultez notre série Construire l'IA avec MongoDB blog (rendez-vous dans la section Prise en main pour consulter les anciens numéros). Ici, vous verrez Atlas Vector Search utilisé pour des applications alimentées par GenAI couvrant l'IA conversationnelle avec des chatbots et des voicebots, des co-pilotes, l'intelligence des menaces et la cybersécurité, la gestion des contrats, la réponse aux questions, la conformité des soins de santé et les assistants de traitement, la découverte et la monétisation de contenu, et bien d'autres choses encore.
Pierce Lamb, ingénieur logiciel principal au sein de l'équipe "Données et apprentissage automatique" de VISO TRUSTMongoDB stockait déjà des métadonnées sur les artefacts dans notre système. Avec l'introduction d'Atlas Vector Search, nous disposons désormais d'une base de données vectorielles complète qui a été testée pendant plus d'une décennie et qui répond à nos besoins en matière de recherche dense. Il n'est pas nécessaire de déployer une nouvelle base de données que nous aurions dû managed et apprendre. Nos vecteurs et les métadonnées des artefacts peuvent être stockés les uns à côté des autres.
Que peut-on apprendre sur l'état de l'IA à partir du rapport Retool ?
Au-delà de la découverte des bases de données vectorielles les plus populaires, l'enquête aborde l'IA sous différents angles. Elle commence par explorer les perceptions de l'IA par les personnes interrogées. (Il n'est pas surprenant de constater que les dirigeants sont plus optimistes que les collaborateurs individuels). Il explore ensuite les priorités d'investissement, l'impact de l'IA sur les perspectives d'emploi futures et la manière dont elle affectera probablement les développeurs et les compétences dont ils auront besoin à l'avenir.
L'enquête explore ensuite le niveau d'adoption et de maturité de l'IA. Plus de 75 % des répondants à l'enquête déclarent que leur entreprise s'efforce de commencer à utiliser l'IA, mais environ la moitié d'entre eux déclarent qu'il s'agit encore de projets précoces, principalement axés sur des applications internes. L'enquête se penche ensuite sur la nature de ces applications et sur l'utilité que les personnes interrogées leur prêtent pour l'entreprise. Elle constate que presque tout le monde utilise l'IA au travail, que cela soit autorisé ou non, et identifie ensuite les principaux points problématiques. Il n'est pas surprenant que la précision des modèles, la sécurité et les hallucinations figurent en tête de liste.
L'étude se termine par l'examen des principaux modèles utilisés. Encore une fois, il n'est pas surprenant que les offres d'Open AI ouvrent la voie, mais cela indique également une intention croissante d'utiliser des modèles open source avec l'infrastructure et les outils d'IA pour la personnalisation à l'avenir.
Vous pouvez approfondir tous les détails de l'enquête en lisant le rapport.
Prise en main avec Atlas Vector Search
Vous souhaitez découvrir notre offre de recherche vectorielle ? Rendez-vous sur notre page produit Atlas Vector Search. Vous y trouverez des liens vers des tutoriels, de la documentation et des intégrations clés de l'écosystème de l'IA afin que vous puissiez vous plonger directement dans la construction de votre propre application alimentée par genAI.
Si vous souhaitez en savoir plus sur les possibilités de haut niveau de la recherche vectorielle, téléchargez notre livre blanc sur l'intégration de l'IA générative.