I database vettoriali sono molto popolari, a giudicare dal numero di start-up che entrano nello spazio e dagli investitori che si impegnano per ottenere una fetta della torta. La proliferazione dei grandi modelli linguistici (LLM) e il movimento di Intelligenza Artificiale generativa (GenAI) hanno creato un terreno fertile per la fioritura delle tecnologie dei database vettoriali.
Mentre i tradizionali database relazionali come Postgres o MySQL sono adatti ai dati strutturati - tipi di dati predefiniti che possono essere ordinatamente archiviati in righe e colonne - questo non funziona così bene per i dati non strutturati come immagini, video, email, post sui social media e tutti i dati che non rispettano un modello di dati predefinito.
I database vettoriali, d'altra parte, memorizzano e elaborano i dati sotto forma di embedding vettoriali, che convertono testo, documenti, immagini e altri dati in rappresentazioni numeriche che catturano il significato e le relazioni tra i diversi punti di dati. Questo è perfetto per il machine learning, poiché il database memorizza i dati spazialmente in base alla rilevanza di ciascun elemento rispetto agli altri, rendendo più facile recuperare dati semanticamente simili.
Questo è particolarmente utile per i LLM, come il GPT-4 di OpenAI, poiché consente al chatbot AI di comprendere meglio il contesto di una conversazione analizzando conversazioni simili precedenti. La ricerca vettoriale è anche utile per tutti i tipi di applicazioni in tempo reale, come raccomandazioni di contenuti nei social network o nelle app di e-commerce, poiché può guardare a ciò che un utente ha cercato e recuperare articoli simili in un attimo.
La ricerca vettoriale può anche aiutare a ridurre le 'allucinazioni' nelle applicazioni LLM, fornendo informazioni aggiuntive che potrebbero non essere state disponibili nell'insieme di dati di addestramento originale.
"Senza utilizzare la ricerca di similarità vettoriale, è comunque possibile sviluppare applicazioni AI/ML, ma sarebbe necessario fare più ritraining e affinamenti", ha spiegato Andre Zayarni, CEO e co-fondatore della start-up di ricerca vettoriale Qdrant, a TechCrunch. "I database vettoriali entrano in gioco quando c'è un grande insieme di dati e hai bisogno di un'utility per lavorare con embedding vettoriali in modo efficiente e conveniente."
A gennaio, Qdrant ha ottenuto 28 milioni di dollari di finanziamento per capitalizzare la crescita che lo ha portato a diventare una delle 10 start-up open source commerciali a più rapida crescita dell'anno scorso. E non è certo l'unica start-up di database vettoriali a raccogliere denaro di recente - Vespa, Weaviate, Pinecone e Chroma hanno raccolto collettivamente 200 milioni di dollari l'anno scorso per varie offerte vettoriali.
Dal cambio dell'anno, abbiamo anche visto Index Ventures guidare un round seed da 9,5 milioni di dollari in Superlinked, una piattaforma che trasforma dati complessi in embedding vettoriali. E qualche settimana fa, Y Combinator (YC) ha svelato la sua coorte invernale del '24, che includeva Lantern, una start-up che vende un motore di ricerca vettoriale ospitato per Postgres.
Altrove, Marqo ha raccolto un round seed da 4,4 milioni di dollari verso la fine dell'anno scorso, seguito rapidamente da un round Serie A da 12,5 milioni di dollari a febbraio. La piattaforma Marqo fornisce una vasta gamma di strumenti vettoriali pronti all'uso, che coprono la generazione, lo storage e il recupero vettoriale, consentendo agli utenti di evitare strumenti di terze parti come OpenAI o Hugging Face, offrendo tutto tramite un'unica API.
I co-fondatori di Marqo, Tom Hamer e Jesse N. Clark, hanno lavorato precedentemente in ruoli di ingegneria presso Amazon, dove hanno realizzato il 'grande bisogno insoddisfatto' di una ricerca semantica e flessibile attraverso diverse modalità come testo e immagini. Ed è così che hanno deciso di formare Marqo nel 2021.
"Lavorando con la ricerca visiva e la robotica presso Amazon è stato quando ho davvero guardato alla ricerca vettoriale - stavo pensando a nuovi modi per scoprire i prodotti, e questo ha convergato molto rapidamente sulla ricerca vettoriale", ha detto Clark a TechCrunch. "In robotica, stavo usando la ricerca multimodale per cercare attraverso molte delle nostre immagini per identificare se ci fossero cose errate come tubi e pacchetti. Altrimenti, sarebbe stato molto difficile risolvere il problema."
Entra nell'azienda
Anche se i database vettoriali stanno vivendo un momento di gloria tra il trambusto di ChatGPT e il movimento GenAI, non sono la panacea per ogni scenario di ricerca aziendale.
"I database dedicati tendono ad essere completamente concentrati su casi d'uso specifici e possono quindi progettare la loro architettura per le prestazioni sulle attività necessarie, così come sull'esperienza utente, rispetto ai database generici, che devono adattarsi al progetto attuale", ha spiegato Peter Zaitsev, fondatore dell'azienda di supporto e servizi per database Percona, a TechCrunch.
Sebbene i database specializzati possano eccellere in una cosa a scapito di altre, è per questo che stiamo cominciando a vedere vecchi attori del settore dei database come Elastic, Redis, OpenSearch, Cassandra, Oracle e MongoDB aggiungere intelligenza di ricerca vettoriale ai database, così come i fornitori di servizi cloud come Azure di Microsoft, AWS di Amazon e Cloudflare.
Zaitsev paragona questo ultimo trend a quello che è accaduto con JSON più di un decennio fa, quando le applicazioni web sono diventate più diffuse e i developer hanno avuto bisogno di un formato di dati indipendente dal linguaggio che fosse facile da leggere e scrivere per gli esseri umani. In quel caso, è emersa una nuova classe di database sotto forma di database documentali come MongoDB, mentre i database relazionali esistenti hanno introdotto anche il supporto JSON.
"Penso che lo stesso possa accadere con i database vettoriali", ha detto Zaitsev a TechCrunch. "Gli utenti che stanno costruendo applicazioni AI molto complesse e su larga scala utilizzeranno database di ricerca vettoriale dedicati, mentre le persone che hanno bisogno di integrare un po' di funzionalità AI nella loro applicazione esistente sono più propense a utilizzare la funzionalità di ricerca vettoriale nei database che già utilizzano."
Ma Zayarni e i suoi colleghi di Qdrant scommettono che le soluzioni native costruite interamente intorno ai vettori forniranno la 'velocità, la sicurezza della memoria e la scala' necessarie con l'esplosione dei dati vettoriali, rispetto alle aziende che aggiungono la ricerca vettoriale come un'idea secondaria.
"Il loro discorso è, 'possiamo fare anche ricerca vettoriale, se necessario'," ha detto Zayarni. "Il nostro discorso è, 'facciamo ricerca vettoriale avanzata nel modo migliore possibile'. Si tratta di specializzazione. Raccomandiamo effettivamente di iniziare con il database che hai già nel tuo stack tecnologico. A un certo punto, gli utenti si troveranno ad affrontare limitazioni se la ricerca vettoriale è un componente critico della soluzione."