Technologieunternehmen auf der ganzen Welt führen neben anderen KI-getriebenen Funktionen die Vektorsuche ein. Was genau steckt dahinter, warum ist die Technologie für Unternehmen wichtig und welche Voraussetzungen müssen sie schaffen, um davon zu profitieren?
Mit dem Indizieren von Vektoren will MongoDB den ANN-Algorithmus beschleunigen.
(Bild: MongoDB)
Was genau ist die Vektorsuche?
Vektoren allgemein sind codierte Darstellungen unstrukturierter Daten wie Text, Bilder und Audio in Form eines Array. Diese Vektoren werden durch Techniken des maschinellen Lernens (ML) erzeugt, welche auch als „Einbettungsmodelle“ bezeichnet werden und auf großen Datenmengen trainiert werden.
Ihre Aufgabe ist es, effektiv sinnvolle Beziehungen und Ähnlichkeiten zwischen Daten zu erfassen. Dadurch wird es für Benutzer möglich, Daten auf Basis ihrer Bedeutung abzufragen. Das sorgt für ein effizienteres Funktionieren von Systemen, die auf Datenanalyse basieren, wie z.B. Empfehlungen, Sprachverständnis und Bilderkennung.
Jede Suche beginnt mit einer Abfrage. Bei der Vektorsuche wird diese Abfrage durch einen Vektor dargestellt und anschließend unter den in einer Datenbank gespeicherten Vektoren derjenige identifiziert, der dem Vektor der Abfrage am ähnlichsten ist. Es geht immer um Ähnlichkeit, weshalb die Vektorsuche oft auch als Ähnlichkeitssuche bezeichnet wird.
Die Funktionsweise von Vector Search
Das Konzept der Vektorähnlichkeit lässt sich am besten mithilfe eines dreidimensionalen Raums erklären, in dem die Position eines Datenpunkts vollständig durch drei Koordinaten bestimmt wird. So verhält es sich z.B. auch bei einem Raum mit 1.024 Dimensionen, hier sind ebenso viele Koordinaten erforderlich, um einen Datenpunkt zu lokalisieren.
Vektoren können auch die Position von Datenpunkten in mehrdimensionalen Räumen liefern. Die Werte in einem Vektor werden hierbei als ein Array behandelt. Sobald wir die Position der Datenpunkte – der Vektoren – haben, wird ihre Ähnlichkeit untereinander berechnet, indem der Abstand zwischen ihnen im Vektorraum gemessen wird. Punkte, die im Vektorraum näher beieinanderliegen, stellen Konzepte dar, deren Bedeutung ähnlicher ist.
Beispielsweise hat „Reifen“ eine größere Ähnlichkeit mit „Auto“ und eine geringere Ähnlichkeit mit „Flugzeug“. Allerdings hätte „Flügel“ nur eine Ähnlichkeit mit „Flugzeug“. Daher wäre der Abstand zwischen den Vektoren für „Reifen“ und „Auto“ kleiner als der Abstand zwischen den Vektoren für „Reifen“ und „Flugzeug“. Allerdings wäre der Abstand zwischen „Flügel“ und „Auto“ enorm.
Mit anderen Worten: „Reifen“ ist relevant, wenn wir von einem „Auto“ und in geringerem Maße von einem „Flugzeug“ sprechen. „Flügel“ ist dagegen nur relevant, wenn wir von einem „Flugzeug“ sprechen, und überhaupt nicht relevant, wenn wir von einem „Auto“ sprechen (zumindest, solange fliegende Autos noch nicht serienreif sind). Die Kontextualisierung von Daten – unabhängig vom Typ – ermöglicht es der Vektorsuche, die relevantesten Ergebnisse zu einer bestimmten Abfrage abzurufen.
Was Vektorsuche für Unternehmen bewirken kann
Primärer Vorteil der Vektorsuche ist Zeit- und damit langfristig Kostenersparnis. Unternehmen können jetzt Datensätze jeder Größe erfolgreich bedienen und sie erheblich schneller und präziser durchforsten. Das sorgt für bessere Ergebnisse in kürzeren Zeiträumen und damit für effizientere Arbeitsprozesse. Dabei unterstützt die Möglichkeit, bereits erstellte Vektordarstellungen zu speichern und wiederzuverwenden.
Auf Basis dieser präziseren Suchergebnisse können personalisierte und individuellere Inhalte für Kunden bereitgestellt werden, was die Kundenzufriedenheit und -bindung langfristig stärkt. Zudem bietet Vektorsuche eine ernstzunehmende und einfacher bedienbare Alternative zur zuvor alleinigen Nutzung deutlich komplexerer k-Nearest-Neighbor-Indizes (k-NN), die in ihrer Applikation ein hohes Maß an Fachwissen und Technik benötigen.
In der Anwendungsentwicklung für künstliche Intelligenz erfreut sich Vektorsuche großer Beliebtheit, da durch sie die Anwendungsentwicklung beschleunigt und die Operationalisierung von KI-gestützten Anwendungs-Workloads vereinfacht werden kann. Zudem vereinfacht Vektorsuche die Einbindung von generativer KI und semantischen Suchfunktionen in Echtzeitanwendungen unter Verwendung unternehmenseigener Daten, da Vektor Suche als skalierbare Vektordatenbank fungiert.
Diese ist wiederum in eine global verteilte operative Datenbank integriert, in der alle Daten eines Unternehmens gespeichert und verarbeitet werden können. So benötigen Entwickler nur eine API, um generative KI-Anwendungen für praktisch jede Art von Workload über die wichtigsten Cloud-Anbieter hinweg zu erstellen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Die Zukunft der Vektorsuche
Vektorsuche ist die Antwort für Entwickler, die generative KI zur Optimierung ihrer Geschäftsmodelle und ihrer Kundenangebote nutzen möchten, in der Umsetzung aber dann auf Herausforderungen treffen, die die bisher gängigen Tools an ihre Grenzen bringen. Auch in der alltäglichen Entwicklungsarbeit ist Vektorsuche ein vielversprechender Katalysator für neue, bessere Entwicklungsprozesse und Ideen. Im Hinblick auf den steigenden Hype rund um KI-basierte Anwendungen aber auch die zunehmende Entwicklung unterschiedlichster Anwendungssysteme bietet Vektorsuche bereits jetzt großes Potenzial.
Vector Search bei MongoDB Atlas
MongoDB Atlas Vector Search bietet derzeit drei Ansätze zur Berechnung der Vektorähnlichkeit. Diese werden auch als Distanzmetriken bezeichnet und bestehen aus:
Obwohl sich die drei Metriken in der Art der Berechnung unterscheiden, messen alle drei die Entfernung. Atlas Vector Search speist diese Distanzmetriken in einen sogenannten „Approximate Nearest Neighbor“- oder kurz ANN-Algorithmus ein, um die gespeicherten Vektoren zu finden, die dem Vektor der Abfrage am ähnlichsten sind.
Um diesen Prozess zu beschleunigen, werden Vektoren mithilfe eines weiteren Algorithmus namens Hierarchical Navigable Small World (HNSW) indexiert. HNSW leitet die Suche dabei durch ein Netzwerk miteinander verbundener Datenpunkte, so dass nur die relevantesten Datenpunkte berücksichtigt werden.
* Über den Autor Julian Wingenfeld verfügt über ein breites Spektrum an Erfahrungen, die er als technischer Berater und Data Engineer sowohl in Start-ups als auch in etablierten Unternehmen gesammelt hat. Bei Accenture übernahm er das Design und die Entwicklung von Datenpipelines in der Cloud und arbeitete dabei sowohl mit SQL- als auch mit NoSQL-Datenbanken, Datenmodellierung, Datenstreaming und verschiedenen Data Warehouses. In seiner Funktion als Associate Solutions Architect unterstützt er Kunden aus verschiedenen Branchen dabei, MongoDB für eine breite Palette von Anwendungsfällen optimal zu nutzen.