Enterprise Search, Teil 1

Warum Alternativen zu Google nötig sind

| Autor / Redakteur: Michael Bark, Geschäftsführer der evodion Information Technologies / Rainer Graefen

Evodion bietet sich mit Solr als Alternative zu Google Search an.
Evodion bietet sich mit Solr als Alternative zu Google Search an. (Evodion)

Google hat unser aller Leben radikal verändert. Die Zeiten, in denen die Brockhaus Enzyklopädie in das Bücherregal jedes bürgerlichen Haushalts gehörte, sind passé. Nicht umfassende Nachschlagewerke wie die Encyclopaedia Britannica oder der Brockhaus sind heute unser Tor zur Welt, sondern Google. Doch nur auf das schnelle Finden zu achten, führt in die Sackgasse.

Mit einem hiesigen Marktanteil von knapp 95 Prozent ist der Suchmaschinen-Gigant das Maß aller (Such-)Dinge. Google indiziert mehrere Hundertmilliarden Websites und meistert selbst komplexe Abfragen in Sekundenbruchteilen.

Die atemberaubende Leistungsfähigkeit der Google-Suche hat einen simplen Grund: geschätzt eine Million Server. Aber Schnelligkeit ist nicht alles, insbesondere beim Thema Enterprise Search.

Reglementierung der Treffer

Wichtig ist, dass man Daten, die einer fachlichen Zugriffskontrolle unterliegen, zwecks Auffindbarkeit indizieren kann. Eine Lösung für die Enterprise Search muss bestehende Benutzer- und Zugriffsrechte einbeziehen können, indem man sie an vorhandene Benutzerverzeichnisse anbindet, wie etwa Open LDAP oder Active Directory.

So ist gewährleistet, dass die Suchmaschine nur „erlaubte“ Treffer ausliefert. Zudem sollte eine Enterprise Search-Lösung möglichst viele Inhalte und Dokumentenformate erfassen und analysieren können. Im Gegensatz zur Google-Suche sind ggf. weitere Formate neben HTML, PDF und Microsoft Office mittels dedizierter Crawler zu berücksichtigen.

Nicht zuletzt spielen Metadaten eine große Rolle: Name des Autors, Erstellungsdatum, Freigaberedakteur oder Abstract – Informationen, die Google in der Regel nicht erfasst. Dennoch erscheint Google auch bei der Enterprise Search als Referenzgröße allgegenwärtig.

Ergänzendes zum Thema
 
Vorteile von Solr

Durch Google Custom bzw. Google Enterprise Search können Unternehmen ihre Website mit einer mächtigen Suchmaschine ausstatten. Für Internetauftritte ist das sicherlich eine attraktive Lösung. Doch es gibt berechtigte Bedenken und Vorbehalte gegenüber der Google-Suche, was den Datenschutz angeht.

Mangelnder Datenschutz und hohe Kosten

Neben Google Custom und Google Enterprise Search bietet das Unternehmen zwei Produkte speziell für Geschäftskunden: Google Site Search und Google Search Appliance. Google Site Search basiert auf derselben Architektur und Technologie wie die Standardsuche.

Die Lösung lässt sich per API einbinden, berücksichtigt aber nur öffentliche Inhalte. Damit eignet sie sich zur Website-Suche, bietet aber keine Enterprise Search-Funktionalität – zumal sie aus Datenschutzgründen kritisch zu betrachten ist.

Google Search Appliance hingegen ist eine Kombination der Google Search Applikation und entsprechender Hardware im Bundle, die Unternehmen selbst hosten können. Darum ist es möglich, Datenschutzbelange hinreichend zu berücksichtigen. Allerdings verursacht die Lösung sehr hohe Kosten – sowohl bei der Lizenzierung als auch im laufenden Betrieb.

Alternative Suchmaschinen im Aufwind

Sucht man nach Alternativen, unterscheiden sich die Ergebnisse stark. Sie sind abhängig vom Blickwinkel, aus dem heraus man sucht. Vor dem Hintergrund der Diskussionen über die Verletzung der Privatsphäre und Sammelwut der amerikanischen Behörden – Stichwort PRISM Leak –, befinden sich viele alternative Suchmaschinen im Aufwind.

Allerdings können sie Google im Bereich der klassischen Suchfunktion nicht das Wasser reichen – mit Ausnahme der Microsoft-Suche Bing und Alibaba im asiatischen Raum, wo kulturelle und sprachliche Anforderungen eine größere Rolle spielen.

Doch auch in anderen Teilen der Welt haben sich weitere, wenn auch nischenspezifische Suchmaschinen etabliert: Wolfram Alpha mit einer semantischen Suche, die weniger Index- und Algorithmus-basiert arbeitet, oder Creative Commons mit Spezialisierung auf frei nutzbare Mediendateien. TinEye wiederum liefert eine Reverse-Bildersuche, während DuckDuckGo die Privatsphäre zu schützen verspricht.

Eine Lösung für die Enterprise Search muss sich an einer Architektur orientieren, die Google Search Appliance verwendet, das heißt: eine Standalone-Lösung. Allerdings sind die verfügbaren Tools aufgrund des Zusammenspiels diverser Komponenten hochkomplex und erfordern daher Spezialwissen.

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43769559 / Services)