Machine-Learning-Frameworks für kognitive Fähigkeiten

ML-Hilfsmittel und die Bauteile maschineller Intelligenz Machine-Learning-Frameworks und -Dienste

19.08.2024 Von Filipe Martins & Anna Kobylinska 10 min Lesedauer

Der Megatrend KI/ML greift immer stärker – mit unzähligen Anwendungsfälle und gnadenloser Komplexität. Machen Machine-Learning-Frameworks es möglich, sich etwas offensiver an die Materie wohl erst einmal vorsichtig heranzuwagen?

Ein neuronales Netz vom Typ CNN für Bildklassifikation.(Bild: AIM India) — Ein neuronales Netz vom Typ CNN für Bildklassifikation.
(Bild: AIM India)

Maschinelle Intelligenz soll cyberphysische Systeme dazu befähigen, in einer datengetriebenen Welt autark zu agieren. Die Umsetzung kognitiver Fähigkeiten in Softwarecode ruft ML-Frameworks auf den Plan. Sie sind erfolgsentscheidend, wenn es darum geht, ML-Modelle für die die Erkennung von Bild und Ton, die Interpretation von natürlicher Sprache, das Verständnis von Ursache-Wirkung-Zusammenhängen und dergleichen andere zu implementieren.

Vorgefertigte, wiederverwendbare Komponenten haben die Aufgabe, Entwicklerinnen und Entwicklern den Weg zu ebnen. Die Herausforderung besteht jetzt darin, die richtigen Bauteile für die avisierte Aufgabe zu wählen -- die Developer haben die Qual der Wahl.

Hugging Face Transformers und „Model Zoo“

Die quelloffene Bibliothek Transformers von Hugging Face hat in der Gemeinschaft der natürlichen Sprachverarbeitung (NLP) große Beliebtheit erlangt. Sie trumpft mit einer breiten Palette vortrainierter Modelle und ihren benutzerfreundlichen APIs zum Tokenisieren von Text und zum Erstellen von Vorhersagen. Die Bibliothek spezialisiert sich auf NLP-Aufgaben wie Textklassifikation, Erkennung benannter Entitäten, das Beantworten von Fragen in natürlicher Sprache, aber beschränkt sich nicht darauf.

Die Modelle sind mit riesigen Mengen an Textdaten vortrainiert und damit bereits relativ brauchbar. Sie lassen sich dann für spezifische nachgelagerte Aufgaben mit relativ geringen Mengen an gelabelten Daten optimieren (Stichwort: Feinabstimmung). Entwickler und Entwicklerinnen nutzen grundlegende ML-Frameworks wie PyTorch, TensorFlow und JAX, um mit Hilfe der leistungsstarken APIs die komplexen Prozesse der Modellbildung und des Trainings zu vereinfachen.

Um die Modelle von Hugging Face schnell in Softwareprojekte zu integrieren, können Developer zum Beispiel das Python-Paket transformers verwenden. Das Unternehmen hat eine wahre Goldgrube von ML-Ressourcen zusammengestellt. Mit einer Plattform namens Hugging Face Model Hub hat sich der Anbieter als einer der wichtigsten Akteure auf diesem Gebiet etabliert.

Training und Inferenz von ML-Modellen des ML-Frameworks Hugging Face auf Microsoft Azure.(Bild: Microsoft) — Training und Inferenz von ML-Modellen des ML-Frameworks Hugging Face auf Microsoft Azure.
(Bild: Microsoft)

Der Hugging Face Model Hub, auch bekannt als „Model Zoo“, ist die zentrale Drehscheibe des Hugging-Face-Ökosystems. Er bietet Zugang zu über 350.000 Modellen, 75.000 Datensätzen und 150.000 Demo-Apps (Spaces), die alle quelloffen und frei verfügbar sind. Hier finden Entwickler/innen unter anderem beliebte Architekturen wie BERT, GPT-2, RoBERTa, T5 und andere.

Der Hugging Face Model Hub ist vergleichbar mit GitHub für KI, wo man mit anderen Machine-Learning-Enthusiasten und Experten zusammenarbeiten kann, um von der geballten Erfahrung der Gemeinde zu profitieren und eigene Beiträge beizusteuern, so dass man gemeinsam vorankommt.

Entwickler können hier vortrainierte Modelle herunterladen, um sie mit verschiedenen Bibliotheken oder der Inference API zu nutzen. Mit Hugging Face Transformers ist es außerdem möglich, eigene neuronale Netzwerkkomponenten und Modelle zu entwickeln, eigene Tokenizer und Trainingspipelines bereitzustellen und eigene Modell-Checkpoints zu hosten.

Bei den Checkpoints handelt es sich um ein allgemeines Konzept des Maschinellen Lernens, es ist nicht nur auf Hugging Face beschränkt. Checkpoints sind gespeicherte (Zwischen)zustände von Modellen, Optimierern, Zufallsgeneratoren und dergleichen anderem. Checkpoints enthalten die Parameter des Modells und möglicherweise andere relevante Informationen zu einem bestimmten Zeitpunkt der Training-Phase. In Checkpoints können Developer den Fortschritt sichern, um das Training zu einem späteren Zeitpunkt fortzusetzen oder die Resultate von Experimenten zu reproduzieren.

Bestimmte Funktionen innerhalb der Bibliothek Hugging Face Accelerate wie save_state() zum Speichern und load_state() zum Laden eines Zustands erleichtern diese Aufgaben. Auch andere ML-Plattformen und -Bibliotheken wie TensorFlow, PyTorch und Keras bieten ähnliche Mechanismen für das Speichern und Laden von Trainingszuständen. Hugging Face Transformers vereinfacht den Prozess der Feinabstimmung von Modellen unter anderem auch durch die Bereitstellung von Beispiel-Skripten und Hilfsprogrammen.

Inhalt des Artikels:

Seite 1: Machine-Learning-Frameworks und -Dienste
Seite 2: TensorFlow und Keras
Seite 3: Apache MXNet und unser Fazit

Nächste Seite >

(ID:50064368)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.