„Red Hat AI Enterprise“ soll mit der Version 4.3 autonome KI-Agenten in Produktionsumgebungen effizienter und sicherer skalieren, verwalten und überprüfen können als bisher. Optimiert wird die Hardware-Unterstützung und -Auslastung. Neue Evaluations- und Observability-Werkzeuge sowie automatisierte Red-Team-Tests kommen hinzu.
Red-Hat-CTO Chris Wright erläutert am 12. Mai 2026 auf dem „Red Hat Summit“ in Atlanta die erweiterten Funktionen für KI-Agenten in „Red Head AI Enterprise 4.3“.
(Bild: Red Hat / Youtube)
Im Rahmen des „Red Hat Summit 2026“ in Atlanta, Georgia, stellt das Unternehmen eine Vielzahl von Neuerungen für die KI-Plattform „Red Hat AI Enterprise“ vor. Mit der Version 3.4 soll vor allem der sichere, nachvollziehbare und effiziente Einsatz von KI-Agenten in Produktionsumgebungen ermöglicht werden.
Performance- und Flexibilitätsverbesserungen
Da das autonome Handeln einer Vielzahl von Agenten einen nochmals gesteigerten Ressourcenbedarf im Vergleich zum manuellen Einsatz generativer KI bedeute, habe sich Red Hat auf die Optimierung der Hardwareauslastung und ihre flexible Nutzung konzentriert. Dafür baut Red Hat die Integration des Open-Source-Projekts „llm-d“ in die KI-Plattform aus. Llm-d wird von Red Hat gemeinsam mit anderen Tech-Unternehmen in der CNCF-Sandbox (Cloud Native Computing Foundation) entwickelt und sorgt für eine effizientere Hardware-Auslastung auf Kubernetes.
Mit dem neuen Release von Red Hat AI wird nun auch Batch-Inferenz unterstützt. Damit können große Mengen nicht-zeitkritischer Anfragen zusammengefasst und asynchron über eine OpenAI-kompatible API verarbeitet werden, um die GPU-Auslastung zu maximieren. Zudem wird llm-d nun Latenz-kritische Anfragen von Hintergrund-Traffic unterscheiden und priorisieren können.
Eine Kostenersparnis von bis zu 19 Prozent bei bestimmten Modellen soll die Einführung von Speculative Decoding auf Basis der Inferenz-Engine „vLLM“ bieten. Bei diesem Verfahren erzeugt ein kleineres, schnelleres Draft-Modell mehrere Token-Kandidaten im Voraus, die das eigentliche Zielmodell anschließend verifiziert.
Model-as-a-Service mit granularen Einstellungen
Ebenfalls mit Hilfe von vLLM wird zudem die Auswahl nutzbarer Hardware erweitert. Red Hat AI unterstützt so nun (teils in einer Vorschau-Phase) die GPUs „AMD Instinct MI355X“ und „MI350P“ PCIe, „AMD Epyc“- und „Intel-Xeon“-CPUs sowie den Inferenzbeschleuniger (NPU) „Atom“ des südkoreanischen Chip-Startups Rebellions. Neu in Red Hat AI 3.4 ist zudem die Möglichkeit, verschiedene Gateways für verschiedene Nutzergruppen mit bestimmten Ressourcenzuweisungen festzulegen.
Damit will Red Hat das mit der Version 3.0 eingeführte Konzept von Modellen als Dienstleistung (Model-as-a-Service) erweitern. Konkret wird in Red Hat AI 3.4 ein Webinterface für Plattform-Ingenieure aus einer Betaphase in die allgemeine Verfügbarkeit überführt, das die granulare Einstellung der Token-Nutzung, der Sicherheitskonfigurationen und der Nutzerrollen für Modelle on-premises (allgemein verfügbar) und in der Cloud (technische Vorschau) erlaubt. Als technische Vorschau ist zudem die Nachverfolgung der Modell- und Ressourcenauslastung durch Nutzer verfügbar (Tracking/Showback). Eine voreingestellte Instanz des Monitoring-Systems Prometheus überwacht dabei die Hardware-Auslastung.
Integrierte Tools
Andere Neuerungen zielen auf die Integration heterogener Tools und Aufgaben. Die Tools „AutoRAG“ (Retrieval-augmented Generation) und „AutoML“ (Machine Learning) sollen die passenden Modelle, Strategien und Aufgaben für verschiedene Datensätze eigenständig auswählen. Ein neuer „Eval Hub“ soll eine einheitliche Steuerungsebene für verschiedene Evaluierungsaufgaben bieten, sodass Teams nicht einzelne Tools für die Einschätzung von Qualität, Genauigkeit oder Risiken einsetzen müssen.
Die Integration der Machine-Learning-Plattform „Mlflow“ ermöglicht in Red Hat AI 3.4 die Protokollierung aller Trainings- und Tuning-Durchläufe und die Versionierung einzelner Prompts mit Parametern, Metriken und Artefakten, so dass Teams Modellversionen reproduzierbar vergleichen können. Insbesondere nachverfolgt werden sollen auch sämtliche Schritte eines KI-Agenten wie Modell-Aufrufe, die Tools-Nutzung und die Denkketten.
Auf Basis von Mlflow entsteht zudem ein zentraler „AI studio playground“, wo einzelne Prompts in Kombination mit verschiedenen Modellen (einem Code-Repository ähnlich) getestet und verbessert werden können. Die zentrale Speicherung von Prompts soll die Nachvollziehbarkeit des KI-Verhaltens fördern.
Funktionen für Transparenz und Agentenkontrolle
Menschliche Red Teams gegen KI-Agenten: Chris Morgan und Cansu Kavılı Örnek lassen das Publikum auf dem „Red Hat Summit“ in Atlanta am 13. Mai 2026 gegen die automatisierte Schwachstellen-Identifikation in „Red Hat AI“ antreten.
(Bild: Red Hat / Youtube)
Neben der Nachverfolgung über Mlflow soll eine Reihe weiterer Neuerungen einen sicheren und nachvollziehbaren Einsatz von KI-Agenten sicherstellen. Die Einbindung der Open-Source-Projekte „Spiffe“ und „Spire“ ermöglicht kryptografische Identitäten für KI-Agenten, und zwar über kurzlebige und rotierende Ausweis-Tokens statt langlebiger Schlüssel. Ein weiteres Open-Source-Tool, der Scanner „Garak“, wird mit Automatisierten Red-Team-Tests Agenten und Modelle auf Schwachstellen gegenüber Prompt Injections und Jailbreaks sowie auf Voreingenommenheit (bias) prüfen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Das Kubernetes-Tool Kagenti ist in Red Hat AI 3.4 für die Lebenszyklusverwaltung von KI-Agenten zuständig. Gewährleisten soll es vor allem das Deployment in Produktionsumgebungen, die Skalierung und Verwaltung von Agenten, ohne ihren Code ändern zu müssen.
MCP: Server-Katalog, Authetifizierungs-Gateway und Kubernetes-Operator
Schließlich vertieft Red Hat mit der neuen Version seiner KI-Plattform die Integration des Model Context Protocol (MCP), eines offenen Standards für die Interaktion von KI-Modellen und Agenten mit Informationsquellen und Tools. Ein MCP-Katalog wird Teams eine Auswahl von Red Hat und Partnern bereitgestellter Server bieten, welche über einen MCP-Operator als Kubernetes-native Workloads betrieben werden können.
Ein MCP-Gateway übernimmt zwischen agentischer KI und MCP-Servern die Authentifizierung und Kontrolle der Tool-Nutzung durch Agenten. Der Katalog und Operator werden als frühe Developer Previews, das Gateway als reifere, aber noch nicht produktionsbereite Tech Preview veröffentlicht.
Auf Nachfrage erklärt Joe Fernandes, Red Hat-Vize und General Manager für AI Business, dass sämtliche Tools Teil des Abonnementmodells von Red Hat AI sein werden, keine separaten Nutzungsgebühren anfallen und es keine Beschränkung des Nutzungsvolumens geben soll. Das Update soll im Laufe des Mai 2026 erscheinen. Die Plattform soll „bald“ auch über die Marketplaces von AWS, Microsoft Azure und Google Cloud verfügbar sein.