Advanced Paste in Microsoft Powertoys: Teil 2 OCR-Analyse für Bilder in der Zwischenablage

Von Thomas Joos 2 min Lesedauer

Anbieter zum Thema

„Advanced Paste“ integriert auch eine lokale OCR-Erkennung für Bilder. Wenn sich eine Grafik mit Text in der Zwischenablage befindet, kann das Tool den enthaltenen Text automatisch erkennen und als normalen Text einfügen.

„Advanced Paste“ gehört zu dem „Powertoys“ von Microsoft. Das Tool integriert  eine lokale OCR-Erkennung für Bilder in der Zwischenablage. (Bild:  Thomas Joos)
„Advanced Paste“ gehört zu dem „Powertoys“ von Microsoft. Das Tool integriert eine lokale OCR-Erkennung für Bilder in der Zwischenablage.
(Bild: Thomas Joos)

Diese Funktion arbeitet vollständig lokal auf dem System. Der extrahierte Inhalt lässt sich anschließend weiterverarbeiten, kopieren oder erneut konvertieren. Damit eignet sich das Tool für Situationen, in denen Text aus Screenshots, Diagrammen oder gescannten Dokumenten benötigt wird.

Transcodierung von Audio und Video

Neben Text- und Bilddaten verarbeitet Advanced Paste auch Mediendateien. Inhalte aus der Zwischenablage lassen sich direkt in andere Medienformate transkodieren. Eine Funktion extrahiert den Audiokanal aus Audio- oder Videodateien und speichert ihn als MP3-Datei. Das Tool übernimmt dabei vorhandene Metadaten und behält Audioqualität sowie Bitrate bei.

Für Videodaten steht eine weitere Transcodierungsfunktion bereit. Sie wandelt Videodateien in das MP4-Format mit H.264-Video und AAC-Audio um. Diese Kombination gehört zu den am weitesten unterstützten Container- und Codecformaten und erleichtert die Nutzung der Dateien in unterschiedlichen Anwendungen oder Geräten. Die Medienverarbeitung nutzt die Windows Media Transcoding APIs und läuft vollständig lokal auf dem System.

KI-gestützte Verarbeitung von Zwischenablageinhalten

Eine zusätzliche Erweiterung stellt die optionale KI-Integration dar. Advanced Paste kann Inhalte aus der Zwischenablage an ein konfiguriertes Sprachmodell übergeben und daraus neue Inhalte erzeugen oder vorhandene transformieren.

Mögliche Szenarien umfassen das Zusammenfassen längerer Texte, Übersetzungen oder die Generierung von Code aus Funktionsbeschreibungen. Auch Stiländerungen oder strukturelle Umformungen lassen sich auf diesem Weg ausführen.

Die KI-Integration funktioniert über externe Modellanbieter oder lokale Modelle. Unterstützt werden unter anderem OpenAI-Modelle sowie Cloud-basierte Dienste verschiedener Anbieter. Alternativ können lokale Modelle über „Foundry Local“ oder „Ollama“ eingebunden werden. Durch diese Architektur bleibt die eigentliche Zwischenablageverarbeitung lokal, während KI-Operationen optional über externe Modelle erfolgen können.

Automatisierte Workflows mit semantischem Kernel

Bei Verwendung von OpenAI-Modellen kann Advanced Paste mehrere Verarbeitungsschritte miteinander kombinieren. Ein Bild aus der Zwischenablage lässt sich dadurch zuerst per OCR analysieren.

Anschließend übersetzt das Modell den Text in eine andere Sprache und speichert das Ergebnis direkt als Datei. Die einzelnen Schritte laufen automatisch nacheinander ab.

(ID:50774540)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung