Freigeben über


Was sind Windows AI APIs?

Abbildung der Symbole für verschiedene Windows AI FoundryAPIs.

Windows AI Foundry bietet eine Vielzahl von Funktionen für künstliche Intelligenz (AI) durch eine Reihe von Windows AI APIs - und hardwarestrahierten KI-Inferencing-Funktionen, die über Windows Machine Learning (ML) ermöglicht werden. Die Windows AI APIs ermöglicht KI-Fähigkeiten, ohne dass Sie ein eigenes ML-Modell (Machine Learning) finden, ausführen oder optimieren müssen. Die Modelle, die Windows AI Foundry auf Copilot+ PCs antreiben, werden lokal und kontinuierlich im Hintergrund ausgeführt.

Eine vollständige App, die veranschaulicht, wie man API mit WinUI verwendet, finden Sie im .

Erstellen Ihrer ersten KI-basierten Windows-App

Um Ihre erste Windows-App mit Visual Studio und einigen einfachen Windows AI APIszu erstellen, erfüllen Sie einfach die Voraussetzungen, und verwenden Sie den bereitgestellten Beispielcode in "Erste Schritte beim Erstellen einer App mit Windows AI APIs".

Von dort aus können Sie zu kurzen Tutorials springen, die eine App erstellen, die bestimmte Windows-KI APIs nutzt, z. B. das Phi-Silica-Walkthrough, das Imaging-Walkthrough und das OCR-Walkthrough.

Testen von APIs und Modellen auf Ihrem PC

AI Dev Gallery ist eine Demo-App , die im Microsoft Store verfügbar ist, mit der Sie Windows AI APIs und Modelle schnell herunterladen, ausprobieren und verwenden können.

Wählen Sie im AI Dev Gallery unter dem Tab Windows AIAPIs den Menüpunkt aus und wählen Sie dann die Phi-Silica-Beispieldatei aus. Wenn das Modell bereits auf Ihrem Gerät verfügbar ist, wird dieses Beispiel sofort ausgeführt. Wählen Sie andernfalls "Modell anfordern " aus, um das Modell herunterzuladen. Nach dem Herunterladen wird dieses Beispiel aktiviert. Erfahren Sie mehr über AI Dev Gallery in Was ist AI Dev Gallery?.

Übersicht über die verfügbaren APIs

Hier sind einige einsatzbereite KI-Features, die Sie aus Ihrer Windows-App nutzen können:

Phi-Silika

Ähnlich wie das GPT Large Language Model (LLM) von OpenAI, das ChatGPT unterstützt, ist Phi ein von Microsoft Research entwickeltes Small Language Model (SLM), um Sprachverarbeitungsaufgaben auf einem lokalen Gerät auszuführen. Phi Silika ist speziell für Windows-Geräte mit einer Neural Processing Unit (NPU) konzipiert, sodass Textgenerierungs- und Unterhaltungsfeatures auf leistungsstarke, hardwarebeschleunigte Weise direkt auf dem Gerät ausgeführt werden können. Phi Silika ist in China nicht verfügbar.

Ein animiertes GIF zeigt eine KI-Chataufforderung mit dem Text

Siehe auch Erste Schritte mit Phi Silica.

Tipp

Um die Barrierefreiheit und Lesbarkeit zu verbessern, verwendet diese Seite in der Standardansicht statische Bilder. Sie können auf ein Bild klicken, um die animierte Version anzuzeigen.

Texterkennung

Die Texterkennung APIs ermöglicht die Erkennung von Text in einem Bild und die Konvertierung auf einem lokalen Gerät verschiedener Dokumenttypen (z. B. gescannte Papierdokumente, PDF-Dateien und Bilder, die von einer Digitalkamera erfasst werden) in bearbeitbare und durchsuchbare Daten.

Eine animierte GIF mit Wörtern in einem Screenshot, die mit Textüberlagerungen erkannt werden, die mithilfe der Texterkennungsfunktion in eine Datei oder Zwischenablage kopiert werden können.

Siehe auch Erste Schritte mit der KI-Texterkennung

Superauflösung für Bilder

Die Bild-Superauflösung APIs ermöglicht das Schärfen und Skalieren von Bildern.

Animiertes GIF mit der Darstellung einer Kombination aus Wörtern und Bildern, die mithilfe der Bildauflösungsfunktion schärfer gemacht und skaliert wird

Sehen Sie sich auch an, was kann ich mit der Bild-Superauflösung tun?.

Bildsegmentierung

Die Bildsegmentierung APIs ermöglicht die Segmentierung von Bildern.

Eine animierte GIF mit einem Mann, der einen Fuß vom Boden hebt, und wählen Sie dann

Weitere Informationen finden Sie unter "Was kann ich mit Bildsegmentierung tun?".

Bildbeschreibung

Die Bildbeschreibung APIs beschreibt Bilder in natürlicher Sprache. Bildbeschreibungsfeatures sind in China nicht verfügbar.

Ein animiertes GIF zeigt einen schlafenden Hund und blendet eine Bildbeschreibung ein, die mit natürlicher Sprache einen flauschigen, zottelhaarigen Hund beschreibt, der bequem auf einer Couch liegt, und nutzt dabei die Bildbeschreibungsfunktion.

Siehe auch "Abrufen einer Textbeschreibung aus einem Bild"

Objektlöschung

Das Objektlöschen APIs ermöglicht das Entfernen von Objekten aus Bildern.

Ein animiertes GIF mit einem Bild, in dem der Benutzer Objekte aus der Objektlöschfunktion entfernt.

Siehe auch "Erste Schritte mit Objektlöschung"

Zusätzliche KI-Features

  • Windows Studio Effects. Windows-Geräte mit kompatiblen neuralen Verarbeitungseinheiten (Neural Processing Units, NPUs) integrieren Windows Studio Effects in die integrierten Kamera- und Mikrofoneinstellungen des Geräts. Sie können z. B. die folgenden Spezialeffekte anwenden, die KI verwenden: Hintergrundunschärfe, Blickkontaktkorrektur, automatischer Rahmen, Porträtbeleuchtungskorrektur, kreative Filter und Sprachfokus zum Herausfiltern von Hintergrundgeräuschen. Siehe Windows Studio Effects Übersicht (Vorschau)

  • Recall: Recall ermöglicht Es Benutzern, schnell Elemente aus ihrer früheren Aktivität zu finden, z. B. Dokumente, Bilder, Websites und mehr. Entwickler können die Benutzererfahrung Recall mit ihrer App erweitern, indem Sie Unterstützung für den Neustart von Inhalten hinzufügen. Diese Integration hilft Benutzern, an der Stelle, an der sie in Ihrer App aufgehört haben, aufzuholen, um das Engagement der App und den nahtlosen Fluss des Benutzers zwischen Windows und Ihrer App zu verbessern. Siehe Recall Übersicht.

  • Übersetzungen für Liveuntertitel (noch nicht unterstützt) Helfen Sie allen Benutzern bei der Verwendung von Windows , einschließlich derjenigen, die taub oder schwerhörig sind, die Audiodaten besser zu verstehen, indem Sie Untertitel gesprochener Inhalte anzeigen (auch wenn sich der Audioinhalt in einer Sprache befindet, die sich von der bevorzugten Sprache des Systems unterscheidet).

Inhaltsmoderation

Erfahren Sie, wie Windows AI Foundry Inhalte moderiert, und wie Sie Sensibilitätsfilter anpassen. Weitere Informationen finden Sie unter Moderation der Inhaltssicherheit mit Windows AI Foundry.

Wenn Sie KI-Features verwenden, empfehlen wir Ihnen, den folgenden Abschnitt zu lesen: Entwicklung verantwortungsbewusster generativer KI-Anwendungen und Features unter Windows.

Zusätzliche Ressourcen

Siehe auch