Anleitung: Verwenden Sie eine beliebige ONNX-LLM in der AI Dev Gallery

In diesem Lernprogramm erfahren Sie, wie Sie ein beliebiges ONNX-basiertes Großsprachmodell (LLM) über die AI Dev Gallery ausführen– eine Open-Source-Windows-Anwendung (verfügbar in der Microsoft Store), die KI-unterstützte Beispiele zeigt.

Diese Schritte funktionieren für alle LLM im ONNX Runtime GenAI Format, einschließlich:

Modelle, die von Hugging Face heruntergeladen wurden
Mit dem Foundry Toolkit für Visual Studio Code-Konvertierungstool konvertierte Modelle aus anderen Frameworks

Schritt 1: Auswählen eines interaktiven Beispiels im AI Dev Gallery

Öffnen Sie die AI Dev Gallery App.
Navigieren Sie zur Registerkarte "Beispiele ", und wählen Sie ein Textbeispiel aus (z. B. "Text generieren" oder "Chat").
Klicken Sie auf die Schaltfläche " Modellauswahl ", um die verfügbaren Modelle für dieses Beispiel anzuzeigen.
Wählen Sie die Registerkarte "Benutzerdefinierte Modelle " aus, um Ihre eigene ONNX LLM einzubringen.

Schritt 2: Abrufen oder Konvertieren eines ONNX LLM-Modells

Um ein Modell im AI Dev GalleryFormat zu verwenden, muss es im ONNX Runtime GenAI Format vorliegen. Sie haben folgende Möglichkeiten:

Laden Sie ein vorkonvertiertes Modell herunter:
- Durchsuchen Sie Modelle in Hugging Face ONNX Models, oder
- Gehen Sie in AI Dev Gallery "Modell hinzufügen" → "Hugging Face durchsuchen"
Konvertieren Sie Ihr eigenes Modell:
- Klicken Sie auf Open Foundry Toolkits Konvertierungstool in der Modellauswahl, die die Erweiterung Foundry Toolkit in Visual Studio Code startet.
  - Wenn Sie es nicht installiert haben, suchen Sie im VS Code Extensions Marketplace nach "Foundry Toolkit".
- Verwenden Sie das Foundry Toolkit für Visual Studio Code, um ein unterstütztes Modell in ONNX Runtime GenAI Format zu konvertieren.

Derzeit unterstützte Modelle für die Konvertierung:

DeepSeek R1 Distill Qwen 1.5B
Phi 3.5 Mini-Anweisung
Qwen 2.5-1.5B Instruct
Llama 3.2 1B-Anweisung

Hinweis

Die Konvertierung des Foundry Toolkits befindet sich in der Vorschau-Version und unterstützt derzeit ausschließlich die oben aufgeführten Modelle.

Schritt 3: Verwenden des ONNX-Modells im AI Dev Gallery

Sobald Sie ein Modell im ONNX Runtime GenAI Format haben, kehren Sie zum AI Dev GalleryModellauswahlfenster zurück.
Klicken Sie auf "Modell hinzufügen" → Von Datenträger , und geben Sie den Pfad zu Ihrem ONNX-Modell an.

Hinweis

Wenn Sie das Konvertierungstool des Foundry Toolkits verwendet haben, sollte der konvertierte Modellpfad diesem Format entsprechen:
c:/{workspace}/{model_project}/history/{workflow}/model/model.onnx
Nachdem Sie hinzugefügt haben, können Sie nun Ihr Modell auswählen und mit den interaktiven Beispielen verwenden.
Klicken Sie optional auf "Quellcode anzeigen" in der App, um den Code anzuzeigen, der das Modell ausführt.

Unterstützte Beispiele in der AI Dev Gallery

Diese ONNX-LLMs können mit den folgenden Beispielen im AI Dev Gallery verwendet werden.

Text

Text generieren
Zusammenfassen von Text
Chat
Semantischer Kernel-Chat
Grammatikprüfung
Paraphrasentext
Analysieren der Textstimmung
Inhaltsmoderation
Benutzerdefinierte Parameter
Retrieval Augmented Generation (RAG)

Intelligente Steuerelemente

Smart TextBox

Code

Code generieren
Erläutern von Code

Nächste Schritte

Nachdem Sie nun Ihre ONNX LLM AI Dev Gallery ausprobiert haben, können Sie den gleichen Ansatz in Ihrer eigenen App integrieren.

Funktionsweise des Beispiels

Die AI Dev Gallery Beispiele verwenden OnnxRuntimeGenAIChatClient (aus dem ONNX Runtime GenAI SDK) zum Umschließen Ihres ONNX-Modells.
Dieser Client wird in die Microsoft.Extensions.AI Abstraktionen (IChatClient, ChatMessage usw.) eingebunden, damit Sie auf natürliche Weise mit Prompts und Antworten auf hoher Ebene arbeiten können.
Innerhalb der Factory (OnnxRuntimeGenAIChatClientFactory) stellt die App sicher, dass Windows ML (WinML) Ausführungsanbieter registriert sind und das ONNX-Modell mit der besten verfügbaren Hardwarebeschleunigung (CPU, GPU oder NPU) ausführt.

Beispiel aus dem Beispiel:

// Register WinML execution providers (under the hood)
var catalog = Microsoft.Windows.AI.MachineLearning.ExecutionProviderCatalog.GetDefault();
await catalog.EnsureAndRegisterCertifiedAsync();

// Create a chat client for your ONNX model
chatClient = await OnnxRuntimeGenAIChatClientFactory.CreateAsync(
    @"C:\path\to\your\onnx\model",
    new LlmPromptTemplate
    {
        System = "<|system|>\n{{CONTENT}}<|end|>\n",
        User = "<|user|>\n{{CONTENT}}<|end|>\n",
        Assistant = "<|assistant|>\n{{CONTENT}}<|end|>\n",
        Stop = [ "<|system|>", "<|user|>", "<|assistant|>", "<|end|>"]
    });

// Stream responses into your UI
await foreach (var part in chatClient.GetStreamingResponseAsync(messages, null, cts.Token))
{
    OutputTextBlock.Text += part;
}

Weitere Informationen zum Integrieren von ONNX-Modellen in Windows Anwendungen finden Sie unter:

Siehe auch

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-21