Erkunden von Azure AI Foundry-Modellen in Azure Machine Learning

2025-05-20

Azure AI Foundry Models ist Ihr zentrales Ziel zum Ermitteln, Auswerten und Bereitstellen leistungsstarker KI-Modelle – ganz gleich, ob Sie einen benutzerdefinierten Copilot erstellen, einen Agent erstellen, eine vorhandene Anwendung verbessern oder neue KI-Funktionen erkunden.

Mit Foundry Models haben Sie folgende Möglichkeiten:

Erkunden Sie einen umfassenden Katalog modernster Modelle von Microsoft, OpenAI, DeepSeek, Hugging Face, Meta und mehr.
Vergleichen und bewerten Sie Modelle nebeneinander mithilfe von realen Aufgaben und Ihren eigenen Daten.
Stellen Sie dank integrierter Tools für Optimierung, Einblick und verantwortungsvolle KI sicher bereit.
Wählen Sie Ihren Pfad aus– bringen Sie Ihr eigenes Modell mit, verwenden Sie ein gehostetes Modell, oder integrieren Sie nahtlos in Azure-Dienste.
Ganz gleich, ob Sie Entwickler, Datenwissenschaftler oder Unternehmensarchitekt sind, Foundry Models bietet Ihnen die Flexibilität und Kontrolle, KI-Lösungen zu erstellen, die skaliert werden – sicher, verantwortungsbewusst und schnell.

Azure AI Foundry bietet einen umfassenden Katalog von KI-Modellen. Es gibt über 1900 Modelle, die von Foundation-Modellen, Reasoning-Modellen, kleinen Sprachmodellen, multimodalen Modellen, domänenspezifischen Modellen, Industriemodellen und mehr reichen.

Unser Katalog ist in zwei Hauptkategorien unterteilt:

Direkt von Azure verkaufte Modelle
Modelle von Partnern und Gemeinschaft

Wenn Sie die Unterscheidung zwischen diesen Kategorien verstehen, können Sie die richtigen Modelle basierend auf Ihren spezifischen Anforderungen und strategischen Zielen auswählen.

Direkt von Azure verkaufte Modelle

Dies sind Modelle, die von Microsoft unter den Microsoft-Produktbedingungen gehostet und verkauft werden. Diese Modelle haben eine strenge Bewertung durchlaufen und sind tief in das KI-Ökosystem von Azure integriert. Die Modelle stammen aus einer Vielzahl von Top-Anbietern und bieten eine verbesserte Integration, optimierte Leistung und direkten Microsoft-Support, einschließlich Vereinbarungen zum Servicelevel auf Unternehmensniveau (SERVICE Level Agreements, SLAs).

Merkmale dieser direkten Modelle:

Offizieller First-Party-Support von Microsoft
Hohes Maß an Integration in Azure-Dienste und -Infrastruktur
Umfangreiches Leistungs-Benchmarking und Validierung
Einhaltung der verantwortungsvollen KI-Standards von Microsoft
Skalierbarkeit, Zuverlässigkeit und Sicherheit auf Unternehmensniveau

Diese Modelle bieten auch den Vorteil eines austauschbaren bereitgestellten Durchsatzes, was bedeutet, dass Sie Ihr Limit und Ihre Reservierungen flexibel in jedem dieser Angebote nutzen können.

Modelle von Partnern und der Gemeinschaft

Diese Modelle stellen die überwiegende Mehrheit der Azure AI Foundry-Modelle dar. Diese Modelle werden von vertrauenswürdigen Drittanbieterorganisationen, Partnern, Forschungslabors und Community-Mitwirkenden bereitgestellt. Diese Modelle bieten spezielle und vielfältige KI-Funktionen, die eine vielzahl von Szenarien, Branchen und Innovationen abdecken.

Merkmale von Modellen von Partnern und Gemeinschaft:

Entwickelt und unterstützt von externen Partnern und Community-Mitwirkenden
Vielfältiges Angebot an spezialisierten Modellen für Nischen oder breite Anwendungsfälle
In der Regel von Anbietern selbst überprüft, wobei integrationsrichtlinien von Azure bereitgestellt werden
Gemeinschaftliche Innovation und schnelle Verfügbarkeit modernster Modelle
Standardmäßige Azure AI-Integration mit Unterstützung und Wartung, die von den jeweiligen Anbietern verwaltet wird

Modelle können als Managed Compute- oder Standardbereitstellungsoptionen (pay-go) bereitgestellt werden. Der Modellanbieter wählt aus, wie die Modelle bereitgestellt werden können.

Auswahl zwischen direkten Modellen und Partner- und Communitymodellen

Berücksichtigen Sie bei der Auswahl von Modellen aus Azure AI Foundry Models Folgendes:

Anwendungsfall und Anforderungen: Modelle, die direkt von Azure verkauft werden, eignen sich ideal für Szenarien, die eine umfassende Azure-Integration, garantierte Unterstützung und Unternehmens-SLAs erfordern. Azure-Ökosystemmodelle zeichnen sich in spezialisierten Anwendungsfällen und innovationsgeführten Szenarien aus.
Supporterwartungen: Modelle, die direkt von Azure verkauft werden, verfügen über robusten von Microsoft bereitgestellten Support und Wartung. Diese Modelle werden von ihren Anbietern mit unterschiedlichen SLA- und Supportstrukturen unterstützt.
Innovation und Spezialisierung: Modelle von Partnern und Community bieten schnellen Zugang zu spezialisierten Innovationen und Nischenfunktionen, die häufig von führenden Forschungslaboren und aufstrebenden KI-Anbietern entwickelt wurden.

Modellsammlungen

Der Modellkatalog organisiert Modelle in unterschiedliche Sammlungen:

Azure OpenAI-Modelle sind ausschließlich in Azure verfügbar: Flagship Azure OpenAI-Modelle, die über eine Integration mit Azure OpenAI in Azure AI Foundry Models verfügbar sind. Microsoft unterstützt diese Modelle und deren Verwendung gemäß den Produktbedingungen und SLA für Azure OpenAI in Azure AI Foundry Models.
Offene Modelle aus dem Hugging Face-Hub: Hunderte von Modellen aus dem Hugging Face-Hub für Echtzeit-Inferenz mit verwalteten Rechendiensten. Hugging Face erstellt und unterhält die in dieser Sammlung aufgelisteten Modelle. Um Hilfe zu erhalten, verwenden Sie das Hugging Face-Forum oder den Hugging Face-Support. Erfahren Sie mehr in Bereitstellen offener Modelle mit Azure KI Foundry.

Mithilfe dieses Formulars können Sie eine Anforderung senden, um dem Modellkatalog ein Modell hinzuzufügen.

Übersicht über die Modellkatalogfunktionen

Der Modellkatalog im Azure KI Foundry-Portal ist der Hub, um eine Vielzahl von Modellen zu entdecken und zu verwenden, mit denen Sie generative KI-Anwendungen erstellen können. Der Modellkatalog verfügt über Hunderte von Modellen über Modellanbieter wie Azure OpenAI, Mistral, Meta, Cohere, NVIDIA und Hugging Face, einschließlich Modellen, die Microsoft trainiert hat. Modelle von anderen Anbietern als Microsoft sind Nicht-Microsoft-Produkte, wie in den Microsoft-Produktbedingungen definiert und unterliegen den mit den Modellen gelieferten Geschäftsbedingungen.

Sie können Modelle suchen und ermitteln, die Ihren Anforderungen durch Stichwortsuche und -filter entsprechen. Der Modellkatalog bietet außerdem ein Leistungs-Ranking und Benchmark-Metriken für ausgewählte Modelle. Sie können darauf zugreifen, indem Sie "Bestenliste durchsuchen " und "Modelle vergleichen" auswählen. Auf Benchmarkdaten kann auch über die Registerkarte "Benchmark" der Modellkarte zugegriffen werden.

Im Modellkatalogfilter finden Sie:

Sammlung: Sie können Modelle basierend auf der Modellanbieterauflistung filtern.
Industrie: Sie können nach den Modellen filtern, die auf branchenspezifischem Dataset trainiert werden.
Funktionen: Sie können nach eindeutigen Modelleigenschaften wie Schlussfolgerungsprozessen und Toolaufrufen filtern.
Bereitstellungsoptionen: Sie können nach den Modellen filtern, die eine bestimmte Bereitstellungsoptionen unterstützen.
- Standard: Mit dieser Option können Sie pro API-Aufruf bezahlen.
- Bereitgestellt: am besten geeignet für die Echtzeitbewertung für große konsistente Mengen.
- Batch: am besten geeignet für kostenoptimierte Batchaufträge und nicht für Latenz. Für die Batchbereitstellung wird keine Unterstützung für den Playground bereitgestellt.
- Verwaltete Berechnung: Mit dieser Option können Sie ein Modell auf einem virtuellen Azure-Computer bereitstellen. Sie werden für Hosting und Inferencing in Rechnung gestellt.
Ableitungsaufgaben: Sie können Modelle basierend auf dem Ableitungsaufgabentyp filtern.
Feintuning-Aufgaben: Sie können Modelle basierend auf dem Feintuning-Aufgabentyp filtern.
Lizenzen: Sie können Modelle basierend auf dem Lizenztyp filtern.

Auf der Modellkarte finden Sie:

Schnelle Fakten: Sie werden wichtige Informationen zum Modell auf einen schnellen Blick sehen.
Details: Diese Seite enthält die detaillierten Informationen zum Modell, einschließlich Beschreibung, Versionsinformationen, unterstützter Datentyp usw.
Benchmarks: Sie finden Leistungs-Benchmarkmetriken für ausgewählte Modelle.
Vorhandene Bereitstellungen: Wenn Sie das Modell bereits bereitgestellt haben, finden Sie es auf der Registerkarte "Vorhandene Bereitstellungen".
Lizenz: Sie finden rechtliche Informationen zur Modelllizenzierung.
Artefakte: Diese Registerkarte wird nur für geöffnete Modelle angezeigt. Sie können die Modellressourcen anzeigen und über die Benutzeroberfläche herunterladen.

Modellbereitstellung: Verwaltete Rechenleistung und Standardbereitstellungen

Zusätzlich zu Azure OpenAI-Modellen bietet der Modellkatalog zwei verschiedene Möglichkeiten zum Bereitstellen von Modellen für Ihre Verwendung: verwaltete Compute- und Standardbereitstellungen.

Die für jedes Modell verfügbaren Bereitstellungsoptionen und Features variieren, wie in den folgenden Tabellen beschrieben. Erfahren Sie mehr über die Datenverarbeitung mit den Bereitstellungsoptionen.

Funktionen der Modellimplementierungsoptionen

Funktionen	Verwaltete Rechenkapazität	Standardimplementierungen
Bereitstellungserfahrung und Abrechnung	Modellgewichtungen werden für dedizierte VMs mit verwalteter Computeressource bereitgestellt. Eine verwaltete Computeressource, die über eine oder mehrere Bereitstellungen verfügen kann, stellt eine REST-API für den Rückschluss zur Verfügung. Ihnen werden die VM-Kernstunden in Rechnung gestellt, welche die Bereitstellungen verwenden.	Der Zugriff auf Modelle erfolgt über eine Bereitstellung, die eine API für den Zugriff auf das Modell bereitstellt. Die API bietet den Zugriff auf das Modell, das von Microsoft gehostet und verwaltet wird, um Rückschlüsse zu ermöglichen. Sie werden für Eingaben und Ausgaben an die APIs in Rechnung gestellt, in der Regel in Token. Preisinformationen werden vor der Bereitstellung bekannt gegeben.
API-Authentifizierung	Schlüssel und Microsoft Entra-Authentifizierung.	Nur Schlüssel.
Inhaltssicherheit	Verwenden Sie Dienst-APIs der Azure KI Inhaltssicherheit.	Azure KI Inhaltssicherheit-Filter sind integriert mit Rückschluss-APIs verfügbar. Azure KI Inhaltssicherheit-Filter werden separat abgerechnet.
Netzwerkisolation	Konfigurieren von verwalteten Netzwerken für Azure KI Foundry-Hubs.	Verwaltete Rechenressourcen folgen der Flaggeinstellung für den öffentlichen Netzwerkzugriff (Public Network Access, PNA) Ihres Hubs. Weitere Informationen finden Sie im Abschnitt Netzwerkisolation für Modelle, die über Standardbereitstellungen bereitgestellt werden weiter unten in diesem Artikel.

Verfügbare Modelle für unterstützte Bereitstellungsoptionen

Der Modellkatalog bietet zwei unterschiedliche Möglichkeiten zum Bereitstellen von Modellen aus dem Katalog für Ihre Nutzung: verwaltete Rechneressourcen und Standardbereitstellungen. Die für jedes Modell verfügbaren Bereitstellungsoptionen variieren. Erfahren Sie in den folgenden Tabellen mehr über die Features der Bereitstellungsoptionen und die Optionen, die für bestimmte Modelle verfügbar sind. Erfahren Sie mehr über die Datenverarbeitung mit den Bereitstellungsoptionen.

Funktionen	Verwaltete Rechenkapazität	Standardimplementierungen
Bereitstellungserfahrung und Abrechnung	Modellgewichtungen werden für dedizierte VMs mit verwalteten Onlineendpunkten bereitgestellt. Der verwaltete Onlineendpunkt, der über eine oder mehrere Bereitstellungen verfügen kann, stellt eine REST-API für den Rückschluss zur Verfügung. Ihnen werden die VM-Kernstunden in Rechnung gestellt, die von den Bereitstellungen verbraucht werden.	Der Zugriff auf Modelle erfolgt über eine Bereitstellung, die eine API für den Zugriff auf das Modell bereitstellt. Die API bietet Zugriff auf das Modell, das für den Rückschluss in einem zentralen GPU-Pool gehostet wird, der von Microsoft verwaltet wird. Dieser Zugriffsmodus wird als „Modelle als ein Dienst“ bezeichnet. Sie werden für Eingaben und Ausgaben an die APIs in Rechnung gestellt, in der Regel in Token. Preisinformationen werden vor der Bereitstellung bereitgestellt.
API-Authentifizierung	Schlüssel und Microsoft Entra ID-Authentifizierung. Weitere Informationen	Nur Schlüssel.
Inhaltssicherheit	Verwenden Sie Dienst-APIs der Azure-Inhaltssicherheit.	Azure KI Inhaltssicherheit-Filter sind integriert mit Rückschluss-APIs verfügbar. Azure KI Inhaltssicherheit-Filter können separat abgerechnet werden.
Netzwerkisolation	Verwaltetes virtuelles Netzwerk mit Onlineendpunkten. Weitere Informationen

Verwaltete Rechenkapazität

Die Funktion zum Bereitstellen von Modellen mit verwalteten Computeressourcen baut auf Plattformfunktionen von Azure Machine Learning auf, um im gesamten GenAIOps-Lebenszyklus (auch als LLMOps bezeichnet) eine nahtlose Integration der umfangreichen Sammlung von Modellen im Modellkatalog zu ermöglichen.

Verfügbarkeit von Modellen für die Bereitstellung als verwaltete Rechenressourcen

Die Modelle werden über Azure Machine Learning-Registrierungen verfügbar gemacht, die den „ML zuerst“-Ansatz zum Hosten und Verteilen von Machine Learning-Ressourcen wie Modellgewichtungen, Containerlaufzeiten für die Ausführung der Modelle, Pipelines zum Auswerten und Verfeinern der Modelle und Datasets für Benchmarks und Stichproben ermöglichen. Diese ML-Registrierungen bauen auf einer hoch skalierbaren und unternehmensfähigen Infrastruktur auf, die Folgendes bietet:

Liefert Modellartefakte für den Zugriff mit geringer Wartezeit für alle Azure-Regionen mit integrierter Georeplikation.
Unterstützt Unternehmenssicherheitsanforderungen wie Zugriff auf Modelle mit Azure Policy einschränken und sichere Bereitstellung mit verwalteten virtuellen Netzwerken.

Bereitstellung von Modellen für Vorhersagen mit verwalteten Rechenressourcen

Modelle, die für die Bereitstellung mit verwalteten Computeressourcen zur Verfügung stehen, können auf Azure Machine Learning-Onlineendpunkten für Echtzeitrückschlüsse bereitgestellt oder für Azure Machine Learning-Batchrückschlüsse für die Batchverarbeitung Ihrer Daten verwendet werden. Für die Bereitstellung mit verwalteten Computeressourcen müssen Sie über eine Quote für virtuelle Maschinen in Ihrem Azure-Abonnement für genau die SKUs verfügen, die für die optimale Ausführung des Modells erforderlich sind. Einige Modelle ermöglichen Ihnen die Bereitstellung im vorübergehend freigegebenen Kontingent zum Testen des Modells. Weitere Informationen zum Bereitstellen von Modellen:

Erstellen von generativen KI-Apps mit verwaltetem Rechenbetrieb

Prompt Flow bietet Funktionen zum Erstellen, Experimentieren, Durchlaufen und Bereitstellen Ihrer KI-Anwendungen. Modelle, die mit verwalteten Computeressourcen bereitgestellt werden, können Sie mit dem Open Model LLM-Tool in Prompt Flow verwenden. Sie können auch die REST-API verwenden, die von den verwalteten Computeressourcen in beliebten LLM-Tools wie LangChain mit der Azure Machine Learning-Erweiterung verfügbar gemacht wird.

Inhaltssicherheit für Modelle, die als verwaltete Rechenressourcen bereitgestellt werden

Der Dienst Azure KI Inhaltssicherheit (Azure AI Content Safety, AACS) kann mit Modellen, die mit verwalteten Computeressourcen bereitgestellt werden, verwendet werden, um eine Überprüfung auf verschiedene Kategorien schädlicher Inhalte wie sexuellen Inhalten, Gewalt, Hass und Selbstverletzung sowie auf komplexe Bedrohungen, beispielsweise durch die Erkennung von Jailbreak-Risiken und die Erkennung von geschütztem Materialtext, durchzuführen. Sie können für die Referenzintegration mit AACS für Llama 2 auf dieses Notebook verweisen, oder das Tool für die Inhaltssicherheit (Text) in Prompt Flow verwenden, um Antworten vom Modell an AACS zur Überprüfung zu übergeben. Diese Nutzung wird Ihnen gemäß den AACS-Preisen separat in Rechnung gestellt.

Standardbereitstellungen mit Standardabrechnung

Bestimmte Modelle im Modellkatalog können als Standardbereitstellungen mit Standardabrechnung bereitgestellt werden; diese Bereitstellungsmethode wird als Standardbereitstellungen bezeichnet. Modelle, die über MaaS verfügbar sind, werden in von Microsoft verwalteter Infrastruktur gehostet, wodurch API-basierter Zugriff auf das Modell des Modellanbieters ermöglicht wird. Der API-basierte Zugriff kann die Kosten für den Zugriff auf ein Modell dramatisch reduzieren und die Bereitstellungserfahrung erheblich vereinfachen. Die meisten MaaS-Modelle verfügen über tokenbasierte Preise.

Wie werden Drittanbietermodelle in MaaS verfügbar gemacht?

Modelle, die für die Bereitstellung als Standardbereitstellungen mit Standardabrechnung verfügbar sind, werden vom Modellanbieter angeboten, aber in der von Microsoft verwalteten Azure-Infrastruktur gehostet und über DIE API aufgerufen. Modellanbieter definieren die Lizenzbedingungen und legen den Preis für die Verwendung ihrer Modelle fest, während Azure Machine Learning Service die Hostinginfrastruktur verwaltet, die Rückschluss-APIs verfügbar macht und als Datenverarbeiter für übermittelte Prompts und Inhaltsausgaben von über MaaS bereitgestellten Modellen fungiert. Weitere Informationen zur Datenverarbeitung für MaaS finden Sie im Artikel Datenschutz.

Hinweis

Cloud Solution Provider (CSP)-Abonnements haben nicht die Möglichkeit, Standardbereitstellungsmodelle zu erwerben.

Abrechnung

Das Erlebnis der Entdeckung, des Abonnements und des Verbrauchs von Modellen, die über MaaS bereitgestellt werden, befindet sich im Azure KI Foundry-Portal und im Azure Machine Learning Studio. Benutzer akzeptieren Lizenzbedingungen für die Verwendung der Modelle. Preisinformationen für den Verbrauch werden während der Bereitstellung bereitgestellt.

Modelle von Nicht-Microsoft-Anbietern werden über Azure Marketplace gemäß den Nutzungsbedingungen des kommerziellen Microsoft-Marketplace in Rechnung gestellt.

Modelle von Microsoft werden über Azure-Verbrauchseinheiten als Erstanbieter-Verbrauchsdienste in Rechnung gestellt. Wie in den Produktbedingungen beschrieben, erwerben Sie Dienste für den Erstanbieterverbrauch mithilfe von Azure-Zählern, unterliegen jedoch nicht den Azure-Dienstbedingungen. Die Verwendung dieser Modelle unterliegt den bereitgestellten Lizenzbedingungen.

Optimierung von Modellen

Für Modelle, die über MaaS verfügbar sind und Feinabstimmungen unterstützen, können Benutzer die gehostete Feinabstimmung mit der Standardabrechnung nutzen, um die Modelle mithilfe von Daten anzupassen, die sie bereitstellen. Weitere Informationen finden Sie unter Feinabstimmung eines Llama 2-Modells im Azure AI Foundry-Portal.

RAG mit Modellen, die als Standardbereitstellungen bereitgestellt werden

Azure KI Foundry ermöglicht Benutzern die Verwendung von Vektorindizes und Retrieval Augmented Generation. Modelle, die als übliche Bereitstellungen verfügbar gemacht werden können, können genutzt werden, um Einbettungen und Schlussfolgerungen basierend auf maßgeschneiderten Daten zu generieren, um fallbezogene Antworten zu erzeugen. Weitere Informationen finden Sie unter Retrieval Augmented Generation und Indizes.

Regionale Verfügbarkeit von Angeboten und Modellen

Die Standardabrechnung ist nur für Benutzer verfügbar, deren Azure-Abonnement zu einem Abrechnungskonto in einem Land/einer Region gehört, in dem der Modellanbieter das Angebot zur Verfügung gestellt hat. Wenn das Angebot in der relevanten Region verfügbar ist, müssen die Benutzer über einen Hub oder ein Projekt in der Azure-Region verfügen, in der das Modell für die Bereitstellung oder Optimierung verfügbar ist. Detaillierte Informationen finden Sie unter Regionenverfügbarkeit für Modelle in Standardbereitstellungen.

Inhaltssicherheit für Modelle, die über Standardbereitstellungen bereitgestellt werden

Von Bedeutung

Dieses Feature ist zurzeit als öffentliche Preview verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und ist nicht für Produktionsworkloads vorgesehen. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar.

Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

Für Sprachmodelle, die über die serverlose API bereitgestellt werden, implementiert Azure AI eine Standardkonfiguration von Azure AI Content Safety-Textmoderationsfiltern, die schädliche Inhalte wie Hass, Selbstschäden, sexuelle und gewalttätige Inhalte erkennen. Weitere Informationen zum Filtern von Inhalten finden Sie unter Leitplanken und Kontrollen für direkt von Azure verkaufte Modelle.

Tipp

Die Inhaltsfilterung ist für bestimmte Modelltypen, die über die serverlose API bereitgestellt werden, nicht verfügbar. Zu diesen Modelltypen gehören Einbettungsmodelle und Zeitreihenmodelle.

Die Inhaltsfilterung erfolgt synchron, während der Dienst Eingaben verarbeitet, um Inhalte zu generieren. Möglicherweise werden Sie gemäß den Azure KI Inhaltssicherheit-Preisen für diese Verwendung separat in Rechnung gestellt. Sie können die Inhaltsfilterung für einzelne serverlose Endpunkte entweder deaktivieren:

Zum Zeitpunkt der ersten Bereitstellung eines Sprachmodells
Später durch Auswählen der Umschaltfläche für die Inhaltsfilterung auf der Seite mit den Bereitstellungsdetails

Angenommen, Sie entscheiden sich für die Verwendung einer anderen API als der Modellinference-API , um mit einem Modell zu arbeiten, das über eine serverlose API bereitgestellt wird. In einer solchen Situation ist die Inhaltsfilterung nicht aktiviert, es sei denn, Sie implementieren sie separat mithilfe von Azure AI Content Safety.

Erste Schritte mit Azure KI Inhaltssicherheit finden Sie im Schnellstart: Analysieren von Textinhalten. Wenn Sie beim Arbeiten mit Modellen, die über die serverlose API bereitgestellt werden, keine Inhaltsfilterung verwenden, besteht ein höheres Risiko, dass Benutzer schädliche Inhalte ausgesetzt werden.

Netzwerkisolation für Modelle, die über standardisierte Bereitstellungen bereitgestellt werden

Endpunkte für Modelle, die als Standardbereitstellungen bereitgestellt werden, entsprechen der PNA-Kennzeichnungseinstellung (Public Network Access) des Arbeitsbereichs, in dem die Bereitstellung vorhanden ist. Um Ihren MaaS-Endpunkt zu sichern, deaktivieren Sie das PNA-Flag in Ihrem Arbeitsbereich. Sie können eingehende Kommunikation von einem Client zu Ihrem Endpunkt sichern, indem Sie einen privaten Endpunkt für den Arbeitsbereich verwenden.

So legen Sie das PNA-Flag für den Arbeitsbereich fest:

Öffnen Sie das Azure-Portal.
Suchen Sie nach Azure Machine Learning und wählen Sie Ihren Arbeitsbereich aus der Liste der Arbeitsbereiche aus.
Verwenden Sie auf der Seite "Übersicht" den linken Bereich, um zu "Netzwerkeinstellungen"> zuwechseln.
Auf der Registerkarte Öffentlicher Zugriff können Sie Einstellungen für das Flag für den Zugriff auf das öffentliche Netzwerk konfigurieren.
Speichern Sie Ihre Änderungen. Es kann bis zu fünf Minuten dauern, bis Ihre Änderungen verteilt sind.

Einschränkungen

Wenn Sie einen Arbeitsbereich mit einem privaten Endpunkt haben, der vor dem 11. Juli 2024 erstellt wurde, folgen neue MaaS-Endpunkte, die diesem Arbeitsbereich hinzugefügt wurden, nicht der Netzwerkkonfiguration. Stattdessen müssen Sie einen neuen privaten Endpunkt für den Arbeitsbereich erstellen und neue Standardbereitstellungen im Arbeitsbereich erstellen, damit die neuen Bereitstellungen der Netzwerkkonfiguration des Arbeitsbereichs folgen können.
Wenn Sie einen Arbeitsbereich mit MaaS-Bereitstellungen haben, die vor dem 11. Juli 2024 erstellt wurden, und Sie einen privaten Endpunkt in diesem Arbeitsbereich aktivieren, folgen die vorhandenen MaaS-Bereitstellungen nicht der Netzwerkkonfiguration des Arbeitsbereichs. Damit Standardbereitstellungen im Arbeitsbereich der Konfiguration des Arbeitsbereichs entsprechen, müssen Sie die Bereitstellungen erneut erstellen.
Derzeit ist Unterstützung für Ihre Daten für MaaS-Bereitstellungen in privaten Arbeitsbereichen nicht verfügbar, da private Arbeitsbereiche das PNA-Flag deaktiviert haben.
Jede Netzwerkkonfigurationsänderung (z. B. das Aktivieren oder Deaktivieren des PNA-Flags) kann bis zu fünf Minuten dauern, bis sie verteilt sind.