Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
- Foundry Local ist in der Vorschau verfügbar. Öffentliche Vorschauversionen bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Bereitstellung befinden.
- Features, Ansätze und Prozesse können sich vor der allgemeinen Verfügbarkeit (General Availability, GA) noch ändern oder eine eingeschränkte Funktionalität aufweisen.
Dieses Dokument enthält bewährte Methoden und Tipps zur Problembehandlung für Foundry Local.
Bewährte Sicherheitsmethoden
- Verwenden Sie Foundry Local in Umgebungen, die den Sicherheitsrichtlinien Ihrer Organisation entsprechen.
- Stellen Sie beim Behandeln vertraulicher Daten sicher, dass Ihr Gerät die Sicherheitsanforderungen Ihrer Organisation erfüllt.
- Verwenden Sie die Datenträgerverschlüsselung auf Geräten, auf denen zwischengespeicherte Modelle möglicherweise vertrauliche Feinabstimmungsdaten enthalten.
Lizenzierungsaspekte
Beachten Sie bei der Verwendung von Foundry Local die Lizenzierungsauswirkungen für die modelle, die Sie ausführen. Sie können die vollständigen Bedingungen der Modelllizenz für jedes Modell im Modellkatalog anzeigen, indem Sie Folgendes verwenden:
foundry model info <model> --license
Produktionsbereitstellungsbereich
Foundry Local ist für die On-Device-Ableitung und nicht für verteilte, containerisierte oder multicomputerbasierte Produktionsbereitstellungen konzipiert.
Problembehandlung
Häufige Probleme und Lösungen
Thema | Mögliche Ursache | Lösung |
---|---|---|
Langsame Ableitung | Nur CPU-Modell mit großer Parameteranzahl | Verwenden von GPU-optimierten Modellvarianten bei Verfügbarkeit |
Modelldownloadfehler | Probleme mit der Netzwerkkonnektivität | Überprüfen Sie Ihre Internetverbindung, und führen Sie die Ausführung aus foundry cache list , um den Cachestatus zu überprüfen. |
Der Dienst kann nicht gestartet werden. | Portkonflikte oder Berechtigungsprobleme | Testen foundry service restart oder Melden eines Problems mit Protokollen mithilfe von foundry zip-logs |
Qualcomm NPU-Fehler (Qnn error code 5005: "Failed to load from EpContext model. qnn_backend_manager." ) |
Qualcomm NPU-Fehler | In Untersuchung |
Verbessern der Leistung
Wenn Sie langsame Rückschlüsse haben, sollten Sie die folgenden Strategien berücksichtigen:
- Gleichzeitiges Ausführen von ONNX-Modellen, die im AI-Toolkit für VS Code bereitgestellt werden, führen zu Ressourcenkonflikten. Beenden Sie die KI-Toolkit-Ableitungssitzung, bevor Sie Foundry Local ausführen.
- Verwenden der GPU-Beschleunigung, wenn verfügbar
- Identifizieren Sie Engpässe, indem Sie die Speicherauslastung während der Ableitung überwachen.
- Versuchen Sie mehr quantisierte Modellvarianten (z. B. INT8 anstelle von FP16)
- Anpassen von Batchgrößen für nicht interaktive Workloads