Delen via


Grote taalmodellen (LLM's) in Databricks

Met Azure Databricks kunt u eenvoudig grote taalmodellen openen en bouwen.

Databricks Runtime voor Machine Learning bevat bibliotheken zoals Hugging Face Transformers en LangChain waarmee u bestaande vooraf getrainde modellen of andere opensourcebibliotheken in uw werkstroom kunt integreren. Hier kunt u gebruikmaken van de mogelijkheden van het Azure Databricks-platform om LLM's af te stemmen met behulp van uw eigen gegevens voor betere domeinprestaties.

Daarnaast biedt Azure Databricks ingebouwde functionaliteit voor SQL-gebruikers om toegang te krijgen tot EN te experimenteren met LLM's zoals Azure OpenAI en OpenAI met behulp van AI-functies.

Basismodeltraining

Belangrijk

Deze functie is beschikbaar als openbare preview. Neem contact op met uw Databricks-accountteam om u in te schrijven voor de openbare preview.

Foundation Model Training is een eenvoudige interface voor de Databricks-trainingsstack om een volledig model af te stemmen.

U kunt het volgende doen met behulp van Foundation Model Training:

  • Verfijn een model met uw aangepaste gegevens, met de controlepunten die zijn opgeslagen in MLflow. U behoudt volledige controle over het verfijnde model.
  • Registreer het model automatisch bij Unity Catalog, zodat u eenvoudig kunt implementeren met het leveren van modellen.
  • Verfijn een voltooid, eigen model door de gewichten van een eerder afgestemd model te laden.

Zie Inleiding tot Foundation Model Training.

Gezichtstransformaties omhelzen

Met Hugging Face Transformers op Databricks kunt u uw NLP-batchtoepassingen (Natural Language Processing) uitschalen en modellen verfijnen voor grootschalige modeltoepassingen.

De Hugging Face-bibliotheek transformers is vooraf geïnstalleerd op Databricks Runtime 10.4 LTS ML en hoger. Veel van de populaire NLP-modellen werken het beste op GPU-hardware, dus u krijgt mogelijk de beste prestaties met recente GPU-hardware, tenzij u een model gebruikt dat speciaal is geoptimaliseerd voor gebruik op CPU's.

LangChain

LangChain is beschikbaar als experimentele MLflow-smaak waarmee LangChain-klanten rechtstreeks vanuit de Azure Databricks-omgeving gebruikmaken van de robuuste hulpprogramma's en mogelijkheden voor het bijhouden van experimenten van MLflow.

LangChain is een softwareframework dat is ontworpen om toepassingen te maken die gebruikmaken van grote taalmodellen (LLM's) en deze te combineren met externe gegevens om meer trainingscontext voor uw LLM's te creëren.

Databricks Runtime ML bevat databricks langchain Runtime 13.1 ML en hoger.

Meer informatie over Databricks-specifieke LangChain-integraties.

AI-functies

Belangrijk

Deze functie is beschikbaar als openbare preview.

AI-functies zijn ingebouwde SQL-functies waarmee SQL-gebruikers:

  • Gebruik Databricks Foundation Model-API's om verschillende taken uit te voeren op de gegevens van uw bedrijf.
  • Open externe modellen zoals GPT-4 vanuit OpenAI en experimenteer ermee.
  • Querymodellen die worden gehost door het Databricks-model dat eindpunten van SQL-query's biedt.