AI och maskininlärning på Databricks

Skapa, distribuera och hantera AI- och maskininlärningsprogram med Mosaic AI, en integrerad plattform som förenar hela AI-livscykeln från förberedelse av data till produktionsövervakning.

En uppsättning självstudier för att komma igång finns i AI- och maskininlärningskurser.

Skapa generativa AI-applikationer

Utveckla och distribuera generativa AI-program i företagsklass, till exempel finjusterade LLM:er, AI-agenter och hämtningsförhöjd generation.

Feature	Description
AI Playground	Prototypa och testa generativa AI-modeller med utformning av anrop utan kodning och justering av parametrar.
Grundmodeller	Hantera toppmoderna LLM:er, inklusive Meta Llama, Anthropic Claude och OpenAI GPT via säkra, skalbara API:er.
Kunskapsassistent	En enkel metod för att skapa och optimera domänspecifika QA-botagenter av hög kvalitet.
Agent Framework	Skapa och distribuera agenter av produktionskvalitet, inklusive RAG-program och system med flera agenter med Python.
MLflow för GenAI	Mäta, förbättra och övervaka kvalitet under hela GenAI-programmets livscykel med hjälp av AI-drivna mått och omfattande spårningsobservabilitet.
Vektorsökning	Lagra och fråga inbäddningsvektorer med automatisk synkronisering till din kunskapsbas för RAG-program.
AI Runtime	Anpassa djupinlärningsarbetsbelastningar med en och flera noder för träning och finjustering av anpassade modeller med hjälp av dina favoritramverk och få toppmodern effektivitet, prestanda och kvalitet.
Finjustering av grundmodell	Anpassa grundmodeller med dina egna data för att optimera prestanda för specifika program.

Träna klassiska maskininlärningsmodeller

Skapa maskininlärningsmodeller med automatiserade verktyg och samarbetsmiljöer för utveckling.

Feature	Description
AutoML	Skapa automatiskt högkvalitativa modeller med minimal kod med hjälp av automatiserad funktionsutveckling och justering av hyperparametrar.
Databricks Runtime för ML	Förkonfigurerade kluster med Stöd för TensorFlow, PyTorch, Keras och GPU för djupinlärningsutveckling.
MLflow-spårning	Spåra experiment, jämföra modellprestanda och hantera hela livscykeln för modellutveckling.
Funktionsutveckling	Skapa, hantera och tillhandahåll funktioner med automatiserade data-pipelines och upptäckande av funktioner.
Databricks-notebook-filer	Samarbetsutvecklingsmiljö med stöd för Python-, R-, Scala- och SQL för ML-arbetsflöden.

Träna djupinlärningsmodeller

Använd inbyggda ramverk för att utveckla djupinlärningsmodeller.

Feature	Description
Distribuerad utbildning	Exempel på distribuerad djupinlärning med Ray, TorchDistributor och DeepSpeed.
Metodtips för djupinlärning i Databricks	Metodtips för djupinlärning i Databricks.
PyTorch	Enkelnod och distribuerad träning med PyTorch.
TensorFlow	Träning med en nod och distribuerad träning med TensorFlow och TensorBoard.
Referenslösningar	Referenslösningar för djupinlärning.

Distribuera och hantera modeller

Distribuera modeller till produktion med skalbara slutpunkter, slutsatsdragning i realtid och övervakning i företagsklass.

Feature	Description
Modelltjänst	Distribuera anpassade modeller och LLM:er som skalbara REST-slutpunkter med stöd för automatisk skalning och GPU.
AI Gateway	Styra och övervaka åtkomsten till generativa AI-modeller med användningsspårning, nyttolastloggning och säkerhetskontroller.
Externa modeller	Integrera modeller från tredje part som finns utanför Databricks med enhetlig styrning och övervakning.
API:er för grundmodell	Få åtkomst till och fråga efter toppmoderna öppna modeller som hanteras av Databricks.

Övervaka och styra ML-system

Säkerställa modellkvalitet, dataintegritet och efterlevnad med omfattande övervaknings- och styrningsverktyg.

Feature	Description
Unity-katalog	Styr data, funktioner, modeller och funktioner med enhetlig åtkomstkontroll, ursprungsspårning och identifiering.
Dataprofilering	Övervaka datakvalitet, modellprestanda och prediktionsavvikelser med automatiserade aviseringar och grundorsaksanalys.
Avvikelseidentifiering	Övervaka datas färskhet och fullständighet på katalognivå.
MLflow för modeller	Spåra, utvärdera och övervaka generativa AI-program under hela utvecklingslivscykeln.

Produktionsanpassa ML-arbetsflöden

Skala maskininlärningsåtgärder med automatiserade arbetsflöden, CI/CD-integrering och produktionsklara pipelines.

Feature	Description
Modeller i Unity-katalogen	Använd modellregistret i Unity Catalog för centraliserad styrning och för att hantera modellens livscykel, inklusive distributioner.
Lakeflow-jobb	Skapa automatiserade arbetsflöden och produktionsklara ETL-pipelines för ML-databearbetning.
Ray på Databricks	Skala ML-arbetsbelastningar med distribuerad databehandling för storskalig modellträning och slutsatsdragning.
MLOps-arbetsflöden	Implementera MLOps från slutpunkt till slutpunkt med automatiserade tränings-, testnings- och distributionspipelines.
Git-integrering	Versionshantering av ML-kod och notebooks med sömlös Git-integrering och samarbete.

Feedback

Var den här sidan till hjälp?

Last updated on 2026-03-27