Sdílet prostřednictvím


Velké jazykové modely (LLM) v Databricks

Azure Databricks usnadňuje přístup k veřejně dostupným velkým jazykovým modelům a umožňuje ho vytvářet.

Databricks Runtime pro Machine Learning zahrnuje knihovny, jako je Hugging Face Transformers a LangChain, které umožňují integrovat existující předem natrénované modely nebo jiné opensourcové knihovny do pracovního postupu. Odtud můžete využít funkce platformy Azure Databricks k vyladění LLM pomocí vlastních dat pro lepší výkon domény.

Kromě toho Azure Databricks nabízí uživatelům SQL integrované funkce pro přístup k LLM a experimentování s llMs, jako je Azure OpenAI a OpenAI, pomocí funkcí AI.

Trénování modelu Puzzle AI

Důležité

Tato funkce je ve verzi Public Preview. Spojte se s týmem účtu Databricks a zaregistrujte se do verze Public Preview.

Puzzle AI Model Training (dříve Foundation Model Training) je jednoduché rozhraní pro trénovací zásobník Databricks k provádění kompletního vyladění modelu.

Pomocí trénování modelu Mosaic AI můžete provést následující akce:

  • Dolaďte model vlastními daty s kontrolními body uloženými do MLflow. Zachováte si úplnou kontrolu nad jemně vyladěným modelem.
  • Automaticky zaregistrujte model do katalogu Unity, což umožňuje snadné nasazení pomocí obsluhy modelů.
  • Dolaďte dokončený, proprietární model načtením hmotností dříve jemně vyladěného modelu.

Viz Rozhraní AI Model Training pro základní modely.

Hugging Face Transformers

Díky hugging Face Transformers v Databricks můžete škálovat dávkové aplikace pro zpracování přirozeného jazyka (NLP) a doladit modely pro aplikace s velkými jazyky.

Knihovna Hugging Face transformers je předinstalovaná ve službě Databricks Runtime 10.4 LTS ML a vyšší. Mnohé z oblíbených modelů NLP fungují nejlépe na hardwaru GPU, takže pokud nepoužíváte model optimalizovaný pro použití na procesorech, můžete dosáhnout nejlepšího výkonu pomocí nejnovějšího hardwaru GPU.

DSPy

DSPy automatizuje ladění výzev tak, že přeloží uživatelsky definované podpisy přirozeného jazyka do kompletních pokynů a několika snímků příkladů.

Příklady použití DSPy najdete v tématu Vytváření aplikací GenAI pomocí DSPy v Azure Databricks .

LangChain

LangChain je k dispozici jako experimentální varianta MLflow, která zákazníkům LangChain umožňuje využívat robustní nástroje a možnosti sledování experimentů MLflow přímo z prostředí Azure Databricks.

LangChain je softwarová architektura navržená tak, aby pomáhala vytvářet aplikace, které využívají velké jazykové modely (LLM) a kombinují je s externími daty, aby přinesly více trénovacího kontextu pro vaše LLM.

Databricks Runtime ML zahrnuje langchain databricks Runtime 13.1 ML a vyšší.

Seznamte se s integracemi jazyka LangChain specifické pro Databricks.

Funkce AI

Důležité

Tato funkce je ve verzi Public Preview.

Funkce AI jsou integrované funkce SQL, které uživatelům SQL umožňují:

  • Pomocí rozhraní API modelu Foundation Databricks můžete provádět různé úkoly s daty vaší společnosti.
  • Získejte přístup k externím modelům, jako je GPT-4, z OpenAI a experimentujte s nimi.
  • Dotazy na modely hostované pomocí architektury Mosaic AI Model Obsluhující koncové body z dotazů SQL