Sdílet prostřednictvím


Vkládání v .NET

Vkládání je způsob, jakým LLMs zachycují sémantický význam. Jedná se o číselnou reprezentaci nečíselných dat, která může LLM použít k určení vztahů mezi koncepty. Vkládání můžete použít k tomu, aby model umělé inteligence rozuměl významu vstupů, aby mohl provádět porovnání a transformace, například sumarizaci textu nebo vytváření obrázků z popisů textu. LLM můžou okamžitě používat vkládání a vkládání můžete ukládat do vektorových databází, aby poskytovaly sémantickou paměť pro LLM podle potřeby.

Případy použití pro vkládání

Tato část uvádí hlavní případy použití pro vkládání.

Použití vlastních dat ke zlepšení relevance dokončení

Pomocí vlastních databází vygenerujte vkládání dat a integrujte je s LLM, abyste je mohli zpřístupnit pro dokončení. Toto použití vkládání je důležitou součástí generování rozšířeného načítání.

Zvětšení množství textu, který můžete umístit do výzvy

Vkládáním můžete zvýšit množství kontextu, který se dá přizpůsobit výzvě, aniž byste zvýšili požadovaný počet tokenů.

Předpokládejme například, že chcete do výzvy zahrnout 500 stránek textu. Počettokench Vkládání můžete použít k shrnutí a rozdělení velkých objemů tohoto textu na části, které jsou dostatečně malé, aby se vešly do jednoho vstupu, a pak posoudit podobnost jednotlivých částí s celým nezpracovaným textem. Pak můžete zvolit kus, který nejlépe zachová sémantický význam nezpracovaného textu a použije ho ve výzvě bez dosažení limitu tokenu.

Provádění klasifikace textu, shrnutí nebo překladu

Vkládání vám pomůže modelu porozumět významu a kontextu textu a pak tento text klasifikovat, shrnout nebo přeložit. Vkládání můžete například použít k tomu, aby modely klasifikovaly texty jako kladné nebo záporné, spamové nebo ne spamy nebo zprávy nebo názory.

Generování a přepis zvuku

Pomocí vkládání zvuku můžete zpracovávat zvukové soubory nebo vstupy ve vaší aplikaci.

Například služba Speech podporuje řadu vložených zvuků, včetně řeči na text a text na řeč. Zvuk můžete zpracovávat v reálném čase nebo v dávkách.

Převod textu na obrázky nebo obrázky na text

Sémantické zpracování obrázků vyžaduje vkládání obrázků, které většina LLM nemůže vygenerovat. K vytvoření vektorových vkládání obrázků pro obrázky použijte model vkládání obrázků, jako je ViT . Tyto vložené objekty s modelem generování obrázků pak můžete použít k vytvoření nebo úpravě obrázků pomocí textu nebo naopak. Můžete například použít DALL· Model E pro generování obrázků , jako jsou loga, tváře, zvířata a krajiny.

Vygenerování nebo kód dokumentu

Pomocí vložených výrazů můžete modelu pomoct vytvořit kód z textu nebo naopak tím, že převedete jiný kód nebo textové výrazy na společnou reprezentaci. Vložením můžete například pomoct vygenerovat model nebo kód dokumentu v jazyce C# nebo Python.

Volba modelu vkládání

Vkládání pro nezpracovaná data vygenerujete pomocí modelu vkládání AI, který dokáže kódovat nečíselná data do vektoru (dlouhé pole čísel). Model může také dekódovat vložení do nečíselných dat, která mají stejný nebo podobný význam jako původní nezpracovaná data. Existuje mnoho modelů vkládání, které můžete použít, a model OpenAI text-embedding-ada-002 je jedním z běžných modelů, které se používají. Další příklady najdete v seznamu modelů vkládání dostupných v Azure OpenAI.

Ukládání a zpracování vkládání do vektorové databáze

Po vygenerování vkládání budete potřebovat způsob, jak je uložit, abyste je později mohli načíst pomocí volání LLM. Vektorové databáze jsou navržené tak, aby ukládaly a zpracovávaly vektory, takže jsou přirozeným domovem pro vkládání. Různé vektorové databáze nabízejí různé možnosti zpracování, takže byste měli zvolit jednu z nezpracovaných dat a vašich cílů. Informace o možnostech najdete v dostupných řešeních vektorové databáze.

Použití vkládání do řešení LLM

Při vytváření aplikací založených na LLM můžete použít sémantické jádro k integraci vložených modelů a vektorových úložišť, takže můžete rychle načíst textová data a vkládat a ukládat vložené položky. To vám umožní použít řešení vektorové databáze k ukládání a načítání sémantických pamětí.