Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Generování umělé inteligence odkazuje na třídu algoritmů AI, které se mohou učit z existujícího multimediálního obsahu a vytvářet nový obsah. Vytvořený obsah je možné přizpůsobit pomocí technik, jako jsou výzvy a vyladění. Algoritmy generování umělé inteligence používají konkrétní modely strojového učení:
- Transformátory a rekurentní neurální sítě (RNN) pro generování textu
- Generativní protivné sítě (GAN) a variační autoenkodéry (VAEs) pro generování obrázků
Generování umělé inteligence se používá v syntéze obrázků a hudby a ve zdravotnictví, spolu s běžnými úkoly, jako jsou automatické dokončování textu, shrnutí textu a překlad. Techniky generování umělé inteligence umožňují funkce pro data, jako jsou clustering a segmentace, sémantické vyhledávání a doporučení, modelování témat, zodpovězení otázek a detekce anomálií.
Následující video ukazuje použití generování umělé inteligence se službou Azure Database for PostgreSQL a pgvector rozšířením, které vám pomůže pochopit koncepty v tomto článku.
OpenAI
OpenAI je výzkumná organizace a technologická společnost známá pro svou průkopnickou práci v oblasti umělé inteligence a strojového učení. Jejím úkolem je zajistit, aby umělá obecná inteligence (AGI), která označuje vysoce autonomní systémy umělé inteligence schopné překonat lidi ve většině ekonomicky hodnotné práce, přinášela výhody celému lidstvu. OpenAI přinesl na trh nejmodernější generativní modely, jako jsou GPT-3, GPT-3.5 a GPT-4.
Azure OpenAI je nabídka služeb Microsoftu, která pomáhá vytvářet generování aplikací AI pomocí Azure. Azure OpenAI poskytuje zákazníkům pokročilou jazykovou AI s využitím modelů OpenAI GPT-4, GPT-3, Codex, DALL-E a Whisper s možnostmi zabezpečení a podniku v Azure. Azure OpenAI spolupracuje na vývoji rozhraní API s OpenAI, aby zajistilo kompatibilitu a hladký přechod z jednoho na druhý.
Zákazníci s Azure OpenAI získají možnosti zabezpečení Microsoft Azure a zároveň spouštět stejné modely jako OpenAI. Azure OpenAI nabízí privátní sítě, regionální dostupnost a zodpovědné filtrování obsahu AI.
Další informace o Azure OpenAI.
Velký jazykový model
Velký jazykový model (LLM) je typ modelu AI, který je natrénovaný na obrovských objemech textových dat, aby porozuměl a vygeneroval jazyk podobný člověku. LLM jsou obvykle založeny na architekturách hlubokého učení, jako jsou transformátory. Jsou známí tím, že dokáží provádět širokou škálu úloh porozumění přirozenému jazyku a generování. Příkladem nabídek LLM jsou služby Azure OpenAI a ChatGPT openAI.
Mezi klíčové charakteristiky a možnosti LLM patří:
- Měřítko: Škála LLM je obrovská z hlediska počtu parametrů, které používají jejich architektury. Modely, jako je GPT-3, obsahují stovky milionů až bilióny parametrů, které jim umožňují zachytit složité vzory v jazyce.
- Předtrénování: LLM procházejí předtrénováním velkého korpusu textových dat z internetu. Toto předtrénování jim umožňuje učit se gramatiku, syntaxi, sémantiku a širokou škálu znalostí o jazyce a světě.
- Jemné ladění: Po předtrénování je možné llmy jemně doladit na konkrétní úkoly nebo domény s menšími datovými sadami specifickými pro jednotlivé úkoly. Tento proces vyladění umožňuje přizpůsobit se specializovanějším úkolům, jako je klasifikace textu, překlad, shrnutí a odpovědi na otázky.
GPT
GPT je zkratka pro Generative Pretrained Transformer a odkazuje na řadu velkých jazykových modelů, které OpenAI vyvinuly. Modely GPT jsou neurální sítě, které jsou předem natrénované na obrovských objemech dat z internetu, takže jsou schopny porozumět a generovat lidský text.
Tady je přehled hlavních modelů GPT a jejich klíčových charakteristik:
GPT-3: Vydáno v červnu 2020 a dobře známý model v řadě GPT. Má 175 miliard parametrů, což z něj dělá jeden z největších a nejvýkonnějších jazykových modelů, které existují.
GPT-3 dosáhl pozoruhodného výkonu na široké škále úloh porozumění přirozeného jazyka a generování. Může provádět úkoly, jako je dokončování textu, překlad a odpovídání na otázky s plynulostí na úrovni člověka.
GPT-3 je rozdělen do různých velikostí modelů, od nejmenších (125 milionů parametrů) po největší (175 miliard parametrů).
GPT-4: Nejnovější model GPT z OpenAI. Má 1,76 miliard parametrů.
Vektory
Vektor je matematický koncept, který se používá v lineární algebrě a geometrii k reprezentaci množství, která mají velikost i směr. V kontextu strojového učení se vektory často používají k reprezentaci datových bodů nebo funkcí.
Mezi klíčové atributy a operace vektorů patří:
- Velikost: Délka nebo velikost vektoru, často označená jako jeho norma, představuje velikost dat. Jedná se o nezáporné reálné číslo.
- Směr: Směr označuje orientaci nebo úhel množství, které představuje ve vztahu k referenčnímu bodu nebo souřadnicovému systému.
-
Komponenty: Vektor lze rozdělit do jejích složek podél různých os nebo rozměrů. V 2D kartézském souřadnicovém systému může být vektor reprezentován jako (x, y), kde x a y jsou jeho komponenty podél osy x a osy y. Vektor v n dimenzích je n-tice (
{x1, x2… xn}). - Sčítání a skalární násobení: Vektory lze sečíst dohromady a vytvořit nové vektory a mohou být vynásobeny skaláry (reálná čísla).
- Tečkované produkty a křížové produkty: Vektory lze kombinovat prostřednictvím tečkových produktů (skalárních produktů) a křížových produktů (vektorové produkty).
Vektorové databáze
Vektorová databáze, označovaná také jako systém pro správu vektorových databází (DBMS), je typ databázového systému, který je navržený k efektivnímu ukládání, správě a dotazování vektorových dat. Tradiční relační databáze primárně zpracovávají strukturovaná data v tabulkách, zatímco vektorové databáze jsou optimalizované pro ukládání a načítání multidimenzionálních datových bodů reprezentovaných jako vektory. Tyto databáze jsou užitečné pro aplikace, kde jsou zapojeny operace, jako jsou vyhledávání podobnosti, geoprostorová data, systémy doporučení a clustering.
Mezi klíčové charakteristiky vektorových databází patří:
- Vektorové úložiště: Vektorové databáze ukládají datové body jako vektory s více dimenzemi. Každá dimenze představuje funkci nebo atribut datového bodu. Tyto vektory mohou představovat širokou škálu datových typů, včetně číselných, kategorických a textových dat.
- Efektivní vektorové operace: Vektorové databáze jsou optimalizované pro provádění vektorových operací, jako je sčítání vektorů, odčítání, tečkované produkty a výpočty podobnosti (například kosinus nebo euklidská vzdálenost).
- Efektivní vyhledávání: Efektivní mechanismy indexování jsou zásadní pro rychlé načítání podobných vektorů. Vektorové databáze používají různé mechanismy indexování, které umožňují rychlé načítání.
- Dotazovací jazyky: Vektorové databáze poskytují dotazovací jazyky a rozhraní API, která jsou přizpůsobená pro vektorové operace a vyhledávání podobnosti. Tyto dotazovací jazyky umožňují uživatelům efektivně vyjádřit kritéria hledání.
- Vyhledávání podobnosti: Vektorové databáze excelují při hledání podobnosti, které uživatelům umožňují najít datové body podobné zadanému bodu dotazu. Tato charakteristika je cenná v systémech vyhledávání a doporučení.
- Geoprostorové zpracování dat: Některé vektorové databáze jsou navržené pro geoprostorová data, takže jsou vhodné pro aplikace, jako jsou služby založené na poloze, geografické informační systémy (GIS) a úlohy související s mapováním.
- Podpora různých datových typů: Vektorové databáze mohou ukládat a spravovat různé typy dat, jako jsou vektory, obrázky a text.
PostgreSQL může získat možnosti vektorové databáze pomocí pgvector rozšíření.
Vkládání
Vkládání je koncept strojového učení a zpracování přirozeného jazyka, který zahrnuje reprezentaci objektů (například slov, dokumentů nebo entit) jako vektorů v multidimenzionálním prostoru.
Tyto vektory jsou často zhuštěné. To znamená, že mají velký počet dimenzí. Učí se různými technikami, včetně neurálních sítí. Vkládání se zaměřuje na zachycení sémantických vztahů a podobností mezi objekty v souvislém vektorovém prostoru.
Mezi běžné typy vkládání patří:
-
Word: Při zpracování přirozeného jazyka představují vkládání slov slova jako vektory. Každé slovo je mapováno na vektor ve vysokodimenzionálním prostoru, kde se slova s podobnými významy nebo kontexty nacházejí blíže k sobě.
Word2VecaGloVejsou oblíbené techniky vkládání slov. -
Dokument: Vkládání dokumentů představuje dokumenty jako vektory.
Doc2Vecje oblíbený pro vytváření dokumentových embedingů. - Obrázek: Obrázky se dají reprezentovat jako vkládání, aby bylo možné zachytit vizuální funkce pro úlohy, jako je rozpoznávání objektů.
Vkládání je centrální pro reprezentaci složitých a vysoce dimenzionálních dat ve formě, kterou modely strojového učení můžou snadno zpracovat. Můžete je vytrénovat na velkých datových sadách a pak je použít jako funkce pro různé úlohy. LLM je používají.
PostgreSQL může získat možnosti generování vektorových vkládání pomocí integrace OpenAI rozšíření Azure AI.
Scénáře
Generativní AI má širokou škálu aplikací v různých oblastech a odvětvích, včetně technologií, zdravotnictví, zábavy, financí, výroby a dalších. Tady je několik běžných úloh, které můžou uživatelé provádět pomocí generující umělé inteligence:
-
Sémantické vyhledávání:
- Generování umělé inteligence umožňuje sémantické vyhledávání dat místo lexicografického vyhledávání. Ten hledá přesné shody s dotazy, zatímco sémantické vyhledávání najde obsah, který vyhovuje záměru vyhledávacího dotazu.
- Chatovací roboti a virtuální asistenti:
- Vyvíjet chatovací roboty, které se mohou zapojit do přirozených kontextových konverzací; Například k implementaci samoobslužné podpory pro zákazníky.
- Systémy doporučení:
- Vylepšete algoritmy doporučení generováním vkládání nebo reprezentací položek nebo uživatelů.
- Clustering a segmentace:
- Generativní umělá inteligence generuje vestavění, která umožňují algoritmům pro clustering dat seskupovat podobná data. Tento clustering umožňuje scénáře, jako je segmentace zákazníků, což inzerentům umožňuje cílit na zákazníky odlišně podle jejich atributů.
- Generování obsahu:
- Vygenerujte lidem podobný text pro aplikace, jako jsou chatovací roboti, vytváření románů/básní a porozumění přirozenému jazyku.
- Vytvářejte realistické obrázky, umělecká díla nebo návrhy pro grafiku, zábavu a reklamu.
- Generujte videa, animace nebo video efekty pro filmy, hry a marketing.
- Generovat hudbu.
- Překlad:
- Přeložte text z jednoho jazyka do druhého.
- Sumarizace:
- Shrnutí dlouhých článků nebo dokumentů pro extrakci klíčových informací
- Rozšíření dat:
- Generování dalších ukázek dat pro rozšíření a vylepšení trénovacích datových sad pro modely strojového učení
- Vytvářejte syntetická data pro scénáře, které jsou obtížné nebo nákladné shromažďovat ve skutečném světě, například pro lékařské obrázky.
- Zjišťování drog:
- Vygenerujte molekulární struktury a predikujte potenciální kandidáty na lék pro farmaceutické výzkumy.
- Vývoj her:
- Umožňuje vytvářet herní obsah, včetně úrovní, znaků a textur.
- Generujte realistická prostředí a krajiny ve hře.
- Označení a dokončení dat:
- Vyčistěte hlučná data generováním čistých vzorků dat.
- Vyplňte chybějící nebo neúplná data v datových sadách.
Související obsah
- Integrujte Azure Database pro PostgreSQL se službou Azure Cognitive Services
- Generování umělé inteligence s využitím Azure Database for PostgreSQL
- Integrace služby Azure Database for PostgreSQL se službou Azure Machine Learning
- Generování vektorových vkládání pomocí Azure OpenAI ve službě Azure Database for PostgreSQL
- Rozšíření Azure AI ve službě Azure Database for PostgreSQL
- Vytvoření systému doporučení s využitím Azure Database for PostgreSQL a Azure OpenAI
- Vytvoření sémantického vyhledávání pomocí Azure Database for PostgreSQL a Azure OpenAI
- Povolení a použití nástroje pgvector ve službě Azure Database for PostgreSQL