Sdílet prostřednictvím


Co je Windows AI APIs?

Obrázek znázorňující ikony pro různé windows AI APIs.

Sadu hardwarových abstraktovaných AI využívajících APIs podporuje celá řada funkcí umělé inteligence (AI). AI systému Windows umožňují funkce umělé inteligence APIs bez nutnosti najít, spustit nebo optimalizovat vlastní model strojového učení (ML). Modely, které pohánějí Windows AI APIs na počítačích Copilot+, běží lokálně a mohou běžet nepřetržitě na pozadí.

Informace o tom, jak používat APIs s WinUI, najdete v ukázkové aplikaci .

Důležité

Následuje seznam funkcí AI systému Windows a verze sady Windows App SDK, ve které jsou aktuálně podporované. Stručný popis najdete v části Přehled dostupných APIs dále v tomto tématu.

Verze 1.8.0 (1.8.250907003) - Phi Silica (funkce s omezeným přístupem),souhrn konverzací (textová inteligence) a vymazání objektu

Verze 1.8 Preview (1.8.0-preview) - Vyladění LoRA pro Phi Silica, Přepisovač textů - Tón (Text Intelligence)

Private Preview – sémantické vyhledávání

Verze 1.7.1 (1.7.250401001) – všechny ostatní APIs

Vytvoření první aplikace využívající AI pro Windows

Návod

Pro zlepšení přístupnosti a čitelnosti se na této stránce ve výchozím nastavení zobrazují obrázky. V některých případech můžete kliknout na obrázek a zobrazit animovanou verzi.

Pokud chcete vytvořit první aplikaci pro Windows pomocí sady Visual Studio a některých jednoduchých funkcí AI pro Windows APIs, stačí splnit požadavky a použít zadaný ukázkový kód v části Začněte vytvořením aplikace s Windows AI APIs.

Odtud můžete přejít do krátkých kurzů, které sestaví aplikaci s využitím specifické umělé inteligence APIs pro Windows, jako je Phi Silica walthrough, Imaging walthrough a OCR walthrough.

Vyzkoušejte APIs a modely na vašem počítači

AI Dev Gallery je ukázková aplikace dostupná z Microsoft Storu, která umožňuje rychle stáhnout, vyzkoušet a používat AI APIs a modely Windows.

Vyberte položku nabídky AI Dev Galleryzáložky Windows AI APIs, poté vyberte ukázku Phi Silica. Pokud už je model na vašem zařízení dostupný, tato ukázka se okamžitě spustí. V opačném případě vyberte Model požadavku a stáhněte si ho. Po stažení se tato ukázka aktivuje. Další informace o AI Dev Gallery najdete v části Co je AI Dev Gallery?.

Přehled dostupných APIs

Tady je několik funkcí AI připravených k použití, ke kterým můžete z aplikace pro Windows klepnout:

Phi Silica

Podobně jako gpT Large Language Model (LLM) OpenAI, který využívá ChatGPT, Phi Silica je malý jazykový model (SLM) vyvinutý společností Microsoft Research k provádění úloh zpracování jazyka na místním zařízení (viz Začínáme s Phi Silica). Phi Silica je speciálně navržená pro zařízení s Windows, která mají jednotku pro neurální zpracování (NPU), která umožňuje spouštění funkcí generování textu a konverzací s vysokým výkonem, hardwarově akcelerovaným způsobem přímo na zařízení. Phi Silica není k dispozici v Číně.

Animovaný gif znázorňující výzvu k chatu AI 'představte se' a jak je vygenerována odpověď pomocí funkce Phi Silica.

Rozpoznání textu

Rozpoznávání APIs textu umožňuje rozpoznávání textu na obrázku a převod na místním zařízení různých typů dokumentů (například naskenovaných papírových dokumentů, souborů PDF a obrázků zachycených digitálním fotoaparátem) do upravitelných a prohledávatelných dat (viz Začínáme s rozpoznáváním textu AI).

Animovaný gif zobrazující slova na snímku obrazovky rozpoznané s překryvnými texty, které lze zkopírovat do souboru nebo schránky pomocí funkce rozpoznávání textu.

Zobrazování

Škálovat a zostřit obrázky (Super rozlišení obrázku), identifikovat objekty v obrázku (Segmentace obrázků), generovat popisy obrázků v přirozeném jazyce (Popis obrázku) a odebírat objekty z obrázků (Vymazání objektu). Viz Začínáme se službou AI Imaging.

Super rozlišení obrázku

Funkce Super rozlišení obrazu APIs umožňuje zostření a škálování obrázků.

Animovaný gif znázorňující obrázek kombinující slova a obrázky, který je zaostřen a škálován pomocí funkce super rozlišení obrázku

Podívejte se také , co lze dělat s funkcí super rozlišení obrázku?.

Segmentace obrázků

Funkce segmentace obrázků APIs umožňuje segmentaci obrázků.

Animovaný obrázek gif znázorňující člověka zvedajícího jednu nohu od země a následným výběrem možnosti Odebrat pozadí izolujte obrázek muže na bílém pozadí pomocí funkce Segmentace obrázku.

Podívejte se také na to, co můžu dělat se segmentací obrázků?

Popis obrázku

Popis APIs obrázku popisuje obrázky v přirozeném jazyce.

Poznámka:

Funkce Popis obrázku nejsou v Číně k dispozici.

Animovaný gif znázorňující spícího psa, který zobrazující popis obrázku pomocí přirozeného jazyka čte chlupatého, střapatého psa ležícího na gauči a pohodlně odpočívajícího, využívající funkci Popisu obrázku.

Podívejte se také , co můžu dělat s popisem obrázku?

Vymazání objektu

Vymazání APIs objektu umožňuje odebrat objekty z obrázků.

Animovaný gif znázorňující obrázek, ve kterém uživatel odebírá objekty pomocí funkce Vymazání objektu

Přečtěte si také téma Začínáme s vymazáním objektů.

Další funkce AI

  • Překlady živých titulků (zatím nejsou podporované). Pomozte všem uživatelům Windows, včetně těch, kteří jsou neslyšící nebo nedoslýchaví, lépe pochopit audio obsah zobrazením titulků promluveného obsahu (i když je audio obsah v jazyce, který se liší od upřednostňovaného jazyka systému).

Moderování obsahu

Zjistěte, jak se obsah moderuje pomocí umělé inteligence APIssystému Windows a jak můžete upravit filtry citlivosti. Viz Moderování bezpečnosti obsahu pomocí umělé inteligence APIssystému Windows .

Při používání funkcí umělé inteligence doporučujeme zkontrolovat: Vývoj zodpovědného generování aplikací a funkcí umělé inteligence ve Windows.

Další zdroje informací

Viz také