Pokyny k formátování pro importované dokumenty a adresy URL

Projděte si tyto pokyny pro formátování a získejte nejlepší výsledky pro váš obsah.

Důležité informace o formátování

Po importu souboru nebo adresy URL služba QnA Maker převede a uloží váš obsah ve formátu markdownu. Proces převodu přidá do textu nové řádky, například \n\n. Znalost formátu markdownu vám pomůže pochopit převedený obsah a spravovat obsah znalostní báze.

Pokud obsah přidáte nebo upravíte přímo v znalostní báze, můžete pomocí formátování markdownu vytvořit obsah rtfingu nebo změnit obsah formátu markdownu, který už je v odpovědi. QnA Maker podporuje většinu formátu Markdownu, který umožňuje do obsahu přenést funkce rtfů. Klientská aplikace, například chatovací robot, ale nemusí podporovat stejnou sadu formátů markdownu. Je důležité otestovat zobrazení odpovědí klientské aplikace.

Podívejte se na úplný seznam typů obsahu a příkladů.

Základní formátování dokumentu

QnA Maker identifikuje oddíly a pododdíly a vztahy v souboru na základě vizuálních vodítek, jako jsou:

  • velikost písma
  • řez písma
  • Číslování
  • Barvy

Poznámka:

Momentálně nepodporujeme extrakci obrázků z nahraných dokumentů.

Příručky k produktům

Příručka je obvykle vodicí materiál, který doprovází výrobek. Pomáhá uživateli nastavit, používat, udržovat a řešit potíže s produktem. Když QnA Maker zpracuje příručku, extrahuje nadpisy a podnadpisy jako otázky a následný obsah jako odpovědi. Podívejte se na příklad zde.

Níže je příklad příručky s indexovou stránkou a hierarchickým obsahem.

Product Manual example for a knowledge base

Poznámka:

Extrakce je nejvhodnější pro příručky, které obsahují obsah nebo indexovou stránku, a jasnou strukturu s hierarchickými nadpisy.

Brožury, pokyny, dokumenty a další soubory

Mnoho dalších typů dokumentů lze také zpracovat a generovat páry kontroly kvality za předpokladu, že mají jasnou strukturu a rozložení. Patří sem: brožury, pokyny, zprávy, dokumenty white paper, vědecké dokumenty, politiky, knihy atd. Podívejte se na příklad zde.

Níže je příklad částečně strukturovaného dokumentu bez indexu:

Azure Blob storage semi-structured Doc

Podpora nestrukturovaných dokumentů

Vlastní odpověď na otázky teď podporuje nestrukturované dokumenty. Dokument, který nemá svůj obsah uspořádaný dobře definovaným hierarchickým způsobem, chybí nastavená struktura nebo má volný obsah, který může být považován za nestrukturovaný dokument.

Tady je příklad nestrukturovaného dokumentu PDF:

Unstructured document example for a knowledge base

V současné době je tato funkce k dispozici pouze prostřednictvím nahrávání dokumentů a pouze pro formáty souborů PDF a DOC.

Důležité

Podpora nestrukturovaného souboru nebo obsahu je k dispozici pouze při odpovídání na otázky.

Strukturovaný dokument QnA

Formát strukturovaných odpovědí na otázky v souborech DOC je ve formě střídavých otázek a odpovědí na řádek, jedna otázka na řádek následovaná odpovědí na následující řádek, jak je znázorněno níže:

Question1

Answer1

Question2

Answer2

Níže je příklad strukturovaného wordového dokumentu QnA:

Structured QnA document example for a knowledge base

Strukturované soubory TXT, TSV a XLS

QnAs ve formě strukturovaných souborů .txt, .tsv nebo .xls lze také nahrát do služby QnA Maker a vytvořit nebo rozšířit znalostní báze. Můžou to být prostý text nebo můžou mít obsah ve formátu RTF nebo HTML. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.

Otázka Odpověď Metadata (1 klíč: 1 hodnota)
Otázka 1 Odpověď1 Key1:Value1 | Key2:Value2
Otázka 2 Odpověď 2 Key:Value

Všechny další sloupce ve zdrojovém souboru se ignorují.

Příklad strukturovaného excelového souboru

Níže je příklad strukturovaného souboru QnA .xls s obsahem HTML:

Structured QnA excel example for a knowledge base

Příklad alternativních otázek pro jednu odpověď v excelovém souboru

Níže je příklad strukturovaného souboru QnA .xls s několika alternativními otázkami pro jednu odpověď:

Example of alternate questions for single answer in Excel file

Po importu souboru se dvojice otázek a odpovědí nachází v znalostní báze, jak je znázorněno níže:

Screenshot of alternate questions for single answer imported into knowledge base

Formát strukturovaných dat prostřednictvím importu

Import znalostní báze nahradí obsah existujícího znalostní báze. Import vyžaduje strukturovaný soubor .tsv, který obsahuje informace o zdroji dat. Tyto informace pomáhají službě QnA Maker seskupit páry odpovědí na otázky a přiřazovat je konkrétnímu zdroji dat. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.

Otázka Odpověď Source Metadata (1 klíč: 1 hodnota)
Otázka 1 Odpověď1 Adresa URL1 Key1:Value1 | Key2:Value2
Otázka 2 Odpověď 2 Redakční Key:Value

Vícenásobné formátování dokumentu

  • Pomocí nadpisů a dílčích nadpisů můžete vysvětlovat hierarchii. Můžete například h1 označit nadřazenou QnA a h2 a označit QnA, která by se měla zobrazit jako výzva. K označení následující hierarchie použijte malou velikost nadpisu. Nepoužívejte styl, barvu ani jiný mechanismus, který by znamenal strukturu v dokumentu, QnA Maker nebude extrahovat výzvy s vícenásobným otáčením.
  • První znak nadpisu musí být velkými písmeny.
  • Neukončí nadpis otazníkem. ?

Ukázkové dokumenty:
Surface Pro (docx)
Výhody společnosti Contoso (docx)
Výhody společnosti Contoso (pdf)

Adresy URL nejčastějších dotazů

QnA Maker může podporovat webové stránky s nejčastějšími dotazy ve 3 různých formách:

  • Stránky s prostými nejčastějšími dotazy
  • Stránky s nejčastějšími dotazy s odkazy
  • Stránky s nejčastějšími dotazy s domovskou stránkou Témat

Stránky s prostými nejčastějšími dotazy

Toto je nejběžnější typ stránky nejčastějších dotazů, ve které odpovědi okamžitě následují otázky na stejné stránce.

Níže je příklad stránky s prostými nejčastějšími dotazy:

Plain FAQ page example for a knowledge base

V tomto typu stránky s nejčastějšími dotazy jsou otázky agregované společně a jsou propojeny s odpověďmi, které jsou buď v různých oddílech stejné stránky, nebo na různých stránkách.

Níže je příklad stránky s nejčastějšími dotazy s odkazy v oddílech, které jsou na stejné stránce:

Section Link FAQ page example for a knowledge base

Tento typ nejčastějších dotazů obsahuje stránku Témata, kde je každé téma propojeno s odpovídající sadou otázek a odpovědí na jiné stránce. QnA Maker prochází všechny propojené stránky a extrahuje odpovídající otázky a odpovědi.

Níže je příklad stránky Témata s odkazy na oddíly s nejčastějšími dotazy na různých stránkách.

Deep link FAQ page example for a knowledge base

Adresy URL podpory

Služba QnA Maker může zpracovávat částečně strukturované webové stránky podpory, jako jsou webové články, které popisují, jak provést danou úlohu, jak diagnostikovat a vyřešit daný problém a jaké jsou osvědčené postupy pro daný proces. Extrakce funguje nejlépe u obsahu, který má jasnou strukturu s hierarchickými nadpisy.

Poznámka:

Extrakce článků podpory je nová funkce a je v počátečních fázích. Nejvhodnější je pro jednoduché stránky, které jsou dobře strukturované a neobsahují složitá záhlaví a zápatí.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

Import a export znalostní báze

Soubory TSV a XLS z exportovaných znalostní báze je možné použít pouze importem souborů ze stránky Nastavení na portálu služby QnA Maker. Nejde je použít jako zdroje dat při vytváření znalostní báze ani pomocí funkce + Přidat soubor nebo + Přidat adresu URL na stránce Nastavení.

Při importu znalostní báze prostřednictvím těchto souborů TSV a XLS se páry QnA přidají do redakčního zdroje a ne ke zdrojům, ze kterých byly qnA extrahovány v exportované znalostní bázi.

Další kroky

Zobrazení úplného seznamu typů obsahu a příkladů