Megosztás a következőn keresztül:


Strukturálatlan dokumentumfeldolgozás áttekintése a Microsoft Syntexben

Megjegyzés:

2025 júniusában díjmentesen kipróbálhatja a strukturálatlan dokumentumfeldolgozást és más kiválasztott Syntex-szolgáltatásokat, ha használatalapú fizetéses számlázást állított be. További információ és korlátozások: A Microsoft Syntex kipróbálása és a szolgáltatásainak megismerése.

A strukturálatlan dokumentumfeldolgozási modell (tanítási módszer) használatával automatikusan osztályozhatja a fájlokat, és információkat nyerhet ki. Strukturálatlan dokumentumok, például levelek vagy szerződések esetén működik a legjobban.

Megjegyzés:

A Microsoft tiszteletben tartja a Modellek betanítása és feldolgozása a Syntexben használt adatok védelmét és tulajdonjogát. A Microsoft a szervezet egyik adatát sem használja fel vagy továbbítja AI-modellek, nagy nyelvi modellek vagy más modellek betanítása gombra. Az adatok biztonságosan megmaradnak a szervezet bérlőjén belül. További információ: A Microsoft adatvédelmi és adatvédelmi gyakorlata.

A strukturálatlan modellek bemutatása

A strukturálatlan dokumentumfeldolgozási modell (korábbi nevén dokumentumértelmező modell) mesterséges intelligenciát (AI) használ a dokumentumok feldolgozásához. Ezeknek a dokumentumoknak olyan szövegekkel kell rendelkezniük, amelyek kifejezések vagy minták alapján azonosíthatók. Az azonosított szöveg a fájl típusát (besorolását) és a kinyerni kívánt fájltípust (a kinyerőit) is kijelöli.

Megjegyzés:

A Syntex használatáról és a példákról további információt a Bevezetés a Microsoft Syntex bevezetésébe és a Microsoft Syntex forgatókönyvei és használati esetei című témakörben talál.

A strukturálatlan dokumentumfeldolgozási modellek egy tartalomközpontnak nevezett SharePoint-webhelyen hozhatók létre és kezelhetők. SharePoint-dokumentumtárra alkalmazva a modell egy tartalomtípushoz van társítva, és oszlopokkal rendelkezik a kinyert információk tárolásához. A létrehozott tartalomtípus a SharePoint tartalomtípus-gyűjteményében található. Választhatja azt is, hogy meglévő tartalomtípusokat használ a sémájuk használatához.

Megjegyzés:

Az írásvédett vagy lezárt tartalomtípusok nem frissíthetők, ezért nem használhatók a modellben.

Osztályozókat és kinyerőket adhat a strukturálatlan dokumentumfeldolgozási modellekhez a következő műveletek végrehajtásához:

  • Az osztályozók a dokumentumtárba feltöltött dokumentumok azonosítására és besorolására szolgálnak. Egy osztályozó például "betanítással" azonosíthatja a tárba feltöltött összes szerződésmegújítási dokumentumot. A szerződésmegújítási tartalomtípust Ön határozza meg az osztályozó létrehozásakor.

  • A kinyerők információkat kérnek le ezekből a dokumentumokból. Például a dokumentumtárban azonosított szerződésmegújítási dokumentumok oszlopai az egyes dokumentumok szolgáltatás kezdési dátumát és ügyfélét jelenítik meg.

Példafájlokkal betaníthatók és tesztelhetők a modell osztályozói és kinyerői. A példafájlok példaként szolgálnak arra, hogy mit kell keresni, amikor adatokat próbálnak azonosítani és kinyerni a fájlokból. Betaníthatja például a szerződésmegújítási osztályozókat és a kivonatolókat a vállalat által használt szerződésmegújítási dokumentumok példáival. Példafájlokat is használhat a modell hatékonyságának teszteléséhez.

A modell közzététele után a tartalomközpontban alkalmazhatja azt minden olyan SharePoint-dokumentumtárra, amelyhez hozzáféréssel rendelkezik.

Követelmények és korlátozások

A modell kiválasztásakor figyelembe veendő követelményekkel kapcsolatos információkért lásd: A Microsoft Syntex modelljeinek követelményei és korlátozásai.