Strukturálatlan dokumentumfeldolgozás áttekintése a Microsoft Syntexben
Megjegyzés:
2025 júniusában díjmentesen kipróbálhatja a strukturálatlan dokumentumfeldolgozást és más kiválasztott Syntex-szolgáltatásokat, ha használatalapú fizetéses számlázást állított be. További információ és korlátozások: A Microsoft Syntex kipróbálása és a szolgáltatásainak megismerése.
A strukturálatlan dokumentumfeldolgozási modell (tanítási módszer) használatával automatikusan osztályozhatja a fájlokat, és információkat nyerhet ki. Strukturálatlan dokumentumok, például levelek vagy szerződések esetén működik a legjobban.
Megjegyzés:
A Microsoft tiszteletben tartja a Modellek betanítása és feldolgozása a Syntexben használt adatok védelmét és tulajdonjogát. A Microsoft a szervezet egyik adatát sem használja fel vagy továbbítja AI-modellek, nagy nyelvi modellek vagy más modellek betanítása gombra. Az adatok biztonságosan megmaradnak a szervezet bérlőjén belül. További információ: A Microsoft adatvédelmi és adatvédelmi gyakorlata.
A strukturálatlan modellek bemutatása
A strukturálatlan dokumentumfeldolgozási modell (korábbi nevén dokumentumértelmező modell) mesterséges intelligenciát (AI) használ a dokumentumok feldolgozásához. Ezeknek a dokumentumoknak olyan szövegekkel kell rendelkezniük, amelyek kifejezések vagy minták alapján azonosíthatók. Az azonosított szöveg a fájl típusát (besorolását) és a kinyerni kívánt fájltípust (a kinyerőit) is kijelöli.
Megjegyzés:
A Syntex használatáról és a példákról további információt a Bevezetés a Microsoft Syntex bevezetésébe és a Microsoft Syntex forgatókönyvei és használati esetei című témakörben talál.
A strukturálatlan dokumentumfeldolgozási modellek egy tartalomközpontnak nevezett SharePoint-webhelyen hozhatók létre és kezelhetők. SharePoint-dokumentumtárra alkalmazva a modell egy tartalomtípushoz van társítva, és oszlopokkal rendelkezik a kinyert információk tárolásához. A létrehozott tartalomtípus a SharePoint tartalomtípus-gyűjteményében található. Választhatja azt is, hogy meglévő tartalomtípusokat használ a sémájuk használatához.
Megjegyzés:
Az írásvédett vagy lezárt tartalomtípusok nem frissíthetők, ezért nem használhatók a modellben.
Osztályozókat és kinyerőket adhat a strukturálatlan dokumentumfeldolgozási modellekhez a következő műveletek végrehajtásához:
Az osztályozók a dokumentumtárba feltöltött dokumentumok azonosítására és besorolására szolgálnak. Egy osztályozó például "betanítással" azonosíthatja a tárba feltöltött összes szerződésmegújítási dokumentumot. A szerződésmegújítási tartalomtípust Ön határozza meg az osztályozó létrehozásakor.
A kinyerők információkat kérnek le ezekből a dokumentumokból. Például a dokumentumtárban azonosított szerződésmegújítási dokumentumok oszlopai az egyes dokumentumok szolgáltatás kezdési dátumát és ügyfélét jelenítik meg.
Példafájlokkal betaníthatók és tesztelhetők a modell osztályozói és kinyerői. A példafájlok példaként szolgálnak arra, hogy mit kell keresni, amikor adatokat próbálnak azonosítani és kinyerni a fájlokból. Betaníthatja például a szerződésmegújítási osztályozókat és a kivonatolókat a vállalat által használt szerződésmegújítási dokumentumok példáival. Példafájlokat is használhat a modell hatékonyságának teszteléséhez.
A modell közzététele után a tartalomközpontban alkalmazhatja azt minden olyan SharePoint-dokumentumtárra, amelyhez hozzáféréssel rendelkezik.
Követelmények és korlátozások
A modell kiválasztásakor figyelembe veendő követelményekkel kapcsolatos információkért lásd: A Microsoft Syntex modelljeinek követelményei és korlátozásai.