Megosztás a következőn keresztül:


Strukturálatlan dokumentumfeldolgozási modell betanítása Microsoft Syntex

A következőkre vonatkozik: ✓ Strukturálatlan dokumentumfeldolgozás

Kövesse a Modell létrehozása a Syntexben című cikk utasításait egy strukturálatlan dokumentumfeldolgozási modell tartalomközpontban való létrehozásához. A modell helyi webhelyen való létrehozásához kövesse a Modell létrehozása helyi SharePoint-webhelyen című cikk utasításait. Ezután kezdje ezzel a cikkel a modell betanításának megkezdéséhez.

Osztályozó létrehozása

Az osztályozó olyan modelltípus, amellyel automatizálható a dokumentumtípus azonosítása és besorolása.



Előfordulhat például, hogy azonosítani szeretné a dokumentumtárhoz hozzáadott összes szerződésmegújítási dokumentumot, például az alábbi ábrán látható módon.

Szerződésmegújítási dokumentum.

Az osztályozók létrehozásával létrehozhat egy új SharePoint-tartalomtípust , amely a modellhez lesz társítva.

Az osztályozó létrehozásakor magyarázatokat kell létrehoznia a modell meghatározásához. Ezzel a lépéssel olyan gyakori adatokat jegyezhet fel, amelyek várhatóan következetesen megtalálják ezt a dokumentumtípust.

A modell "betanítása" a dokumentumtípusra ("példafájlok") példákat használva azonosítja az azonos tartalomtípusú fájlokat.

Osztályozó létrehozásához a következőkre van szükség:

  1. Nevezze el a modellt.
  2. Adja hozzá a példafájlokat.
  3. Címkézze fel a példafájlokat.
  4. Hozzon létre egy magyarázatot.
  5. Tesztelje a modellt.

Megjegyzés:

Bár a modell egy osztályozót használ a dokumentumtípusok azonosításához és besorolásához, dönthet úgy is, hogy a modell által azonosított egyes fájlokból konkrét információkat kér le. Ehhez hozzon létre egy elszívót , amelyet hozzá szeretne adni a modellhez. Lásd: Elszívó létrehozása.

A modell elnevezése

A modell létrehozásának első lépése egy név megadása:

  1. A tartalomközpontban válassza az Új, majd a Modell lehetőséget.

  2. A Modelllétrehozási lehetőségek lapon válassza a Tanítási módszer lehetőséget.

  3. A Tanítási módszer: Részletek lapon válassza a Tovább lehetőséget.

  4. A Modell létrehozása a tanítási módszerrel lapon írja be a modell nevét a Modell neve mezőbe. Ha például azonosítani szeretné a szerződésmegújítási dokumentumokat, nevezze el a szerződésmegújítási modellt.

  5. Válassza a Létrehozás gombot. Ez a művelet létrehoz egy kezdőlapot a modellhez.

    Az Osztályozó modell kezdőlapja.

Modell létrehozásakor egy új webhely-tartalomtípust is létrehoz. A tartalomtípus olyan dokumentumkategóriát jelöl, amely közös jellemzőkkel rendelkezik, és az adott tartalomhoz tartozó oszlopok vagy metaadat-tulajdonságok gyűjteményét osztja meg. A SharePoint-tartalomtípusok kezelése a Tartalomtípusok gyűjteményen keresztül történik. Ebben a példában a modell létrehozásakor egy új szerződésmegújítási tartalomtípust hoz létre.

Válassza a Speciális beállítások lehetőséget , ha ezt a modellt egy meglévő vállalati tartalomtípusra szeretné leképzni a SharePoint tartalomtípus-gyűjteményében a sémájának használatához. A vállalati tartalomtípusokat a SharePoint Felügyeleti központ Tartalomtípus-központban tárolja a rendszer, és a bérlő összes webhelye számára osztja el. Vegye figyelembe, hogy annak ellenére, hogy egy meglévő tartalomtípust használhat a sémájának felhasználásához az azonosításhoz és a besoroláshoz, be kell tanítania a modellt, hogy információkat nyerjen ki az általa azonosított fájlokból.

Speciális beállítások.

Példafájlok hozzáadása

A modell kezdőlapján adja hozzá a példafájlokat, amelyekre szüksége lesz a modell betanítása során a dokumentumtípus azonosításához.



Megjegyzés:

Az osztályozó és az elszívó betanításához is ugyanazokat a fájlokat kell használnia. Később mindig lehetősége van továbbiak hozzáadására, de általában egy teljes mintafájlkészletet ad hozzá. Címkézzen fel néhányat a modell betanítása érdekében, és tesztelje a többi címkézetlent a modell alkalmasságának kiértékeléséhez.

A betanítási készlethez pozitív és negatív példákat is használnia kell:

  • Pozitív példa: A dokumentumtípust képviselő dokumentumok. Ezek olyan sztringeket és információkat tartalmaznak, amelyek mindig ilyen típusú dokumentumban lennének.
  • Negatív példa: Bármely más dokumentum, amely nem az osztályozni kívánt dokumentumot jelöli.

Ügyeljen arra, hogy legalább öt pozitív példát és legalább egy negatív példát használjon a modell betanításához. Létre szeretne hozni egy másikat a modell teszteléséhez a betanítási folyamat után.

Példafájlok hozzáadása:

  1. A modell kezdőlapján, a Példafájlok hozzáadása csempén válassza a Fájlok hozzáadása lehetőséget.

  2. A Példafájlok kiválasztása a modellhez lapon válassza ki a példafájlokat a tartalomközpont Betanítási fájlok tárából. Ha még nem töltötte fel őket, akkor a Feltöltés gombra kattintva töltse fel őket a Betanítási fájlok tárba.

  3. Miután kiválasztotta a modell betanításához használandó példafájlokat, válassza a Hozzáadás lehetőséget.

    Válassza ki a példafájlokat.

Példafájlok címkézése

A példafájlok hozzáadása után pozitív vagy negatív példaként kell megjelölnie őket.

  1. A modell kezdőlapján, a Fájlok osztályozása és betanítás futtatása csempén válassza az Osztályozó betanítása lehetőséget. Ez a lépés megjeleníti a példafájlok listáját megjelenítő címkeoldalt, amelyen az első fájl látható a megtekintőben.

  2. Az első példafájl tetején lévő megjelenítőben meg kell jelennie egy szövegnek, amely rákérdez, hogy a fájl az imént létrehozott modellre mutat-e példát. Ha pozitív példa, válassza az Igen lehetőséget. Negatív példa esetén válassza a Nem lehetőséget.

  3. A bal oldali Címkézett példák listában jelölje ki a példákként használni kívánt további fájlokat, és címkézze fel őket.

    Az Osztályozó kezdőlapja.

Megjegyzés:

Címkézzen fel legalább öt pozitív példát. Legalább egy negatív példát is fel kell címkéznie.

Magyarázat létrehozása

A következő lépés egy magyarázat létrehozása a Betanítása oldalon. A magyarázat segít a modellnek megérteni, hogyan ismerheti fel a dokumentumot. A szerződésmegújítási dokumentumok például mindig tartalmaznak egy További közzétételi kérelem szöveges sztringet.

Megjegyzés:

Az elszívókkal együtt használva egy magyarázat azonosítja a dokumentumból kinyerni kívánt sztringet.

Magyarázat létrehozása:

  1. A modell kezdőlapján válassza a Betanítása lapot a Betanítása lap megnyitásához.

  2. A Betanítása lap Betanított fájlok szakaszában látnia kell a korábban címkézett mintafájlok listáját. Válassza ki a lista egyik pozitív fájlját, amely megjelenik a megtekintőben.

  3. A Magyarázat szakaszban válassza az Új , majd az Üres lehetőséget.

  4. A Magyarázat létrehozása lapon:
    a. Írja be a Nevet (például "Közzétételi blokk").
    B. Válassza a Típus lehetőséget. A mintához válassza a Kifejezéslista lehetőséget, mivel hozzáad egy szöveges sztringet.
    C. A Típus ide mezőbe írja be a sztringet. A mintához adja hozzá a "További közzététel kérése" lehetőséget. Ha a sztringnek megkülönböztetnie kell a kis- és nagybetűket, kiválaszthatja a Kis- és nagybetűk megkülönböztetése lehetőséget.
    D. Válassza a Mentés elemet.

    Magyarázat létrehozása.

  5. A tartalomközpont ellenőrzi, hogy a létrehozott magyarázat elég teljes-e ahhoz, hogy a többi címkézett példafájlt helyesen, pozitív és negatív példaként azonosítsa. A Betanított fájlok szakaszban ellenőrizze a Kiértékelés oszlopot a betanítás befejezése után az eredmények megtekintéséhez. A fájlok Egyezés értéket mutatnak, ha a létrehozott magyarázatok elegendőek ahhoz, hogy a pozitív vagy negatív címkével ellátott adatok megegyezhessenek.

    Érték egyeztetése.

    Ha a címkézett fájlok nem egyeznek , előfordulhat, hogy további magyarázatot kell létrehoznia a modellnek a dokumentumtípus azonosításához szükséges további információk megadásához. Ha eltérés történik, válassza ki a fájlt, hogy további információt kapjon arról, hogy miért történt eltérés.

Miután betanított egy elszívót, ez a betanított elszívó használható magyarázatként. A Magyarázatok szakaszban ez modellhivatkozásként jelenik meg.

Képernyőkép a Magyarázatok szakaszról, amelyen a Modellhivatkozás típus látható.

A modell tesztelése

Ha egyezést kapott a címkézett mintafájlokon, tesztelheti a modellt a többi címkézetlen mintafájlon, amelyeket a modell még nem látott. Ez a lépés nem kötelező, de hasznos lépés a modell "alkalmasságának" vagy készültségének kiértékeléséhez a használat előtt, a modell által korábban nem látott fájlokon való tesztelésével.

  1. A modell kezdőlapján válassza a Teszt lapot. Ez futtatja a modellt a címkézetlen mintafájlokon.

  2. A Tesztfájlok listában a példafájlok megjelennek, és megjelenítik, hogy a modell pozitív vagy negatív előrejelzést adott-e rájuk. Ez az információ segít meghatározni az osztályozó hatékonyságát a dokumentumok azonosításában.

    Címkézetlen fájlok tesztelése.

Lásd még

Kinyerő létrehozása

Magyarázattípusok

Modell alkalmazása

A Syntex kisegítő módja