Megosztás a következőn keresztül:


Egyéni NER-projekt létrehozása

Ebből a cikkből megtudhatja, hogyan állíthatja be az egyéni NER-hez szükséges követelményeket, és hogyan hozhat létre projektet.

Előfeltételek

Az egyéni NER használatának megkezdése előtt a következőkre lesz szüksége:

Nyelvi erőforrás létrehozása

Az egyéni NER használatának megkezdése előtt szüksége lesz egy Azure AI Language-erőforrásra. Javasoljuk, hogy hozza létre a nyelvi erőforrást, és csatlakoztassa hozzá a tárfiókot az Azure Portalon. Az Azure Portalon létrehozhat egy erőforrást, amely lehetővé teszi, hogy egyszerre hozzon létre egy Azure Storage-fiókot, és az összes szükséges engedély előre konfigurálva van. A cikk további részében azt is megtudhatja, hogyan használhat egy már meglévő erőforrást, és konfigurálhatja úgy, hogy az egyéni elnevezett entitásfelismeréssel működjön.

Szüksége lesz egy Azure Storage-fiókra is, ahol feltölti az .txt entitások kinyerésére szolgáló modell betanítása során használt dokumentumokat.

Feljegyzés

  • Egy nyelvi erőforrás létrehozásához tulajdonosi szerepkörrel kell rendelkeznie az erőforráscsoporthoz.
  • Ha egy már meglévő tárfiókot fog csatlakoztatni, hozzá kell rendelnie egy tulajdonosi szerepkört.

Nyelvi erőforrás létrehozása és tárfiók csatlakoztatása

Az erőforrást a következő módokon hozhatja létre:

  • Az Azure Portal
  • Language Studio
  • PowerShell

Feljegyzés

A tárfiókot nem szabad áthelyezni egy másik erőforráscsoportba vagy előfizetésbe, ha az a Nyelvi erőforráshoz van társítva.

Új erőforrás létrehozása az Azure Portalról

  1. Jelentkezzen be az Azure Portalra egy új Azure AI-nyelvi erőforrás létrehozásához.

  2. A megjelenő ablakban válassza az Egyéni szövegbesorolás > egyéni elnevezett entitásfelismerés lehetőséget az egyéni funkciók közül. A Folytatás gombra kattintva hozza létre az erőforrást a képernyő alján.

    Képernyőkép az egyéni szövegbesorolásról és az egyéni elnevezett entitásfelismerésről az Azure Portalon.

  3. Hozzon létre egy nyelvi erőforrást a következő részletekkel.

    Név Leírás
    Előfizetés Az Azure-előfizetése.
    Erőforráscsoport Az erőforrást tartalmazó erőforráscsoport. Használhat egy meglévőt, vagy létrehozhat egy újat.
    Régió A nyelvi erőforrás régiója . Például: "USA 2. nyugati régiója".
    Név Az erőforrás neve.
    Tarifacsomag A nyelvi erőforrás tarifacsomagja . Az ingyenes (F0) szinttel kipróbálhatja a szolgáltatást.

    Feljegyzés

    Ha "a bejelentkezési fiókja nem a kiválasztott tárfiók erőforráscsoportjának tulajdonosa", akkor a nyelvi erőforrás létrehozása előtt a fióknak hozzá kell rendelnie egy tulajdonosi szerepkört az erőforráscsoporthoz. Segítségért forduljon az Azure-előfizetés tulajdonosához.

  4. Az Egyéni szöveg besorolása & egyéni elnevezett entitásfelismerés szakaszban válasszon ki egy meglévő tárfiókot, vagy válassza az Új tárfiók lehetőséget. Ezek az értékek segítenek az első lépésekben, és nem feltétlenül azok a tárfiókértékek , amelyeket éles környezetben szeretne használni. A projekt létrehozása során felmerülő késés elkerülése érdekében csatlakozzon a nyelvi erőforrással azonos régióban lévő tárfiókokhoz.

    Tárfiók értéke Javasolt érték
    Tárfiók neve Bármely név
    Tárfiók típusa Standard LRS
  5. Győződjön meg arról, hogy a Felelős AI-értesítés be van jelölve. Válassza a Lap alján a Véleményezés + létrehozás lehetőséget, majd a Létrehozás lehetőséget.

Új nyelvi erőforrás létrehozása a Language Studióból

Ha először jelentkezik be, megjelenik egy ablak a Language Studióban, amellyel kiválaszthat egy meglévő nyelvi erőforrást, vagy létrehozhat egy újat. Az erőforrásokat úgy is létrehozhatja, hogy a jobb felső sarokban a Beállítások ikonra kattint, az Erőforrások gombra kattint, majd az Új erőforrás létrehozása parancsra kattint.

Hozzon létre egy nyelvi erőforrást a következő részletekkel.

Példány részletei Kötelező érték
Azure-előfizetés Az Azure-előfizetése
Azure-erőforráscsoport Az Azure-erőforráscsoport
Azure-erőforrás neve Az Azure-erőforrás neve
Hely A nyelvi erőforrás régiója .
Tarifacsomag A nyelvi erőforrás tarifacsomagja .

Fontos

  • Nyelvi erőforrás létrehozásakor mindenképpen engedélyezze a felügyelt identitást .
  • A felelős AI-értesítés elolvasása és megerősítése

Az egyéni elnevezett entitásfelismerés használatához létre kell hoznia egy Azure Storage-fiókot, ha még nem rendelkezik ilyen fiókkal .

Új nyelvi erőforrás létrehozása a PowerShell használatával

Létrehozhat egy új erőforrást és egy tárfiókot a GitHubon üzemeltetett alábbi CLI-sablonnal és paraméterfájlokkal.

Szerkessze a következő értékeket a paraméterfájlban:

Paraméter neve Érték leírása
name A nyelvi erőforrás neve
location Régió, ahol az erőforrás üzemel. további információkért tekintse meg a szolgáltatás korlátait.
sku Az erőforrás tarifacsomagja .
storageResourceName A tárfiók neve
storageLocation Régió, ahol a tárfiókot üzemelteti.
storageSkuType A tárfiók termékváltozata.
storageResourceGroupName A tárfiók erőforráscsoportja

Az alábbi PowerShell-paranccsal helyezze üzembe az Azure Resource Manager-sablont a szerkesztett fájlokkal.

New-AzResourceGroupDeployment -Name ExampleDeployment -ResourceGroupName ExampleResourceGroup `
  -TemplateFile <path-to-arm-template> `
  -TemplateParameterFile <path-to-parameters-file>

A sablonok és paraméterfájlok üzembe helyezésével kapcsolatos információkért tekintse meg az ARM-sablon dokumentációját.

Feljegyzés

  • A tárfiók nyelvi erőforráshoz való csatlakoztatásának folyamata visszafordíthatatlan, később nem bontható le.
  • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

Meglévő nyelvi erőforrás használata

Ha ez az erőforrás megfelel az alábbi követelményeknek, használhat egy meglévő nyelvi erőforrást az egyéni NER használatának megkezdéséhez:

Követelmény Leírás
Régiók Győződjön meg arról, hogy a meglévő erőforrás ki van építve az egyik támogatott régióban. Ha nem, akkor létre kell hoznia egy új erőforrást ezen régiók egyikében.
Tarifacsomag További információ a támogatott tarifacsomagokról.
Felügyelt identitás Győződjön meg arról, hogy az erőforrás felügyelt identitásbeállítása engedélyezve van. Ellenkező esetben olvassa el a következő szakaszt.

Az egyéni elnevezett entitásfelismerés használatához létre kell hoznia egy Azure Storage-fiókot, ha még nem rendelkezik ilyen fiókkal .

Identitáskezelés engedélyezése az erőforráshoz

A nyelvi erőforrásnak identitáskezeléssel kell rendelkeznie az Azure Portalon való engedélyezéséhez:

  1. Ugrás a nyelvi erőforrásra
  2. A bal oldali menü Erőforrás-kezelés szakaszában válassza az Identitás lehetőséget
  3. A Rendszer által hozzárendelt lapon győződjön meg arról, hogy az állapotbe van kapcsolva

Egyéni elnevezett entitásfelismerési funkció engedélyezése

Győződjön meg arról, hogy engedélyezi az Egyéni szövegbesorolás/Egyéni elnevezett entitásfelismerés funkciót az Azure Portalon.

  1. Nyissa meg a nyelvi erőforrást az Azure Portalon.
  2. A bal oldali menü Resource Management szakaszában válassza a Szolgáltatások lehetőséget.
  3. Egyéni szövegbesorolás engedélyezése / Egyéni elnevezett entitásfelismerési funkció.
  4. Csatlakozás tárfiókját.
  5. Válassza az Alkalmazás lehetőséget.

Fontos

  • Győződjön meg arról, hogy a nyelvi erőforrás rendelkezik a csatlakoztatni kívánt tárfiókhoz hozzárendelt storage blobadatok közreműködői szerepkörével.

Szükséges szerepkörök hozzáadása

Az alábbi lépésekkel állíthatja be a nyelvi erőforráshoz és tárfiókhoz szükséges szerepköröket.

Animált kép, amely bemutatja, hogyan állíthat be szerepköröket az Azure Portalon.

Szerepkörök az Azure AI Language-erőforráshoz

  1. Nyissa meg tárfiókját vagy nyelvi erőforrását az Azure Portalon.

  2. A bal oldali navigációs menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.

  3. Válassza a Hozzáadás szerepkör-hozzárendelések hozzáadásához lehetőséget, és válassza ki a fióknak megfelelő szerepkört.

    A nyelvi erőforráshoz tulajdonosi vagy közreműködői szerepkört kell hozzárendelni.

  4. A Hozzáférés hozzárendelése területen válassza a Felhasználó, csoport vagy szolgáltatásnév lehetőséget

  5. Tagok kijelölése

  6. Válassza ki a felhasználónevet. A felhasználóneveket a Kiválasztás mezőben keresheti meg. Ismételje meg ezt az összes szerepkör esetében.

  7. Ismételje meg ezeket a lépéseket az összes olyan felhasználói fiók esetében, amelyhez hozzá kell férni ehhez az erőforráshoz.

A tárfiók szerepkörei

  1. Nyissa meg a tárfiók lapját az Azure Portalon.
  2. A bal oldali navigációs menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.
  3. Válassza a Hozzáadás szerepkör-hozzárendelések hozzáadásához lehetőséget, és válassza ki a Tárfiókban a Storage-blobadatok közreműködői szerepkörét.
  4. A Hozzáférés hozzárendelése területen válassza a Felügyelt identitás lehetőséget.
  5. Tagok kijelölése
  6. Válassza ki az előfizetést, és a Language (Nyelv ) lehetőséget felügyelt identitásként. A felhasználóneveket a Kiválasztás mezőben keresheti meg.

Fontos

Ha virtuális hálózata vagy privát végpontja van, mindenképpen válassza az Azure-szolgáltatások engedélyezése a megbízható szolgáltatások listájában, hogy hozzáférjenek ehhez a tárfiókhoz az Azure Portalon.

CORS engedélyezése a tárfiókhoz

Győződjön meg arról, hogy engedélyezi a (GET, PUT, DELETE) metódusokat a forrásközi erőforrás-megosztás (CORS) engedélyezésekor. Állítsa be az engedélyezett forrásmezőt a következőre https://language.cognitive.azure.com: . Az összes fejléc engedélyezéséhez adja hozzá * az engedélyezett fejlécértékeket, és állítsa be a maximális életkort 500.

Képernyőkép a CORS tárfiókokhoz való használatáról.

Egyéni elnevezett entitásfelismerő projekt létrehozása

Miután konfigurálta az erőforrás- és tárolótárolót, hozzon létre egy új egyéni NER-projektet. A projektek olyan munkaterületek, ahol egyéni AI-modelleket hozhat létre az adatok alapján. A projektet csak Ön és mások érhetik el, akik hozzáférnek a használt Azure-erőforráshoz. Ha címkézett adatokat használ, a projekt importálásával kezdheti meg az első lépéseket.

  1. Jelentkezzen be a Language Studióba. Megjelenik egy ablak, amely lehetővé teszi az előfizetés és a nyelvi erőforrás kiválasztását. Válassza ki a fenti lépésben létrehozott nyelvi erőforrást.

  2. A Language Studio Információ kinyerése szakaszában válassza az Egyéni elnevezett entitásfelismerés lehetőséget.

    Képernyőkép az egyéni NER helyéről a Language Studio kezdőlapján.

  3. Válassza az Új projekt létrehozása lehetőséget a projektek lapjának felső menüjében. A projekt létrehozása lehetővé teszi az adatok címkézését, a modellek betanítása, kiértékelése, fejlesztése és üzembe helyezése.

    Képernyőkép a projekt létrehozási oldaláról.

  4. Miután rákattintott az Új projekt létrehozása elemre, megjelenik egy ablak, amely lehetővé teszi a tárfiók csatlakoztatását. Ha már csatlakoztatott egy tárfiókot, látni fogja, hogy a tárfiók csatlakoztatva van. Ha nem, válassza ki a tárfiókot a megjelenő legördülő listából, és válassza ki Csatlakozás tárfiókot. Ezzel beállítja a tárfiókhoz szükséges szerepköröket. Ez a lépés valószínűleg hibát ad vissza, ha nincs tulajdonosként hozzárendelve a tárfiókhoz.

    Feljegyzés

    • Ezt a lépést csak egyszer kell elvégeznie minden egyes új erőforráshoz, amelyet használ.
    • Ez a folyamat visszafordíthatatlan, ha egy tárfiókot csatlakoztat a nyelvi erőforráshoz, később nem bonthatja le.
    • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

    Képernyőkép a tárkapcsolat képernyőről.

  5. Adja meg a projekt adatait, beleértve a projektben lévő fájlok nevét, leírását és nyelvét. Ha a példaadatkészletet használja, válassza az Angol lehetőséget. Később nem módosíthatja a projekt nevét. Válassza a Tovább lehetőséget

    Tipp.

    Az adatkészletnek nem kell teljesen azonos nyelven lennie. Több dokumentumot is használhat, amelyek mindegyike különböző támogatott nyelvekkel rendelkezik. Ha az adathalmaz különböző nyelvű dokumentumokat tartalmaz, vagy ha futásidőben különböző nyelvektől vár szöveget, akkor a projekt alapadatainak megadásakor válassza a többnyelvű adatkészlet engedélyezése lehetőséget. Ez a beállítás később engedélyezhető a Projekt beállításai lapon.

  6. Válassza ki azt a tárolót, ahová feltöltötte az adathalmazt. Ha már felcímkézett adatokat, győződjön meg arról, hogy az a támogatott formátumot követi, és válassza az Igen lehetőséget, a fájljaim már fel vannak címkézve, és formázott JSON-címkéket tartalmazó fájllal rendelkezem, és a legördülő menüben válassza ki a címkefájlt. Válassza a Tovább lehetőséget.

  7. Tekintse át a megadott adatokat, és válassza a Projekt létrehozása lehetőséget.

Projekt importálása

Ha már címkézett adatokat, azokkal megkezdheti a szolgáltatást. Győződjön meg arról, hogy a címkézett adatok az elfogadott adatformátumokat követik.

  1. Jelentkezzen be a Language Studióba. Megjelenik egy ablak, amely lehetővé teszi az előfizetés és a nyelvi erőforrás kiválasztását. Válassza ki a nyelvi erőforrást.

  2. A Language Studio Információ kinyerése szakaszában válassza az Egyéni elnevezett entitásfelismerés lehetőséget.

    Képernyőkép az egyéni NER-funkció helyéről a Language Studio kezdőlapján.

  3. Válassza az Új projekt létrehozása lehetőséget a projektek lapjának felső menüjében. A projekt létrehozása lehetővé teszi az adatok címkézését, a modellek betanítása, kiértékelése, fejlesztése és üzembe helyezése.

    Képernyőkép a projekt létrehozási oldaláról.

  4. Miután kiválasztotta az Új projekt létrehozása lehetőséget, megjelenik egy képernyő, amely lehetővé teszi a tárfiók csatlakoztatását. Ha nem találja a tárfiókot, győződjön meg arról, hogy az ajánlott lépések végrehajtásával létrehozott egy erőforrást. Ha már csatlakoztatott egy tárfiókot a nyelvi erőforráshoz, látni fogja, hogy a tárfiók csatlakoztatva van.

    Feljegyzés

    • Ezt a lépést csak egyszer kell elvégeznie minden egyes használt új nyelvi erőforrás esetében.
    • Ez a folyamat visszafordíthatatlan, ha egy tárfiókot csatlakoztat a nyelvi erőforráshoz, később nem bonthatja le.
    • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

    Képernyőkép az új projektek tárkapcsolati képernyőjének képéről.

  5. Adja meg a projekt adatait, beleértve a projektben lévő fájlok nevét, leírását és nyelvét. Később nem módosíthatja a projekt nevét. Válassza a Tovább lehetőséget.

    Tipp.

    Az adatkészletnek nem kell teljesen azonos nyelven lennie. Több dokumentumot is használhat, amelyek mindegyike különböző támogatott nyelvekkel rendelkezik. Ha az adathalmaz különböző nyelvű dokumentumokat tartalmaz, vagy ha futásidőben különböző nyelvektől vár szöveget, akkor a projekt alapadatainak megadásakor válassza a többnyelvű adatkészlet engedélyezése lehetőséget. Ez a beállítás később engedélyezhető a Projekt beállításai lapon.

  6. Válassza ki azt a tárolót, ahová feltöltötte az adathalmazt.

  7. Válassza az Igen lehetőséget, a fájljaim már címkézve vannak, és formázott JSON-címkéket tartalmazó fájllal rendelkezem, és az alábbi legördülő menüben válassza ki a címkék fájlját a JSON-címkék fájl importálásához. Győződjön meg arról, hogy a formátum a támogatott formátumot követi.

  8. Válassza a Tovább lehetőséget.

  9. Tekintse át a megadott adatokat, és válassza a Projekt létrehozása lehetőséget.

Projekt részleteinek lekérése

  1. Lépjen a projektbeállítások lapjára a Language Studióban.

  2. A projekt részletei láthatók.

  3. Ezen a lapon frissítheti a projekt leírását, és engedélyezheti/letilthatja a többnyelvű adatkészletet a projektbeállításokban.

  4. A csatlakoztatott tárfiókot és tárolót a nyelvi erőforráshoz is megtekintheti.

  5. Az elsődleges erőforráskulcsot ezen a lapon is lekérheti.

    Képernyőkép a Language Studio projektbeállítási oldaláról.

Projekt törlése

Ha már nincs szüksége a projektre, törölheti a projektet a Language Studióval. Felülről válassza az Egyéni elnevezett entitásfelismerés (NER) lehetőséget, válassza ki a törölni kívánt projektet, majd válassza a Törlés lehetőséget a felső menüből.

Következő lépések

  • Tudnia kell, hogy milyen projektsémát fog használni az adatok címkézéséhez.

  • A projekt létrehozása után megkezdheti az adatok címkézését, amely tájékoztatja az entitás-kinyerési modellt a szöveg értelmezéséről, és a betanításhoz és a kiértékeléshez lesz felhasználva.