Megosztás a következőn keresztül:


Egyéni szövegbesorolási projekt létrehozása

Ebből a cikkből megtudhatja, hogyan állíthatja be az egyéni szövegbesorolással és projekt létrehozásával kapcsolatos követelményeket.

Előfeltételek

Az egyéni szövegbesorolás használatba vétele előtt a következőkre lesz szüksége:

Nyelvi erőforrás létrehozása

Az egyéni szövegbesorolás használatba vétele előtt szüksége lesz egy Azure AI Language-erőforrásra. Javasoljuk, hogy hozza létre a nyelvi erőforrást, és csatlakoztassa hozzá a tárfiókot az Azure Portalon. Az Azure Portalon létrehozhat egy erőforrást, amely lehetővé teszi, hogy egyszerre hozzon létre egy Azure Storage-fiókot, és az összes szükséges engedély előre konfigurálva van. A cikk további részében azt is megtudhatja, hogyan használhat egy már meglévő erőforrást, és hogyan konfigurálhatja úgy, hogy az egyéni szövegbesorolással működjön.

Szüksége lesz egy Azure Storage-fiókra is, ahol feltölti a .txt szöveget osztályozó modell betanításához használt dokumentumokat.

Megjegyzés:

  • Egy nyelvi erőforrás létrehozásához tulajdonosi szerepkörrel kell rendelkeznie az erőforráscsoporthoz.
  • Ha egy már meglévő tárfiókot fog csatlakoztatni, hozzá kell rendelnie egy tulajdonosi szerepkört.

Nyelvi erőforrás létrehozása és tárfiók csatlakoztatása

Megjegyzés:

A tárfiókot nem szabad áthelyezni egy másik erőforráscsoportba vagy előfizetésbe, ha az a Nyelvi erőforráshoz van társítva.

Új erőforrás létrehozása az Azure Portalról

  1. Lépjen az Azure Portalra egy új Azure AI-nyelvi erőforrás létrehozásához.

  2. A megjelenő ablakban válassza az Egyéni szövegbesorolás > egyéni elnevezett entitásfelismerés lehetőséget az egyéni funkciók közül. A Folytatás gombra kattintva hozza létre az erőforrást a képernyő alján.

    A screenshot showing the selection option for custom text classification and custom named entity recognition in Azure portal.

  3. Hozzon létre egy nyelvi erőforrást a következő részletekkel.

    Név Kötelező érték
    Előfizetés Az Azure-előfizetése.
    Erőforráscsoport Az erőforrást tartalmazó erőforráscsoport. Használhat egy meglévőt, vagy létrehozhat egy újat.
    Region Az egyik támogatott régió. Például: "USA 2. nyugati régiója".
    Név Az erőforrás neve.
    Tarifacsomag Az egyik támogatott tarifacsomag. Az ingyenes (F0) szinttel kipróbálhatja a szolgáltatást.

    Ha "a bejelentkezési fiókja nem a kiválasztott tárfiók erőforráscsoportjának tulajdonosa", akkor a nyelvi erőforrás létrehozása előtt a fióknak hozzá kell rendelnie egy tulajdonosi szerepkört az erőforráscsoporthoz. Segítségért forduljon az Azure-előfizetés tulajdonosához.

    Az Azure-előfizetés tulajdonosának meghatározásához keresse meg az erőforráscsoportot , és kövesse a társított előfizetésre mutató hivatkozást. Ekkor:

    1. A Hozzáférés-vezérlés (IAM) lap kiválasztása
    2. Szerepkör-hozzárendelések kiválasztása
    3. Szűrés szerepkör:tulajdonos szerint.
  4. Az Egyéni szöveg besorolása & egyéni elnevezett entitásfelismerés szakaszban válasszon ki egy meglévő tárfiókot, vagy válassza az Új tárfiók lehetőséget. Vegye figyelembe, hogy ezek az értékek segítenek az első lépésekben, és nem feltétlenül azok a tárfiókértékek , amelyeket éles környezetben szeretne használni. A projekt létrehozása során felmerülő késés elkerülése érdekében csatlakozzon a nyelvi erőforrással azonos régióban lévő tárfiókokhoz.

    Tárfiók értéke Javasolt érték
    Storage account name Bármely név
    Tárfiók típusa Standard LRS
  5. Győződjön meg arról, hogy a Felelős AI-értesítés be van jelölve. Válassza a Véleményezés + létrehozás lehetőséget a lap alján.

Megjegyzés:

  • A tárfiók nyelvi erőforráshoz való csatlakoztatásának folyamata visszafordíthatatlan, később nem bontható le.
  • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

Meglévő nyelvi erőforrás használata

Követelmény Leírás
Regions Győződjön meg arról, hogy a meglévő erőforrás ki van építve az egyik támogatott régióban. Ha nem rendelkezik erőforrással, létre kell hoznia egy újat egy támogatott régióban.
Tarifacsomag Az erőforrás tarifacsomagja .
Managed identity Győződjön meg arról, hogy az erőforrás felügyelt identitásbeállítása engedélyezve van. Ellenkező esetben olvassa el a következő szakaszt.

Az egyéni szövegbesorolás használatához létre kell hoznia egy Azure Storage-fiókot, ha még nem rendelkezik ilyen fiókkal .

Identitáskezelés engedélyezése az erőforráshoz

A nyelvi erőforrásnak identitáskezeléssel kell rendelkeznie az Azure Portalon való engedélyezéséhez:

  1. Ugrás a nyelvi erőforrásra
  2. A bal oldali menü Erőforrás-kezelés szakaszában válassza az Identitás lehetőséget
  3. A Rendszer által hozzárendelt lapon győződjön meg arról, hogy az állapotbe van kapcsolva

Egyéni szövegbesorolási funkció engedélyezése

Győződjön meg arról, hogy engedélyezi az Egyéni szövegbesorolás/Egyéni elnevezett entitásfelismerés funkciót az Azure Portalon.

  1. Nyissa meg a nyelvi erőforrást az Azure Portalon
  2. A bal oldali menü Erőforrás-kezelés szakaszában válassza a Szolgáltatások lehetőséget
  3. Egyéni szövegbesorolás engedélyezése / Egyéni elnevezett entitásfelismerési funkció
  4. a tárfiók Csatlakozás
  5. Válassza az Alkalmaz lehetőséget

Fontos

  • Győződjön meg arról, hogy a nyelvi erőforrás rendelkezik a csatlakoztatni kívánt tárfiókhoz hozzárendelt storage blobadatok közreműködői szerepkörével.

Szerepkörök beállítása az Azure AI Language-erőforráshoz és -tárfiókhoz

Az alábbi lépésekkel állíthatja be a nyelvi erőforráshoz és tárfiókhoz szükséges szerepköröket.

An animated image showing how to set roles in the Azure portal.

Szerepkörök az Azure AI Language-erőforráshoz

  1. Nyissa meg tárfiókját vagy nyelvi erőforrását az Azure Portalon.

  2. A bal oldali navigációs menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.

  3. Válassza a Hozzáadás szerepkör-hozzárendelések hozzáadásához lehetőséget, és válassza ki a fióknak megfelelő szerepkört.

    A nyelvi erőforráshoz tulajdonosi vagy közreműködői szerepkört kell hozzárendelni.

  4. A Hozzáférés hozzárendelése területen válassza a Felhasználó, csoport vagy szolgáltatásnév lehetőséget

  5. Tagok kijelölése

  6. Válassza ki a felhasználónevet. A felhasználóneveket a Kiválasztás mezőben keresheti meg. Ismételje meg ezt az összes szerepkör esetében.

  7. Ismételje meg ezeket a lépéseket az összes olyan felhasználói fiók esetében, amelyhez hozzá kell férni ehhez az erőforráshoz.

A tárfiók szerepkörei

  1. Nyissa meg a tárfiók lapját az Azure Portalon.
  2. A bal oldali navigációs menüben válassza a Hozzáférés-vezérlés (IAM) lehetőséget.
  3. Válassza a Hozzáadás szerepkör-hozzárendelések hozzáadásához lehetőséget, és válassza ki a Tárfiókban a Storage-blobadatok közreműködői szerepkörét.
  4. A Hozzáférés hozzárendelése területen válassza a Felügyelt identitás lehetőséget.
  5. Tagok kijelölése
  6. Válassza ki az előfizetést, és a Language (Nyelv ) lehetőséget felügyelt identitásként. A felhasználóneveket a Kiválasztás mezőben keresheti meg.

Fontos

Ha virtuális hálózata vagy privát végpontja van, mindenképpen válassza az Azure-szolgáltatások engedélyezése a megbízható szolgáltatások listájában, hogy hozzáférjenek ehhez a tárfiókhoz az Azure Portalon.

CORS engedélyezése a tárfiókhoz

Győződjön meg arról, hogy engedélyezi a (GET, PUT, DELETE) metódusokat a forrásközi erőforrás-megosztás (CORS) engedélyezésekor. Állítsa be az engedélyezett forrásmezőt a következőre https://language.cognitive.azure.com: . Az összes fejléc engedélyezéséhez adja hozzá * az engedélyezett fejlécértékeket, és állítsa be a maximális életkort 500.

A screenshot showing how to use CORS for storage accounts.

Egyéni szövegbesorolási projekt létrehozása

Miután konfigurálta az erőforrás- és tárolótárolót, hozzon létre egy új egyéni szövegbesorolási projektet. A projektek olyan munkaterületek, ahol egyéni AI-modelleket hozhat létre az adatok alapján. A projektet csak Ön és mások érhetik el, akik hozzáférnek a használt Azure-erőforráshoz. Ha címkézett adatokkal rendelkezik, importálhatja azokat az első lépésekhez.

  1. Jelentkezzen be a Language Studióba. Megjelenik egy ablak, amely lehetővé teszi az előfizetés és a nyelvi erőforrás kiválasztását. Válassza ki a nyelvi erőforrást.

  2. A Language Studio Szövegbesorolás szakaszában válassza az Egyéni szövegbesorolás lehetőséget.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Válassza az Új projekt létrehozása lehetőséget a projektek lapjának felső menüjében. A projekt létrehozása lehetővé teszi az adatok címkézését, a modellek betanítása, kiértékelése, fejlesztése és üzembe helyezése.

    A screenshot of the custom text classification project creation page.

  4. Miután rákattintott az Új projekt létrehozása elemre, megjelenik egy ablak, amely lehetővé teszi a tárfiók csatlakoztatását. Ha már csatlakoztatott egy tárfiókot, látni fogja, hogy a tárfiók csatlakoztatva van. Ha nem, válassza ki a tárfiókot a megjelenő legördülő listából, és válassza ki Csatlakozás tárfiókot. Ezzel beállítja a tárfiókhoz szükséges szerepköröket. Ez a lépés valószínűleg hibát ad vissza, ha nincs tulajdonosként hozzárendelve a tárfiókhoz.

    Megjegyzés:

    • Ezt a lépést csak egyszer kell elvégeznie minden egyes használt új nyelvi erőforrás esetében.
    • Ez a folyamat visszafordíthatatlan, ha egy tárfiókot csatlakoztat a nyelvi erőforráshoz, később nem bonthatja le.
    • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

    A screenshot of the storage connection screen for custom classification projects.

  5. Válassza ki a projekt típusát. Létrehozhat egy többcímkés besorolási projektet, amelyben minden dokumentum egy vagy több osztályhoz vagy egycímkés besorolási projekthez tartozhat, ahol minden dokumentum csak egy osztályhoz tartozhat. A kijelölt típus később nem módosítható. További információ a projekttípusokról

    A screenshot of the available custom classification project types.

  6. Adja meg a projekt adatait, beleértve a projekt dokumentumainak nevét, leírását és nyelvét. Ha a példaadatkészletet használja, válassza az Angol lehetőséget. Később nem módosíthatja a projekt nevét. Válassza a Következő lehetőséget.

    Tipp.

    Az adatkészletnek nem kell teljesen azonos nyelven lennie. Több dokumentumot is használhat, amelyek mindegyike különböző támogatott nyelvekkel rendelkezik. Ha az adathalmaz különböző nyelvű dokumentumokat tartalmaz, vagy ha futásidőben különböző nyelvektől vár szöveget, akkor a projekt alapadatainak megadásakor válassza a többnyelvű adatkészlet engedélyezése lehetőséget. Ez a beállítás később engedélyezhető a Projekt beállításai lapon.

  7. Válassza ki azt a tárolót, ahová feltöltötte az adathalmazt.

    Megjegyzés:

    Ha már címkézte az adatokat, győződjön meg arról, hogy az a támogatott formátumot követi, és válassza az Igen lehetőséget, a dokumentumaim már fel vannak címkézve, és formáztam a JSON-címkéket tartalmazó fájlt, és az alábbi legördülő menüben válassza ki a címkék fájlját.

    Ha az egyik példaadatkészletet használja, használja a mellékelt webOfScience_labelsFile vagy movieLabels json fájlt. Ezután válassza a Tovább gombra.

  8. Tekintse át a megadott adatokat, és válassza a Projekt létrehozása lehetőséget.

Egyéni szövegbesorolási projekt importálása

Ha már címkézett adatokat, azokkal megkezdheti a szolgáltatást. Győződjön meg arról, hogy a címkézett adatok az elfogadott adatformátumokat követik.

  1. Jelentkezzen be a Language Studióba. Megjelenik egy ablak, amely lehetővé teszi az előfizetés és a nyelvi erőforrás kiválasztását. Válassza ki a nyelvi erőforrást.

  2. A Language Studio Szövegbesorolás szakaszában válassza az Egyéni szövegbesorolás lehetőséget.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Válassza az Új projekt létrehozása lehetőséget a projektek lapjának felső menüjében. A projekt létrehozása lehetővé teszi az adatok címkézését, a modellek betanítása, kiértékelése, fejlesztése és üzembe helyezése.

    A screenshot of the project creation page.

  4. Miután kiválasztotta az Új projekt létrehozása lehetőséget, megjelenik egy képernyő, amely lehetővé teszi a tárfiók csatlakoztatását. Ha nem találja a tárfiókot, győződjön meg arról, hogy az ajánlott lépések végrehajtásával létrehozott egy erőforrást. Ha már csatlakoztatott egy tárfiókot a nyelvi erőforráshoz, látni fogja, hogy a tárfiók csatlakoztatva van.

    Megjegyzés:

    • Ezt a lépést csak egyszer kell elvégeznie minden egyes használt új nyelvi erőforrás esetében.
    • Ez a folyamat visszafordíthatatlan, ha egy tárfiókot csatlakoztat a nyelvi erőforráshoz, később nem bonthatja le.
    • A nyelvi erőforrást csak egy tárfiókhoz csatlakoztathatja.

    A screenshot of the storage connection screen for custom classification projects.

  5. Válassza ki a projekt típusát. Létrehozhat egy többcímkés besorolási projektet, amelyben minden dokumentum egy vagy több osztályhoz vagy egycímkés besorolási projekthez tartozhat, ahol minden dokumentum csak egy osztályhoz tartozhat. A kijelölt típus később nem módosítható.

    A screenshot of the available custom classification project types.

  6. Adja meg a projekt adatait, beleértve a projekt dokumentumainak nevét, leírását és nyelvét. Később nem módosíthatja a projekt nevét. Válassza a Következő lehetőséget.

    Tipp.

    Az adatkészletnek nem kell teljesen azonos nyelven lennie. Több dokumentumot is használhat, amelyek mindegyike különböző támogatott nyelvekkel rendelkezik. Ha az adathalmaz különböző nyelvű dokumentumokat tartalmaz, vagy ha futásidőben különböző nyelvektől vár szöveget, akkor a projekt alapadatainak megadásakor válassza a többnyelvű adatkészlet engedélyezése lehetőséget. Ez a beállítás később engedélyezhető a Projekt beállításai lapon.

  7. Válassza ki azt a tárolót, ahová feltöltötte az adathalmazt.

  8. Válassza az Igen lehetőséget, a dokumentumok már fel vannak címkézve, és formázott JSON-címkéket tartalmazó fájllal rendelkezem, és az alábbi legördülő menüben válassza ki a címkék fájlját a JSON-címkék fájljának importálásához. Győződjön meg arról, hogy a formátum a támogatott formátumot követi.

  9. Válassza a Következő lehetőséget.

  10. Tekintse át a megadott adatokat, és válassza a Projekt létrehozása lehetőséget.

Projekt részleteinek lekérése

  1. Lépjen a projektbeállítások lapjára a Language Studióban.

  2. A projekt részletei láthatók.

  3. Ezen a lapon frissítheti a projekt leírását, és engedélyezheti/letilthatja a többnyelvű adatkészletet a projektbeállításokban.

  4. A csatlakoztatott tárfiókot és tárolót a nyelvi erőforráshoz is megtekintheti.

  5. Az erőforrás elsődleges kulcsát ezen a lapon is lekérheti.

    A screenshot of the project settings page.

Projekt törlése

Ha már nincs szüksége a projektre, törölheti a projektet a Language Studióval. Válassza ki az egyéni szövegbesorolást a tetején, majd válassza ki a törölni kívánt projektet. A projekt törléséhez válassza a Törlés lehetőséget a felső menüből.

További lépések

  • Tudnia kell, hogy milyen projektsémát fog használni az adatok címkézéséhez.

  • A projekt létrehozása után megkezdheti az adatok címkézését, amely tájékoztatja a szövegbesorolási modellt a szöveg értelmezéséről, valamint a betanításhoz és a kiértékeléshez.