Delen via


Een aangepast tekstclassificatieproject maken

Gebruik dit artikel voor meer informatie over het instellen van de vereisten voor het starten met aangepaste tekstclassificatie en het maken van een project.

Vereisten

Voordat u begint met het gebruik van aangepaste tekstclassificatie, hebt u het volgende nodig:

Een taalresource maken

Voordat u begint met het gebruik van aangepaste tekstclassificatie, hebt u een Azure AI-taalresource nodig. Het is raadzaam om uw taalresource te maken en er een opslagaccount aan te koppelen in Azure Portal. Als u een resource maakt in Azure Portal, kunt u tegelijkertijd een Azure-opslagaccount maken, waarbij alle vereiste machtigingen vooraf zijn geconfigureerd. U kunt ook verder lezen in het artikel voor meer informatie over het gebruik van een bestaande resource en het configureren ervan voor gebruik met aangepaste tekstclassificatie.

U hebt ook een Azure-opslagaccount nodig waarin u uw .txt documenten uploadt die worden gebruikt om een model te trainen om tekst te classificeren.

Notitie

  • U moet een eigenaarsrol hebben toegewezen aan de resourcegroep om een taalresource te maken.
  • Als u een bestaand opslagaccount verbindt, moet er een eigenaarsrol aan het account zijn toegewezen.

Taalresource maken en opslagaccount verbinden

Notitie

U moet het opslagaccount niet verplaatsen naar een andere resourcegroep of een ander abonnement nadat het is gekoppeld aan de taalresource.

Een nieuwe resource maken vanuit Azure Portal

  1. Ga naar Azure Portal om een nieuwe Azure AI-taalresource te maken.

  2. Selecteer in het venster dat wordt weergegeven aangepaste tekstclassificatie en aangepaste entiteitsherkenning in de aangepaste functies. Selecteer Doorgaan om uw resource onder aan het scherm te maken.

    A screenshot showing the selection option for custom text classification and custom named entity recognition in Azure portal.

  3. Maak een taalresource met de volgende details.

    Naam Vereiste waarde
    Abonnement Uw Azure-abonnement.
    Resourcegroep Een resourcegroep die uw resource bevat. U kunt een bestaande gebruiken of een nieuwe maken.
    Regio Een van de ondersteunde regio's. Bijvoorbeeld US - west 2.
    Naam Een naam voor uw resource.
    Prijscategorie Een van de ondersteunde prijscategorieën. U kunt de gratis laag (F0) gebruiken om de service uit te proberen.

    Als u een bericht krijgt met de tekst 'uw aanmeldingsaccount is geen eigenaar van de resourcegroep van het geselecteerde opslagaccount', moet voor uw account een eigenaarsrol zijn toegewezen aan de resourcegroep voordat u een taalresource kunt maken. Neem contact op met de eigenaar van uw Azure-abonnement voor hulp.

    U kunt de eigenaar van uw Azure-abonnement bepalen door uw resourcegroep te doorzoeken en de koppeling naar het bijbehorende abonnement te volgen. Daarna kunt u het volgende doen:

    1. Het tabblad Toegangsbeheer (IAM) selecteren
    2. Roltoewijzingen selecteren
    3. Filteren op rol:eigenaar.
  4. Selecteer in de sectie Aangepaste tekstclassificatie en aangepaste entiteitsherkenning een bestaand opslagaccount of selecteer Nieuw opslagaccount. Houd er rekening mee dat deze waarden u helpen aan de slag te gaan en niet noodzakelijkerwijs de waarden van het opslagaccount die u wilt gebruiken in productieomgevingen. Om latentie te voorkomen tijdens het bouwen van uw project, maakt u verbinding met opslagaccounts in dezelfde regio als uw taalresource.

    Waarde van opslagaccount Aanbevolen waarde
    Naam van het opslagaccount Elke naam
    Storage account type Standaard - LRS
  5. Zorg ervoor dat de verantwoordelijke AI-kennisgeving is ingeschakeld. Selecteer Controleren en maken onderaan de pagina.

Notitie

  • Het proces voor het verbinden van een opslagaccount met uw taalresource kan niet ongedaan worden gemaakt. De verbinding kan later niet meer worden verbroken.
  • U kunt uw taalresource alleen verbinden met één opslagaccount.

Een bestaande taalresource gebruiken

Vereiste Beschrijving
Regio's Zorg ervoor dat uw bestaande resource is ingericht in een van de ondersteunde regio's. Als u geen resource hebt, moet u een nieuwe maken in een ondersteunde regio.
Prijscategorie De prijscategorie voor de resource.
Beheerde identiteit Zorg ervoor dat de beheerde identiteitinstelling van de resource is ingeschakeld. Lees anders de volgende sectie.

Als u aangepaste tekstclassificatie wilt gebruiken, moet u een Azure-opslagaccount maken als u er nog geen hebt.

Identiteitsbeheer inschakelen voor uw resource

Uw taalresource moet identiteitsbeheer hebben om deze in te schakelen met behulp van Azure Portal:

  1. Ga naar uw taalresource
  2. Selecteer Identiteit in het linkermenu onder de sectie Resourcebeheer
  3. Ga naar het tabblad Systeem toegewezen en zorg ervoor dat u Status instelt op Aan

Functie voor aangepaste tekstclassificatie inschakelen

Zorg ervoor dat u de functie Aangepaste tekstclassificatie/Aangepaste entiteitsherkenning inschakelt vanuit de Azure-portal.

  1. Ga naar uw taalresource in Azure Portal
  2. Selecteer Functies in het menu aan de linkerkant onder De sectie Resourcebeheer
  3. Aangepaste tekstclassificatie inschakelen /Functie Voor herkenning van aangepaste benoemde entiteiten
  4. Verbinding maken uw opslagaccount
  5. Selecteer toepassen

Belangrijk

  • Zorg ervoor dat voor uw taalresourcede rol opslagblobgegevensbijdrager is toegewezen aan het opslagaccount waarmee u verbinding maakt.

Rollen instellen voor uw Azure AI-taalresource en -opslagaccount

Gebruik de volgende stappen om de vereiste rollen in te stellen voor uw taalresource en opslagaccount.

An animated image showing how to set roles in the Azure portal.

Rollen voor uw Azure AI-taalresource

  1. Ga naar uw opslagaccount of taalresource in Azure Portal.

  2. Selecteer Toegangsbeheer (IAM) in het linkernavigatiemenu.

  3. Selecteer Toevoegen om roltoewijzingen toe te voegen en kies de juiste rol voor uw account.

    U moet de rol van eigenaar of inzender hebben toegewezen aan uw taalresource.

  4. Binnen Toegang toewijzen aan, selecteert u Gebruiker, groep of service-principal

  5. Selecteer Leden selecteren

  6. Selecteer uw gebruikersnaam. U kunt zoeken naar gebruikersnamen in het veld Selecteren . Herhaal dit voor alle rollen.

  7. Herhaal deze stappen voor alle gebruikersaccounts die toegang nodig hebben tot deze resource.

Rollen voor uw opslagaccount

  1. Ga naar de pagina van uw opslagaccount in Azure Portal.
  2. Selecteer Toegangsbeheer (IAM) in het linkernavigatiemenu.
  3. Selecteer Toevoegen om roltoewijzingen toe te voegen en kies de rol Inzender voor opslagblobgegevens in het opslagaccount.
  4. Selecteer beheerde identiteit binnen Toegang toewijzen tot.
  5. Selecteer Leden selecteren
  6. Selecteer uw abonnement en Taal als de beheerde identiteit. U kunt zoeken naar gebruikersnamen in het veld Selecteren .

Belangrijk

Als u een virtueel netwerk of privé-eindpunt hebt, selecteert u Toestaan dat Azure-services in de lijst met vertrouwde services toegang hebben tot dit opslagaccount in Azure Portal.

CORS inschakelen voor uw opslagaccount

Zorg ervoor dat u methoden (GET, PUT, DELETE) toestaat wanneer u CORS (Cross-Origin Resource Sharing) inschakelt. Stel het veld Toegestane oorsprong in op https://language.cognitive.azure.com. Alle headers toestaan door toe te voegen * aan de toegestane headerwaarden en de maximale leeftijd in te stellen op 500.

A screenshot showing how to use CORS for storage accounts.

Een aangepast tekstclassificatieproject maken

Zodra uw resource en opslagcontainer zijn geconfigureerd, maakt u een nieuw aangepast tekstclassificatieproject. Een project is een werkgebied voor het bouwen van uw aangepaste AI-modellen op basis van uw gegevens. Uw project kan alleen worden geopend door u en anderen die toegang hebben tot de Azure-resource die wordt gebruikt. Als u gelabelde gegevens hebt, kunt u deze importeren om aan de slag te gaan.

  1. Meld u aan bij Language Studio. Er wordt een venster weergegeven waarmee u uw abonnement en taalresource kunt selecteren. Selecteer uw taalresource.

  2. Selecteer aangepaste tekstclassificatie onder de sectie Tekst classificeren van Language Studio.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Selecteer Nieuw project maken in het bovenste menu op de pagina Projecten. Door een project te maken kunt u gegevens labelen, trainen, evalueren, verbeteren en implementeren.

    A screenshot of the custom text classification project creation page.

  4. Nadat u op Nieuw project hebt geklikt, wordt er een venster weergegeven waarmee u verbinding kunt maken met uw opslagaccount. Als u al een opslagaccount hebt verbonden, ziet u dat de opslagaccount is verbonden. Als dat niet het is, kiest u uw opslagaccount in de vervolgkeuzelijst die wordt weergegeven en selecteert u Verbinding maken opslagaccount. Hiermee worden de vereiste rollen voor uw opslagaccount ingesteld. Met deze stap wordt mogelijk een fout geretourneerd als u niet als eigenaar van het opslagaccount bent toegewezen.

    Notitie

    • U hoeft deze stap slechts één keer uit te voeren voor elke nieuwe taalresource die u gebruikt.
    • Dit proces kan niet ongedaan worden gemaakt als u een opslagaccount verbindt met uw taalresource, kunt u het later niet loskoppelen.
    • U kunt uw taalresource alleen verbinden met één opslagaccount.

    A screenshot of the storage connection screen for custom classification projects.

  5. Selecteer het projecttype. U kunt een classificatieproject met meerdere labels maken waarin elk document kan behoren tot een of meer klassen of een project voor classificatie van één label, waarbij elk document tot slechts één klasse kan behoren. Het geselecteerde type kan later niet meer worden gewijzigd. Meer informatie over projecttypen

    A screenshot of the available custom classification project types.

  6. Voer de projectgegevens in, inclusief een naam, beschrijving en de taal van de documenten in uw project. Als u de voorbeeldgegevensset gebruikt, selecteert u Engels. U kunt de naam van uw project later niet meer wijzigen. Selecteer Volgende.

    Tip

    Uw gegevensset hoeft zich niet volledig in dezelfde taal te bevinden. U kunt meerdere documenten hebben, elk met verschillende ondersteunde talen. Als uw gegevensset documenten van verschillende talen bevat of als u tijdens runtime tekst uit verschillende talen verwacht, schakelt u de optie voor meertalige gegevenssets in wanneer u de basisgegevens voor uw project invoert. Deze optie kan later worden ingeschakeld op de pagina Project-instellingen .

  7. Selecteer de container waar u uw gegevensset hebt geüpload.

    Notitie

    Als u uw gegevens al hebt gelabeld, moet u ervoor zorgen dat deze de ondersteunde indeling volgt en Ja selecteert , zijn mijn documenten al gelabeld en heb ik het JSON-labelsbestand opgemaakt en selecteer het labelbestand in de vervolgkeuzelijst hieronder.

    Als u een van de voorbeeldgegevenssets gebruikt, gebruikt u het opgenomen webOfScience_labelsFile of movieLabels json-bestand. Selecteer Volgende.

  8. Controleer de gegevens die u hebt ingevoerd en selecteer Project maken.

Een aangepast tekstclassificatieproject importeren

Als u al gelabelde gegevens hebt, kunt u deze gebruiken om aan de slag te gaan met de service. Zorg ervoor dat uw gelabelde gegevens de geaccepteerde gegevensindelingen volgen.

  1. Meld u aan bij Language Studio. Er wordt een venster weergegeven waarmee u uw abonnement en taalresource kunt selecteren. Selecteer uw taalresource.

  2. Selecteer aangepaste tekstclassificatie onder de sectie Tekst classificeren van Language Studio.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Selecteer Nieuw project maken in het bovenste menu op de pagina Projecten. Door een project te maken kunt u gegevens labelen, trainen, evalueren, verbeteren en implementeren.

    A screenshot of the project creation page.

  4. Nadat u Nieuw project maken hebt geselecteerd, wordt er een scherm weergegeven waarmee u verbinding kunt maken met uw opslagaccount. Als u uw opslagaccount niet kunt vinden, controleert u of u een resource hebt gemaakt met behulp van de aanbevolen stappen. Als u al een opslagaccount hebt verbonden met uw taalresource, ziet u dat uw opslagaccount is verbonden.

    Notitie

    • U hoeft deze stap slechts één keer uit te voeren voor elke nieuwe taalresource die u gebruikt.
    • Dit proces kan niet ongedaan worden gemaakt als u een opslagaccount verbindt met uw taalresource, kunt u het later niet loskoppelen.
    • U kunt uw taalresource alleen verbinden met één opslagaccount.

    A screenshot of the storage connection screen for custom classification projects.

  5. Selecteer het projecttype. U kunt een classificatieproject met meerdere labels maken waarin elk document kan behoren tot een of meer klassen of een project voor classificatie van één label, waarbij elk document tot slechts één klasse kan behoren. Het geselecteerde type kan later niet meer worden gewijzigd.

    A screenshot of the available custom classification project types.

  6. Voer de projectgegevens in, inclusief een naam, beschrijving en de taal van de documenten in uw project. U kunt de naam van uw project later niet meer wijzigen. Selecteer Volgende.

    Tip

    Uw gegevensset hoeft zich niet volledig in dezelfde taal te bevinden. U kunt meerdere documenten hebben, elk met verschillende ondersteunde talen. Als uw gegevensset documenten van verschillende talen bevat of als u tijdens runtime tekst uit verschillende talen verwacht, schakelt u de optie voor meertalige gegevenssets in wanneer u de basisgegevens voor uw project invoert. Deze optie kan later worden ingeschakeld op de pagina Project-instellingen .

  7. Selecteer de container waar u uw gegevensset hebt geüpload.

  8. Selecteer Ja, mijn documenten zijn al gelabeld en ik heb het JSON-labelsbestand opgemaakt en selecteer het labelbestand in de vervolgkeuzelijst hieronder om het JSON-labelbestand te importeren. Zorg ervoor dat deze de ondersteunde indeling volgt.

  9. Selecteer Volgende.

  10. Controleer de gegevens die u hebt ingevoerd en selecteer Project maken.

Projectdetails ophalen

  1. Ga naar de pagina met projectinstellingen in Language Studio.

  2. U kunt projectdetails bekijken.

  3. Op deze pagina kunt u de projectbeschrijving bijwerken en de meertalige gegevensset in-/uitschakelen in projectinstellingen.

  4. U kunt ook het verbonden opslagaccount en de container weergeven met uw taalresource.

  5. U kunt uw primaire resourcesleutel ook ophalen van deze pagina.

    A screenshot of the project settings page.

Project verwijderen

Wanneer u uw project niet meer nodig hebt, kunt u uw project verwijderen met Behulp van Language Studio. Selecteer aangepaste tekstclassificatie bovenaan en selecteer vervolgens het project dat u wilt verwijderen. Selecteer Verwijderen in het bovenste menu om het project te verwijderen.

Volgende stappen

  • U moet een idee hebben van het projectschema dat u gaat gebruiken om uw gegevens te labelen.

  • Nadat uw project is gemaakt, kunt u beginnen met het labelen van uw gegevens, zodat uw tekstclassificatiemodel wordt geïnformeerd over het interpreteren van tekst en wordt gebruikt voor training en evaluatie.