Delen via


Een taalmodel aanpassen met Azure AI Video Indexer

Azure AI Video Indexer biedt ondersteuning voor automatische spraakherkenning via integratie met de Microsoft Custom Speech Service. U kunt het taalmodel aanpassen door aanpassingstekst te uploaden. Deze tekst komt uit het domein waarvan u de woordenlijst wilt gebruiken om de engine aan te passen. Zodra u uw model hebt getraind, worden nieuwe woorden in de aanpassingstekst herkend, ervan uitgaande dat de standaard uitspraak en het taalmodel nieuwe waarschijnlijke reeksen woorden leert. Bekijk de lijst met ondersteunde talen van Azure AI Video Indexer in ondersteunde langues.

Kubernetes (in de context van de Azure Kubernetes-service) is bijvoorbeeld een woord dat zeer specifiek is. Omdat het woord nieuw is voor Azure AI Video Indexer, wordt het herkend als 'community'. Train het model om het te herkennen als 'Kubernetes'. In andere gevallen bestaan de woorden, maar het taalmodel verwacht niet dat ze in een bepaalde context worden weergegeven. 'containerservice' is bijvoorbeeld geen reeks van twee woorden die een niet-gespecialiseerd taalmodel als een specifieke set woorden herkent.

Er zijn twee manieren om een taalmodel aan te passen:

  • Optie 1: Bewerk het transcript dat is gegenereerd door Azure AI Video Indexer. Door het transcript te bewerken en te corrigeren, traint u een taalmodel om in de toekomst verbeterde resultaten te bieden.
  • Optie 2: Een of meer tekstbestanden uploaden om het taalmodel te trainen. Het bestand kan een lijst met woorden bevatten zoals u wilt dat ze worden weergegeven in het transcript van Video Indexer of de relevante woorden die op natuurlijke wijze zijn opgenomen in zinnen en alinea's. Naarmate er betere resultaten worden bereikt met de laatste benadering, is het raadzaam dat het uploadbestand volledige zinnen of alinea's bevat die betrekking hebben op uw inhoud.

Belangrijk

Neem de woorden of zinnen niet op zoals momenteel onjuist getranscribeerd (bijvoorbeeld 'community's') in het uploadbestand, omdat dit de beoogde impact verkrijgt. Neem alleen de woorden op zoals u ze wilt weergeven (bijvoorbeeld 'Kubernetes').

Uw aangepaste taalmodel optimaliseren

Azure AI Video Indexer leert op basis van de waarschijnlijkheid van woordcombinaties, zodat u het beste kunt leren:

  • Geef voldoende echte voorbeelden van zinnen zoals ze zouden worden gesproken.
  • Plaats slechts één zin per regel, niet meer. Anders leert het systeem waarschijnlijkheden in zinnen.
  • Het is goed om één woord als zin te plaatsen om het woord tegen anderen te verbeteren, maar het systeem leert het beste van volledige zinnen.
  • Bij het introduceren van nieuwe woorden of acroniemen, indien mogelijk, geeft u zoveel mogelijk voorbeelden van gebruik in een volledige zin om zoveel mogelijk context aan het systeem te geven.
  • Probeer verschillende aanpassingsopties te plaatsen en te zien hoe ze voor u werken.
  • Vermijd herhaling van dezelfde zin meerdere keren. Er kan een vooroordelen ontstaan ten opzichte van de rest van de invoer.
  • Vermijd het opnemen van ongebruikelijke symbolen (~, # @ % &) omdat ze worden verwijderd. De zinnen waarin ze worden weergegeven, worden ook verwijderd.
  • Vermijd het plaatsen van te grote invoer, zoals honderdduizenden zinnen, omdat dit het effect van het stimuleren zal verdunnen.

Vereisten

  • Een Azure-account
  • Een Azure AI Video Indexer-account

Een taalmodel maken

  1. Ga naar de website van Azure AI Video Indexer en meld u aan.
  2. Als u een model in uw account wilt aanpassen, selecteert u de knop Con tentmodus l aanpassing aan de linkerkant van de pagina.
  3. Selecteer het tabblad Taal . U ziet een lijst met ondersteunde talen.
  4. Selecteer Model toevoegen onder de gewenste taal.
  5. Typ de naam voor het taalmodel en druk op Enter. Met deze stap maakt u het model en krijgt u de mogelijkheid om tekstbestanden naar het model te uploaden.
  6. Als u een tekstbestand wilt toevoegen, selecteert u Bestand toevoegen. De verkenner wordt geopend.
  7. Navigeer naar het tekstbestand en selecteer het. U kunt meerdere tekstbestanden toevoegen aan een taalmodel. U kunt ook een tekstbestand toevoegen door de knop ... aan de rechterkant van het taalmodel te selecteren en bestand toevoegen te selecteren.
  8. Zodra u klaar bent met het uploaden van de tekstbestanden, selecteert u de groene optie Trainen .

Het trainingsproces kan enkele minuten duren. Zodra de training is voltooid, wordt Getraind naast het model weergegeven. U kunt het bestand bekijken, downloaden en verwijderen uit het model.

Een taalmodel gebruiken in een nieuwe video

Als u uw taalmodel wilt gebruiken voor een nieuwe video, voert u een van de volgende acties uit:

  1. Selecteer de knop Uploaden boven aan de pagina.
  2. Zet uw audio- of videobestand neer of blader naar uw bestand.
  3. Selecteer een taalmodel dat u hebt gemaakt in de vervolgkeuzelijst Videobrontaal .
  4. Selecteer de optie Uploaden onder aan de pagina en de nieuwe video wordt geïndexeerd met uw taalmodel.

Een taalmodel gebruiken om opnieuw te indexeren

  1. Meld u aan bij de startpagina van Azure AI Video Indexer .
  2. Klik op de knop ... in de video en selecteer Opnieuw indexeren.
  3. Selecteer de vervolgkeuzelijst Videobrontaal en selecteer een taalmodel dat u in de lijst hebt gemaakt.
  4. Selecteer de knop Opnieuw indexeren en uw video wordt opnieuw geïndexeerd met behulp van uw taalmodel.

Een taalmodel bewerken

U kunt een taalmodel bewerken door de naam te wijzigen, er bestanden aan toe te voegen en bestanden ervan te verwijderen. Als u bestanden toevoegt aan of verwijdert uit het taalmodel, moet u het model opnieuw trainen door de groene optie Trainen te selecteren.

De naam van het taalmodel wijzigen

U kunt de naam van het taalmodel wijzigen door de knop met het beletselteken (...) aan de rechterkant van het taalmodel te selecteren en Naam wijzigen te selecteren. Voer de nieuwe naam in.

Bestanden toevoegen

  1. Selecteer Bestand toevoegen. De verkenner wordt geopend.
  2. Navigeer naar het tekstbestand en selecteer het. U kunt meerdere tekstbestanden toevoegen aan een taalmodel.

U kunt ook een tekstbestand toevoegen door de knop met het beletselteken (...) aan de rechterkant van het taalmodel te selecteren en het bestand toevoegen te selecteren.

Bestanden verwijderen

Met deze actie wordt het bestand volledig uit het taalmodel verwijderd.

  1. Selecteer de knop met het beletselteken (...) aan de rechterkant van het tekstbestand.
  2. Selecteer Verwijderen. Er verschijnt een nieuw venster met de mededeling dat de verwijdering niet ongedaan kan worden gemaakt.
  3. Selecteer de optie Verwijderen in het nieuwe venster.

Een taalmodel verwijderen

Met deze actie wordt het taalmodel volledig uit uw account verwijderd. Elke video die gebruikmaakt van het verwijderdelLanguage-model, behoudt dezelfde index totdat u de video opnieuw indexeert. Als u de video opnieuw indexeren, kunt u een nieuw taalmodel aan de video toewijzen. Anders gebruikt Azure AI Video Indexer het standaardmodel om de video opnieuw te indexeren.

  1. Selecteer de knop met het beletselteken (...) aan de rechterkant van het taalmodel.
  2. Selecteer Verwijderen. Er verschijnt een nieuw venster met de mededeling dat de verwijdering niet ongedaan kan worden gemaakt.
  3. Selecteer de optie Verwijderen in het nieuwe venster.

Taalmodellen aanpassen door transcripties te corrigeren

Azure AI Video Indexer past taalmodellen aan op basis van de werkelijke correcties die gebruikers aanbrengen in de transcripties van hun video's. Hiermee worden alle regels vastgelegd die u hebt gecorrigeerd in de transcriptie van uw video en worden ze toegevoegd aan een tekstbestand met de naam From transcript edits. Deze bewerkingen worden gebruikt voor het opnieuw trainen van het taalmodel dat is gebruikt om de video te indexeren.

Bewerkingen die zijn uitgevoerd in de tijdlijn van de widget, worden ook opgenomen.

Als u geen taalmodel hebt opgegeven bij het indexeren van deze video, worden alle bewerkingen voor deze video opgeslagen in een standaardtaalmodel dat wordt aangeroepen Account adaptations in de gedetecteerde taal van de video.

Als er meerdere wijzigingen zijn aangebracht in dezelfde regel, wordt alleen de laatste versie van de gecorrigeerde regel gebruikt voor het bijwerken van het taalmodel.

Notitie

Alleen tekstcorrecties worden gebruikt voor de aanpassing. Correcties die geen werkelijke woorden bevatten (bijvoorbeeld leestekens of spaties) worden niet opgenomen.

  1. Selecteer de video die u wilt bewerken in uw bibliotheek.
  2. Selecteer het tabblad Tijdlijn .
  3. Selecteer het potloodpictogram om het transcriptie van uw transcriptie te bewerken.
  4. U ziet dat transcriptcorrecties worden weergegeven op het tabblad Taal van de aanpassingspagina Con tentmodus l. Als u het bestand 'Van transcripties bewerken' wilt bekijken voor elk van uw taalmodellen, selecteert u het om het te openen.