Dela via


Användningsfall för anpassad textklassificering

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för bindningsversionen.

Vad är en transparensanteckning?

Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Att skapa ett system som är lämpligt för sitt avsedda syfte kräver en förståelse för hur tekniken fungerar, dess funktioner och begränsningar och hur du uppnår bästa prestanda. Microsofts transparensanteckningar är avsedda att hjälpa dig att förstå hur vår AI-teknik fungerar, vilka val systemägare kan göra som påverkar systemets prestanda och beteende samt vikten av att tänka på hela systemet, inklusive teknik, människor och miljö. Du kan använda Transparensanteckningar när du utvecklar eller distribuerar ditt eget system eller delar dem med de personer som kommer att använda eller påverkas av systemet.

Microsofts Transparensanteckningar är en del av ett bredare arbete hos Microsoft för att omsätta våra AI-principer i praktiken. Mer information finns i Microsoft AI-principer.

Introduktion till anpassad textklassificering

Anpassad textklassificering är en molnbaserad API-tjänst som tillämpar maskininlärningsinformation så att du kan skapa anpassade modeller för textklassificeringsuppgifter.

Anpassad textklassificering stöder två typer av projekt:

  • Klassificering med en etikett: Du tilldelar endast en etikett för varje fil i datauppsättningen. Om en fil till exempel är ett filmskript kan den bara klassificeras som "Action", "Thriller" eller "Romance".
  • Klassificering av flera etiketter: Du tilldelar flera etiketter för varje fil i datauppsättningen. Om en fil till exempel är ett filmskript kan den klassificeras som "Action" eller "Action" och "Thriller".

Grunderna i anpassad textklassificering

Anpassad textklassificering erbjuds som en del av de anpassade funktionerna i Azure AI Language. Med den här funktionen kan användarna skapa anpassade AI-modeller för att klassificera text i anpassade kategorier som är fördefinierade av användaren. Genom att skapa ett anpassat textklassificeringsprojekt kan utvecklare iterativt tagga data och träna, utvärdera och förbättra modellprestanda innan de gör dem tillgängliga för förbrukning. Kvaliteten på taggade data påverkar modellens prestanda avsevärt.

För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.

Terminologi för anpassad textklassificering

Följande termer används ofta inom anpassad textklassificering:

Begrepp Definition
Projekt Ett projekt är ett arbetsområde för att skapa anpassade AI-modeller baserat på dina data. Ditt projekt kan bara nås av dig och andra som har deltagaråtkomst till den Azure-resurs som används. I ett projekt kan du tagga data, skapa modeller, utvärdera och förbättra dem vid behov och så småningom distribuera en modell för att vara redo för förbrukning. Du kan skapa flera modeller i projektet på samma datauppsättning.
Modell En modell är ett objekt som har tränats att utföra en viss uppgift. För det här systemet klassificerar modellerna text. Modeller tränas genom att lära sig från taggade data.
Klass En klass är en användardefinierad kategori som anger textens övergripande klassificering. Utvecklare taggar sina data med sina tilldelade klasser innan de skickar dem till modellen för träning.

Exempel på användningsfall för anpassad textklassificering

Anpassad textklassificering kan användas i flera scenarier i olika branscher. Några exempel är:

  • Automatisk e-post eller biljetttriaging: Supportcenter av alla typer får en stor mängd e-postmeddelanden eller biljetter som innehåller ostrukturerad, frihandstext och bifogade filer. Det är viktigt att granska, bekräfta och dirigera ämnesexperter i interna team i tid. E-posttriage i den här skalan kräver att personer granskar och dirigerar till rätt avdelningar, vilket tar tid och resurser. Anpassad textklassificering kan användas för att analysera inkommande text och sortera och kategorisera innehållet som ska dirigeras automatiskt till relevanta avdelningar för ytterligare åtgärder.

  • Kunskapsutvinning för att förbättra och berika semantisk sökning: Sökningen är grundläggande för alla appar som visar textinnehåll för användarna. Vanliga scenarier är katalog- eller dokumentsökningar, produktsökningar i detaljhandeln eller kunskapsutvinning för datavetenskap. Många företag inom olika branscher försöker skapa en omfattande sökupplevelse över privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av pipelinen kan utvecklare använda anpassad textklassificering för att kategorisera sin text i klasser som är relevanta för deras bransch. De förutsagda klasserna kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

Överväganden när du väljer ett användningsfall

  • Undvik att använda anpassad textklassificering för beslut som kan ha allvarliga negativa effekter. Inkludera mänsklig granskning av beslut som kan få allvarliga konsekvenser för enskilda personer. Du kan till exempel identifiera om du vill acceptera eller avvisa ett försäkringsanspråk baserat på en användares beskrivning av en incident.

  • Undvik att skapa klasser som är tvetydiga och inte representativa. När du utformar schemat bör du undvika klasser som liknar varandra så att det kan vara svårt att skilja dem från varandra. Om du till exempel klassificerar filmskript bör du undvika att skapa en klass för romantik, komedi och rom-com. Överväg i stället att använda en klassificeringsmodell med flera etiketter med romans- och komediklasser. Tilldela sedan båda klasserna för rom-com-filmer.

  • Juridiska och regelmässiga överväganden: Organisationer måste utvärdera potentiella specifika juridiska och regelmässiga skyldigheter när de använder AI-tjänster och lösningar, vilket kanske inte är lämpligt för användning i alla branscher eller scenarion. Dessutom är AI-tjänster eller lösningar inte utformade för och får inte användas på sätt som är förbjudna i tillämpliga användningsvillkor och relevanta uppförandekoder.

Nästa steg