Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktigt!
Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US
av det här dokumentet för bindningsversionen.
Vad är en transparensanteckning?
Viktigt!
Den här artikeln förutsätter att du är bekant med riktlinjer och metodtips för Azure AI Language. Mer information finns i Transparensanteckning för Azure AI Language.
Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Att skapa ett system som är lämpligt för sitt avsedda syfte kräver en förståelse för hur tekniken fungerar, dess funktioner och begränsningar och hur du uppnår bästa prestanda. Microsofts transparensanteckningar är avsedda att hjälpa dig att förstå hur vår AI-teknik fungerar, vilka val systemägare kan göra som påverkar systemets prestanda och beteende samt vikten av att tänka på hela systemet, inklusive teknik, människor och miljö. Du kan använda Transparensanteckningar när du utvecklar eller distribuerar ditt eget system eller delar dem med de personer som kommer att använda eller påverkas av systemet.
Microsofts transparensanteckningar är en del av ett bredare arbete hos Microsoft för att omsätta våra AI-principer i praktiken. Mer information finns i Microsoft AI-principer.
Grunderna i Attitydanalys
Inledning
Funktionen Attitydanalys i Azure AI Language utvärderar text och returnerar sentimentpoäng och etiketter för varje mening. Detta är användbart för att identifiera positiva, neutrala och negativa sentiment i sociala medier, kundrecensioner, diskussionsforum och andra produkt- och tjänstscenarier.
Förmågor
Systemets beteende
Attitydanalys ger sentimentetiketter (till exempel "negativ", "neutral" och "positiv") baserat på den högsta konfidenspoängen som hittats av tjänsten på menings- och dokumentnivå. Den här funktionen returnerar också konfidenspoäng mellan 0 och 1 för varje dokument och mening för positiva, neutrala och negativa sentiment. Poäng närmare 1 indikerar ett högre förtroende för etikettens klassificering, medan lägre poäng indikerar lägre konfidens. Som standard är den övergripande sentimentetiketten den största av de tre konfidenspoängen, men du kan definiera ett tröskelvärde för någon eller alla individuella förtroendepoäng för sentiment beroende på vad som fungerar bäst för ditt scenario. För varje dokument eller varje mening adderar de förutsagda poängen associerade med etiketterna (positiva, negativa och neutrala) upp till 1. Läs mer om sentimentetiketter och poäng.
Dessutom returnerar den valfria yttrandeutvinningsfunktionen aspekter (till exempel attributen för produkter eller tjänster) och deras tillhörande åsiktsord. För varje aspekt returneras en övergripande sentimentetikett tillsammans med konfidenspoäng för positiva och negativa sentiment. Till exempel har meningen "Restaurangen hade god mat och vår servitör var vänlig" två aspekter, "mat" och "servitör", och deras motsvarande åsiktsord är "bra" och "vänliga". De två aspekterna får därför sentimentklassificering positive
, med konfidenspoäng mellan 0 och 1,0. Läs mer om åsiktsutvinning.
Se JSON-svaret för det här exemplet.
Användningsfall
Attitydanalys kan användas i flera scenarier i olika branscher. Vissa exempel inkluderar:
- Övervaka positiva och negativa feedbacktrender totalt. Efter att ha introducerat en ny produkt kan en återförsäljare använda sentimenttjänsten för att övervaka flera sociala medier för omnämnanden av produkten och dess tillhörande sentiment. Den trendiga attityden kan användas i produktmöten för att fatta affärsbeslut om den nya produkten.
- Kör sentimentanalys på råtextresultat från undersökningar för att få insikter för analys och uppföljning med deltagare (kunder, anställda, konsumenter osv.). En butik med en princip för att följa upp kundernas negativa recensioner inom 24 timmar och positiva recensioner inom en vecka kan använda sentimenttjänsten för att kategorisera recensioner för enkel och snabb uppföljning.
- Hjälp kundtjänstpersonalen att förbättra kundengagemanget genom insikter som samlas in från realtidsanalys av interaktioner. Extrahera insikter från transkriberade kundtjänstsamtal för att bättre förstå kundagentinteraktioner och trender för att förbättra kundengagemang.
Att tänka på när du väljer ett användningsfall
- Undvik automatiska åtgärder utan mänsklig inblandning för scenarier med hög påverkan. Till exempel bör de anställdas bonusar inte automatiskt baseras på attitydpoäng från deras interaktionstext för kundtjänst. Källdata bör alltid granskas när en persons ekonomiska situation, hälsa eller säkerhet påverkas.
- Överväg noggrant scenarier utanför produkt- och tjänstgranskningsdomänen. Eftersom modellen tränas på produkt- och tjänstgranskningar kanske systemet inte korrekt känner igen attitydfokuserat språk i andra domäner. Se alltid till att testa systemet på drifttestdatauppsättningar för att säkerställa att du får den prestanda du behöver. Din datauppsättning för drifttest bör återspegla de verkliga data som systemet ser i produktion med alla egenskaper och variationer som du kommer att ha när produkten distribueras. Syntetiska data och tester som inte återspeglar ditt scenario från slutpunkt till slutpunkt är sannolikt inte tillräckliga.
- Tänk noga på scenarier som vidtar automatiska åtgärder för att filtrera eller ta bort innehåll. Du kan lägga till en mänsklig granskningscykel och/eller rangordna om innehåll (i stället för att filtrera det helt) om ditt mål är att säkerställa att innehållet uppfyller dina communitystandarder.
- Juridiska och regelmässiga överväganden: Organisationer måste utvärdera potentiella specifika juridiska och regelmässiga skyldigheter när de använder AI-tjänster och lösningar, vilket kanske inte är lämpligt för användning i alla branscher eller scenarion. Dessutom är AI-tjänster eller lösningar inte utformade för och får inte användas på sätt som är förbjudna i tillämpliga användningsvillkor och relevanta uppförandekoder.
Begränsningar
Beroende på ditt scenario och dina indata kan du uppleva olika prestandanivåer. Följande information är utformad för att hjälpa dig att förstå systembegränsningar och viktiga begrepp om prestanda när de gäller attitydanalys.
Viktiga begränsningar att tänka på:
Maskininlärningsmodellen som används för att förutsäga sentiment har tränats på produkt- och tjänstgranskningar. Det innebär att tjänsten fungerar bäst för liknande scenarier och mindre exakt för scenarier som inte omfattas av produkt- och tjänstgranskningarna. Personalgranskningar kan till exempel använda ett annat språk för att beskriva sentiment och därför kanske du inte får de resultat eller prestanda du förväntar dig. Ett ord som "stark" i frasen "Shafali var en stark ledare" kanske inte får en positiv attityd eftersom ordet starkt kanske inte har en tydlig positiv attityd i produkt- och tjänstrecensioner.
Eftersom modellen tränas på produkt- och tjänstgranskningar kan dialekter och språk som är mindre representerade i datamängden ha lägre noggrannhet.
Modellen har ingen förståelse för den relativa betydelsen av olika meningar som skickas tillsammans. Eftersom den övergripande attityden är en enkel aggregerad poäng av meningarna kanske den övergripande attitydpoängen inte överensstämmer med en människas tolkning som skulle ta hänsyn till det faktum att vissa meningar kan ha större betydelse för att fastställa den övergripande attityden.
Modellen kanske inte känner igen sarkasm. Kontext, som tonfall, ansiktsuttryck, textens författare, målgruppen för texten eller föregående konversation är ofta viktigt för att förstå sentimentet. Med sarkasm behövs ofta ytterligare kontext för att identifiera om en textinmatning är positiv eller negativ. Med tanke på att tjänsten bara ser textinmatningen kan klassificeringen av sarkastiska sentiment vara mindre exakt. Det var till exempel fantastiskt, kan vara antingen positivt eller negativt beroende på kontext, tonfall, ansiktsuttryck, författare och publik.
Storleken på konfidenspoängen återspeglar inte attitydens intensitet. Den baseras på modellens förtroende för en viss attityd (positiv, neutral, negativ). Om ditt system är beroende av attitydens intensitet bör du därför överväga att använda en mänsklig granskare eller logik efter bearbetning på de enskilda åsiktspoängen eller den ursprungliga texten för att rangordna attitydens intensitet.
Vi har försökt minska den bias som våra modeller uppvisar, men de begränsningar som följer med språkmodeller, inklusive möjligheten för den att producera felaktiga, otillförlitliga och partiska utdata, gäller för Azure AI Language Sentiment Analysis-modellen. Vi förväntar oss att modellen har några falska negativa och positiva resultat för tillfället, men vi är angelägna om att samla in användarfeedback för att hjälpa vårt pågående arbete med att förbättra den här tjänsten.
Metodtips för att förbättra systemprestanda
Eftersom sentimentet är något subjektivt går det inte att ge en universellt tillämplig uppskattning av modellens prestanda. I slutändan beror prestanda på ett antal faktorer, till exempel ämnesdomänen, egenskaperna för den bearbetade texten, användningsfallet för systemet och hur människor tolkar systemets utdata.
Du kan hitta förtroendepoäng för positiva, negativa och neutrala sentiment skiljer sig beroende på ditt scenario. I stället för att använda den övergripande attityden på meningsnivå för hela dokumentet eller meningen kan du definiera ett tröskelvärde för någon eller alla individuella förtroendepoäng för sentiment som fungerar bäst för ditt scenario. Om det till exempel är viktigare att identifiera alla potentiella instanser av negativa sentiment kan du använda ett lägre tröskelvärde för det negativa sentimentet i stället för att titta på den övergripande attitydetiketten. Det innebär att du kan få fler falska positiva identifieringar (neutral eller positiv text som identifieras som negativ attityd), men färre falska negativa (negativ text identifieras inte som negativ attityd). Du kanske till exempel vill läsa all produktåterkoppling som har en potentiell negativ ton för idéer till produktförbättring. I så fall kan du bara använda den negativa attitydpoängen och ange ett lägre tröskelvärde. Detta kan leda till extra arbete eftersom det skulle sluta med att du läser några recensioner som inte är negativa, men du är mer benägna att identifiera möjligheter till förbättringar. Om det är viktigare för systemet att bara känna igen sann negativ text kan du använda ett högre tröskelvärde eller använda den övergripande attitydetiketten. Du kanske till exempel vill svara på produktrecensioner som är negativa. Om du vill minimera arbetet med att läsa och svara på negativa recensioner kan du bara använda den övergripande attitydförutsägelse och ignorera enskilda sentimentpoäng. Även om du kanske missar vissa förutsagda negativa omdömen, kommer du sannolikt att fånga de flesta av de verkligt negativa recensionerna. Tröskelvärden kanske inte har konsekvent beteende i olika scenarier. Därför är det viktigt att du testar systemet med verkliga data som det kommer att bearbeta i produktion.
Se även
- Transparensanteckning för Azure AI Language
- Transparensanteckning för namngiven entitetsigenkänning och personligt identifierande information
- Transparensanteckning för hälsa
- Transparensanteckning för extrahering av nyckelfraser
- Transparensanteckning för språkidentifiering
- Transparensanteckning för svar på frågor
- Transparensanteckning för sammanfattning
- Datasekretess och säkerhet för Azure AI Language
- Vägledning för integrering och ansvarsfull användning med Azure AI Language