Zelfstudie: Sentimentanalyse met Azure AI-services
In deze zelfstudie leert u hoe u eenvoudig uw gegevens in Azure Synapse Analytics kunt verrijken met Azure AI-services. U gebruikt de tekstanalysemogelijkheden van Azure AI Language om sentimentanalyse uit te voeren.
Een gebruiker in Azure Synapse kan eenvoudig een tabel selecteren die een tekstkolom bevat om te verrijken met sentimenten. Deze gevoelens kunnen positief, negatief, gemengd of neutraal zijn. Er wordt ook een kans geretourneerd.
In deze zelfstudie komt het volgende aan bod:
- Stappen voor het ophalen van een Spark-tabelgegevensset met een tekstkolom voor sentimentanalyse.
- Het gebruik van een wizard-ervaring in Azure Synapse om gegevens te verrijken met behulp van Text Analytics in Azure AI Language.
Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Vereisten
- Azure Synapse Analytics-werkruimte met een Azure Data Lake Storage Gen2-opslagaccount dat is geconfigureerd als de standaardopslag. U moet de inzender voor opslagblobgegevens zijn van het Data Lake Storage Gen2 bestandssysteem waarmee u werkt.
- Spark-pool in uw Azure Synapse Analytics-werkruimte. Zie Een Spark-pool maken in Azure Synapse voor meer informatie.
- Stappen vóór de configuratie die worden beschreven in de zelfstudie Azure AI-services configureren in Azure Synapse.
Aanmelden bij Azure Portal
Meld u aan bij de Azure-portal.
Een Spark-tabel maken
Voor deze zelfstudie hebt u een Spark-tabel nodig.
Download het FabrikamComments.csv-bestand , dat een gegevensset voor tekstanalyse bevat.
Upload het bestand naar uw Azure Synapse opslagaccount in Data Lake Storage Gen2.
Maak een Spark-tabel op basis van het .csv-bestand door met de rechtermuisknop op het bestand te klikken en Nieuw notitieblok>Spark-tabel maken te selecteren.
Geef de tabel een naam in de codecel en voer de notebook uit in een Spark-pool. Vergeet niet om in te stellen
header=True
.%%pyspark df = spark.read.load('abfss://default@azuresynapsesa.dfs.core.windows.net/data/FabrikamComments.csv', format='csv' ## If a header exists, uncomment the line below , header=True ) df.write.mode("overwrite").saveAsTable("default.YourTableName")
De wizard Azure AI-services openen
Klik met de rechtermuisknop op de Spark-tabel die u in de vorige procedure hebt gemaakt. Selecteer Machine Learning>Voorspellen met een model om de wizard te openen.
Er wordt een configuratievenster weergegeven en u wordt gevraagd een vooraf getraind model te selecteren. Selecteer Sentimentanalyse.
Sentimentanalyse configureren
Configureer vervolgens de sentimentanalyse. Selecteer de volgende details:
- Gekoppelde Azure Cognitive Services-service: als onderdeel van de vereiste stappen hebt u een gekoppelde service gemaakt voor uw Azure AI-service. Selecteer deze hier.
- Taal: selecteer Engels als de taal van de tekst waarop u een sentimentanalyse wilt uitvoeren.
- Tekstkolom: selecteer opmerking (tekenreeks) als de tekstkolom in uw gegevensset die u wilt analyseren om het gevoel te bepalen.
Wanneer u klaar bent, selecteert u Notitieblok openen. Hiermee wordt een notebook voor u gegenereerd met PySpark-code waarmee de sentimentanalyse met Azure AI-services wordt uitgevoerd.
Het notitieblok uitvoeren
Het notebook dat u zojuist hebt geopend, gebruikt de SynapseML-bibliotheek om verbinding te maken met Azure AI-services. Met de gekoppelde Azure AI-servicesservice die u hebt opgegeven, kunt u vanuit deze ervaring veilig verwijzen naar uw Azure AI-service zonder geheimen te onthullen.
U kunt nu alle cellen uitvoeren om uw gegevens te verrijken met sentimenten. Selecteer Alles uitvoeren.
De sentimenten worden geretourneerd als positief, negatief, neutraal of gemengd. U krijgt ook waarschijnlijkheden per gevoel. Meer informatie over sentimentanalyse in Azure AI-services.