Tabell för antal import

Artikel
05/06/2019

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Importerar en tidigare skapad tabell med antal

Kategori: Learning med antal

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Import Count Table i Machine Learning Studio (klassisk).

Syftet med modulen Import Count Table (Importantaltabell) är att låta kunder som har skapat en tabell med count-baserad statistik med hjälp av en tidigare version av Machine Learning att uppgradera sina experiment. Den här modulen sammanfogar de befintliga count-tabellerna med nya data.

Allmän information om antalstabeller och hur de används för att skapa funktioner finns i Learning med antal.

Viktigt

Den här modulen tillhandahålls endast för bakåtkompatibilitet med experiment som använder den inaktuella buildantaltabellen och inaktuella moduler för Count Featurizer. Vi rekommenderar att du uppgraderar experimentet för att använda de nya modulerna för att dra nytta av nya funktioner.

För alla nya experiment rekommenderar vi att du använder följande moduler:

Så här konfigurerar du importantalstabell

I Machine Learning Studio (klassisk) öppnar du ett experiment som innehåller en count-tabell som skapats med hjälp av den inaktuella modulen Build Count Table.
Lägg till modulen Import Count Table (Importantaltabell) i experimentet.
Anslut de två utdata från modulen Build Count Table (inaktuell) till matchande indataportar i importantalstabellen.

Om du har en annan datauppsättning med antal som du vill sammanfoga med den importerade count-tabellen ansluter du den till indata längst till höger för modulen Import Count Table .
Använd alternativet Inventeringstyp för att ange var och hur count-tabellen lagras:
- Datauppsättning: De data som används för att skapa antal sparas som en datauppsättning i Machine Learning Studio (klassisk).
- Blob: De data som används för att skapa antal lagras som en blockblob i Windows Azure Storage.
- MapReduce: De data som används för att skapa antal lagras som en blob i Windows Azure Storage.
  
  Det här alternativet rekommenderas vanligtvis för mycket stora datamängder. För att komma åt antalet måste du aktivera HDInsight-klustret. Ett MapReduce-jobb startas för att utföra inventeringen. Båda dessa aktiviteter kan medföra kostnader för lagring och beräkning.
  
  Mer information finns i HDInsight på Azure.
När du har specificerat datalagringsläget kan du behöva ange ytterligare anslutningsinformation för data, även om du tidigare använde en importdatamodul i experimentet för att komma åt data. Det beror på att modulen Count Featurizer (inaktuell) kommer åt datalagringen separat för att läsa data och skapa de tabeller som krävs.
Använd alternativet Antal tabelltyper för att ange format och lagringsläge för den tabell som används för att lagra antal.
- Ordlista: Använder en tabell för ordlisteantal.
  
  Alla kolumnvärden i de valda kolumnerna behandlas som strängar och hashas med hjälp av en bitmatris med en storlek på upp till 31 bitar. Därför representeras alla kolumnvärden av ett icke-negativt 32-bitars heltal.
- CMSketch: Använder en tabell som sparats i minsta skisstabell för antal.
  
  Med det här formatet används flera oberoende hash-funktioner med ett mindre intervall för att förbättra minneseffektiviteten och minska risken för hash-kollisioner.
I allmänhet bör du använda ordlistealternativet för mindre datamängder (<1 GB) och använda cmsketch-alternativet för större datauppsättningar.
Kör experimentet.
När du är klar högerklickar du på utdata för modulen Importera antal tabeller, väljer Spara som transformering och skriver ett namn för transformeringen. När du gör detta sparas de sammanslagna antalstabellerna och eventuella featuriseringsparametrar som du har tillämpat i ett format som kan tillämpas på en ny datauppsättning.

Exempel

Utforska exempel på count-based featurization using these sample experiments in the Azure AI Gallery:

Förutsägelse av flygfördröjning: Visar hur count-baserad featurization kan vara användbart i en mycket stor datamängd.
Learning med antal: Multiklassklassificering med NYC-taxidata: visar användningen av count-baserade funktioner i en förutsägelseuppgift med flera klasser.
Learning med antal: Binär klassificering med NYC-taxidata: Använder count-baserade funktioner i en binär klassificeringsuppgift.

Anteckning

Alla dessa galleriexperiment har skapats med den tidigare, och nu inaktuella, versionen av Learning med modulerna Antal. När du öppnar experimentet i Studio (klassisk) uppgraderas experimentet automatiskt för att använda de nyare modulerna.

Förväntade indata

Namn	Typ	Description
Räkna metadata	Datatabell	Metadata för antalen
Antalstabell	Datatabell	Antalstabellen
Räknad datauppsättning	Datatabell	Den datauppsättning som används för att räkna

Modulparametrar

Namn	Typ	Intervall	Valfritt	Standardvärde	Description
Inventeringstyp	CountingType		Obligatorisk		Inventeringstyp

Utdata

Namn	Typ	Description
Räkna transformering	ITransform-gränssnitt	Inventeringstransformen

Undantag

Undantag	Description
Fel 0003	Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0018	Undantag inträffar om indatauppsättningen inte är giltig.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Learning med antal

Share via