Megosztás a következőn keresztül:


Átalakítás adathalmazzá

Ez a cikk azt ismerteti, hogyan alakíthatja át a folyamat adatait a tervező belső formátumára az Azure Machine Learning Designer Adatkészletté alakítás összetevőjével.

A legtöbb esetben nincs szükség átalakításra. Az Azure Machine Learning implicit módon konvertálja az adatokat a natív adathalmaz formátumára, amikor bármilyen műveletet végez az adatokon.

Ha valamilyen normalizálást vagy tisztítást végzett egy adathalmazon, javasoljuk, hogy mentse az adatokat az adathalmaz formátumára, és biztosítani szeretné, hogy a módosítások más folyamatokban is használhatók legyenek.

Feljegyzés

Az adatkészletté alakítás csak az adatok formátumát módosítja. Nem menti az adatok új másolatát a munkaterületen. Az adathalmaz mentéséhez kattintson duplán a kimeneti portra, válassza a Mentés adathalmazként lehetőséget, és adjon meg egy új nevet.

A Konvertálás adathalmazsá alakítás használata

Javasoljuk, hogy a Metaadatok szerkesztése összetevő használatával készítse elő az adathalmazt a Konvertálás adathalmazsá alakítás előtt. Hozzáadhat vagy módosíthat oszlopneveket, módosíthatja az adattípusokat, és szükség szerint egyéb módosításokat is végezhet.

  1. Adja hozzá a Konvertálás adatkészletté összetevőt a folyamathoz. Ezt az összetevőt az Adatátalakítás kategóriában találja a tervezőben.

  2. Csatlakoztassa minden olyan összetevőhöz, amely egy adathalmazt kimenetel.

    Mindaddig, amíg az adatok táblázatosak, átalakíthatja adathalmazsá. Ide tartoznak az Adatok importálása, az Adatok manuális beírása révén létrehozott adatok, vagy az átalakítás alkalmazásával átalakított adathalmazok.

  3. A Művelet legördülő listában adja meg, hogy szeretne-e bármilyen tisztítást végezni az adatokon az adathalmaz mentése előtt:

    • Nincs: Használja az adatokat, ahogy van.

    • SetMissingValue: Adott érték beállítása hiányzó értékre az adathalmazban. Az alapértelmezett helyőrző a kérdőjel karakter (?), de az Egyéni hiányzó érték beállítással más értéket adhat meg. Ha például az egyéni hiányzó értékhez adja meg a Taxi értéket, akkor az adathalmazban lévő Taxi összes példánya a hiányzó értékre változik.

    • ReplaceValues: Ezzel a beállítással egyetlen pontos értéket adhat meg, amelyet bármely más pontos értékkel helyettesíthet. A hiányzó értékeket vagy egyéni értékeket a Csere metódus beállításával cserélheti le :

      • Hiányzik: Ezt a beállítást választva lecserélheti a bemeneti adathalmaz hiányzó értékeit. Az Új érték mezőben adja meg azt az értéket, amellyel lecserélheti a hiányzó értékeket.
      • Egyéni: Ezt a beállítást választva lecserélheti a bemeneti adathalmaz egyéni értékeit. Egyéni értékként adja meg a keresett értéket. Ha például az adatok a hiányzó értékek helyőrzőjeként használt sztringet obs tartalmazzák, akkor be kell írnia obs. Új érték esetén írja be az új értéket az eredeti sztring lecseréléséhez.

    Vegye figyelembe, hogy a ReplaceValues művelet csak a pontos egyezésekre vonatkozik. Ezek a sztringek például nem lesznek hatással: obs., obsolete.

  4. Küldje el a folyamatot.

Results (Eredmények)

  • Ha az eredményként kapott adathalmazt új névvel szeretné menteni, válassza az összetevő jobb oldali paneljén, a Kimenetek lap Kimenetek lapján az adatkészlet regisztrálása ikont.

Technikai megjegyzések

  • Bármely összetevő, amely bemenetként fogad egy adathalmazt, a CSV-fájlban vagy a TSV-fájlban is adatokat vehet fel. Az összetevőkód futtatása előtt a bemenetek előfeldolgozásra kerülnek. Az előfeldolgozás egyenértékű azzal, hogy a bemeneten futtatja a Konvertálás adathalmazra összetevőt.

  • Az SVMLight formátumból nem konvertálható adathalmazsá.

  • Egyéni csereművelet megadásakor a keresési és csere művelet a teljes értékekre vonatkozik. Részleges egyezések nem engedélyezettek. A 3-at például lecserélheti -1 vagy 33 karakterre, de a 3-at nem helyettesítheti kétjegyű számmal( például 35).

  • Egyéni csereműveletek esetén a csere csendesen meghiúsul, ha olyan karaktert használ, amely nem felel meg az oszlop aktuális adattípusának.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket.