Megosztás a következőn keresztül:


Átalakítás adathalmazzá

Ez a cikk azt ismerteti, hogyan alakíthatja át a folyamat adatait a tervező belső formátumára az Azure Machine Learning Designer Konvertálás adathalmazra összetevőjével.

A legtöbb esetben nincs szükség átalakításra. Az Azure Machine Learning implicit módon konvertálja az adatokat a natív adathalmaz formátumára, amikor bármilyen műveletet végrehajt az adatokon.

Ha valamilyen normalizálást vagy tisztítást végzett egy adatkészleten, javasoljuk, hogy mentse az adatokat az adathalmaz formátumára, és biztosítani szeretné, hogy a módosításokat más folyamatokban is használják.

Megjegyzés

Az Adathalmazra konvertálás csak az adatok formátumát módosítja. Nem menti az adatok új másolatát a munkaterületen. Az adathalmaz mentéséhez kattintson duplán a kimeneti portra, válassza a Mentés adatkészletként lehetőséget, és adjon meg egy új nevet.

Az Adathalmazra konvertálás használata

Javasoljuk, hogy a Metaadatok szerkesztése összetevő használatával készítse elő az adathalmazt a Konvertálás adatkészletté használata előtt. Hozzáadhat vagy módosíthat oszlopneveket, módosíthatja az adattípusokat, és szükség szerint egyéb módosításokat végezhet.

  1. Adja hozzá a Konvertálás adathalmazsá összetevőt a folyamathoz. Ezt az összetevőt az Adatátalakítás kategóriában találja a tervezőben.

  2. Csatlakoztassa bármely olyan összetevőhöz, amely egy adathalmazt kimenetel.

    Amíg az adatok táblázatosak, átalakíthatja adatkészletté. Ide tartoznak az Adatok importálása, az Adatok manuális megadása vagy az Átalakítás alkalmazásával átalakított adathalmazok.

  3. A Művelet legördülő listában adja meg, hogy szeretne-e bármilyen tisztítást végezni az adatokon az adathalmaz mentése előtt:

    • Nincs: Használja az adatokat úgy, ahogy van.

    • SetMissingValue: Állítson be egy adott értéket egy hiányzó értékre az adathalmazban. Az alapértelmezett helyőrző a kérdőjel karakter (?), de az Egyéni hiányzó érték beállítással más értéket adhat meg. Ha például a Taxi for Custom hiányzó értéket adja meg, akkor az adathalmaz taxijának összes példánya a hiányzó értékre változik.

    • ReplaceValues: Ezzel a beállítással egyetlen pontos értéket adhat meg, amelyet bármely más pontos értékkel kell helyettesíteni. A hiányzó értékeket vagy egyéni értékeket a Csere metódus beállításával cserélheti le :

      • Hiányzó: Ezt a lehetőséget választva lecserélheti a bemeneti adatkészlet hiányzó értékeit. Az Új érték mezőben adja meg azt az értéket, amellyel lecserélheti a hiányzó értékeket.
      • Egyéni: Ezt a lehetőséget választva lecserélheti a bemeneti adathalmaz egyéni értékeit. Az Egyéni érték mezőbe írja be a megkeresni kívánt értéket. Ha például az adatok a hiányzó értékek helyőrzőjeként használt sztringet obs tartalmazzák, akkor a következőt kell megadnia obs: . Az Új érték mezőben adja meg az új értéket az eredeti sztring lecseréléséhez.

    Vegye figyelembe, hogy a ReplaceValues művelet csak a pontos egyezésekre vonatkozik. Ezek a sztringek például nem lesznek hatással a következőkre: obs., obsolete.

  4. Küldje el a folyamatot.

Results (Eredmények)

  • Ha az eredményként kapott adathalmazt új névvel szeretné menteni, válassza az adathalmaz regisztrálása ikont az összetevő jobb oldali paneljének Kimenetek lapján.

Technikai megjegyzések

  • Minden olyan összetevő, amely bemenetként vesz fel egy adathalmazt, a CSV-fájlban vagy a TSV-fájlban is adatokat vehet fel. Az összetevőkódok futtatása előtt a bemenetek előfeldolgozásra kerülnek. Az előfeldolgozás egyenértékű azzal, hogy a bemeneten futtatja a Konvertálás adathalmazra összetevőt.

  • Az SVMLight formátumból nem konvertálható adatkészletté.

  • Egyéni csereművelet megadásakor a keresés és csere művelet a teljes értékekre vonatkozik. Részleges egyezések nem engedélyezettek. Lecserélheti például a 3-at -1-re vagy 33-ra, de a 3-at nem cserélheti kétjegyű számra, például a 35-öt.

  • Egyéni csereműveletek esetén a csere csendesen meghiúsul, ha olyan karaktert használ helyettesítőként, amely nem felel meg az oszlop aktuális adattípusának.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .