Átalakítás adathalmazzá
Ez a cikk azt ismerteti, hogyan alakíthatja át a folyamat adatait a tervező belső formátumára az Azure Machine Learning Designer Konvertálás adathalmazra összetevőjével.
A legtöbb esetben nincs szükség átalakításra. Az Azure Machine Learning implicit módon konvertálja az adatokat a natív adathalmaz formátumára, amikor bármilyen műveletet végrehajt az adatokon.
Ha valamilyen normalizálást vagy tisztítást végzett egy adatkészleten, javasoljuk, hogy mentse az adatokat az adathalmaz formátumára, és biztosítani szeretné, hogy a módosításokat más folyamatokban is használják.
Megjegyzés
Az Adathalmazra konvertálás csak az adatok formátumát módosítja. Nem menti az adatok új másolatát a munkaterületen. Az adathalmaz mentéséhez kattintson duplán a kimeneti portra, válassza a Mentés adatkészletként lehetőséget, és adjon meg egy új nevet.
Az Adathalmazra konvertálás használata
Javasoljuk, hogy a Metaadatok szerkesztése összetevő használatával készítse elő az adathalmazt a Konvertálás adatkészletté használata előtt. Hozzáadhat vagy módosíthat oszlopneveket, módosíthatja az adattípusokat, és szükség szerint egyéb módosításokat végezhet.
Adja hozzá a Konvertálás adathalmazsá összetevőt a folyamathoz. Ezt az összetevőt az Adatátalakítás kategóriában találja a tervezőben.
Csatlakoztassa bármely olyan összetevőhöz, amely egy adathalmazt kimenetel.
Amíg az adatok táblázatosak, átalakíthatja adatkészletté. Ide tartoznak az Adatok importálása, az Adatok manuális megadása vagy az Átalakítás alkalmazásával átalakított adathalmazok.
A Művelet legördülő listában adja meg, hogy szeretne-e bármilyen tisztítást végezni az adatokon az adathalmaz mentése előtt:
Nincs: Használja az adatokat úgy, ahogy van.
SetMissingValue: Állítson be egy adott értéket egy hiányzó értékre az adathalmazban. Az alapértelmezett helyőrző a kérdőjel karakter (?), de az Egyéni hiányzó érték beállítással más értéket adhat meg. Ha például a Taxi for Custom hiányzó értéket adja meg, akkor az adathalmaz taxijának összes példánya a hiányzó értékre változik.
ReplaceValues: Ezzel a beállítással egyetlen pontos értéket adhat meg, amelyet bármely más pontos értékkel kell helyettesíteni. A hiányzó értékeket vagy egyéni értékeket a Csere metódus beállításával cserélheti le :
- Hiányzó: Ezt a lehetőséget választva lecserélheti a bemeneti adatkészlet hiányzó értékeit. Az Új érték mezőben adja meg azt az értéket, amellyel lecserélheti a hiányzó értékeket.
- Egyéni: Ezt a lehetőséget választva lecserélheti a bemeneti adathalmaz egyéni értékeit. Az Egyéni érték mezőbe írja be a megkeresni kívánt értéket. Ha például az adatok a hiányzó értékek helyőrzőjeként használt sztringet
obs
tartalmazzák, akkor a következőt kell megadniaobs
: . Az Új érték mezőben adja meg az új értéket az eredeti sztring lecseréléséhez.
Vegye figyelembe, hogy a ReplaceValues művelet csak a pontos egyezésekre vonatkozik. Ezek a sztringek például nem lesznek hatással a következőkre:
obs.
,obsolete
.Küldje el a folyamatot.
Results (Eredmények)
- Ha az eredményként kapott adathalmazt új névvel szeretné menteni, válassza az adathalmaz regisztrálása ikont az összetevő jobb oldali paneljének Kimenetek lapján.
Technikai megjegyzések
Minden olyan összetevő, amely bemenetként vesz fel egy adathalmazt, a CSV-fájlban vagy a TSV-fájlban is adatokat vehet fel. Az összetevőkódok futtatása előtt a bemenetek előfeldolgozásra kerülnek. Az előfeldolgozás egyenértékű azzal, hogy a bemeneten futtatja a Konvertálás adathalmazra összetevőt.
Az SVMLight formátumból nem konvertálható adatkészletté.
Egyéni csereművelet megadásakor a keresés és csere művelet a teljes értékekre vonatkozik. Részleges egyezések nem engedélyezettek. Lecserélheti például a 3-at -1-re vagy 33-ra, de a 3-at nem cserélheti kétjegyű számra, például a 35-öt.
Egyéni csereműveletek esetén a csere csendesen meghiúsul, ha olyan karaktert használ helyettesítőként, amely nem felel meg az oszlop aktuális adattípusának.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket .
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: