Hiányzó adatok törlése

Cikk
05/06/2019

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Megadja, hogyan kell kezelni az adatkészletből hiányzó értékeket

Kategória: Adatátalakítás /-manipuláció

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Clean Missing Data (Hiányzó adatok törlése) modul a Machine Learning Studióban) hiányzó értékek eltávolítására, cseréjére vagy ki következtetésére.

Az adattudósok gyakran ellenőrzik, hogy vannak-e hiányzó értékek, majd különböző műveleteket végeznek az adatok kijavítása vagy új értékek beszúrása érdekében. Az ilyen tisztítási műveletek célja a modell betanítása során esetlegesen felmerülő hiányzó adatok által okozott problémák megelőzése.

Ez a modul többféle műveletet támogat a hiányzó értékek "tisztítása" érdekében, beleértve a következőket:

Hiányzó értékek cseréje helyőrzőre, átlagértékre vagy egyéb értékre
Hiányzó értékeket tartalmazó sorok és oszlopok teljes eltávolítása
Értékek ki következtetése statisztikai módszerek alapján

Tipp

Még csak most tanulja a gépi tanulást? Ez a cikk jó magyarázatot ad arra, hogy miért érdemes az egyes metódusokat használni a hiányzó értékek lecserélésére: Hiányzó értékek kezelésére használható módszerek

A modul használata nem módosítja a forrásadatkészletet. Ehelyett egy új adatkészletet hoz létre a munkaterületen, amely a következő munkafolyamatban használható. Az új, megtisztított adatkészletet újra is mentheti.

Ez a modul a hiányzó értékek megtisztítására használt átalakítás definícióját is kihozja. Az Átalakítás alkalmazása modullal újra felhasználhatja ezt az átalakítást más, azonos sémával és adatkészletekkel.

Hiányzó adatok megtisztítása használata

Ebben a modulban meghatározhat egy tisztítási műveletet. A tisztítási műveletet mentheti is, így később alkalmazhatja az új adatokra. A tisztítási folyamat létrehozásához és mentéshez tekintse meg a következő hivatkozásokat:

Hiányzó értékek cseréje
Tisztítási átalakítás alkalmazása új adatokra

Fontos

A hiányzó értékek kezelésével használt tisztítási módszer jelentős hatással lehet az eredményekre. Javasoljuk, hogy kísérletezzen különböző metódusokkal. Gondolja át egy adott módszer használatának indoklását és az eredmények minőségét.

Hiányzó értékek cseréje

Minden alkalommal, amikor a Clean Missing Data (Hiányzó adatok törlése) modult alkalmazza egy adathalmazra, a rendszer ugyanazt a tisztítási műveletet alkalmazza az összes kiválasztott oszlopra. Ezért ha különböző oszlopokat kell megtisztítani különböző metódusokkal, használja a modul különálló példányait.

Adja hozzá a Clean Missing Data (Hiányzó adatok tisztítása ) modult a kísérlethez, és kösse össze a hiányzó értékeket tartalmazó adatkészletet.
A megtisztítani kívánt oszlopoknál válassza ki a módosítani kívánt hiányzó értékeket tartalmazó oszlopokat. Több oszlopot is kiválaszthat, de minden kijelölt oszlopban ugyanazt a helyettesítő módszert kell használnia. Ezért általában a sztringoszlopokat és a numerikus oszlopokat külön kell megtisztítani.

Ha például az összes numerikus oszlopból hiányzó értékeket keres:
1. Nyissa meg az Oszlopválasztót, és válassza a WITH RULES (SZABÁLYOKKAL) lehetőséget.
2. A KEZDÉSHEZ válassza AZ OSZLOPOK NÉLKÜL lehetőséget.
  
  Az ÖSSZES OSZLOP oszloppal is kezdhet, majd kizárhat oszlopokat. Kezdetben a szabályok nem jelennek meg, ha először a MINDEN OSZLOP elemre kattint, de a NO COLUMNS (NINCS OSZLOP), majd ismét a ALL COLUMNS (ÖSSZES OSZLOP) elemre kattintva az összes oszlopból indul ki, majd a név, az adattípus vagy az oszlopok indexe alapján szűri ki (zárja ki) az oszlopokat.
3. A Include (Be foglalja) mezőben válassza az Oszlop típusa lehetőséget a legördülő listából, majd válassza a Numeric (Numerikus) vagy egy pontosabban meghatározott numerikus típust.
Minden választott tisztítási vagy csere módszernek a kijelölésben lévő összes oszlopra érvényesnek kell lennie. Ha bármely oszlop adatai nem kompatibilisek a megadott művelettel, a modul hibát ad vissza, és leállítja a kísérletet.
A Hiányzó értékek minimális aránya beállításban adja meg a művelet végrehajtásához szükséges hiányzó értékek minimális számát.

Ezt a beállítást a Hiányzó értékek maximális aránya érték arányával együtt használva határozhatja meg azokat a feltételeket, amelyek esetén tisztítási műveletet hajt végre a rendszer az adatkészleten. Ha túl sok vagy túl kevés sorból hiányoznak értékek, a művelet nem hajtható végre.

A megadott szám a hiányzó értékek és az oszlopban lévő összes érték arányát jelöli. Alapértelmezés szerint a Minimális hiányzó érték arány tulajdonság értéke 0. Ez azt jelenti, hogy a hiányzó értékek akkor is meg vannak tisztítva, ha csak egy érték hiányzik. A beállítás használatával kapcsolatos további példáért lásd : Setting a Threshold for Cleaning Operations (A tisztítási műveletek küszöbértékének beállítása).

Figyelmeztetés

A megadott művelet csak akkor alkalmazható, ha minden oszlopnak teljesülnie kell ennek a feltételnek. Tegyük fel például, hogy három oszlopot választott ki, majd a hiányzó értékek minimális arányát 0,2-re (20%), de valójában csak egy oszlop rendelkezik 20%-osan hiányzó értékekkel. Ebben az esetben a tisztítási művelet csak arra az oszlopra vonatkozik, amelyből több mint 20% hiányzik. A többi oszlop tehát változatlan marad.

Ha nem biztos abban, hogy a hiányzó értékek módosultak-e, válassza a Hiányzó értékjelző oszlop létrehozása lehetőséget. A rendszer egy oszlopot fűz az adatkészlethez, amely jelzi, hogy az egyes oszlopok megfelelnek-e a minimális és maximális tartományok megadott feltételeinek.
A Hiányzó értékek maximális aránya beállításban adja meg a művelet végrehajtásához szükséges hiányzó értékek maximális számát.

Előfordulhat például, hogy csak akkor szeretne hiányzó értékhelyettesítést végezni, ha a sorok 30%-a vagy kevesebb tartalmazza a hiányzó értékeket, de az értékeket hagyja üresen, ha a sorok több mint 30%-a tartalmaz hiányzó értékeket.

A számot a hiányzó értékek és az oszlopban lévő összes érték arányaként határozhatja meg. Alapértelmezés szerint a Hiányzó értékek maximális aránya 1 értékre van állítva. Ez azt jelenti, hogy a hiányzó értékek akkor is meg vannak tisztítva, ha az oszlopban lévő értékek 100%-a hiányzik.

Megjegyzés

Ha a Minimum missing value ratio (Hiányzó értékek minimális aránya) vagy a Maximum missing value ratio (Hiányzó értékek maximális aránya) beállításokkal a küszöbértéket adja meg, a tisztítási művelet nem hajtható végre, ha még az egyik kiválasztott oszlop sem felel meg a feltételeknek.
A Cleaning Mode (Tisztítási mód) beállításhoz válasszon az alábbi lehetőségek közül a hiányzó értékek lecserélésénél vagy eltávolításában:
- Csere a MICE használatával: Ez a beállítás minden hiányzó értékhez új értéket rendel hozzá, amelyet a statisztikai szakirodalom "Többváltozós imputálás láncolt egyenletekkel" vagy "Többszörös imputálás láncolt egyenletekkel" metódusával számít ki a rendszer. Több imputációs módszerrel a hiányzó adatokkal rendelkező változók modellezése feltételesen, az adatok többi változóját használva, a hiányzó értékek kitöltése előtt. Ezzel szemben egyetlen imputációs módszerben (például egy hiányzó érték oszlopátlán való lecseréléskor) egyetlen pass-t kell használni az adatokon a kitöltési érték meghatározásához.
  
  Minden imputációs módszer hibát vagy torzítást eredményez, de a többszörös beszámítás jobban szimulálja az adatokat generáló folyamatot és az adatok valószínűségi eloszlását.
  
  A hiányzó értékek kezelésének általános bemutatásáért lásd: Missing Data: the state of the art (Hiányzó adatok: a kép állapota). Schafer andRel, 2002.
  
  Figyelmeztetés
  
  Ez a beállítás nem alkalmazható teljesen üres oszlopokra. Ezeket az oszlopokat el kell távolítani, vagy a kimenetnek a megfelelő módon át kell őket venni.
- Egyéni helyettesítési érték: Ezzel a beállítással megadhat egy helyőrző értéket (például 0 vagy NA), amely az összes hiányzó értékre vonatkozik. A csereként megadott értéknek kompatibilisnek kell lennie az oszlop adattípusával.
- Csere átlagértékre: Kiszámítja az oszlop átlagát, és a átlagértéket használja helyettesítő értékként az oszlopban található hiányzó értékekhez.
  
  Csak egész, dupla vagy logikai adattípusú oszlopokra vonatkozik. További információért tekintse meg a Műszaki megjegyzések szakaszt.
- Csere mediánra: Kiszámítja az oszlop mediánértékét, és a mediánértéket használja az oszlopban hiányzó értékek helyettesítésére.
  
  Csak olyan oszlopokra vonatkozik, amelyek egész vagy dupla adattípusúak. További információért tekintse meg a Műszaki megjegyzések szakaszt.
- Csere módra: Kiszámítja az oszlop módját, és a módot használja helyettesítő értékként az oszlopban található összes hiányzó értékhez.
  
  Egész, Dupla, Logikai vagy Kategorikus adattípusú oszlopokra vonatkozik. További információért tekintse meg a Műszaki megjegyzések szakaszt.
- Teljes sor eltávolítása: Teljesen eltávolítja az adatkészlet összes olyan sorát, amely egy vagy több hiányzó értékkel rendelkezik. Ez akkor hasznos, ha a hiányzó érték véletlenszerűen hiányzónak tekinthető.
- Teljes oszlop eltávolítása: Teljesen eltávolítja az adatkészlet összes olyan oszlopát, amely egy vagy több hiányzó értékkel rendelkezik.
- Csere valószínűségi PCA használatával: A hiányzó értékeket egy lineáris modellel helyettesíti, amely elemzi az oszlopok közötti korrelációkat, és becslést ad az adatok alacsony dimenziós közelítésére, amelyből a teljes adatok rekonstruálva vannak. A mögöttes dimenziócsökkentés a főkomponens-elemzés (PCA) valószínűségi formája, és a Model variánsát implementálja a The Journal of the Statistical Society, B 21(3), 611–622. sorozat a Tipping and The Society által.
  
  Más lehetőségekhez, például a Chained Equations (MICE) használatával végzett többszörös imputáláshoz képest ennek a lehetőségnek az az előnye, hogy nem kell minden oszlophoz prediktív értékeket használni. Ehelyett a teljes adatkészlet kovacimát hozzávetőlegesen. Ezért jobb teljesítményt nyújt az olyan adatkészletek számára, amelyek sok oszlopból hiányoznak értékek.
  
  Ennek a módszernek a fő korlátai, hogy a kategorikus oszlopokat numerikus jelzőkre bontja ki, és kiszámítja az eredményül kapott adatok sűrű kkalációs mátrixát. Emellett nem ritka ábrázolásra van optimalizálva. Emiatt a nagy számú oszlopot és/vagy nagy (több tízezer) kategorikus tartományt tartalmazó adatkészletek nem támogatottak a túlzott területfelhasználás miatt.
  
  Tipp
  
  Ne feledje, hogy a kiválasztott metódus a kijelölésben lévő összes oszlopra alkalmazva lesz. Így ha egyes hiányzó értékeket nullákra szeretne cserélni egyes oszlopokban, de be szeretne szúrni egy helyőrzőt más oszlopokba, az Adatkészlet Oszlopainak kijelölése használatával válassza el az adatokat, és használja a Hiányzó adatok törlése modul különböző példányait.
A Csereérték lehetőség akkor érhető el, ha az Egyéni helyettesítési érték lehetőséget választotta. Írjon be egy új értéket, amely az oszlopban található összes hiányzó érték helyettesítő értéke lesz.

Vegye figyelembe, hogy ezt a beállítást csak olyan oszlopokban használhatja, amelyek egész, dupla, logikai vagy dátum típusúak. Dátumoszlopok esetén a helyettesítő érték 100 nanoszekundumos órajelszámként is megadva 1/1/0001 és 12:00 között.
Hiányzó értékjelző oszlop létrehozása: Válassza ezt a lehetőséget, ha azt szeretné, hogy a kimenetben látható legyen, hogy az oszlop értékei megfelelnek-e a hiányzó értéktisztítás feltételeinek. Ez a lehetőség különösen akkor hasznos, ha új tisztítási műveletet hoz létre, és meg szeretne győződni arról, hogy a tervezett módon működik.
Futtassa a kísérletet, vagy válassza a Clean Missing Data (Hiányzó adatok tisztítása ) modult, és kattintson a Run selected (Futtatás kiválasztva) gombra.

Results (Eredmények)

A modul két kimenetet ad vissza:

Megtisztított adatkészlet: A kijelölt oszlopokból álló adatkészlet, a hiányzó értékeket a megadott módon kezelve, valamint egy jelzőoszlopot, ha ezt a beállítást választotta.

A tisztításhoz nem kiválasztott oszlopok is "át vannak jelölve".
Tisztítási átalakítás: Tisztításhoz használt adatátalakítás, amely később menthető a munkaterületen, és alkalmazható az új adatokra.

Mentett tisztítási művelet alkalmazása az új adatokra

Ha gyakran kell megismételnie a tisztítási műveleteket, javasoljuk, hogy mentse a receptet adattisztításhoz átalakításként, hogy újra felhasználja ugyanazt az adatkészletet. A tisztítási átalakítás mentése különösen akkor hasznos, ha rendszeresen újra kell importálni, majd megtisztítani az azonos sémával rendelkezik adatokat.

Adja hozzá az Átalakítás alkalmazása modult a kísérlethez.
Adja hozzá a megtisztítani kívánt adatkészletet, és csatlakoztassa az adatkészletet a jobb oldali bemeneti porthoz.
Bontsa ki az Átalakítások csoportot a Studio (klasszikus) bal oldali ablaktábláján. Keresse meg a mentett átalakítást, és húzza a kísérletbe.
Csatlakozás a mentett átalakítást az Átalakítás alkalmazása bal oldali bemeneti portra.

Mentett átalakítás alkalmazásakor nem választhatja ki azokat az oszlopokat, amelyekre az átalakítás alkalmazva van. Ennek az az oka, hogy az átalakítás már definiálva van, és automatikusan alkalmazva lesz az eredeti műveletben megadott adattípusra.

Tegyük fel azonban, hogy a numerikus oszlopok egy részkészletében átalakítást hozott létre. Ezt az átalakítást hiba létrehozása nélkül alkalmazhatja vegyes oszloptípusok adatkészletére, mivel a hiányzó értékek csak a megfelelő numerikus oszlopokban módosulnak.
Futtassa a kísérletet.

Példák

Tekintsen meg példákat a modul használatára a Azure AI Gallery:

Tanulói teljesítmény előrejelzése: Ebben a példában nullák vannak beszúrva a hiányzó értékekhez.
Bináris osztályozó keresztellenőrzése – minta: A hiányzó értékek kitöltésére nullák használhatók, és létrejön egy jelzőoszlop a módosítások nyomon követéséhez. Az összes hiányzó értéket tartalmazó oszlopok is megmaradnak.
Adatkészlet-feldolgozás és -elemzés: Ebben a mintában a kísérlet különböző ágai különböző metódusokat alkalmaznak a hiányzó értékhelyettesítéshez, és az adatkészletek kiértékelése az Adatok összegzése és a Számítási lineáris korreláció használatával történik.
Repülőjárat késésének előrejelzési mintája: Az üres sorokat a rendszer teljes egészében eltávolítja.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, valamint az ismert problémákat és a gyakori kérdéseket tartalmazza.

Hiba történik, ha a középérték vagy a medián lehetőséget használja, amikor bármely sztringoszlop ki van jelölve. Ha különböző adattípusok oszlopait kell feldolgoznia, hozzon létre két példányt a Clean Missing Data (Hiányzó adatok törlése) két példányban.
Ha a hiányzó értékeket egy átlagos értékre cseréli az oszlopokban a logikai, egész szám, dátum/idő vagy időtartomány adattípusra, a rendszer először lebegőpontos számra konvertálja az oszlopot, kiszámítja a átlagértéket, majd az eredményt az eredeti adattípus legközelebbi értékére kerekül.
Amikor helyettesítő értéket ad meg, az értéknek kompatibilisnek kell lennie a kiválasztott oszlop adattípusával.
NaNA , és Infértékek –Inf olyan oszlopokhoz engedélyezettek, amelyek adattípusa Double.
A MICE metódus használata esetén a helyettesítő érték előrejelzése a betanított MICE modell használatával történik.
A Clean Missing Data (Hiányzó adatok tisztítása ) funkcióval más oszloptípusok is visszaállíthatóak. Ha az adatok más típusú oszlopokat is tartalmaznak, például címkéket, használja a Metaadatok szerkesztése parancsokat az oszloptípusok kijavítása érdekében.

A tisztítási átalakítások használatának korlátozásai

Az alábbi korlátozások érvényesek, ha (hiányzó adatok tisztítása alapján) mentett átalakítást használ az új adatokon:

A mentett átalakítások akkor sem hozhatnak létre jelzőértékeket, ha ezt a beállítást használták az eredeti tisztítási műveletben. Új átalakítás tesztelőinek leginkább a mutatóértékeket érdemes figyelembe vennie.
Az átalakítás nem számítja ki az új értékeket az új adatkészlet alapján. Más szóval, ha a Clean Missing Data (Hiányzó adatok tisztítása) értéket használta az A adatkészleten, és 0,5-ös átlagértéket generált, ugyanez az érték lesz alkalmazva a B adatkészlet hiányzó értékeinek lecserélésének átlagaként, a B adatkészlet tényleges értékeitől függetlenül.
Az új adatkészlet oszlopainak adattípusának meg kell egyeznie az átalakítást eredetileg létrehozó oszlopok adattípusának. Hiba történik, ha olyan műveleteket hajt végre az oszlopon, amelyek implicit módon módosítják az adattípust.

Tegyük fel például, hogy egy [Col1] egész szám adatoszlophoz hoz létre egy átlagos adatokat, és menti az átalakítást. Most alkalmazni szeretné a tisztítási átalakítást a [Col1] egy olyan példányára, amely egy képlettel lett módosítva, például ([Col1] /1.5). Annak érdekében, hogy az eredmény egész szám legyen, kerekítést kell alkalmazni, de az átalakítás alkalmazásakor továbbra is hibaüzenetet kap. Ha azonban egy olyan képlettel módosítja az értéket, mint a ([Col 1] * 10), nem történik hiba!

Az ilyen problémák elkerülése érdekében használja a Metaadatok szerkesztése parancsot az adattípus egész számra való explicit visszaállításához. Általánosságban elmondható, hogy a Matematikai műveletek alkalmazása modul műveletei implicit módon a numerikus oszlopokat a következőre módosítják: double.

Küszöbértékek beállítása és értelmezése

Ha a Minimális hiányzó érték aránya vagy a Hiányzó értékek maximális aránya beállításokkal határoz meg egy küszöbértéket a tisztítási műveletekhez, az eredmények váratlanak vagy zavarosak lehetnek. Annak szemléltetésére, hogy hogyan működnek a hiányzó értékek maximális és minimális értékei, bemutattunk néhány példát az Automobile Prices (Autóárak) mintaadatkészletből, amely számos oszlopot tartalmaz hiányzó értékekkel.

Az alábbi táblázat az adatkészlet több oszlopának hiányzó értékeit mutatja, valamint az adatkészleten kiszámított hiányzó értékek arányát. A hiányzó értékek aránya (a jobb szélső oszlopban) az adatkészletnek a megadott küszöbértékekkel való kiértékelése során használt érték.

Tegyük fel, hogy a Minimális hiányzó érték aránya 0,019, a Hiányzó értékek maximális aránya beállítás pedig 0,020. Az alábbi értékek táblázata alapján egyes oszlopok megfelelnek a küszöbérték-feltételeknek, néhány pedig nem:

A és a bore oszlop stroke megfelel a küszöbérték-feltételeknek.
A és a normalized-lossescompression-ratio oszlop nem felel meg a küszöbérték-feltételeknek.

Oszlop neve	Hiányzó értékek száma	Hiányzó értékek aránya
Normalizált veszteségek	41	0,2
Viselte	4	0.019512195
Stroke	4	0.019512195
Tömörítési arány	0	0

Mivel a kiválasztott oszlopok némelyike nem felelt meg a megadott feltételeknek, egyik oszlopon sem végeztek tisztítási műveletet. A modul a FALSE (HAMIS) értéket adja vissza a két jelzőoszlopban, a és a oszlopban, bore_IsMissingstroke_IsMissinghogy segítsen kideríteni, hogy mi történt.

Ha azonban a küszöbértéket a Minimális hiányzó érték arány esetében az alapértelmezett 0 értékre, a Hiányzó értékek maximális aránya beállításnál pedig az 1 értékre módosítja, a rendszer egy jelzőoszlopot ad vissza az összes kijelölt oszlophoz, és a megadott műveletet végzi el.

Tipp

Ha nem biztos abban, hogy a hiányzó értékek tisztítása a várt módon működik-e, válassza a Hiányzó értékjelző oszlop létrehozása lehetőséget.

Ismert problémák

Ha a MICE metódussal megtisztítja az adatokat, majd feldolgoz egy hiányzó értékeket tartalmazó adatkészletet, a következő hibaüzenet jelenhet meg: "AFx Library library exception: Model is not trained( AFx Library library exception: Model is not trained. ( 1000-es hiba )"

Ez a hiba csak akkor fordul elő, ha a MICE metódus van kiválasztva, és ha a betanítás adatkészlete nem tartalmaz hiányzó értékeket, de a tesztadatkészlet igen.

Várt bemenetek

Név	Típus	Description
Adathalmaz	Adattábla	Megtisztítani szükséges adatkészlet

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
A megtisztítani fog oszlopok	Bármelyik	ColumnSelection (Oszlopválasztás)	Mind	Válassza ki a hiányzó értékek clean műveletének oszlopait.
Hiányzó értékek minimális aránya	[0.0;1.0]	Float	0,0	Csak olyan oszlop tisztítása, amelyből hiányzik az értékarány a megadott érték fölött, az összes kijelölt oszlopból.
Hiányzó értékek maximális aránya	[0.0;1.0]	Float	1.0	Csak a megadott érték alatti hiányzó értékarányú oszlopokat kell megtisztítani az összes kijelölt oszlopból.
Tisztítási mód	Lista	Szabályzat kezelése	Egyéni helyettesítési érték	Válasszon egy algoritmust a hiányzó értékek megtisztításakor.
Csereérték	Bármelyik	Sztring	"0"	Írjon be egy értéket a hiányzó értékek helyére. Ez az érték nem kötelező.
Oszlop az összes hiányzó értékkel	Bármelyik	ColumnsWithAllValuesMissing	Eltávolítás	Jelezze, hogy az összes hiányzó érték oszlopait meg kell-e őrizni a kimenetben.
Hiányzó értékjelző oszlop létrehozása	Bármelyik	Logikai	hamis	Hozzon létre egy oszlopot, amely jelzi, hogy mely sorok voltak megtisztítva.
Iterációk száma	[1;10]	Egész szám	5	Adja meg az iterációk számát a MICE használata esetén.
PCA-előrejelzés iterációinak száma	[1;50]	Egész szám	10	Adja meg az iterációk számát PCA-előrejelzés használata esetén.

Kimenetek

Név	Típus	Description
Megtisztított adatkészlet	Adattábla	Megtisztított adatkészlet
Átalakítás tisztítása	ITransform interfész	Átalakítás, amely az Átalakítás alkalmazása modulnak lesz átkedve az új adatok tisztítása érdekében.

Kivételek

Kivétel	Description
0002-es hiba	Kivétel történik, ha egy vagy több paramétert nem lehetett a megadott típusból a cél metódus által megkövetelt típusra átalakítani.
0003-as hiba	Kivétel történik, ha egy vagy több bemeneti adatkészlet null vagy üres.
0008-as hiba	Kivétel történik, ha egy paraméter nem esik a tartományba.
0013-as hiba	Kivétel történik, ha a modulnak átadott értéknek érvénytelen a típusa.
0018-as hiba	Kivétel történik, ha a bemeneti adatkészlet érvénytelen.
0039-es hiba	A művelet meghiúsulása kivételt képez.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listáját a hibakódok Machine Learning REST API.

Lásd még

Manipuláció
Adatátalakítás
A-Z modullista

Megosztás a következőn keresztül: