Spojit data
Tento článek popisuje, jak pomocí komponenty Join Data v návrháři služby Azure Machine Learning sloučit dvě datové sady pomocí operace spojení ve stylu databáze.
Konfigurace dat spojení
Pokud chcete provést spojení se dvěma datovými sadami, měly by souviset s klíčovým sloupcem. Podporují se také složené klíče používající více sloupců.
Přidejte datové sady, které chcete zkombinovat, a potom přetáhněte komponentu Join Data do kanálu.
Komponentu najdete v kategorii Transformace dat v části Manipulace.
Připojte datové sady ke komponentě Join Data .
Výběrem možnosti Spustit selektor sloupců zvolte klíčové sloupce. Nezapomeňte zvolit sloupce pro levý i pravý vstup.
Pro jeden klíč:
Vyberte jeden klíčový sloupec pro oba vstupy.
Složený klíč:
Vyberte všechny klíčové sloupce z levého vstupu a pravého vstupu ve stejném pořadí. Komponenta Join Data spojí tabulky, když se shodují všechny klíčové sloupce. Zaškrtněte políčko Povolit duplikáty a zachovat pořadí sloupců ve výběru , pokud pořadí sloupců není stejné jako původní tabulka.
Pokud chcete zachovat citlivost písmen u spojení textového sloupce, vyberte možnost Rozlišovat malá a velká písmena.
Pomocí rozevíracího seznamu Typ spojení určete, jak se mají datové sady kombinovat.
Vnitřní spojení: Nejběžnější operací spojení je vnitřní spojení . Vrátí kombinované řádky pouze v případech, kdy se hodnoty klíčových sloupců shodují.
Levé vnější spojení: Levé vnější spojení vrátí spojené řádky pro všechny řádky z levé tabulky. Pokud řádek v levé tabulce neobsahuje odpovídající řádky v pravé tabulce, obsahuje vrácený řádek chybějící hodnoty pro všechny sloupce, které pocházejí z pravé tabulky. Můžete také zadat náhradní hodnotu chybějících hodnot.
Úplné vnější spojení: Úplné vnější spojení vrátí všechny řádky z levé tabulky (tabulka1) a z pravé tabulky (tabulka2).
Pro každý z řádků v obou tabulce, které nemají žádné odpovídající řádky v druhé, výsledek obsahuje řádek obsahující chybějící hodnoty.
Levé střední spojení: Levé střední spojení vrátí pouze hodnoty z levé tabulky, když se hodnoty klíčových sloupců shodují.
Pro možnost Zachovat správné klíčové sloupce ve spojené tabulce:
- Tuto možnost vyberte, pokud chcete zobrazit klíče z obou vstupních tabulek.
- Zrušte výběr, pokud chcete vrátit pouze klíčové sloupce z levého vstupu.
Odešlete kanál.
Pokud chcete zobrazit výsledky, klikněte pravým tlačítkem na data spojení a vyberte Vizualizovat.
Další kroky
Podívejte se na sadu komponent dostupných pro Azure Machine Learning.