Sdílet prostřednictvím


Spojit data

Tento článek popisuje, jak pomocí komponenty Join Data v návrháři služby Azure Machine Learning sloučit dvě datové sady pomocí operace spojení ve stylu databáze.

Konfigurace dat spojení

Pokud chcete provést spojení se dvěma datovými sadami, měly by souviset s klíčovým sloupcem. Podporují se také složené klíče používající více sloupců.

  1. Přidejte datové sady, které chcete zkombinovat, a potom přetáhněte komponentu Join Data do kanálu.

    Komponentu najdete v kategorii Transformace dat v části Manipulace.

  2. Připojte datové sady ke komponentě Join Data .

  3. Výběrem možnosti Spustit selektor sloupců zvolte klíčové sloupce. Nezapomeňte zvolit sloupce pro levý i pravý vstup.

    Pro jeden klíč:

    Vyberte jeden klíčový sloupec pro oba vstupy.

    Složený klíč:

    Vyberte všechny klíčové sloupce z levého vstupu a pravého vstupu ve stejném pořadí. Komponenta Join Data spojí tabulky, když se shodují všechny klíčové sloupce. Zaškrtněte políčko Povolit duplikáty a zachovat pořadí sloupců ve výběru , pokud pořadí sloupců není stejné jako původní tabulka.

    selektor sloupců

  4. Pokud chcete zachovat citlivost písmen u spojení textového sloupce, vyberte možnost Rozlišovat malá a velká písmena.

  5. Pomocí rozevíracího seznamu Typ spojení určete, jak se mají datové sady kombinovat.

    • Vnitřní spojení: Nejběžnější operací spojení je vnitřní spojení . Vrátí kombinované řádky pouze v případech, kdy se hodnoty klíčových sloupců shodují.

    • Levé vnější spojení: Levé vnější spojení vrátí spojené řádky pro všechny řádky z levé tabulky. Pokud řádek v levé tabulce neobsahuje odpovídající řádky v pravé tabulce, obsahuje vrácený řádek chybějící hodnoty pro všechny sloupce, které pocházejí z pravé tabulky. Můžete také zadat náhradní hodnotu chybějících hodnot.

    • Úplné vnější spojení: Úplné vnější spojení vrátí všechny řádky z levé tabulky (tabulka1) a z pravé tabulky (tabulka2).

      Pro každý z řádků v obou tabulce, které nemají žádné odpovídající řádky v druhé, výsledek obsahuje řádek obsahující chybějící hodnoty.

    • Levé střední spojení: Levé střední spojení vrátí pouze hodnoty z levé tabulky, když se hodnoty klíčových sloupců shodují.

  6. Pro možnost Zachovat správné klíčové sloupce ve spojené tabulce:

    • Tuto možnost vyberte, pokud chcete zobrazit klíče z obou vstupních tabulek.
    • Zrušte výběr, pokud chcete vrátit pouze klíčové sloupce z levého vstupu.
  7. Odešlete kanál.

  8. Pokud chcete zobrazit výsledky, klikněte pravým tlačítkem na data spojení a vyberte Vizualizovat.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.