Spojení dat

Tento článek popisuje, jak pomocí komponenty Join Data v návrháři služby Azure Machine Learning sloučit dvě datové sady pomocí operace spojení ve stylu databáze.

Postup konfigurace dat připojení

Pokud chcete provést spojení se dvěma datovými sadami, měly by být propojeny klíčovým sloupcem. Podporují se také složené klíče používající více sloupců.

  1. Přidejte datové sady, které chcete zkombinovat, a přetáhněte komponentu Join Data do kanálu.

    Komponentu najdete v kategorii Transformace dat v části Manipulace.

  2. Připojte datové sady ke komponentě Join Data .

  3. Vyberte Spustit selektor sloupců a zvolte klíčové sloupce. Nezapomeňte zvolit sloupce pro levý i pravý vstup.

    Pro jeden klíč:

    Vyberte jeden sloupec klíče pro oba vstupy.

    Složený klíč:

    Vyberte všechny klíčové sloupce z levého vstupu a pravého vstupu ve stejném pořadí. Komponenta Join Data spojí tabulky, když se shodují všechny klíčové sloupce. Pokud pořadí sloupců není stejné jako původní tabulka, zaškrtněte políčko Povolit duplicity a zachovat pořadí sloupců ve výběru .

    selektor sloupců

  4. Pokud chcete zachovat rozlišování velkých a malých písmen ve spojení textového sloupce, vyberte možnost Rozlišovat velká a velká písmena.

  5. Pomocí rozevíracího seznamu Typ spojení určete, jak se mají datové sady kombinovat.

    • Vnitřní spojení: Nejběžnější operací spojení je vnitřní spojení . Vrátí kombinované řádky pouze v případech, kdy se hodnoty klíčových sloupců shodují.

    • Levé vnější spojení: Levé vnější spojení vrátí spojené řádky pro všechny řádky z levé tabulky. Pokud řádek v levé tabulce neobsahuje žádné odpovídající řádky v pravé tabulce, obsahuje vrácený řádek chybějící hodnoty pro všechny sloupce, které pocházejí z pravé tabulky. Můžete také zadat hodnotu nahrazení chybějících hodnot.

    • Úplné vnější spojení: Úplné vnější spojení vrátí všechny řádky z levé tabulky (tabulka1) a z pravé tabulky (tabulka2).

      Pro každý z řádků v jedné z tabulek, které nemají žádné odpovídající řádky v druhé, obsahuje výsledek řádek obsahující chybějící hodnoty.

    • Levé poloviční spojení: Levé poloviční spojení vrátí pouze hodnoty z levé tabulky, pokud se shodují hodnoty klíčových sloupců.

  6. Možnost Zachovat správné klíčové sloupce ve spojené tabulce:

    • Tuto možnost vyberte, pokud chcete zobrazit klíče z obou vstupních tabulek.
    • Zrušte výběr, pokud chcete vrátit pouze sloupce s klíči z levého vstupu.
  7. Odešlete kanál.

  8. Pokud chcete zobrazit výsledky, klikněte pravým tlačítkem na Připojit data a vyberte Vizualizovat.

Další kroky

Projděte si sadu komponent dostupných pro Azure Machine Learning.