Megosztás a következőn keresztül:


Az Excel csatlakoztatása az Apache Hadoophoz a Power Query használatával

A Microsoft big data megoldásának egyik fő funkciója a Microsoft üzletiintelligencia-összetevőinek integrálása az Apache Hadoop-fürtökkel az Azure HDInsightban. Az elsődleges példa az Excel csatlakoztatása a Hadoop-fürthöz társított adatokat tartalmazó Azure Storage-fiókhoz a Microsoft Power Query for Excel bővítmény használatával. Ez a cikk bemutatja, hogyan állíthatja be és használhatja a Power Queryt a HDInsighttal felügyelt Hadoop-fürthöz társított adatok lekérdezésére.

Előfeltételek

  • Apache Hadoop-fürt az HDInsight platformon. Tekintse meg a HDInsight linuxos használatának első lépéseit.
  • Windows 10, 7, Windows Server 2008 R2 vagy újabb operációs rendszert futtató munkaállomás.
  • Nagyvállalati Microsoft 365-alkalmazások, Office 2016, Office 2013 Professional Plus, Önálló Excel 2013 vagy Office 2010 Professional Plus.

A Microsoft Power Query telepítése

A Power Query képes olyan adatokat importálni, amelyeket egy HDInsight-fürtön futó Hadoop-feladat hozott létre.

Az Excel 2016-ban a Power Query integrálva lett az Adatok menüszalagra a Beolvasás és átalakítás szakaszban. Régebbi Excel-verziók esetén töltse le az Excelhez készült Microsoft Power Queryt a Microsoft Letöltőközpontból , és telepítse.

HDInsight-adatok importálása az Excelbe

Az Excelhez készült Power Query bővítmény megkönnyíti az adatok importálását a HDInsight-fürtből az Excelbe, ahol az olyan BI-eszközök, mint a PowerPivot és a Power Map az adatok elemzésére, vizsgálatára és bemutatására használhatók.

  1. Az Excel elindítása

  2. Hozzon létre egy új, üres munkafüzetet.

  3. Hajtsa végre a következő lépéseket az Excel-verzió alapján:

    • Excel 2016

      • Válassza az >Adatok>Adatok lekérése>Azure-ból>Azure HDInsightból (HDFS) lehetőséget.

        HDI. PowerQuery.SelectHdiSource.2016.

    • Excel 2013/2010

      • Válassza a Power Queryt>az Azure-ből>a Microsoft Azure HDInsight-ből.

        HDI. PowerQuery.SelectHdiSource.

        Jegyzet: Ha nem látja a Power Query menüt, nyissa meg a Fájlbeállítások>>bővítményeket, és válassza a COM-bővítményeket a lap alján található legördülő menüBen. Válassza az Ugrás... gombot, és ellenőrizze, hogy be van-e jelölve az Excelhez készült Power Query bővítmény melletti jelölőnégyzet.

        Jegyzet: A Power Query lehetővé teszi, hogy adatokat importáljon a HDFS-ből a Más forrásokból lehetőség kiválasztásával.

  4. Az Azure HDInsight (HDFS) párbeszédpanel Fióknév vagy URL-cím mezőjében adja meg a fürthöz társított Azure Blob Storage-fiók nevét. Ezután válassza OKlehetőséget. Ez a fiók lehet az alapértelmezett tárfiók vagy egy társított tárfiók. A formátum https://StorageAccountName.blob.core.windows.net/.

  5. A Fiókkulcs mezőben adja meg a Blob Storage-fiók kulcsát, majd válassza a Csatlakozás lehetőséget. (Csak akkor kell megadnia a fiókadatokat, amikor először éri el ezt az áruházat.)

  6. A Lekérdezésszerkesztő bal oldalán található Navigátor panelen kattintson duplán a fürthöz társított Blob-tároló nevére. Alapértelmezés szerint a tároló neve megegyezik a fürt nevével.

  7. Keresse meg aHiveSampleData.txt a Név oszlopban (a mappa elérési útja .. /hive/warehouse/hivesampletable/), majd válassza a Bináris lehetőséget a HiveSampleData.txtbal oldalán. HiveSampleData.txt az összes klaszterrel együtt érkezik. Igény szerint használhatja a saját fájlját.

    HDI Excel power query adatok importálása.

  8. Ha szeretné, átnevezheti az oszlopneveket. Ha elkészült, válassza a Bezárás és betöltés lehetőséget. Az adatok betöltve lettek a munkafüzetbe:

    HDI Excel Power Query importált tábla.

Következő lépések

Ebből a cikkből megtudhatja, hogyan kérdezhet le adatokat a HDInsightból az Excelbe a Power Query használatával. Hasonlóképpen adatokat is lekérhet a HDInsightból az Azure SQL Database-be. Az adatok a HDInsightba is feltölthetők. További információért tekintse meg a következő cikkeket: