Megosztás a következőn keresztül:


Elemzés végrehajtása a Machine Learning Studióval (klasszikus) SQL Server-adatbázis használatával

ÉRVÉNYES: A következőkre vonatkozik.Machine Learning Studio (klasszikus) Nem vonatkozik gombra.Azure Machine Learning

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

A helyszíni adatokkal dolgozó vállalatok gyakran szeretnék kihasználni a felhő méretezését és rugalmasságát a gépi tanulási számítási feladataikhoz. A helyszíni adatok felhőbe való áthelyezésével azonban nem szeretnék megzavarni a jelenlegi üzleti folyamataikat és munkafolyamataikat. A Machine Learning Studio (klasszikus) mostantól támogatja az adatok SQL Server-adatbázisból való beolvasását, majd egy modell betanítását és pontozását ezekkel az adatokkal. Többé nem kell manuálisan másolnia és szinkronizálnia az adatokat a felhő és a helyszíni kiszolgáló között. Ehelyett a Machine Learning Studióban (klasszikus) az Adatok importálása modul mostantól közvetlenül az SQL Server-adatbázisból olvashat be a betanítási és pontozási feladatokhoz.

Ez a cikk áttekintést nyújt az SQL Server-adatok Machine Learning Studióba (klasszikus) való bejövő forgalmáról. Feltételezi, hogy ismeri a Studio (klasszikus) fogalmait, például a munkaterületeket, modulokat, adatkészleteket, kísérleteket stb.

Feljegyzés

Ez a funkció ingyenes munkaterületeken nem érhető el. A Machine Learning díjszabásáról és szintjeiről további információt a Machine Learning Studio (klasszikus) díjszabásában talál.

A Data Factory saját üzemeltetésű integrációs moduljának telepítése

Ha a Machine Learning Studióban (klasszikus) szeretne sql server-adatbázist elérni, le kell töltenie és telepítenie kell a Data Factory saját üzemeltetésű integrációs modulját, amely korábban adatkezelés Gateway volt. Ha a Machine Learning Studióban (klasszikus) konfigurálja a kapcsolatot, lehetősége van az integrációs modul (IR) letöltésére és telepítésére az alábbiakban ismertetett Adatátjáró letöltése és regisztrálása párbeszédpanelen.

Az integrációs modult előre is telepítheti, ha letölti és futtatja az MSI telepítőcsomagot a Microsoft letöltőközpontból. Az MSI-vel egy meglévő integrációs modult is frissíthet a legújabb verzióra, az összes beállítás megőrzve.

A Data Factory saját üzemeltetésű integrációs moduljának előfeltételei a következők:

  • A Data Factory saját üzemeltetésű integrációja 64 bites operációs rendszert igényel a .NET-keretrendszer 4.6.1-es vagy újabb verziójával.
  • A Windows operációs rendszer támogatott verziói a Windows 10, a Windows Server 2012, a Windows Server 2012 R2 és a Windows Server 2016.
  • Az IR-gép ajánlott konfigurációja legalább 2 GHz, 4 magos PROCESSZOR, 8 GB RAM és 80 GB-os lemez.
  • Ha a gazdagép hibernál, az integrációs modul nem válaszol az adatkérésekre. Ezért az integrációs modul telepítése előtt konfiguráljon egy megfelelő energiatervet a számítógépen. Ha a gép hibernálásra van konfigurálva, az integrációs modul telepítése üzenetet jelenít meg.
  • Mivel a másolási tevékenység egy adott gyakorisággal történik, a gép erőforrás-kihasználtsága (CPU, memória) is ugyanazt a mintát követi, csúcsidővel és tétlen időpontokkal. Az erőforrás kihasználtsága az áthelyezett adatok mennyiségétől is nagymértékben függ. Ha több másolási feladat is folyamatban van, megfigyelheti, hogy az erőforrások kihasználtsága csúcsidőben felfelé halad. Bár a fent felsorolt minimális konfiguráció technikailag elegendő, érdemes lehet olyan konfigurációt használni, amely több erőforrást tartalmaz, mint a minimális konfiguráció az adatáthelyezési terheléstől függően.

A Data Factory saját üzemeltetésű integrációs moduljának beállításakor és használatakor vegye figyelembe a következőket:

  • Az integrációs modulnak csak egy példányát telepítheti egyetlen számítógépre.

  • Egyetlen integrációs modult több helyszíni adatforráshoz is használhat.

  • Különböző számítógépeken több IR-t is csatlakoztathat ugyanahhoz a helyszíni adatforráshoz.

  • Egyszerre csak egy munkaterülethez konfigurálhat IRS-eket. Az IRS-ek jelenleg nem oszthatók meg a munkaterületeken.

  • Egyetlen munkaterülethez több IR-t is konfigurálhat. Érdemes lehet például olyan integrációs modult használni, amely a fejlesztés során csatlakozik a tesztadatforrásokhoz, és egy éles integrációs modult, amikor készen áll az üzembe helyezésre.

  • Az integrációs modulnak nem kell ugyanazon a gépen lennie, mint az adatforrásnak. Az adatforráshoz való közelebb maradás azonban csökkenti az átjáró adatforráshoz való csatlakozásának idejét. Javasoljuk, hogy telepítse az integrációs modult egy olyan gépre, amely eltér a helyszíni adatforrást üzemeltető géptől, hogy az átjáró és az adatforrás ne versenyezzen az erőforrásokért.

  • Ha már telepítve van egy integrációs modul a Power BI vagy az Azure Data Factory forgatókönyveit kiszolgáló számítógépre, telepítsen egy külön integrációs modult a Machine Learning Studióhoz (klasszikus) egy másik számítógépre.

    Feljegyzés

    A Data Factory saját üzemeltetésű integrációs modulja és a Power BI Gateway ugyanazon a számítógépen nem futtatható.

  • A Data Factory saját üzemeltetésű Machine Learning Studio integrációs modulját (klasszikus) akkor is használnia kell, ha az Azure ExpressRoute-ot más adatokhoz használja. Az adatforrást helyszíni adatforrásként kell kezelnie (ez egy tűzfal mögött található), még akkor is, ha ExpressRoute-ot használ. A Data Factory saját üzemeltetésű integrációs moduljának használatával létesíthet kapcsolatot a Machine Learning és az adatforrás között.

A telepítés előfeltételeiről, a telepítési lépésekről és a hibaelhárítási tippekről a Data Factory integrációs moduljában talál részletes információkat.

Adatok bejövő forgalma az SQL Server-adatbázisból a Machine Learningbe

Ebben az útmutatóban beállít egy Azure Data Factory integrációs modult egy Azure Machine Learning-munkaterületen, konfigurálja, majd adatokat olvas egy SQL Server-adatbázisból.

Tipp.

A kezdés előtt tiltsa le a böngésző előugró ablakának blokkolását studio.azureml.net. Ha a Google Chrome böngészőt használja, töltse le és telepítse a Google Chrome WebStore Kattintásra alkalmazásbővítményben elérhető számos beépülő modul egyikét.

Feljegyzés

Az Azure Data Factory saját üzemeltetésű integrációs modulja korábban adatkezelés Gateway néven volt ismert. A lépésenkénti oktatóanyag továbbra is átjáróként fog hivatkozni rá.

1. lépés: Átjáró létrehozása

Az első lépés az átjáró létrehozása és beállítása az SQL-adatbázis eléréséhez.

  1. Jelentkezzen be a Machine Learning Studióba (klasszikus), és válassza ki a munkaterületet, amelyben dolgozni szeretne.

  2. Kattintson a bal oldali BEÁLLÍTÁSOK panelre, majd a felül található DATA GATEWAYS fülre.

  3. Kattintson az ÚJ ADATÁTJÁRÓ gombra a képernyő alján.

    Új adatátjáró

  4. Az Új adatátjáró párbeszédpanelen adja meg az átjáró nevét, és szükség esetén adjon meg egy leírást. A konfiguráció következő lépéséhez kattintson a jobb alsó sarokban lévő nyílra.

    Adja meg az átjáró nevét és leírását

  5. Az Adatátjáró letöltése és regisztrálása párbeszédpanelen másolja az ÁTJÁRÓ REGISZTRÁCIÓS KULCSát a vágólapra.

    Adatátjáró letöltése és regisztrálása

  6. Ha még nem töltötte le és telepítette a Microsoft adatkezelés-átjárót, kattintson az Adatkezelési átjáró letöltése elemre. Ezzel a Microsoft letöltőközpontba kerül, ahol kiválaszthatja a szükséges átjáróverziót, letöltheti és telepítheti. A telepítési előfeltételekről, a telepítési lépésekről és a hibaelhárítási tippekről a cikk első szakaszaiban talál részletes információkat az adatok áthelyezése a helyszíni források és a felhő között adatkezelés Gateway használatával.

  7. Az átjáró telepítése után megnyílik a adatkezelés Átjáró konfigurációkezelője, és megjelenik az Átjáró regisztrálása párbeszédpanel. Illessze be a vágólapra másolt átjáróregisztrációs kulcsot, és kattintson a Regisztráció gombra.

  8. Ha már telepítve van egy átjáró, futtassa a adatkezelés Gateway Configuration Managert. Kattintson a Kulcs módosítása gombra, illessze be az előző lépésben a vágólapra másolt átjáróregisztrációs kulcsot, majd kattintson az OK gombra.

  9. Ha a telepítés befejeződött, megjelenik a Microsoft adatkezelés Gateway Configuration Manager átjáró regisztrálása párbeszédpanelje. Illessze be a vágólapra az előző lépésben másolt ÁTJÁRÓREGISZTRÁCIÓS KULCSOT, és kattintson a Regisztráció gombra.

    Átjáró regisztrálása

  10. Az átjárókonfiguráció akkor fejeződik be, ha a Microsoft adatkezelés Gateway Configuration Manager Kezdőlap lapján az alábbi értékek vannak beállítva:

    • Az átjáró neve és a példány neve az átjáró nevére van állítva.

    • A regisztráció a Regisztrált értékre van állítva.

    • Az állapot Indítás értékre van állítva.

    • Az alsó állapotsoron megjelenik a Csatlakoztatott adatkezelés Átjáró felhőszolgáltatáshoz, valamint egy zöld pipa.

      adatkezelés Gateway Manager

      A Machine Learning Studio (klasszikus) is frissül, ha a regisztráció sikeres.

    Átjáróregisztráció sikeres

  11. Az Adatátjáró letöltése és regisztrálása párbeszédpanelen kattintson a pipára a beállítás befejezéséhez. A Beállítások lapon az átjáró állapota "Online" néven jelenik meg. A jobb oldali panelen megtalálja az állapotot és más hasznos információkat.

    Átjáró beállításai

  12. A Microsoft adatkezelés Gateway Configuration Managerben váltson a Tanúsítvány lapra. Az ezen a lapon megadott tanúsítvány a portálon megadott helyszíni adattár hitelesítő adatainak titkosítására/visszafejtésére szolgál. Ez a tanúsítvány az alapértelmezett tanúsítvány. A Microsoft azt javasolja, hogy ezt módosítsa saját tanúsítványára, amelyről biztonsági másolatot készít a tanúsítványkezelő rendszerben. Kattintson a Módosítás gombra a saját tanúsítvány használatához.

    Átjárótanúsítvány módosítása

  13. (nem kötelező) Ha részletes naplózást szeretne engedélyezni az átjáróval kapcsolatos problémák elhárításához, a Microsoft adatkezelés Gateway Configuration Managerben váltson a Diagnosztika lapra, és ellenőrizze a Részletes naplózás engedélyezése hibaelhárítási célokra lehetőséget. A naplózási információk a Windows Eseménynapló az Alkalmazások és szolgáltatások naplói –>adatkezelés átjárócsomópont alatt találhatók. A Diagnosztika lapon tesztelheti a helyszíni adatforráshoz való kapcsolatot az átjáróval.

    Részletes naplózás engedélyezése

Ez befejezi az átjáró beállítási folyamatát a Machine Learning Studióban (klasszikus). Most már készen áll a helyszíni adatok használatára.

Minden munkaterülethez létrehozhat és beállíthat több átjárót a Studióban (klasszikus). Előfordulhat például, hogy rendelkezik egy átjáróval, amelyet a fejlesztés során szeretne csatlakozni a tesztadatforrásokhoz, és egy másik átjárót az éles adatforrásokhoz. A Machine Learning Studio (klasszikus) rugalmasan állíthat be több átjárót a vállalati környezettől függően. Jelenleg nem oszthat meg átjárót a munkaterületek között, és csak egy átjáró telepíthető egyetlen számítógépre. További információ: Adatok áthelyezése helyszíni források és felhő között adatkezelés Átjáróval.

2. lépés: Adatok beolvasása helyszíni adatforrásból az átjáró használatával

Az átjáró beállítása után hozzáadhat egy Adatimportálás modult egy kísérlethez, amely az SQL Server-adatbázisból adja meg az adatokat.

  1. A Machine Learning Studióban (klasszikus) válassza a KÍSÉRLETEK lapot, kattintson a bal alsó sarokban az +ÚJ gombra, és válassza az Üres kísérlet lehetőséget (vagy válasszon egyet a rendelkezésre álló mintakísérletek közül).

  2. Keresse meg és húzza az Adatok importálása modult a kísérletvászonra.

  3. Kattintson a Vászon alatti Mentés gombra. Adja meg a kísérlet nevét a "Machine Learning Studio (klasszikus) helyszíni SQL Server-oktatóanyag" mezőben, jelölje ki a munkaterületet, és kattintson az OK pipára .

    Kísérlet mentése új névvel

  4. Kattintson az Adatok importálása modulra a kijelöléshez, majd a vászontól jobbra található Tulajdonságok panelen válassza a "Helyszíni SQL Database" lehetőséget az Adatforrás legördülő listában.

  5. Válassza ki a telepített és regisztrált adatátjárót . Egy másik átjárót az "(új adatátjáró hozzáadása...)" lehetőség kiválasztásával állíthat be.

    Adatátjáró kiválasztása adatimportálási modulhoz

  6. Adja meg az SQL Database-kiszolgáló nevét és adatbázisnevét, valamint a végrehajtani kívánt SQL Database-lekérdezést.

  7. Kattintson az Enter (Érték megadása) elemre a Felhasználónév és jelszó területen, majd adja meg az adatbázis hitelesítő adatait. Az SQL Server konfigurálásának módjától függően windowsos integrált hitelesítést vagy SQL Server-hitelesítést is használhat.

    Adatbázis hitelesítő adatainak megadása

    A "szükséges értékek" üzenet zöld pipával "értékkészlet" értékre változik. Csak egyszer kell megadnia a hitelesítő adatokat, kivéve, ha az adatbázis adatai vagy jelszava megváltozik. A Machine Learning Studio (klasszikus) az átjáró telepítésekor megadott tanúsítványt használja a felhőben lévő hitelesítő adatok titkosításához. Az Azure soha nem tárolja a helyszíni hitelesítő adatokat titkosítás nélkül.

    Adatmodul tulajdonságainak importálása

  8. Kattintson a FUTTATÁS gombra a kísérlet futtatásához.

A kísérlet futtatása után az adatbázisból importált adatokat az Adatok importálása modul kimeneti portjára kattintva és a Vizualizáció gombra kattintva jelenítheti meg.

Miután befejezte a kísérlet fejlesztését, üzembe helyezheti és üzembe helyezheti a modellt. A Batch Végrehajtási szolgáltatás használatával az Adatok importálása modulban konfigurált SQL Server-adatbázis adatait a rendszer beolvassa és felhasználja a pontozáshoz. Bár a Helyszíni adatok pontozásához használhatja a Kérelem-válasz szolgáltatást, a Microsoft ehelyett az Excel bővítmény használatát javasolja. Jelenleg az SQL Server-adatbázisba való adatexportálás nem támogatott sem a kísérletekben, sem a közzétett webszolgáltatásokban.