Betanítási adatok betöltése a Model Builderbe

Megtudhatja, hogyan töltheti be a betanítási adatkészleteket egy fájlból vagy egy SQL Server-adatbázisból, hogy az ML.NET egyik Model Builder-forgatókönyvében használhassa. A Model Builder-forgatókönyvek SQL Server-adatbázisokat, képfájlokat és CSV- vagy TSV-fájlformátumokat használhatnak betanítási adatokként.

A Model Builder csak vesszővel, tabulátorral és pontosvesszővel, PNG- és JPG-képekkel rendelkező TSV-, CSV- és TXT-fájlokat fogad el.

Model Builder-forgatókönyvek

A Model Builder segítségével modelleket hozhat létre a következő gépi tanulási forgatókönyvekhez:

  • Adatbesorolás (bináris & többosztályos besorolás): A szöveges adatok besorolása két vagy több kategóriába.
  • Érték-előrejelzés (regresszió): Numerikus érték előrejelzése.
  • Képbesorolás (mélytanulás): A képek besorolása két vagy több kategóriába.
  • Javaslat (javaslat): Egy adott felhasználó számára javasolt elemek listájának létrehozása.
  • Objektumészlelés (mélytanulás): Objektumok észlelése és azonosítása képeken. Ez megkereshet egy vagy több objektumot, és ennek megfelelően címkézheti őket.

Ez a cikk szöveges vagy numerikus adatokat, képbesorolást és objektumészlelési forgatókönyveket tartalmazó besorolást és regressziót tartalmaz.

Szöveg vagy numerikus adatok betöltése fájlból

Szöveg- vagy numerikus adatokat tölthet be egy fájlból a Model Builderbe. Vesszőkkel tagolt (CSV) vagy tabulátorral tagolt (TSV) fájlformátumokat fogad el.

  1. A Model Builder adatlépésében válassza a Fájl lehetőséget adatforrástípusként.

  2. Jelölje ki a szövegmező melletti Tallózás gombot, majd a Fájlkezelő használatával tallózzon és jelölje ki az adatfájlt.

  3. Válasszon egy kategóriát az Oszlopban a (Címke) legördülő lista előrejelzéséhez.

    Feljegyzés

    (Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.

  4. Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.

Elkészült a Model Builder adatforrásfájljának beállításával. A Következő lépés gombra kattintva lépjen a Model Builder következő lépésére.

Adatok betöltése SQL Server-adatbázisból

A Model Builder támogatja az adatok betöltését helyi és távoli SQL Server-adatbázisokból.

Helyi adatbázisfájl

Adatok betöltése SQL Server-adatbázisfájlból a Model Builderbe:

  1. A Model Builder adatlépésében válassza az SQL Servert adatforrástípusként.

  2. Válassza az Adatforrás kiválasztása gombot.

    1. Az Adatforrás kiválasztása párbeszédpanelen válassza a Microsoft SQL Server-adatbázisfájlt.
    2. Törölje a jelet a Mindig használja ezt a jelölőnégyzetet, és válassza a Folytatás lehetőséget
    3. A Csatlakozás ion Properties (Tulajdonságok) párbeszédpanelen válassza a Tallózás lehetőséget, és válassza ki a letöltött elemet. MDF-fájl.
    4. Kattintson az OK gombra
  3. Válassza ki az adathalmaz nevét a Táblanév legördülő listából.

  4. Az Oszlop (Címke) legördülő listában válassza ki azt az adatkategóriát, amelyre előrejelzést szeretne készíteni.

    Feljegyzés

    (Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.

  5. Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.

Távoli adatbázis

Adatok betöltése SQL Server-adatbázis-kapcsolatból a Model Builderbe:

  1. A Model Builder adatlépésében válassza az SQL Servert adatforrástípusként.

  2. Válassza az Adatforrás kiválasztása gombot.

    1. Az Adatforrás kiválasztása párbeszédpanelen válassza a Microsoft SQL Servert.
  3. A Csatlakozás ion Properties (Tulajdonságok) párbeszédpanelen adja meg a Microsoft SQL-adatbázis tulajdonságait.

    1. Adja meg azt a kiszolgálónevet, amelyhez csatlakozni szeretne.
    2. Állítsa be a hitelesítést a kiszolgálóra. Ha az SQL Server-hitelesítés van kiválasztva, adja meg a kiszolgáló felhasználónevét és jelszavát.
    3. Válassza ki, hogy melyik adatbázishoz szeretne csatlakozni a Kiválasztás vagy az Adatbázisnév legördülő listában. Ennek automatikusan fel kell töltenie, ha a kiszolgáló neve és a bejelentkezési adatok helyesek.
    4. Kattintson az OK gombra
  4. Válassza ki az adathalmaz nevét a Táblanév legördülő listából.

  5. Az Oszlop (Címke) legördülő listában válassza ki azt az adatkategóriát, amelyre előrejelzést szeretne készíteni.

    Feljegyzés

    (Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.

  6. Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.

Elkészült a Model Builder adatforrásfájljának beállításával. A Következő lépés gombra kattintva lépjen a Model Builder következő lépésére.

Képbesorolási adatfájlok beállítása

A Model Builder elvárja, hogy a képbesorolási adatok JPG- vagy PNG-fájlok legyenek, amelyek a besorolás kategóriáinak megfelelő mappákba vannak rendezve.

Ha képeket szeretne betölteni a Model Builderbe, adja meg egyetlen legfelső szintű könyvtár elérési útját:

  • Ez a legfelső szintű könyvtár minden előrejelezendő kategóriához egy almappát tartalmaz.
  • Az egyes almappák tartalmazzák a kategóriájához tartozó képfájlokat.

Az alább látható mappaszerkezetben a legfelső szintű könyvtár flower_photos. Az előrejelezni kívánt kategóriáknak öt alkönyvtára van: százszorszép, pitypang, rózsa, napraforgó és tulipán. Ezen alkönyvtárak mindegyike a saját kategóriájához tartozó képeket tartalmazza.

\---flower_photos
    +---daisy
    |       100080576_f52e8ee070_n.jpg
    |       102841525_bd6628ae3c.jpg
    |       105806915_a9c13e2106_n.jpg
    |
    +---dandelion
    |       10443973_aeb97513fc_m.jpg
    |       10683189_bd6e371b97.jpg
    |       10919961_0af657c4e8.jpg
    |
    +---roses
    |       102501987_3cdb8e5394_n.jpg
    |       110472418_87b6a3aa98_m.jpg
    |       118974357_0faa23cce9_n.jpg
    |
    +---sunflowers
    |       127192624_afa3d9cb84.jpg
    |       145303599_2627e23815_n.jpg
    |       147804446_ef9244c8ce_m.jpg
    |
    \---tulips
            100930342_92e8746431_n.jpg
            107693873_86021ac4ea_n.jpg
            10791227_7168491604.jpg

Objektumészlelési képadatfájlok beállítása

A Model Builder elvárja, hogy az objektumészlelési képadatok JSON formátumban legyenek létrehozva a VoTT-ből. A JSON-fájl a vott-json-export mappában található a projektbeállításokban megadott célhelyen .

A JSON-fájl a VoTT-ből létrehozott alábbi információkból áll:

  • Minden létrehozott címke
  • A képfájl helyei
  • A kép határolókeretének adatai
  • A képhez társított címke

További információ az adatok objektumészlelésre való előkészítéséről: Objektumészlelési adatok létrehozása a VoTT-ből.

Következő lépések

Az alábbi oktatóanyagokat követve gépi tanulási alkalmazásokat hozhat létre a Model Builderrel:

Ha kóddal tanít be egy modellt, megtudhatja, hogyan tölthet be adatokat a ML.NET API használatával.