Az Azure Machine Tanulás által válogatott nyílt forráskódú alapmodellek használata

Cikk
12/28/2023

Ebből a cikkből megtudhatja, hogyan finomíthatja, értékelheti és helyezheti üzembe az alapmodelleket a Modellkatalógusban.

Az előre betanított modelleket gyorsan tesztelheti a modellkártyán található Mintakövető űrlap használatával, és saját mintabemenetet biztosít az eredmény teszteléséhez. Emellett az egyes modellek modellkártyája tartalmazza a modell rövid leírását, valamint a modell kódalapú következtetési, finomhangolási és kiértékelési mintáira mutató hivatkozásokat.

Alapmodellek kiértékelése saját tesztadatokkal

Az alapmodellt kiértékelheti a tesztadatkészleten a Felhasználói felület kiértékelése űrlap vagy a modellkártyáról csatolt kódalapú minták használatával.

Kiértékelés a stúdió használatával

A Modell kiértékelése űrlapot a modellkártyán található Kiértékelés gombra kattintva hívhatja meg bármely alapmodellhez.

Screenshot showing the evaluation settings form after the user selects the evaluate button on a model card for a foundation model.

Minden modell kiértékelhető az adott következtetési tevékenységhez, amelyet a modell használni fog.

Adatok tesztelése:

Adja meg a modell kiértékeléséhez használni kívánt tesztadatokat. Választhat, hogy feltölt egy helyi fájlt (JSONL formátumban), vagy kiválaszt egy meglévő regisztrált adatkészletet a munkaterületről.
Miután kiválasztotta az adathalmazt, le kell képeznie a bemeneti adatok oszlopait a feladathoz szükséges séma alapján. Képezd le például a szövegbesorolás "mondat" és "címke" kulcsainak megfelelő oszlopneveket

Számítás:

Adja meg a modell finomhangolásához használni kívánt Azure Machine Tanulás Compute-fürtöt. A kiértékelésnek GPU-számításon kell futnia. Győződjön meg arról, hogy elegendő számítási kvótával rendelkezik a használni kívánt számítási termékváltozatokhoz.
A kiértékelési feladat elküldéséhez válassza a Befejezés lehetőséget a Kiértékelési űrlapon. A feladat befejezése után megtekintheti a modell kiértékelési mérőszámait. A kiértékelési metrikák alapján eldöntheti, hogy szeretné-e finomhangolni a modellt a saját betanítási adataival. Emellett eldöntheti, hogy regisztrálni szeretné-e a modellt, és üzembe szeretné-e helyezni egy végponton.

Kiértékelés kódalapú minták használatával

Annak érdekében, hogy a felhasználók megkezdhessék a modellértékelést, közzétettünk mintákat (Python-jegyzetfüzeteket és CLI-példákat is) az AzureML-példák git-adattárában található kiértékelési mintákban. Minden modellkártya a megfelelő feladatok kiértékelési mintáira is hivatkozik

Alapmodellek finomhangolása saját betanítási adatokkal

A számítási feladatok modellteljesítményének javításához érdemes lehet finomhangolni egy alapmodellt a saját betanítási adataival. Ezeket az alapmodelleket egyszerűen finomhangolhatja a stúdió finomhangolási beállításaival, vagy a modellkártyáról csatolt kódalapú minták használatával.

Finomhangolás a stúdióval

A finomhangolási beállítások űrlapot úgy hívhatja meg, ha a modellkártyán a Finomhangolás gombot választja bármely alapmodellhez.

Gépház finomhangolása:

Screenshot showing the fine-tune settings options in the foundation models fine-tune settings form.

Feladattípus finomhangolása

A modellkatalógus minden előre betanított modellje finomhangolható egy adott tevékenységcsoporthoz (például: Szövegbesorolás, Jogkivonat-besorolás, Kérdés megválaszolása). Válassza ki a kívánt feladatot a legördülő listában.

Betanítási adatok

Adja meg a modell finomhangolásához használni kívánt betanítási adatokat. Választhat, hogy feltölt egy helyi fájlt (JSONL, CSV vagy TSV formátumban), vagy kiválaszt egy meglévő regisztrált adatkészletet a munkaterületről.
Miután kiválasztotta az adathalmazt, le kell képeznie a bemeneti adatok oszlopait a feladathoz szükséges séma alapján. Például: a szövegbesorolás "mondat" és "címke" kulcsainak megfelelő oszlopnevek leképezése

Érvényesítési adatok: Adja meg a modell ellenőrzéséhez használni kívánt adatokat. Az automatikus felosztás kiválasztása a betanítási adatok automatikus felosztását foglalja le az ellenőrzéshez. Másik lehetőségként másik érvényesítési adatkészletet is megadhat.
Tesztadatok: Adja meg a finomhangolt modell kiértékeléséhez használni kívánt tesztadatokat. Az Automatikus felosztás kiválasztása a betanítási adatok automatikus felosztását foglalja le a teszteléshez.
Számítás: Adja meg a modell finomhangolásához használni kívánt Azure Machine Tanulás Számítási fürtöt. A finomhangolásnak GPU-számításon kell futnia. Finomhangoláskor a számítási termékváltozatokat A100/V100 GPU-kkal javasoljuk. Győződjön meg arról, hogy elegendő számítási kvótával rendelkezik a használni kívánt számítási termékváltozatokhoz.

A finomhangolási feladat elküldéséhez válassza a Befejezés lehetőséget a finomhangolási űrlapon. A feladat befejezése után megtekintheti a finomhangolt modell kiértékelési mérőszámait. Ezután a finomhangolási feladattal regisztrálhatja a finomhangolt modell kimenetét, és üzembe helyezheti ezt a modellt egy végponton a következtetéshez.

Finomhangolás kódalapú minták használatával

Az Azure Machine Tanulás jelenleg a következő nyelvi feladatokhoz támogatja a modellek finomhangolását:

Szövegbesorolás
Jogkivonatok besorolása
Kérdésmegválaszolás
Összegzés
Fordítás

Annak érdekében, hogy a felhasználók gyorsan elkezdhessék a finomhangolást, közzétettük a mintákat (Mind a Python-jegyzetfüzeteket, mind a CLI-példákat) az azureml-példák git-adattár Finetune-mintáiban szereplő feladatokhoz. Minden modellkártya a támogatott finomhangolási feladatok finomhangolási mintáira is hivatkozik.

Alapmodellek üzembe helyezése végpontokon következtetés céljából

Az alapmodelleket (a modellkatalógusból előre betanított modelleket és a finomhangolt modelleket is üzembe helyezheti, miután regisztrálták őket a munkaterületre) egy végpontra, amely aztán következtetésre használható. A kötegvégpontokra és a valós idejű végpontokra való üzembe helyezés egyaránt támogatott. Ezeket a modelleket a Felhasználói felület üzembe helyezése varázslóval vagy a modellkártyáról csatolt kódalapú minták használatával helyezheti üzembe.

Üzembe helyezés a studióval

A Felhasználói felület üzembe helyezése űrlapot úgy hívhatja meg, hogy kiválasztja a modellkártyán található Üzembe helyezés gombot bármely alapmodellhez, és kiválasztja a valós idejű végpontot vagy a Batch-végpontot

Telepítési beállítások

Mivel a pontozási szkript és a környezet automatikusan bekerül az alapmodellbe, csak a használni kívánt virtuálisgép-termékváltozatot, a példányok számát és az üzembe helyezéshez használni kívánt végpontnevet kell megadnia.

Screenshot showing the deploy options on the foundation model card after user selects the deploy button.

Megosztott kvóta

Ha Láma-2, Phi, Nemotron, Mistral, Dolly vagy Deci-DeciLM modellt helyez üzembe a modellkatalógusból, de nem rendelkezik elegendő kvótával az üzembe helyezéshez, az Azure Machine Tanulás lehetővé teszi, hogy korlátozott ideig használjon kvótát egy megosztott kvótakészletből. A megosztott kvótával kapcsolatos további információkért tekintse meg az Azure Machine Learning megosztott kvótát.

Üzembe helyezés kódalapú minták használatával

Annak érdekében, hogy a felhasználók gyorsan elkezdhessék az üzembe helyezést és a következtetést, közzétettük a mintákat az Azureml-examples git adattárban található Következtetési mintákban. A közzétett minták Python-jegyzetfüzeteket és CLI-példákat tartalmaznak. Minden modellkártya a valós idejű következtetési mintákra és a Batch-következtetésekre is hivatkozik.

Alapmodellek importálása

Ha olyan nyílt forráskód modellt szeretne használni, amely nem szerepel a modellkatalógusban, importálhatja a modellt a Face öleléséből az Azure Machine Tanulás-munkaterületre. Az Ölelés arc egy nyílt forráskódú kódtár a természetes nyelvi feldolgozáshoz (NLP), amely előre betanított modelleket biztosít a népszerű NLP-feladatokhoz. A modellimportálás jelenleg a következő feladatokhoz támogatja a modellek importálását, amennyiben a modell megfelel a modell importálási jegyzetfüzetében felsorolt követelményeknek:

kitöltési maszk
jogkivonat-besorolás
kérdések megválaszolása
Összefoglaló
szöveggenerálás
szövegbesorolás
fordítás
képbesorolás
szövegről képre

Megjegyzés:

A Face öleléséből származó modellekre az Ölelés Arc modell részletei oldalon elérhető külső licencfeltételek vonatkoznak. Az Ön felelőssége, hogy megfeleljen a modell licencfeltételeinek.

A modellkatalógus jobb felső sarkában található Importálás gombra kattintva használhatja a Modellimportáló jegyzetfüzetet.

Screenshot showing the model import button as it's displayed in the top right corner on the foundation model catalog.

A modell importálási jegyzetfüzete az azureml-examples git-adattárban is megtalálható.

A modell importálásához át kell adnia az MODEL_ID Ölelés arcról importálni kívánt modellt. Tallózzon a Face Hub ölelésében használt modellek között, és azonosítsa az importálni kívánt modellt. Győződjön meg arról, hogy a modell tevékenységtípusa a támogatott tevékenységtípusok közé tartozik. Másolja ki a modellazonosítót, amely elérhető az oldal URI-jában, vagy a modell neve melletti másolás ikonnal másolható. Rendelje hozzá a modell importálási jegyzetfüzetében található "MODEL_ID" változóhoz. Például:

Screenshot showing an example of a hugging face model ID ('bert-base-uncased') as it's displayed in the hugging face model documentation page.

Meg kell adnia a modellimportálás futtatásához szükséges számítást. A Modellimportálás futtatása azt eredményezi, hogy a megadott modell importálása az Ölelés arcról történik, és regisztrálva van az Azure Machine Tanulás-munkaterületen. Ezután finomhangolhatja ezt a modellt, vagy üzembe helyezheti azt egy végponton következtetés céljából.

Tudjon meg többet

Fedezze fel a modellkatalógust az Azure Machine Tanulás Studióban. A katalógus megismeréséhez Azure Machine Tanulás-munkaterületre van szüksége.
A modellkatalógus és -gyűjtemények megismerése