Muistiinpano
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Fabric:n low-code AutoML-käyttöliittymä tekee koneoppimisen aloittamisesta helppoa määrittämällä koneoppimistehtäväsi ja muutamia perusasetuksia. Näiden valintojen perusteella AutoML-käyttöliittymä luo esikonfiguroidun muistikirjan, joka on räätälöity syötteidesi mukaan. Kun ajat muistikirjaa, se kirjaa ja seuraa automaattisesti kaikkia mallin mittareita ja iteraatioita olemassa olevista koneoppimiskokeista ja mallielementeistä, tarjoten järjestelmällisen ja tehokkaan tavan hallita ja arvioida mallin suorituskykyä.
Edellytykset
Hanki Microsoft Fabric-tilaus. Tai tilaa ilmainen Microsoft Fabric kokeilujakso.
Kirjaudu sisään Microsoft Fabric.
Vaihda Fabric-tilaan käyttämällä etusivun vasemmassa alakulmassa olevaa kokemuskytkintä.
Aseta automaattinen koneoppimiskokeilu
Voit kätevästi käynnistää AutoML-velhon Fabric-tilassa suoraan olemassa olevasta kokeesta, mallista tai muistikirjan tuotteesta.
Valitse tietolähde
AutoML-käyttäjänä Fabric-sovelluksessa voit valita saatavilla olevista lakehouseistasi, jolloin alustalla tallennetun datan käyttö ja analysointi on helppoa. Kun olet valinnut järvenrakennuksen, valitse tietty taulukko tai tiedosto käytettäväksi AutoML-tehtävissä.
Vihje
Lakehousea valitessa voit valita taulukon tai tiedoston käytettäväksi AutoML:n kanssa. Tuettuja tiedostotyyppejä ovat CSV , XLS, XLSX ja JSON.
Koneoppimismallin tarkoituksen määrittäminen
Tässä vaiheessa käyttäjät määrittävät mallinsa tarkoituksen valitsemalla koneoppimistehtävän, joka sopii parhaiten heidän tietoihinsa ja tavoitteisiinsa.
Fabric'n AutoML-ohjattu työkalu tarjoaa seuraavat koneoppimistehtävät:
- Regressio: jatkuvien numeeristen arvojen ennustamiseen.
- Binaariluokitus: Tietojen luokitteleminen toiseen kahdesta luokasta.
- Moniluokkainen luokitus: tietojen luokitteleminen yhdeksi useista luokista.
- Ennustaminen: Ennusteiden tekeminen aikasarjatiedoista.
Kun olet valinnut koneoppimistehtäväsi, voit valita AutoML-tilan. Jokainen tila määrittää automaattianalyysipalveluiden kokeiluversion oletusmääritykset, kuten tutkittavan mallin sekä parhaan mallin löytämiseen varatun ajan. Käytettävissä olevat tilat ovat seuraavat:
- Nopea prototyyppi: tuottaa nopeita tuloksia, jotka sopivat erinomaisesti testaukseen ja iterointiin nopeasti.
- Tulkittava tila: se kestää hieman kauemmin ja keskittyy malleihin, joita on luonnostaan helpompi tulkita.
- Paras vastaavuus: suorittaa kattavamman haun laajennetulla suorituspalvelulla tavoitteenaan löytää paras mahdollinen malli.
- Mukautettu: Voit säätää joitakin asetuksia manuaalisesti automaattianalyysipalveluiden kokeiluversiossa räätälöityä määritystä varten.
Valitsemalla oikean koneoppimistehtävän ja automaattianalyysipalveluiden tilan varmistat, että ohjattu automaattianalyysipalveluiden toiminto vastaa tavoitteitasi ja tasapainottaa nopeuden, tulkittavuuden ja suorituskyvyn valitsemasi kokoonpanon mukaan.
Harjoitustietojen määrittäminen
Tässä vaiheessa konfiguroit koulutusdatan, jota AutoML käyttää mallisi rakentamiseen. Aloita valitsemalla ennustesarakke, tämä on kohdesarakke, jota mallisi koulutetaan ennustamaan.
Kun olet valinnut ennustesarakkeen, voit mukauttaa lisää syötetietojen käsittelyä:
- Tietotyypit: Tarkista ja säädä kunkin syötesarakkeen tietotyyppejä yhteensopivuuden varmistamiseksi ja mallin suorituskyvyn optimoimiseksi.
- Imputointimenetelmä: Valitse, miten voit käsitellä tietojoukon puuttuvia arvoja, valitsemalla imputointimenetelmän, joka täyttää aukot tiedoissa asetustesi mukaan.
Voit myös ottaa käyttöön tai poistaa käytöstä Automaattisen määrityksen asetuksen. Kun asetus on käytössä, automaattinen esittely luo harjoittamiseen lisäominaisuuksia, jotka mahdollisesti parantavat mallin suorituskykyä poimimalla tiedoistasi ylimääräisiä merkityksellisiä tietoja. Näiden tietoasetusten määrittäminen auttaa automaattianalyysipalveluiden ohjattua toimintoa tulkitsemaan ja käsittelemään tietojoukkosi tarkasti, mikä parantaa kokeilutulosten laatua.
Anna lopulliset tiedot
Nyt päätät, miten haluat AutoML-kokeesi suoritettavan, sekä nimikäytännöt kokeellesi ja tuloksellesi. Voit suorittaa automaattianalyysipalveluiden kokeiluversion kahdella eri tavalla:
Kouluta useita malleja samanaikaisesti: Tämä vaihtoehto on ihanteellinen, jos datasi voidaan ladata Pandas DataFrameen, jolloin voit käyttää Spark-klusteria useiden mallien ajamiseen rinnakkain. Tämä lähestymistapa nopeuttaa kokeiluprosessia harjoittamalla useita malleja kerralla.
Harjoita malleja järjestyksessä Sparkin avulla: Tämä vaihtoehto sopii suurempiin tietojoukkoihin tai niihin, jotka hyötyvät hajautetusta koulutuksesta. Se käyttää Sparkiä ja SynapseML:ää hajautettujen mallien tutkimiseen harjoittaen yhtä mallia kerrallaan Sparkin tarjoamalla skaalattavuudella.
Muistiinpano
Tällä hetkellä Spark-tila ei tue syöte- ja lähtöskeeman kirjaamista Spark-pohjaisille malleille. Tämä rakenne on pakollinen kenttä SynapseML PREDICT -funktiolle. Kiertotapana voit ladata mallin suoraan MLflow'lla ja suorittaa päättelyä muistikirjassasi, ohittaen skeeman ennustusvaatimuksen.
Kun olet valinnut suoritustilan, viimeistele määritykset määrittämällä muistikirjasi, kokeilusi ja mallisi nimet. Nämä nimeämiskäytännöt auttavat järjestämään AutoML-resurssisi Fabric-ohjelmassa ja tekevät kokeilujen seurannasta ja hallinnasta helppoa. Kun työ on valmis, valintojesi perusteella luodaan muistikirja, joka on valmis toteutettavaksi ja muokattavaksi tarpeen mukaan.
Tarkista ja luo muistikirja
Viimeisessä vaiheessa sinulla on mahdollisuus käydä läpi kaikki AutoML-asetuksesi ja esikatsella luotua koodia, joka sopii valintoihin. Tämä on tilaisuutesi varmistaa, että valittu koneoppimistehtävä, -tila, -tietojen määritys ja muut määritykset täyttävät tavoitteesi.
Kun olet tyytyväinen, voit viimeistellä tämän vaiheen ja luoda muistikirjan, joka sisältää kaikki AutoML-kokeilusi osat. Tämän muistikirjan avulla voit seurata prosessin jokaista vaihetta tietojen valmistelusta mallin arviointiin, ja se toimii kattavana tietueena työstäsi. Voit myös mukauttaa tätä muistikirjaa tarpeen mukaan säätämällä koodia ja asetuksia autoML-kokeilutulosten hienosäätämiseksi.
Automaattianalyysipalveluiden suoritusten seuraaminen
Kun suoritat muistikirjasi, AutoML-koodi käyttää MLflow-lokitusta seuraamaan automaattisesti keskeisiä mittareita ja parametreja jokaiselle kokeilussa testatulle mallille. Tämän saumattoman integraation avulla voit seurata ja tarkastella automaattianalyysipalveluiden suorituksen jokaista iterointia ilman lisämäärityksiä.
Voit tutkia AutoML-kokeilujakson tuloksia seuraavasti:
Siirry koneoppimiskokeilukohteeseen: Koneoppimiskokeilussa voit seurata kaikkia automaattianalyysipalveluiden prosessissa luotuja eri suoritinta. Jokainen suoritus kirjaa arvokkaita tietoja, kuten mallin suorituskykymittareita, parametreja ja määrityksiä, mikä helpottaa tulosten analysointia ja vertailemista.
Arvostelu AutoML-konfiguraatioista: Jokaisessa AutoML-kokeilussa löydät käytetyt AutoML-konfiguraatiot, jotka tarjoavat tietoa siitä, miten kukin malli on asetettu ja mitkä asetukset johtivat optimaalisiin tuloksiin.
Etsi paras malli: Avaa koneoppimismallisi, jotta voit käyttää automaattianalyysipalveluiden kokeilujakson lopullista ja parhaiten toimivaa mallia.
Tämän seurantatyönkulun avulla voit järjestellä, arvioida ja hallita mallejasi ja varmistaa, että sinulla on täysi näkyvyys kunkin automaattianalyysipalvelukokeilussa testatun mallin suorituskykyyn ja asetuksiin. Tästä voit hyödyntää SynapseML PREDICT -rajapintaa tai luoda ennusteita suoraan muistikirjoistasi.