Huomautus
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Microsoft 365 Copilot Tuning luo tehtäväkohtaisen hienosäädetyn mallin mallin tekijän antaman tietyn tietämyksen perusteella. Kun valitset tietoja yrityksesi sisäisistä asiakirjoista, voit antaa mallille mahdollisuuden oppia oppimaan omat terminologiasi, tyylisi ja toimintatapasi.
Tietojen valitseminen Copilot Tuningia varten tarkoittaa oikean sisältöjoukon tunnistamista ja valmistelemista organisaatiostasi, josta malli oppii. Tietämyksen valinta sisältää edustavien asiakirjojen, esimerkkien ja ohjeiden keräämisen, jotka vangitsevat asiantuntemuksen, jota haluat hienosäädetyn mallin jäljittelevän. Lakiasiainosasto voi esimerkiksi hienosäätää mallia yrityksen aiempien tapausten selonteoissa ja malleissa, jotta mallia käyttävät agentit voivat laatia sopimuksia yrityksen tyylillä ja terminologialla. Mitä paremmin valittu tietämys kuvastaa toimialuettasi ja tehtävääsi, sitä paremmin malli tuottaa olennaisia ja laadukkaita tuloksia.
Tässä artikkelissa kerromme, miten voit valita ja valmistella tietoja Copilot Tuningia varten. Saat tietoja tarvittavista tiedostotyypeistä, niiden järjestämisestä ja perusvaatimuksista (kuten tietonäytteiden vähimmäistyypeistä ja tiedostomuodoista). Kun ymmärrät tietämyksen valinnan, voit varmistaa, että hienosäädetty mallisi on tehokas ja tarpeidesi mukainen.
Oikean tietämyksen valmisteleminen virittämiseen
Tietämyksen valitseminen on copilot-viritysten ensimmäinen ja kriittisin vaihe. Sinun tulisi järjestää laadukas koulutustietojoukko oleellisimmasta ja tärkeimmästä sisällöstä. Tärkeintä on antaa esimerkkejä, jotka opettavat mallille tarkalleen, mitä odotat sen tekevän. Valitsemasi sisältö määräytyy tehtävätyypin mukaan. Copilot Tuning tukee tällä hetkellä kolmea ensisijaista tehtäväskenaariota: asiantuntijakysymyksiä & vastausta (Q&A), tiedostojen luontia ja tiedostojen yhteenvetoa. Huomioi jokaisessa skenaariossa seuraavat vaatimukset:
Tuetut tiedostomuodot ja sisältö: Kaikki copilotin viritystehtävät tukevat yleisiä tekstipohjaisia tiedostomuotoja. Voit käyttää lähdemateriaaleina Word tiedostoja (.doc, .docx), HTML-tiedostoja (.html, .aspx), Markdown-tiedostoja (.md) tai PDF-tiedostoja, jotka OCR-tekstintunnistus käsittelee. Voit myös sisällyttää Excel-asiakirjoja (.xls, .xlsx) asiantunteville Q&A:lle. Viritysprosessi käsittelee näiden tiedostojen tekstisisällön. Se ei opi kuvista, upotetuista taulukoista tai muista asiakirjojen muista kuin tekstielementeistä. Varmista, että koulutusasiakirjoissasi olevat tärkeät tiedot ovat tekstimuodossa. Jos esimerkiksi filePDF sisältää kaavion, sisällytä asiakirjaan tekstimuotoinen selitys kaavion merkityksellisille tiedoille.
Asiakirjojen määrä: Sinun on annettava Copilot Tuningiin vähintään 20 mallia (Q&A ja yhteenveto; tiedoston luonnin syöte-tulosteparit). Yleensä sadat tai tuhannet näytteet ovat ihanteellisia, ja voit antaa enintään 10 000. Näytteiden laatu on tärkeämpi kuin raakamäärä. Suosittelemme, että keskität tietojen valmisteluajan monien laadukkaiden näytteiden etsimiseen, jotka ovat hyvin linjassa sen kanssa, mitä odotat hienosäädetyn mallisi tekevän.
Mallin ohjeet: Mallin määritysprosessin aikana Copilot Tuning pyytää mallin tekijää antamaan vastauksia malliohjeisiin, jotka opastavat järjestelmää valitsemasi tiedon käytössä. Kullakin tehtävätyypillä on omat kysymyksensä valitusta tietolähteestä. Valmistele selkeät ja jäsennetyt vastaukset kuhunkin kysymykseen. Asiantuntija Q&A vaatii kuvauksen tietolähteen tiedoista ja niiden järjestämisestä. Tiedoston luominen edellyttää, että määrität, miten alkuperäiseen syötteeseen, muutoksiin ja tulosteluonnokseen viitataan organisaatiossasi. Yhteenveto edellyttää, että määrität, miten yhteenvetoihin viitataan. On tärkeää, että nämä tiedot ovat selkeitä ja edustavat tarkasti tietojasi, jotta järjestelmä olisi tehokkain.
Rajoitukset ja huomioitavat seikat
Copilot Tuning on tehokas, mutta siihen liittyy tärkeitä rajoituksia ja huomioon otettavia seikkoja, jotka kannattaa pitää mielessä, kun valitset tietoja hienosäätöä varten.
Vain teksti -ymmärrys: Hienosäätöprosessi oppii vain asiakirjojen tekstisisällöstä. Malli ei ymmärrä kuvien, kaavioiden, skannattujen PDF-tiedostojen tai muiden kuin tekstimuotojen tietoja. Vastaavasti monimutkainen muotoilu, kuten yksityiskohtaiset taulukot tai upotetut laskentataulukot, ei välttämättä johdata mallin harjoittamiseen. Teksti on ehkä luettu, mutta rakenteellinen merkitys voidaan menettää. Varmista, että kaikki tärkeät tiedot ilmaistaan tekstimuodossa koulutusmateriaaleissa tai lisäohjeissa. Sen sijaan, että odottaisivat mallin oppivan toimintosarjan vuokaaviokuvasta, kirjoita ohjeet tästä vuokaaviosta tekstiin.
Sisällön laajuus ja mallin kapasiteetti: Suuret asiakirjat saatetaan katkaista tai ne on murrettava osiin. Pohjana villa malleilla on kontekstin pituusrajat oppimismallien aikana. Jos sinulla on pitkiä tiedostoja (kymmeniä sivuja), mieti, tarvitaanko kaikkea tätä sisältöä säätämiseen. Voi olla parempi harjoittaa useilla pienemmillä ja kohdistetuilla asiakirjoilla kuin yhdellä suurella tiedostolla. Varmista, että esimerkit keskittyvät kohdetehtävän olennaisiin osiin. Epäolennainen tai ylimääräinen teksti harjoitustiedoissa voi hämmentää mallia. Vältä samalla liian lyhyitä tai riittämättömiä harjoitustietoja.
Staattinen tilannevedos tiedoista: Hienosäädetty malli on tilannevedos koulutushetkellä tietämyksestä. Se ei päivity automaattisesti, jos lähdeasiakirjat muuttuvat tai uusia tiedostoja lisätään. Jos esimerkiksi hienosäädät mallia käytännön käsikirjassa ja kyseistä manuaalista tarkistetaan ensi vuosineljänneksellä, malli heijastaa vanhaa käytäntöä, kunnes harjoitat sen uudelleen uusilla tiedoilla. Tämä toiminta poikkeaa Copilotin vakiotoiminnasta, jossa noudetaan lisätyn luonnin avulla reaaliaikaisia tietoja kyselyn aikana. Hienosäätö käy kauppaa reaaliaikaisesti päivittämällä syvempää osaamista. Sinun kannattaa kouluttaa (tai ainakin arvioida) mallia säännöllisesti tai silloin, kun toimialueellasi tapahtuu merkittäviä muutoksia.
Tärkeää
Asiakirjan käyttöoikeuksiin harjoittamisen jälkeen tehdyt muutokset eivät vaikuta malliin heti. Jos joku menettää lähdetiedoston käyttöoikeuden mallin harjoittamisen jälkeen, malli saattaa silti sisältää tietoja kyseisestä tiedostosta. Järjestelmänvalvojana sinun on ehkä säänneltävä mallin käyttöä tai uudelleenkoulutusta tarvittaessa, jotta voit noudattaa kehittyviä käyttöoikeuskäytäntöjä.
Ymmärtämällä nämä rajoitukset voit paremmin suunnitella tietovalinnan ja määrittää oikeat odotukset viritetylle mallille. Voit lieventää rajoituksia tarjoamalla hyviä tietoja ja ylläpitämällä mallia ajan kuluessa.
Yleiskuormitus ja ylläpito
Copilot Tuningin toteuttaminen aiheuttaa jonkin verran kuormituskustannuksia ja jatkuvaa ylläpitoa, joka on hallittavissa asianmukaisella suunnittelulla.
Ensimmäinen työ tietojen valmistelemiseksi: Työvoimavaltaisin osa on koulutustiedon kerääminen ja järjestäminen. Aiot käyttää aikaa sopivien asiakirjojen etsimiseen sekä niiden uudelleenmuotoiluun tai merkintöjen lisäämiseen. Voit esimerkiksi poistaa arkaluontoisia osia, joiden ei pitäisi olla koulutuksessa, tai kirjoittaa jäsennettyjä muutosohjeita. Saatat myös joutua koordinoimaan työtovereiden kanssa (esimerkiksi toimialueen asiantuntijat, jotka tietävät, mitkä asiakirjat ovat parhaita esimerkkejä). Tämä alkuponnistus on ratkaisevaa – parempi valmistelu vähentää turhautumista myöhemmin. Käsittele sitä sijoituksena asiantuntijatietojoukon luomiseen.
Iterointi ja arviointi: Hienosäätö on usein toistuva prosessi. Ensimmäinen malliversio ei ehkä ole täydellinen. Kun malli on harjoitettu, käytä aikaa sen testaamiseen realististen kehotteiden avulla. Asiantuntijoiden on annettava aiheasiantuntijoiden arvioida tulokset. Saatat huomata, että malli on heikko tietyssä aliaiheessa tai muodossa. Siinä tapauksessa palaa takaisin ja lisää vielä muutama harjoitusesimerkki tai tarkenna ohjeitasi ja harjoita sitten uudelleen. Muodosta ajoissa vähintään yhdelle tai kahdelle tarkennusjaksolle. Jokainen jakso tarkoittaa hieman enemmän tietojen valmistelua ja toista harjoitusta.