Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Microsoft 365 Copilot Finomhangolás feladatspecifikus, a modellkészítő által biztosított ismeretek alapján finomhangolt modellt hoz létre. A vállalat belső dokumentumaiból származó ismeretek kiválasztásával lehetővé teszi a modell számára az egyedi terminológia, stílus és eljárások megismerését.
A Copilot-finomhangoláshoz szükséges ismeretek kiválasztása azt jelenti, hogy azonosítja és előkészíti a modell által megismert megfelelő tartalomkészletet a szervezettől. A tudás kiválasztása magában foglalja a reprezentatív dokumentumok, példák és utasítások összegyűjtését, amelyek rögzítik a finomhangolt modell által utánozni kívánt szakértelmet. Egy jogi részleg például finomhangolhat egy modellt a cég korábbi ügyintézőire és sablonjaira, így a modellt használó ügynök a cég stílusában és terminológiájában készíthet szerződéseket. Minél jobb a kiválasztott tudás tükrözi a tartományt és a feladatot, annál inkább releváns, kiváló minőségű eredményeket ad a modell.
Ebben a cikkben bemutatjuk, hogyan választhatja ki és készítheti elő tudását a Copilot tuninghoz. Megismerheti a szükséges dokumentumtípusokat, azok rendszerezését és az alapvető követelményeket (például minimális adatmintákat és fájlformátumokat). A tudás kiválasztásának megértésével gondoskodhat arról, hogy a finomhangolt modell hatékonyan és az igényeinek megfelelően legyen beállítva.
A megfelelő tudás előkészítése a finomhangoláshoz
A Tudás kiválasztása a Copilot Tuning első és legkritikusabb lépése. A legrelevánsabb és mérvadóbb tartalmakból érdemes kiváló minőségű betanítási adathalmazt összeállítani. A kulcs az, hogy olyan példákat adjon meg, amelyek pontosan megtanítják a modellnek, hogy mit vár el tőle. A választott tartalom a feladat típusától függ. A Copilot Tuning jelenleg három elsődleges feladatforgatókönyvet támogat: szakértői kérdéseket & választ (Q&A), dokumentumgenerálást és dokumentumösszesítést. Minden forgatókönyv esetében vegye figyelembe a következő követelményeket:
Támogatott fájlformátumok és tartalom: A Copilot hangolási feladatai támogatják a gyakori szövegalapú dokumentumformátumokat. Forrásanyagként Word dokumentumokat (.doc, .docx), HTML-fájlokat (.html, .aspx), Markdown-fájlokat (.md) vagy optikai karakterfelismerés (OCR) által feldolgozott PDF-fájlokat használhat. Excel-dokumentumokat (.xls, .xlsx) is felvehet a Q&A szakértő számára. A hangolási folyamat betölti a szöveges tartalmat ezekből a fájlokból. Nem tanul képekből, beágyazott táblázatokból vagy a dokumentumok egyéb nem szöveges elemeiből. Győződjön meg arról, hogy a betanítási dokumentumokban szereplő fontos információk szöveges formátumúak. Ha például egy filePDF diagramot tartalmaz, szöveges magyarázatot kell adni a diagram megállapításainak a dokumentumban való tárolására.
Dokumentumok száma: A Copilot hangolásához legalább 20 mintát (Q&A-dokumentumokat és összegzéseket, dokumentumlétrehozás bemeneti-kimeneti párokat) kell megadnia. Általában több száz vagy ezer minta ideális, és legfeljebb 10 ezer mintát adhat meg. A minták minősége fontosabb, mint a nyers mennyiség. Javasoljuk, hogy az adat-előkészítési időt arra összpontosítsa, hogy annyi kiváló minőségű mintát találjon, amely megfelel a várt finomhangolt modellnek.
Modellutasítások: A modellkonfigurációs folyamat során a Copilot Tuning arra kéri a modellkészítőt, hogy adjon választ a modellre vonatkozó utasítások sorozatára, amelyek útmutatást nyújtanak a rendszer számára a kiválasztott ismeretek használatához. Minden tevékenységtípusnak saját kérdései vannak a kiválasztott tudásbázissal kapcsolatban. Készítsen világos, strukturált válaszokat az egyes kérdésekre. A szakértői Q&A megköveteli a tudásforrás adatainak leírását és rendszerezését. A dokumentumlétrehozáshoz meg kell adnia, hogy a szervezet hogyan hivatkozik az eredeti bemeneti, módosítási és kimeneti piszkozatra. Az összegzéshez meg kell adnia, hogyan hivatkozzon az összegzésekre. Fontos, hogy ezek az információk egyértelműek és pontosak legyenek, hogy a rendszer a leghatékonyabb legyen.
Korlátozások és szempontok
Bár a Copilot-hangolás hatékony, fontos korlátozásokat és szempontokat kell szem előtt tartani a finomhangoláshoz szükséges tudás kiválasztásakor.
Csak szövegértés: A finomhangolási folyamat csak a dokumentumok szöveges tartalmaiból tanul. A modell nem érti a képek, diagramok, beolvasott PDF-ek vagy más nem szöveges formátumok információit. Hasonlóképpen, az összetett formázás, például a részletes táblázatok vagy a beágyazott számolótáblák nem feltétlenül lesznek lefordítva a modell betanítására. Lehet, hogy a szöveg olvasható, de a szerkezeti jelentés elveszhet. Győződjön meg arról, hogy a lényeges adatokat egyszerű szöveges formában fejezik ki a képzési anyagokban vagy a kiegészítő utasításokban. Ahelyett például, hogy azt várjuk, hogy a modell egy folyamatábra-képből tanuljon meg egy eljárást, írja ki a folyamatábra lépéseit szövegben.
Tartalom hatóköre és modellkapacitása: Előfordulhat, hogy a nagyméretű dokumentumok csonkulnak, vagy részekre kell bontani őket. A mögöttes modellek tanulási minták esetén a környezeti hosszkorlátokkal rendelkeznek. Ha hosszadalmas fájlokkal (több tucat oldallal) rendelkezik, gondolja át, hogy szükség van-e az összes tartalomra a hangoláshoz. Jobb lehet több kisebb, koncentrált dokumentumot betaníteni, mint egy nagy fájlt. Győződjön meg arról, hogy a példák a célfeladat megfelelő részeire összpontosítanak. A betanítási adatok irreleváns vagy felesleges szövege összezavarhatja a modellt. Ugyanakkor kerülje a túl rövid vagy elégtelen betanítási adatokat.
A tudás statikus pillanatképe: A finomhangolt modell a betanítás időpontjában a tudás pillanatképét ábrázolja. Nem frissül automatikusan, ha a forrásdokumentumok megváltoznak vagy új dokumentumokat adnak hozzá. Ha például egy szabályzati kézikönyvre finomhangol egy modellt, és a kézikönyvet a következő negyedévben módosítják, a modell továbbra is a régi szabályzatot fogja tükrözni, amíg újra be nem tanítja az új információkkal. Ez a viselkedés eltér a Copilot szokásos viselkedésétől, amely lekéréssel bővített generációt használ az élő adatok lekérdezési időpontban történő kereséséhez. A kereskedések finomhangolása valós idejű frissítés a tanult szakértelmekért. Tervezze meg a modell rendszeres időközönkénti újratanítását (vagy legalább kiértékelését), vagy ha jelentős változások történnek a tartományban.
Fontos
A dokumentumengedélyek betanítás utáni módosításai nincsenek azonnal hatással a modellre. Ha valaki elveszíti a hozzáférést egy forrásfájlhoz a modell betanítása után, a modell továbbra is tartalmazhat ismereteket a fájlból. Rendszergazdaként szükség lehet a modellhozzáférés szabályozására, vagy szükség esetén újratanításra a változó hozzáférési szabályzatok betartásához.
Ezeknek a korlátozásoknak a megértésével jobban megtervezheti a tudását, és helyes elvárásokat állíthat be a hangolt modellhez. Mérsékelje a korlátozásokat a megfelelő adatok biztosításával és a modell időbeli karbantartásával.
Többletterhelés és karbantartás
A Copilot-finomhangolás implementálása némi többletterhelést jelent az erőfeszítés és a folyamatos karbantartás terén, ami a megfelelő tervezéssel kezelhető.
Az adatok előkészítésének kezdeti erőfeszítése: A leginkább munkaigényes rész a képzési ismeretek összegyűjtése és rendszerezése. Tervezze meg, hogy időt töltsön a megfelelő dokumentumok megkeresésével és azok újraformázásával vagy jegyzetekkel való ellátásával. Eltávolíthatja például azokat a bizalmas szakaszokat, amelyeknek nem kellene részt vennie a betanításban, vagy megírhatja a strukturált módosítási utasításokat. Előfordulhat, hogy a munkatársakkal is egyeztetnie kell (például olyan tartományi szakértőkkel, akik tudják, hogy melyik dokumentum a legjobb példa). Ez az előzetes erőfeszítés létfontosságú – a jobb előkészítés sokkal kevesebb frusztrációt eredményez később. A szakértő adathalmaz létrehozására irányuló befektetésként kezelje.
Iteráció és értékelés: A finomhangolás gyakran iteratív folyamat. Előfordulhat, hogy az első modellverzió nem tökéletes. A modell betanítása után szánja rá az időt, hogy reális kérésekkel tesztelje. A téma szakértői értékeljék ki a kimeneteket. Előfordulhat, hogy a modell gyenge egy bizonyos altopikus vagy formátum esetében. Ebben az esetben térjen vissza, és adjon hozzá néhány további betanítási példát, vagy pontosítsa az utasításokat, majd végezze el az újratanítást. Állítsd be időben legalább egy vagy két pontosítási ciklust. Minden ciklus egy kicsit több adat-előkészítést és egy újabb betanítási futtatásokat jelent.