Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Microsoft 365 Copilot A hangolás lehetővé teszi a szervezetek számára, hogy az AI-modelleket az egyedi terminológiájuknak, kommunikációs stílusuknak és üzleti folyamatuknak megfelelően alakítsák. A nagy nyelvi modellek (LLM-ek) saját adatokkal történő finomhangolásával javíthatja a Copilot-válaszok pontosságát, hangnemét és relevanciáját a bérlőben.
A Copilot-hangolás túlmutat a megőrzésen és lekérésen a bérlőspecifikus LLM-ek betanításához a szervezet adatain, miközben robusztus vállalati biztonsági, megfelelőségi, irányítási és felügyeleti vezérlőket tart fenn. Az LLM-eket olyan konkrét feladatokhoz hangoljuk, mint az összegzés, a dokumentumlétrehozás és a szakértői Q&A.
Ez a cikk a modellek betanításának és finomhangolásának folyamatát ismerteti a szervezet Microsoft 365 Copilot testreszabásához.
Megjegyzés:
A Copilot Tuning jelenleg a Korai Access előzetes verzió (EAP) esetében érhető el. A követelményekkel és a regisztrációval kapcsolatos részletekért tekintse meg a rendszergazdai útmutatót.
Finomhangolási folyamat áttekintése
A Copilot Tuning használata a szervezet számára finomhangolt AI-modellek létrehozásához a következő betanítási és finomhangolási lépésekből áll:
- A tartományspecifikus adaptáció beképzi az LLM-et a Copilotba betöltött szervezeti adatok feldolgozásával.
- A felügyelt finomhangolás úgy igazítja a modellt adott feladatokhoz, hogy bemeneti-kimeneti párokra tanítja be.
- A megerősítő tanulás segít a modellnek a szervezet stílusának, hangnemének és preferenciáinak elfogadásában a Copilot-válaszok további optimalizálása érdekében.
Megjegyzés:
A hangolt modellek privátak. Az adatokkal nem tanítunk be általános modelleket más bérlők számára. Az adatok minden feldolgozása olyan bérlőben történik, amelyhez csak jogosult felhasználók férhetnek hozzá, és bizonyos személyek, általában rendszergazdák szabályozhatják a betanítási folyamatot.
Tartományspecifikus adaptáció
A tartományspecifikus adaptáció a corpora betöltése után következik be. Ez az adaptáció magában foglalja a szervezet tartalmának feldolgozását az eredeti formátumból egy egyszerű szöveges formátumba, soronként egy utasítással. Ez a formátum biztosítja, hogy az AI-modell nem hivatkozik az eredeti adatokra.
A tartományspecifikus adaptáció során a modelleket előre betanítjuk a szervezettől származó nagy mennyiségű címkézetlen adattal, hogy tartományi ismereteket biztosítsunk a bérlői LLM-nek. A felügyelt finomhangolástól eltérően, amely magában foglalja a modell pontos és pontos válaszokra való tanítását, a tartományspecifikus adaptáció betaníthatja a modellt, hogy tisztában legyen a szervezeten belüli adattípusokkal, és megfelelően válaszoljon.
A tartományadaptálás bővíti a modell üzleti tartományra vonatkozó ismereteit, hogy a Copilot megismerje az Ön által végzett munka típusát. Ez lehetővé teszi, hogy a Copilot gyorsan lekérje a releváns ismereteket ahelyett, hogy a gyors tervezés során megtanulja vagy több lépésben kér le egy modellt.
Az ügyféloldali parancssori tervezés tovább javíthatja az eredményeket. Az intelligens kérések tartományspecifikus adaptációval való kombinálásával lehetővé teheti a vállalati adatmegőrzést és -lekérést olyan forrásokból, mint a Microsoft Search, a SharePoint stb.
Felügyelt finomhangolás
A felügyelt finomhangolás egy olyan technika, amellyel egy előre betanított modell adott feladatokhoz vagy szervezeti követelményekhez igazítható a címkézett bemeneti-kimeneti párokra való betanításával. Ez a folyamat segít a modellnek abban, hogy megtanuljon olyan válaszokat előállítani, amelyek megfelelnek a szervezet által előnyben részesített formátumoknak, hangnemeknek és megfelelőségi igényeknek. Felügyelt finomhangolás:
- Strukturáltság és hangvétel tanítása – A modellek megtanulják, hogyan reagálhat a szervezet hangját tükröző módon.
- A feladatok pontosságának javítása – A kiváló minőségű példák betanításával a modell megbízhatóbbá válik a nagyvállalati használati esetekhez.
- Támogatja a megfelelőséget – Modelleket taníthat be a szabályozási nyelvek és a belső besorolások felismerésére és megválaszolására.
A felügyelt finomhangolás akkor hasznos, ha a modellre a következőkre van szüksége:
- Kövessen egy adott Q&A formátumot.
- A vállalat jogi vagy HR-kommunikációs stílusát tükrözi.
- Tartományspecifikus terminológia (például GDPR vagy biztonsági besorolások) felismerése és megválaszolása.
Egy jogi csapat például olyan válogatott válaszok használatával finomhangolhatja a modelleket, amelyek az olyan adat joghatósági kifejezésekre való hivatkozásokat tartalmaznak, mint a GDPR vagy a belső besorolások.
ACL: This document is important to the DSR database and should be given utmost priority.
ACL: Access and Confidentiality Level - High
ACL: Data Classification Level - Medium
Ez biztosítja, hogy a modell olyan válaszokat generáljon, amelyek nemcsak a jogi pontosságot tükrözik, hanem a belső dokumentációs szabványoknak is megfelelnek.
A felügyelt finomhangolás segíthet a modelleknek a szervezeti sablonokkal összhangban álló strukturált kimenetek létrehozásában, valamint jogi és belső szabályozási protokollok alkalmazásában, ahogy az alábbi példában látható.
Haladéktalan: Milyen biztonsági védelmet kell alkalmazni erre a dokumentumra?
Válasz: Ez a dokumentum jogi és megfelelőségi kérdésekre vonatkozó bizalmas és kiemelt információkat tartalmaz. Titkosítást, hozzáférés-vezérlést és rendszeres naplózást igényel a jogosulatlan hozzáférés megakadályozása érdekében. A hozzáférés-vezérlés módosításait a felső vezetésnek jóvá kell hagynia.
A felügyelt finomhangolás emellett segít biztosítani, hogy a válaszok pontosak és összhangban legyenek a szervezet hangszínével, ahogy az alábbi példában látható.
Haladéktalan: Hány szabadságidőt vehet fel egy alkalmazott a teljes összeg leértékelődése előtt?
Válasz: A szabadság maximális egyenlege 200 órára van korlátozva. A korlát elérése után az alkalmazottak nem fognak több órát igénybevenni. Javasoljuk, hogy a munka és a magánélet egészséges egyensúlyának fenntartása érdekében rendszeresen szabadideje legyen. További részletekért forduljon a feletteséhez vagy a HR-hez.
Megerősítő tanulás
A megerősítő tanulás egy betanítás utáni technika, amellyel az LLM-eket a szervezet egyedi kommunikációs stílusához, hangjához és eszközhasználati beállításaihoz igazíthatja. A felügyelt finomhangolástól eltérően, amely arra tanítja a modellt, hogy a címkézett példákból helyes kimeneteket állítson elő, a megerősítő tanulás a visszajelzési jelekből tanulva optimalizálja a szubjektív tulajdonságokat.
A megerősítő tanulás akkor hasznos, ha a modellt a következőre szeretné használni:
- A hang adott hangnemének tükrözése (empatikus, formális, tömör).
- Előnyben részesítsen bizonyos eszközöket (például a Microsoft Graph API-kat a RAG-alapú lekérés helyett).
- Ne kérjen le tartalmat bizalmas forrásokból (például ACL-címkével ellátott dokumentumokból).
- Tanuljon a felhasználói visszajelzésekből a folyamatos fejlesztéshez.
A megerősítő tanulás a szervezeti preferenciákon alapuló kimenet pontozásával finomítja a modellt, emberi és automatizált visszajelzések használatával a tanulás irányításához. Ha például a Copilot pozitív visszajelzést kap egy szabadságszabályzati kérdésre adott válaszról, a válasz hasonló kontextusban lesz megerősítve és újra felhasználva. Ezzel szemben, ha egy válasz hang- vagy tartalomként van megjelölve, a modell megtanulja elkerülni ezt a mintát.
Speciális alkalmazkodás és karbantartás
A felügyelt és megerősítő tanulás finomhangolásának kombinálásával olyan modelleket hozhat létre, amelyek tükrözik a szervezet hangnemét, a feladatkiegészítési mintákat és az adatirányítási követelményeket. Ezek a modellek a szervezet egyedi hang- és működési tudását a következőkre alkalmazzák:
- Konzisztens hangnemet és formázást tarthat fenn a tevékenységek között.
- Tartományspecifikus ismeretek beágyazása a dokumentumkészítéshez, összegzéshez és szakértői Q&A-hoz.
- A betanítás és a következtetés során tartsa tiszteletben a hozzáférés-vezérlést és az adatbesorolási szabályzatokat.
- Pontos válaszokat hozhat létre a belső szabványoknak és a felhasználói elvárásoknak megfelelően.
A modell finomhangolása során nehézségekbe ütközhet. Kihívást jelenthet például, ha elegendő, kiváló minőségű címkézett adatot talál a betanításhoz. Szimulált adatokat olyan modellek használatával hozhat létre, mint a ChatGPT a referenciakimenet létrehozásához. Azt is szeretné biztosítani, hogy a betanítási adatok kellően változatosak legyenek. A betanítási adatoknak számos használati esetet kell lefedniük a valós forgatókönyvek lefedéséhez és a lehetséges torzítások mérsékléséhez.
A modell minőségének és megfelelőségének legjobb biztosítása érdekében:
- Végezzen értékeléseket manuális felülvizsgálat vagy automatizált eszközök, például az Azure OpenAI szolgáltatás használatával.
- Monitorozza a túlillesztést a nem látott bemenetek tesztelésével és a tanulási sebesség igény szerinti módosításával.
- Szigorú hozzáférés-vezérlési és auditnaplók fenntartása a betanítási életciklus során.
Minden értékelés bizalmas, és a Microsoft felelős AI-alapelvei szabályozzák.
A modell tovább fejleszthető a következővel:
- Új adatok feltöltése megerősítési ciklusok között a folyamatos finomhangolás érdekében.
- Gyors tervezés alkalmazása az új tevékenységtípusokhoz vagy szabályozási változásokhoz való alkalmazkodáshoz.
- A Copilot Studio kevés kódolású eszközeivel ügynököket helyezhet üzembe és kezelhet a finomhangolt modellek alapján.