Concepts d’ajustement des modèles
La mise au point est un processus qui consiste à prendre un modèle pré-entraîné et à l'ajuster pour qu'il corresponde mieux à vos données. Ce processus peut vous aider à tirer le meilleur parti de vos données et à améliorer les performances de votre modèle. Dans cet article, vous apprendrez les concepts de base de l'ajustement fin et quand il est approprié d'affiner un modèle IA.
Introduction
Le réglage fin est une technique puissante qui peut vous aider à tirer le meilleur parti de vos données. Pour comprendre l'ajustement fin, il est important de comprendre le concept d'apprentissage transférentiel. L'apprentissage par transfert est une technique de machine learning dans laquelle un modèle formé sur une tâche est réutilisé sur une seconde tâche connexe. Pour ce faire, on prend un modèle pré-entraîné et on l'ajuste pour qu'il corresponde mieux aux nouvelles données. Le réglage fin est une forme d'apprentissage par transfert où le modèle pré-entraîné est ajusté pour mieux s'adapter aux nouvelles données.
Le réglage fin d'un modèle comporte plusieurs étapes. Tout d'abord, vous devez sélectionner un modèle pré-entraîné bien adapté à votre tâche. Ensuite, vous devez préparer votre échantillon de données et affiner le modèle sur ces données. Enfin, vous devez itérer sur votre modèle pour améliorer ses performances.
Quand peaufiner
Le réglage fin convient lorsque vous disposez d'une petite quantité de données et que vous souhaitez améliorer les performances de votre modèle. En commençant par un modèle pré-entraîné, vous pouvez exploiter les connaissances que le modèle a déjà apprises et l'ajuster pour qu'il corresponde mieux à vos données. Cela peut vous aider à améliorer les performances de votre modèle et à réduire la quantité de données nécessaires pour l'entraîner.
Il n'est généralement pas nécessaire d'affiner votre modèle lorsque vous disposez d'une grande quantité de données. Dans ce cas, vous pouvez entraîner votre modèle à partir de zéro et obtenir de bonnes performances sans ajustement. Cependant, le réglage fin peut toujours être utile dans ce cas si vous souhaitez améliorer davantage les performances de votre modèle. Vous pouvez également vouloir affiner votre modèle si vous avez une tâche spécifique qui est différente de la tâche sur laquelle le modèle pré-entraîné a été formé à l'origine.
Vous pouvez éviter la mise au point coûteuse d'un modèle en recourant à l'ingénierie ou à l'enchaînement de requêtes. Ces techniques peuvent vous aider à générer un texte de haute qualité sans qu'il soit nécessaire de procéder à un réglage fin.
Sélectionner un modèle pré-entraîné
Vous devez sélectionner un modèle pré-entraîné bien adapté aux exigences de votre tâche. Il existe de nombreux modèles pré-entraînés qui ont été entraînés sur un large éventail de tâches. Vous devez choisir un modèle qui a été entraîné sur une tâche similaire à celle sur laquelle vous travaillez. Cela vous permettra de tirer parti des connaissances que le modèle a déjà acquises et de l'ajuster pour qu'il corresponde mieux à vos données.
Les modèles HuggingFace sont un bon point de départ lors de la recherche de modèles préentraînés. Les modèles HuggingFace sont regroupés en catégories en fonction de la tâche sur laquelle ils ont été formés, ce qui permet de trouver facilement un modèle adapté à votre tâche.
Ces catégories sont les suivantes
- Multimodal
- Vision par ordinateur
- Traitement en langage naturel
- Audio
- Tabulaire
- Apprentissage par renforcement
Vérifier la compatibilité du modèle avec votre environnement et les outils que vous utilisez. Par exemple, si vous utilisez Visual Studio Code, vous pouvez utiliser l'extension Azure Machine Learning pour Visual Studio Code afin d'affiner votre modèle.
Vérifier le statut et la licence du modèle. Certains modèles pré-entraînés peuvent être disponibles sous une licence open source, tandis que d'autres peuvent nécessiter une licence commerciale ou personnelle pour être utilisés. Tous les modèles figurant sur HuggingFace comprennent des informations sur la licence. Assurez-vous que vous disposez des permissions nécessaires pour utiliser le modèle avant de l'affiner.
Préparer les données de l'échantillon
La préparation de votre échantillon de données implique le nettoyage et le prétraitement de vos données afin de les rendre aptes à la formation. Vous devez également diviser vos données en ensembles de formation et de validation afin d'évaluer les performances de votre modèle. Le format de vos données doit correspondre au format attendu par le modèle pré-entraîné que vous utilisez. Ces informations se trouvent avec les modèles sur HuggingFace dans la section Format d'instruction de la carte du modèle. La plupart des fiches de modèle comprennent un modèle de requête pour le modèle et un pseudo-code pour vous aider à démarrer.
Améliorez votre modèle
Une fois que vous avez affiné votre modèle, vous devez évaluer ses performances sur l'ensemble de validation. Vous pouvez utiliser des mesures telles que l'exactitude, la précision, le rappel et le score F1 pour évaluer les performances de votre modèle. Si les performances de votre modèle ne sont pas satisfaisantes, vous pouvez itérer sur votre modèle en ajustant les hyperparamètres, en changeant l'architecture ou en affinant le modèle sur davantage de données. Vous pouvez également examiner la qualité et la diversité de vos données pour voir s'il y a des problèmes à régler. En règle générale, un petit ensemble de données de haute qualité a plus de valeur qu'un grand ensemble de données de faible qualité.
Voir aussi
Pour en savoir plus sur le réglage fin des modèles d'IA, consultez les ressources suivantes :
- Affiner un modèle Llama 2 dans le portail Azure AI Foundry
- Affiner un modèle pré-entraîné sur HuggingFace
- Affiner un modèle pré-entraîné à l'aide de TensorFlow
Lorsque vous utilisez des fonctionnalités IA, nous vous recommandons de vous référer à l’article suivant : Développement d’applications et de fonctionnalités d’IA générative responsable sur Windows.