Partager via


Démarrage rapide : Prise en main de GPT-4 Turbo avec Vision sur vos images et vidéos dans Azure AI Studio

Important

Les éléments marqués (préversion) dans cet article sont actuellement en préversion publique. Cette préversion est fournie sans contrat de niveau de service, nous la déconseillons dans des charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

Utilisez cet article pour commencer à utiliser Azure AI Studio pour déployer et tester le modèle GPT-4 Turbo avec Vision.

GPT-4 Turbo avec Vision et Azure AI Vision offrent des fonctionnalités avancées, notamment :

  • Reconnaissance optique de caractères (OCR) : extrait le texte des images et le combine avec l’invite et l’image de l’utilisateur pour développer le contexte.
  • Mise à l’échelle de l’objet : complète le GPT-4 Turbo avec la réponse de texte Vision avec la mise au sol des objets et décrit les objets saillants dans les images d’entrée.
  • Invites vidéo : GPT-4 Turbo avec Vision peut répondre aux questions en récupérant les images vidéo les plus pertinentes pour l’invite de l’utilisateur.

Des frais d’utilisation supplémentaires peuvent s’appliquer lors de l’utilisation de GPT-4 Turbo avec Vision et la fonctionnalité Azure AI Vision.

Prérequis

Préparer votre média

Vous avez besoin d’une image pour suivre les guides de démarrage rapide de l’image. Vous pouvez utiliser cet exemple d’image ou toute autre image à votre disposition.

Photo d’un accident de voiture qui peut être utilisé pour suivre le guide de démarrage rapide.

Pour les prompts vidéo, vous avez besoin d’une vidéo de moins de trois minutes.

Déployer un modèle GPT-4 Turbo avec Vision

  1. Connectez-vous à Azure AI Studio et sélectionnez le hub dans lequel vous souhaitez travailler.
  2. Dans le menu de navigation de gauche, sélectionnez Services IA. Sélectionnez le panneau Essayer GPT-4 Turbo.
  3. Dans la page gpt-4, sélectionnez Déployer. Dans la fenêtre qui s’affiche, sélectionnez votre ressource Azure OpenAI. Sélectionnez vision-preview comme version du modèle.
  4. Sélectionnez Déployer.
  5. Ensuite, accédez à la page de votre nouveau modèle et sélectionnez Ouvrir dans le terrain de jeu. Dans le terrain de jeu de conversation, le déploiement GPT-4 que vous avez créé doit être sélectionné dans la liste déroulante Déploiement.

Dans cette session de conversation, vous demandez à l’assistant de comprendre les images que vous entrez.

  1. Dans la zone de texte Message système sous l’onglet Message système, fournissez ce prompt pour guider l’assistant : "You're an AI assistant that helps people find information." Vous pouvez adapter le prompt à votre image ou scénario.
  2. Sélectionnez Appliquer les modifications pour enregistrer vos modifications.
  3. Dans le volet de session de conversation, sélectionnez le bouton de pièce jointe pour Charger l’image. Choisissez votre image.
  4. Ajoutez la question suivante dans le champ de conversation : "Describe this image", puis sélectionnez l’icône de flèche droite pour envoyer.
  5. L’icône de flèche droite est remplacée par un bouton Arrêter. Si vous le sélectionnez, l’assistant cesse de traiter votre demande. Pour ce guide de démarrage rapide, laissez l’assistant terminer sa réponse.
  6. L’assistant répond avec une description de l’image.
  7. Posez une question de suivi relative à l’analyse de votre image. Vous pouvez entrer : "What should I highlight about this image to my insurance company?".
  8. Vous devez recevoir une réponse pertinente similaire à ce qui s’affiche ici :
    When reporting the incident to your insurance company, you should highlight the following key points from the image:  
    
    1. **Location of Damage**: Clearly state that the front end of the car, particularly the driver's side, is damaged. Mention the crumpled hood, broken front bumper, and the damaged left headlight.  
    
    2. **Point of Impact**: Indicate that the car has collided with a guardrail, which may suggest that no other vehicles were involved in the accident.  
    
    3. **Condition of the Car**: Note that the damage seems to be concentrated on the front end, and there is no visible damage to the windshield or rear of the car from this perspective.  
    
    4. **License Plate Visibility**: Mention that the license plate is intact and can be used for identification purposes.  
    
    5. **Environment**: Report that the accident occurred near a roadside with a guardrail, possibly in a rural or semi-rural area, which might help in establishing the accident location and context.  
    
    6. **Other Observations**: If there were any other circumstances or details not visible in the image that may have contributed to the accident, such as weather conditions, road conditions, or any other relevant information, be sure to include those as well.  
    
    Remember to be factual and descriptive, avoiding speculation about the cause of the accident, as the insurance company will conduct its own investigation.
    

Afficher et exporter du code

À n’importe quel moment de la session de conversation, vous pouvez activer le commutateur Afficher au format JSON brut en haut de la fenêtre de conversation pour voir la conversation au format JSON. Voici ce qu’il ressemble au début de la session de conversation de démarrage rapide :

[
	{
		"role": "system",
		"content": [
			"You are an AI assistant that helps people find information."
		]
	},
]

Nettoyer les ressources

Pour éviter la facturation de coûts inutiles, vous devez supprimer les ressources créées dans ce guide de démarrage rapide si elles ne sont plus nécessaires. Pour gérer les ressources, vous pouvez utiliser le Portail Microsoft Azure.

Étapes suivantes