Ce navigateur n’est plus pris en charge.
Effectuez une mise à niveau vers Microsoft Edge pour tirer parti des dernières fonctionnalités, des mises à jour de sécurité et du support technique.
Choisissez la meilleure réponse à chacune des questions ci-dessous.
Vous paramétrez PostgreSQL pour une charge de travail de recherche vectorielle avec 2 millions d’incorporations de 1536 dimensions. Les requêtes sont lentes et vous observez un taux d’accès au cache de 85%. Quelle modification de configuration devez-vous hiérarchiser ?
Augmenter shared_buffers pour conserver davantage de données dans le cache PostgreSQL
shared_buffers
Diminuer random_page_cost pour encourager davantage d’analyses d’index
random_page_cost
Augmenter ivfflat.probes pour rechercher d’autres partitions d’index
ivfflat.probes
Vous devez créer un index vectoriel pour un jeu de données de 5 millions d’incorporations de produits qui reçoivent des mises à jour de lots fréquentes (actualisation complète quotidienne). Le temps de compilation doit être inférieur à 30 minutes. Quelle configuration d’index devez-vous choisir ?
IVFFlat avec des listes définies sur sqrt(rows)
HNSW avec m=16 et ef_construction=64
HNSW avec m=8 et ef_construction=32
Votre requête de recherche vectorielle filtrée applique des filtres par category_id et trie ensuite par similarité vectorielle. Le plan de requête affiche une analyse séquentielle sur la table produits. Que devez-vous vérifier en premier ?
category_id
Vérifier qu’un index B-tree existe sur la category_id colonne
Vérifiez que l’index vectoriel utilise la même classe d’opérateur que la requête
Augmenter hnsw.ef_search pour développer l’espace de recherche
hnsw.ef_search
Vous implémentez la gestion des connexions pour une application IA qui effectue 500 requêtes vectorielles par seconde pendant les pics de trafic. Votre instance Azure Database pour PostgreSQL prend en charge 1 719 connexions maximales. Quelle approche devez-vous adopter ?
Activer PgBouncer en mode transaction avec une taille de pool appropriée pour vos instances d’application
Créer une connexion de base de données pour chaque requête
Activer PgBouncer en mode session pour gérer les connexions persistantes
Vous mettez à l’échelle un moteur de recommandation qui s’exécute actuellement sur une instance 8 vCore usage général. L’utilisation du processeur moyenne est de 75% et la latence de requête P95 est de 150 ms, mais vous devez atteindre une latence inférieure à 50 ms. Quelle approche de mise à l’échelle devez-vous essayer en premier ?
Mettre à niveau vers un niveau mémoire optimisé avec plus de vCores
Ajouter des réplicas en lecture pour répartir la charge des requêtes
Implémenter la mise en cache au niveau de l’application avec Azure Cache pour Redis
Vous devez répondre à toutes les questions avant de vérifier votre travail.
Cette page a-t-elle été utile ?
Vous avez besoin d’aide pour cette rubrique ?
Vous souhaitez essayer d’utiliser Ask Learn pour clarifier ou vous guider dans cette rubrique ?