Évaluation des modules - Training

1.

Vous paramétrez PostgreSQL pour une charge de travail de recherche vectorielle avec 2 millions d’incorporations de 1536 dimensions. Les requêtes sont lentes et vous observez un taux d’accès au cache de 85%. Quelle modification de configuration devez-vous hiérarchiser ?

Augmenter shared_buffers pour conserver davantage de données dans le cache PostgreSQL

Diminuer random_page_cost pour encourager davantage d’analyses d’index

Augmenter ivfflat.probes pour rechercher d’autres partitions d’index

2.

Vous devez créer un index vectoriel pour un jeu de données de 5 millions d’incorporations de produits qui reçoivent des mises à jour de lots fréquentes (actualisation complète quotidienne). Le temps de compilation doit être inférieur à 30 minutes. Quelle configuration d’index devez-vous choisir ?

IVFFlat avec des listes définies sur sqrt(rows)

HNSW avec m=16 et ef_construction=64

HNSW avec m=8 et ef_construction=32

3.

Votre requête de recherche vectorielle filtrée applique des filtres par category_id et trie ensuite par similarité vectorielle. Le plan de requête affiche une analyse séquentielle sur la table produits. Que devez-vous vérifier en premier ?

Vérifier qu’un index B-tree existe sur la category_id colonne

Vérifiez que l’index vectoriel utilise la même classe d’opérateur que la requête

Augmenter hnsw.ef_search pour développer l’espace de recherche

4.

Vous implémentez la gestion des connexions pour une application IA qui effectue 500 requêtes vectorielles par seconde pendant les pics de trafic. Votre instance Azure Database pour PostgreSQL prend en charge 1 719 connexions maximales. Quelle approche devez-vous adopter ?

Activer PgBouncer en mode transaction avec une taille de pool appropriée pour vos instances d’application

Créer une connexion de base de données pour chaque requête

Activer PgBouncer en mode session pour gérer les connexions persistantes

5.

Vous mettez à l’échelle un moteur de recommandation qui s’exécute actuellement sur une instance 8 vCore usage général. L’utilisation du processeur moyenne est de 75% et la latence de requête P95 est de 150 ms, mais vous devez atteindre une latence inférieure à 50 ms. Quelle approche de mise à l’échelle devez-vous essayer en premier ?

Mettre à niveau vers un niveau mémoire optimisé avec plus de vCores

Ajouter des réplicas en lecture pour répartir la charge des requêtes

Implémenter la mise en cache au niveau de l’application avec Azure Cache pour Redis

Évaluation du module

Commentaires