L'agent ne lit pas les données indexées d'Azure Cognitive Search malgré une connexion réussie

Nesrine Bradai 0 Points de réputation
2025-06-24T22:01:54.19+00:00

Hello,

Je rencontre un problème avec un agent IA configuré dans mon projet. Bien que la connexion entre l'agent et l'index de recherche soit établie, l'agent ne peut pas accéder aux données récemment indexées.

J'ai confirmé la présence des données en interrogeant directement l'index à l'aide de l'éditeur de requêtes JSON. Cependant, lors de l'interaction avec l'agent, celui-ci ne reflète pas les informations les plus récentes et renvoie des réponses obsolètes.

J'ai essayé de créer de nouveaux threads et d'exécuter de nouvelles sessions, mais le problème persiste.

Pourriez-vous m'aider à comprendre pourquoi l'agent ne parvient pas à lire le contenu indexé le plus récent, même si la connexion à l'index est active et confirmée ?


Modération : votre question a été traduite, merci de votre compréhension.

Azure
Azure
Plateforme et infrastructure de cloud computing pour la génération, le déploiement et la gestion d’applications et de services à travers un réseau mondial de centres de données gérés par Microsoft.
611 questions
{count} votes

1 réponse

Trier par : Le plus utile
  1. Prashanth Veeragoni 5,645 Points de réputation Personnel externe Microsoft Modérateur
    2025-06-25T09:02:11.1733333+00:00

    Hi Nesrine Bradai,

    Vous rencontrez un problème courant : l'agent Azure AI est connecté à la Recherche cognitive Azure, mais il ne parvient pas à lire ou à refléter les données les plus récentes dont vous avez confirmé l'existence dans l'index. Je vais vous expliquer ce problème et vous guider à travers une explication théorique, les causes possibles et la solution.

    Explication de l'agent ne lisant pas les données récentes de la Recherche cognitive Azure :

    Même si la connexion à l'index est établie avec succès (ce qui signifie qu'Azure AI Agent dispose d'une autorisation et d'un lien logique avec l'index de la Recherche cognitive), l'agent ne semble pas refléter ou récupérer les données les plus récentes, même si l'interrogation directe du même index via l'Explorateur de recherche ou l'API REST confirme l'existence des nouvelles données.

    Ce comportement peut être compris en analysant l'intégration de l'agent à la Recherche cognitive Azure, le flux de données de l'index vers le modèle et les facteurs susceptibles d'interrompre ou de retarder ce flux.

    Interaction entre l'agent AI et la Recherche cognitive :

    Lorsque vous connectez un index de Recherche cognitive à un agent Azure AI Agent, un pipeline de sources de données est configuré. Cela inclut :

    • Mappages de champs : vous définissez les champs représentant le corps du contenu, le titre ou la clé du document.

    • Construction de requêtes : les questions des utilisateurs sont traduites en requêtes structurées (par mots-clés ou sémantiques) pour récupérer les documents pertinents.

    • Mécanisme de classement : les documents sont classés selon leur pertinence sémantique (si activée).

    • Mise en cache et gestion du contexte : pour améliorer le temps de réponse et la cohérence entre les sessions.

    L'agent utilise ce pipeline pour récupérer les documents qui sont ensuite transmis au modèle GPT comme contexte de récupération. La réponse finale de l'agent résulte de cette fusion contextuelle.

    Cependant, ce pipeline peut ne pas refléter le contenu nouvellement indexé en temps réel en raison de plusieurs comportements et contraintes sous-jacents, notamment les mécanismes de mise en cache, les délais d'actualisation de l'index ou les requêtes mal configurées.

    Causes principales :

    L'une des principales causes de ce comportement est la couche de mise en cache que les agents Azure AI peuvent utiliser. Pour optimiser les performances et réduire l'utilisation des jetons ou la latence des réponses, l'agent peut mettre en cache les réponses ou les résultats de récupération par session ou thread. Par conséquent, même si de nouvelles données sont indexées dans Azure Cognitive Search, l'agent peut répondre avec du contenu précédemment mis en cache, en particulier si la saisie utilisateur est similaire aux invites précédentes.

    De plus, le comportement de la requête générée par l'agent peut filtrer les documents plus récents. Cela peut se produire si :

    • La requête ne récupère que les N documents les plus pertinents (généralement 3 ou 5).

    • La configuration sémantique ou les filtres omettent le nouveau contenu en fonction de la date ou du score de pertinence.

    • Le contenu nouvellement indexé présente des incohérences de mappage de champs, empêchant l'agent de l'identifier ou de le restituer correctement.

    Même si le contenu existe dans l'index, ces couches peuvent l'empêcher d'apparaître dans le résultat de récupération transmis au modèle.

    Retards d'indexation et actualisation de l'index sémantique

    Un autre point subtil, mais important, est que l'indexation et le classement sémantiques peuvent ne pas refléter instantanément les données nouvellement ajoutées. Lorsque des données sont ajoutées ou mises à jour dans un index de recherche cognitive, le pipeline d'indexation standard traite le contenu, mais le classeur sémantique, s'il est activé, peut nécessiter un délai supplémentaire pour intégrer et noter les nouveaux documents. Durant cette période, les documents peuvent ne pas être correctement affichés via les requêtes sémantiques, que l'agent utilise souvent par défaut.

    De même, si le schéma d'index a été récemment modifié (par exemple, ajout de nouveaux champs ou modification du format du contenu), et que ces modifications ne sont pas reflétées dans la configuration de la source de données de l'agent, la couche de récupération devient incohérente avec les données réelles.

    Diagnostic et résolution du problème :

    Pour résoudre ce problème théoriquement, vous devez examiner l'ensemble du flux de données (indexation, enrichissement sémantique, récupération et comportement du cache) et vous assurer que toutes les couches sont mises à jour et synchronisées.

    Vous devez :

    • Désactiver ou contourner la mise en cache, en particulier pendant les phases de test, afin de garantir que les récupérations sont basées sur des données réelles.

    • Inspectez les mappages de champs dans la configuration de l'agent pour vérifier que les champs corrects (par exemple, contenu, titre) sont utilisés pour la récupération.

    • Supprimez les filtres inutiles ou augmentez le nombre de documents les plus recherchés pour garantir une couverture de données plus large.

    • Utilisez Search Explorer ou l'API REST pour interroger directement l'index et comparer les différences de réponses.

    • Reconstruisez ou actualisez l'index et assurez-vous que l'enrichissement sémantique est activé et stable.

    Veuillez consulter les documents ci-dessous :

    Azure Cognitive Search – Index Explorer

    Azure OpenAI sur vos données (configuration RAG)

    J'espère que cela vous sera utile. Si vous avez des questions complémentaires, n'hésitez pas à me contacter. Je serai ravi de vous aider.

    **

    N'oubliez pas d'accepter la réponse et de voter positivement chaque fois que les informations fournies vous sont utiles. Cela peut être utile aux autres membres de la communauté.

    Merci !


Votre réponse

Les réponses peuvent être marquées comme Réponses acceptées par l’auteur de la question, ce qui permet aux utilisateurs de connaître la réponse qui a résolu le problème de l’auteur.