Partager via


Utilisation de l’analyse de site pour analyser un site web

par Ruslan Yakushev

L’analyse de site IIS est un outil au sein du Kit de ressources IIS SEO qui peut être utilisé pour analyser les sites Web dans le but d’optimiser le contenu, la structure et les URL du site pour les analyseurs de moteur de recherche. En outre, vous pouvez utiliser cet outil pour découvrir et résoudre les problèmes courants dans le contenu du site qui affectent négativement son expérience utilisateur. L’outil d’analyse de site IIS inclut un analyseur web qui analyse tous les liens et ressources de site disponibles publiquement et qui télécharge le contenu qui sera utilisé pour l’analyse de site.

Analyser un site web

La première étape de l’analyse d’un site Web consiste à analyser toutes les ressources et URL exposées publiquement par le site. C’est ce que fait l’outil d’analyse de site IIS quand une nouvelle analyse de site est créée. Pour que l’outil d’analyse de site IIS analyse un site Web et collecte des données pour l’analyse, procédez comme suit :

  1. Lancez l’outil SEO en accédant au menu Démarrer > Program Files > Extensions IIS 7.0, puis cliquez sur l’icône du kit de ressources SEO.

  2. Dans le volet Connexions, sélectionnez le nœud du serveur. La page principale SEO s’ouvre automatiquement.

  3. Cliquez sur le lien de tâche «Créer une analyse» dans la section Analyse du site.
    Screenshot of the Search Engine Optimization Toolkit startup screen.

  4. Dans la boîte de dialogue Nouvelle analyse, entrez un nom qui identifie de manière unique le rapport d’analyse. Entrez également l’URL par laquelle l’analyseur doit commencer.
    Screenshot of the S E O Toolkit Site Analysis page. The New Analysis dialog box is open.
    Notez que, étant donné que le nœud serveur est sélectionné dans le volet Connexions (nous n’avons pas sélectionné un site Web spécifique sur le serveur), il est possible d’analyser n’importe quel site Web accessible publiquement sur Internet. Pour plus d’informations sur la boîte de dialogue « Nouvelle analyse », reportez-vous à la section «Paramètres du robot d’indexation ».

  5. Une fois que tous les paramètres ont été spécifiés, cliquez sur OK pour démarrer l’analyse :
    Screenshot of the New Analysis dialog box displaying the results of the analysis.
    Les deux nombres signalés lors de l’analyse sont les suivants :

    • Liens traités : il s’agit du nombre total de liens analysés et téléchargés par l’analyseur Web.
    • Liens totaux : il s’agit du nombre total de liens trouvés lors de l’analyse du site Web.

Remarque

que l’analyseur Web s’exécute toujours sur un ordinateur client. Si vous vous connectez à un serveur IIS distant et que vous démarrez une nouvelle analyse, l’analyseur Web sera hébergé dans le processus du Gestionnaire IIS (InetMgr.exe) sur l’ordinateur local connecté au serveur IIS distant. Toutes les données collectées et le contenu web mis en cache sont conservés sur le système de fichiers client local.

Une fois l’analyse du site web terminée, un résumé du rapport d’analyse du site s’affiche. Consultez l’article « Utilisation des rapports d’analyse de site » pour plus d’informations sur la façon d’analyser le site pour le référencement et les problèmes spécifiques au contenu.

Paramètres de l’analyseur web

Les autres paramètres qui peuvent être spécifiés lors du démarrage d’une nouvelle analyse sont les suivants :

  • Nombre maximal de liens : ce paramètre contrôle le nombre de liens uniques qui seront traités et téléchargés à partir d’un site Web pendant une analyse. Un lien est toute URL utilisée dans le balisage d’une page, y compris les liens hypertexte, les références aux fichiers image, les fichiers css et les fichiers javascript. L’augmentation de ce nombre augmente la taille du fichier de rapports et rend le processus d’analyse plus long.
  • Taille maximale de téléchargement par lien : ce paramètre contrôle le nombre de kilo-octets de contenu qui seront téléchargés pour chaque lien. L’augmentation de ce nombre augmente la taille du contenu mis en cache stocké par l’outil d’analyse de site sur le système de fichiers local.
  • Ignorer l’attribut « nofollow » : l’attribut « nofollow » et la balise méta «nofollow» sont utilisées pour indiquer aux analyseurs du moteur de recherche d’ignorer certains ou tous les liens hypertexte d’une page. Il s’agit d’un moyen de protection contre le spam dans les commentaires de blog. Si les pages de votre site utilisent cet attribut, les liens hypertexte de ces pages ne seront pas traités ni analysés pendant l’analyse du site. Notez que les liens vers des ressources telles que des images ou des fichiers css ou javascript seront toujours traités. S’il est nécessaire d’analyser même les liens hypertexte qui utilisent cet attribut, utilisez ce paramètre pour ignorer les attributs « nofollow » et les balises méta.
  • Ignorer la balise meta « noindex » : la balise «noindex» est utilisée pour indiquer aux analyseurs du moteur de recherche de ne pas indexer le contenu de la page. Si les pages de votre site utilisent cette balise méta, le contenu de ces pages ne sera pas inspecté pour trouver des violations. S’il est nécessaire d’analyser même les pages qui utilisent cet attribut, utilisez ce paramètre pour ignorer la balise méta « noindex ».
  • Liens externes : vous pouvez utiliser cette liste déroulante lorsque votre site Web a des sous-domaines ou si vous souhaitez exécuter une analyse sur un répertoire particulier au sein d’un site. Ce paramètre contrôle si les sous-domaines et/ou sous-répertoires doivent être traités comme des liens externes ou internes.

En outre, les paramètres génériques suivants peuvent être configurés pour l’analyseur web en sélectionnant Modifier FeatureSettings dans le volet Actions :

  • Nombre maximal de requêtes simultanées : ce paramètre contrôle le nombre de demandes simultanées effectuées par l’analyseur Web.
  • Répertoire de rapports : spécifie le répertoire sur le système de fichiers local où toutes les données analysées et le contenu du site web mis en cache sont stockés.

Blocage de l’analyseur web de l’outil d’analyse de site IIS

Toutes les requêtes HTTP effectuées par l’analyseur web de l’outil d’analyse de site IIS ont un en-tête HTTP « user-agent » défini sur :

"iisbot/1.0 (+http://www.iis.net/iisbot.html)"

L’analyseur web de l’outil d’analyse de site IIS est entièrement conforme au protocole d’exclusion des robots. Cela signifie que vous pouvez utiliser le fichier Robots.txt pour empêcher l’analyseur web de l’outil d’analyse de site IIS d’analyser votre site web. Vous pouvez l’utiliser pour empêcher d’autres personnes d’exécuter des analyses de site IIS sur vos sites web.

Pour empêcher l’analyseur de l’outil d’analyse de site IIS d’analyser un site Web, ajoutez les lignes suivantes à la fin du fichier Robots.txt situé dans le répertoire racine du site :

User-Agent: iisbot
Disallow: /

Résumé

Vous avez maintenant configuré l’outil d’analyse de site IIS pour l’analyse d’un site Web et la collecte de données sur le contenu et la structure de ce site. Pour plus d’informations sur la façon d’analyser les données collectées à l’aide de rapports Analyse de site, reportez-vous à « Utilisation des rapports d’analyse de site ».