Lorsque vous désirez interdire aux robots des moteurs de recherche l'accès à un fichier ou à un répertoire de votre site, il suffit de créer un fichier robots.txt et de le placer à la racine de votre site. Ce fichier contient des commandes dont la syntaxe est relativement simple :
|
#robots.txt pour le site http://www.monsite.com
User-agent: * User-agent: WebCrawler Disallow: /rep/sousrep/ Disallow: /fichier.html Disallow: / Disallow: |
La commande User-agent:* signifie que la requête s'applique à tous les moteurs. Si un robot est spécifié à la place de l'étoile, alors seul ce robot n'aura pas accès aux pages et répertoires du sites énumérés.
Les lignes suivantes indiquent aux robots de ne pas visiter dans l'ordre :
Tandis que la dernière commande autorise un accès sans restriction au site.
Pour en savoir plus sur le sujet, consultez le document The Web Robots Pages.