bonjour
je souhaiterai bloquer ou bannir un nom de domain qui point vers mon site, j'ai un taux de rebond éléver et dans les logs de ovh j'ai souvent c'est lignes la :
217.182.132.179 www.boutique-pcland-officiel.fr - [10/May/2017:06:54:14 +0200] "GET /ou-acheter-pc-sur-mesure/ HTTP/1.1" 404 34007 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"
164.132.161.42 www.boutique-pcland-officiel.fr - [10/May/2017:06:55:20 +0200] "GET /produit/acheter-cle-uplay-ghost-recon-wildlands/?share=facebook HTTP/1.1" 403 212 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"
83.149.126.98 www.boutique-pcland-officiel.fr - [10/May/2017:06:56:30 +0200] "GET /robots.txt HTTP/1.1" 403 182 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)"
217.182.132.186 www.boutique-pcland-officiel.fr - [10/May/2017:06:57:32 +0200] "GET /produit/pc-bureau-terra-pc-4000/?add_to_wishlist=4259 HTTP/1.1" 200 68730 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.2; +http://ahrefs.com/robot/)"
ce qu'il me déplais car j'utilise pas Ahrefs.com,
sa serait même un bote, puis l'ip change
c'est assez chiant
merci de vos réponse
Bonjour,
et concrètement cela servirait à quoi de le bloquer ce NDD ?
CAr si vous suivez le lien qu'il donne il explique que c'est un crawler (même titre que mj12bot.com / googlebot etc…) et qui respecte le robots.txt qu'il suffit donc d’alimenter (comme l'explique leur site encore une fois).
Cordialement, janus57
AhrefsBot
bonjour @janus57 tu as vus le site ? je n'y vais pas moi sur ce type de site. d'autre part j'ai tout le temps une connexion de dubai qui reste sur la page home, par jour y viens bien 5 a 7 fois et sa fais monter mon taux de rebond pour rien
Le taux de rebond ce n'est que des statistiques internes pour toi…
Sinon quel est le problème ?
La procédure pour qu'il ne vienne plus est expliquée ici https://ahrefs.com/fr/robot
Si c'est l'anglais Google traduction suffit amplement pour ce genre de phrase..
je comprend le les lignes son mis dans mon robots.txt il parle de 1 semaine le temps que le bot comprenne qui doit plus passer,
Qu est ce qui te pose problème ?
ben c'est pas moi qui demande de faire passer le bot sur mon site, pour sa que je veux le bloquer
Le taux de rebond ce n'est que des statistiques internes pour toi…
oui en quelque sorte
ben c'est pas moi qui demande de faire passer le bot sur mon site, pour sa que je veux le bloquer
C'est le principe du Web.. Le site est ouvert à tous vents.
Si tu ne veux plus du robot tu remplis le robots.txt et tu attends quelques heures/jours..
Remplir le htaccess de lignes pour bloquer tel ou tel site ne fera que ralentir ton site au final..
Bonjour,
c'est pas moi qui demande de faire passer le bot sur mon site
ah car vous avez demandé à "majestic.com" (mj12bot.com) alors de passer sur votre site ?
Idem pour les centaines de milliers de robots qui existe ? Idem pour les robots de bruteforce ?
Comme l'a dit @Buddy c'est le bruit de fond de l'internet, et encore là ils sont gentils il respectent le robots.txt, d'autre non (et change de domaine/ip régulièrement).
Cordialement, janus57
sa viens de eux visiblement http://semalt.com/
Sribnokilska St 3a, Kyiv, 02095 Ukraine
me reste plus qu'a bloquer leur bot
ErrorDocument 403 default
SetEnvIfNoCase User-Agent AhrefsBot bad_bot
deny from env=bad_bot
