.htaccess et caractère "espace" dans une URL

Bonjour,

J'ai un souci avec une URL erronée et l'usage du .htaccess.

Une ancienne page comporte, par erreur, un espace dans son URL et elle n'est pas trouvée
https://assiste.com/Vider_ la_Corbeille_de_Windows.html

Le serveur la trouve à :
https://assiste.com/Vider_%20la_Corbeille_de_Windows.html

J'ai réécrit cette page et corrigé son URL
https://assiste.com/Vider_la_Corbeille_de_Windows.html

Dans le .htaccess, la redirection
https://assiste.com/Vider_ la_Corbeille_de_Windows.html
vers
https://assiste.com/Vider_la_Corbeille_de_Windows.html
ne donne rien.

Si, dans le .htaccess, je fais la redirection
https://assiste.com/Vider_%20la_Corbeille_de_Windows.html
vers
https://assiste.com/Vider_la_Corbeille_de_Windows.html
il y a un plantage du serveur (le site n'est plus accessible).

Où est l'erreur ? Un paramétrage côté serveur ? Le caractère & en [url=https://assiste.com/SEO_et_Webmastering/Tableau_de_conversions_des_caracteres_ASCII.html]entité[/url] ?

Merci,


https://assiste.com/Vider_ la_Corbeille_de_Windows.html


Bonjour @PierreP8

Dans quelle page de ton site se trouve ce lien vers https://assiste.com/Vider_ la_Corbeille_de_Windows.html ?

Bonjour, Gaston_Phone,

Si je fais une recherche avec un moteur, il me répond :

https://www.qwant.com/?q=vider+la+corbeille+de+Windows+site%3Aassiste.com&l=fr&btnG=Go&t=web
https://assiste.com/Vider_%20la_Corbeille_de_Windows.html

https://www.google.com/search?q=vider+la+corbeille+de+Windows+site%3Aassiste.com&newwindow=1
https://assiste.com/Vider_%20la_Corbeille_de_Windows.html

Dans le site, par exemple
https://assiste.com/Entretien_periodique_d_un_PC_sous_Windows.html#p19
Là, l'accès vers cette URL erronée est bon.

Cordialement,

Pierre

Bonsoir @PierreP8

Le pb semble être seulement chez GOOGLE. à oublier.

Bonjour, Gaston_Phone,

Avant de poursuivre avec le %20 qu'utilisent tous les moteurs, est-ce qu'il y a une limite à la taille d'un .htacess ou son nombre de lignes ? Je suis en mutu.

Question subsidiaire : est-ce que les 301 dans le .htacess sont à conserver à vie ou en combien de temps est-ce que les mises à jour des sitemaps sont prises en compte par les moteurs (en combien de temps ils finissent par oublier une URL qui n'est plus dans les sitesmap ?).

Cordialement,

Pierre

Bonjour @PierreP8

Mon .htaccess fait 547 lignes et fonctionne très bien.


est-ce qu'il y a une limite à la taille d'un .htacess ou son nombre de lignes ?


En principe (à ma connaissance) non ! Mais il faut quand même pas exagérer, s'il y a beaucoup de lignes ça risque de ralentir le site.


est-ce que les 301 dans le .htacess sont à conserver à vie ou en combien de temps


S'il a des liens externes vers ces pages (depuis d'autres sites web) il vaut mieux de les garder.


en combien de temps est-ce que les mises à jour des sitemaps sont prises en compte par les moteurs (en combien de temps ils finissent par oublier une URL qui n'est plus dans les sitesmap ?)


Difficile à dire les moteurs de recherche font ce qu'ils veulent et se tiennent pas toujours aux sitemaps.

Petite remarque :
Il est plutôt déconseillé d'utiliser des lettres en majuscules et des underscores ("_") dans les url. Il vaut mieux séparer les mots avec des tirets ("-")

https://www.webrankinfo.com/dossiers/conseils/pas-undescore-dans-url

Bonjour, vous deux,

Mon .htaccess faisait 1126 lignes avant la rencontre de ce problème avec le %20 dans une URL.
J’ai obtenu alors le message

« Internal Server Error
The server encountered an internal error or misconfiguration and was unable to complete your request.
Please contact the server administrator at postmaster@assiste.com to inform them of the time this error occurred, and the actions you performed just before this error.
More information about this error may be available in the server error log. »

J’ai alors viré la ligne 301 avec le %20 et le .htaccess fonctionne.
J‘ajoute une 301 « normale » et « Internal Server Error ».
Je recherche alors s’il y a d’autres lignes avec des %xx et en trouve plusieurs qui ne gênaient pas le serveur par le passé. Je les vire et toujours « Internal Server Error ». Plus d’accès au site !
J’extrais la totalité des 301 et tout fonctionne.
Je réintroduis les 301 par petits paquets pour tenter d’identifier une ligne fautive.
Peu avant une taille totale proche de 100 KO (97,523 KO) du .htaccess, je ne peux plus rien ajouter sinon re « Internal Server Error ». C’est nouveau, sauf erreur de ma part. L'admin du serveur aurait-il changé quelque chose ?
Mon problème est que de nombreuses pages du site remontent à très longtemps, à une époque où tout était en vrac à la racine et c’est là que les moteurs les ont indexées.

Cordialement,

Pierre


Mon .htaccess faisait 1126 lignes avant la rencontre de ce problème avec le %20 dans une URL.

Bonjour @PierreP8

En règle générale, éviter les espaces dans les adresses de pages et les chemins/noms de fichiers.

Même règle pour les caractères accentués.

J’ai alors viré la ligne 301 avec le %20 et le .htaccess fonctionne.
J‘ajoute une 301 « normale » et « Internal Server Error ».
Je recherche alors s’il y a d’autres lignes avec des %xx et en trouve plusieurs qui ne gênaient pas le serveur par le passé.


Dans les htaccess la signe % et parfois utiliser pour autre chose

`%1 Refers to a pattern matched in a RewriteCond condition, while $1 refers to a pattern matched inside a RewriteRule.`

https://stackoverflow.com/questions/6654834/difference-between-1-vs-1-in-htaccess

peut être ça peut t'aider pour ton problème "%20"

https://stackoverflow.com/questions/35368651/htaccess-rewrite-blank-spaces-with-20-to

https://stackoverflow.com/questions/25288118/htaccess-url-rewrite-and-removing-20

J'utilise beaucoup le terme "cauchemar" actuellement.

Comment est-ce que j'écris l'URL notepad++.html ?

J'ai une page notepad++ en ligne. Je ne la trouve même pas ! Personne ne la trouve !

Merci,

Pierre

Bonjour
Serait-ce celle-ci ? https://assiste.com/Logitheque/Notepad.html
Ou celle-ci ? https://assiste.com/Notepad++.html
Ou une autre ?


Comment est-ce que j'écris l'URL notepad++.html ?


mois je utiliserais notepad-plus-plus.html
Wikipedia a fait un truc pas terrible

`https://fr.wikipedia.org/wiki/Notepad%2B%2B`
Elle existe aussi dans un autre contexte. https://assiste.com/Desinstaller_completement/Notepad-plus-plus.html
Bonjour,<br /><br />MaryS<br />&gt; Elle existe aussi dans un autre contexte. https://assiste.com/Desinstaller_completement/Notepad-plus-plus.html1<br />Ça, c&#39;est un article plutôt orienté vers la suppression des bloatwares et probables PUP. Normalement, ces articles devraient arriver en dernier, car la priorité, dans le sitemap, est basse. Je m&#39;interroge sur la gestion des priorités par Qwant.<br /><br />kingkurt<br /><blockquote><br />moi j&#39;utiliserais notepad-plus-plus.html<br />Wikipédia a fait un truc pas terrible<br /><br />https://fr.wikipedia.org/wiki/Notepad%2B%2B<br /></blockquote><br />Oui, mais Wikipédia a raison. Je crois qu&#39;il faut simplement donner au serveur quelque chose, un paramètre, pour qu&#39;il convertisse automatiquement les caractères spéciaux des URLs.<br /><br /><br />kingkurt<br /><blockquote><br />Dans les htaccess la signe % et parfois utiliser pour  autre chose<br /></blockquote><br />Oui, mais ces usages sont internes au .htaccess, rien à voir avec les URLs;<br />Exemples :<br />#Forcer HTTPS<br />RewriteCond %{SERVER_PORT} 80<br />RewriteRule ^(.*)$ https://assiste.com/$1 [R&#61;301,L]<br /><br />#Forcer appels AVEC www vers SANS www (SEO - évite la qualification en duplicate content)<br />RewriteCond %{HTTP_HOST} ^www.assiste.com$ [NC]<br />RewriteRule ^(.*) https://assiste.com/$1 [QSA,R&#61;301,L]<br /><br /><br />Gaston_Phone<br /><blockquote><br />Bonjour &#64;PierreP8<br /><br />En règle générale, éviter les espaces dans les adresses de pages et les chemins/noms de fichiers.<br /><br />Même règle pour les caractères accentués.<br /></blockquote><br /><br />Ça, je vais m&#39;en souvenir et corriger.<br /><br />kingkurt<br /><blockquote><br />Petite remarque :<br />Il est plutôt déconseillé d&#39;utiliser des lettres en majuscules et des underscores (&#34;_&#34;) dans les url. Il vaut mieux séparer les mots avec des tirets (&#34;-&#34;)<br /></blockquote><br />C&#39;est un problème. Le trait d&#39;union, comme son nom l&#39;indique, lie des mots qui forment un nom, comme dans Ad-Aware, mais dans Ad-Aware polémique, l&#39;espace doit être remplacé par un underscore (à mon sens), ce qui donne <br />https://assiste.com/Logitheque/Ad-Aware_polemique.html<br /> <br />Cordialement et merci à tous.<br /><br />Pierre

C'est un problème. Le trait d'union, comme son nom l'indique, lie des mots qui forment un nom, comme dans Ad-Aware, mais dans Ad-Aware polémique, l'espace doit être remplacé par un underscore (à mon sens


Google interpréte :

> Why Do Hyphens in URLs Matter?
> Underscores in URLs aren’t recognized by Google, a URL containing "my_page" will look like “mypage”. A URL containing “my-page” will be interpreted as “my page”. This matters because “my page” is easier for Google to interpret, making it appear more relevant to queries about the “my page” topic (“what is my page”, “how to create my page”, etc.).

> The easier it is for Google to read and interpret the URL, the easier it is to determine relevance (and thusly rankings) for a search query.

> Say, for example, you have a page about weight loss tips. You have to choose between two URL structures: tips_for_weight_loss or tips-for-weight-loss. If you choose the first one, Google will only see “tipsforweightloss”, which will be harder for it to understand.

https://www.woorank.com/en/blog/underscores-in-urls-why-are-they-not-recommended

Oui je sais il y'a 20 ans on utilisait encore beaucoup des_underscores aujourd'hui il n'y a presque plus personne qui fait ça ! Pour moi perso de voir des underscores dans les hyperliens est même un indice pour un vieux site pas mis à jour depuis très longtemps. Autant que les urls qui contient l'extensions fichiers et qui finissent par .html, .php ou .asp par ailleurs.

Et les majuscules dans les URLs sont plutôt nocifs.
Personne ne va taper à la main "www.lesite.com/commet-utilser-Windows" et "www.lesite.com/commet-utilser-windows" donne un erreur 404 dans ce cas

Bonjour, kingkurt,

Peux-tu me dire où j'ai rangé l'aspirine ?


Peux-tu me dire où j'ai rangé l'aspirine ?


Peut être dans les chaussettes ?
Non un peu sérieusement, dans le cas de ton site je ne sais pas si ça vaut la peine de mettre des milliers des lignes dans le .htaccess pour changer quelques URLs