Projet

Général

Profil

Evolution #4103

Autoriser /local/cache-gd2/ et /local/cache-vignette/ dans robots.txt

Ajouté par jean marie il y a 8 mois. Mis à jour il y a 5 mois.

Statut:
En cours
Priorité:
Normal
Assigné à:
Version cible:
Début:
27/02/2018
Echéance:
% réalisé:

0%

Resolution:

Description

Pour fournir les images à la "bonne taille", le plugin Métas+ les redimensionne (cf https://zone.spip.org/trac/spip-zone/browser/_plugins_/metaplus/branches/v1/inclure/metasplus.html#L30 ).
De fait, les images se retrouvent dans /local/. Le soucis, c'est que /local/ est interdits aux robots par robots.txt (pour des questions de perf je crois), donc Twitter chouinne (cf log ci-dessous) alors que c'est le but.

Le log du validator ( https://cards-dev.twitter.com/validator ) :
INFO: Page fetched successfully
INFO: 35 metatags were found
INFO: twitter:card = summary_large_image tag found
INFO: Card loaded successfully
WARN: The image URL http://www.domaine.net/local/cache-gd2/6b/8d4f9ad77b1817e55de4ff171d8565.png?1515680421 specified by the 'twitter:image' metatag may be restricted by the site's robots.txt file, which will prevent Twitter from fetching it.

Il faudrait autoriser /local/cache-gd2/ et sans doute aussi /local/cache-vignette/ comme ça a été fait pour /local/cache-css/ et /local/cache-js/.

Voir l'échange sur la liste : https://www.mail-archive.com/spip-zone@rezo.net/msg45211.html

Historique

#1 Mis à jour par jean marie il y a 8 mois

oups, j'ai oublié le bon sujet : Autoriser /local/cache-gd2/ et /local/cache-vignette/ dans robots.txt

#2 Mis à jour par b b il y a 8 mois

  • Projet changé de SPIP à Squelettes Dist
  • Sujet changé de Autoriser à Autoriser /local/cache-gd2/ et /local/cache-vignette/ dans robots.txt
  • Version cible mis à 3.3

#3 Mis à jour par jluc - il y a 8 mois

N'y a t il pas d'autres dossiers, pour gd1, convert et les autres librairies proposées par SPIP ?
(et 'distant' il est où ?)

#4 Mis à jour par b b il y a 8 mois

N'y a t il pas d'autres dossiers, pour gd1, convert et les autres librairies proposées par SPIP ?

D'après ce que j'en ai vu après avoir fait le tour de quelques sites, les vignettes sont dans cache-gd2 quelle que soit la librairie utilisée.

(et 'distant' il est où ?)

Hors sujet, on parle ici des images retaillées, et non des images pleine taille (cf le thread sur la liste).

#5 Mis à jour par b b il y a 8 mois

  • Statut changé de Nouveau à En cours
  • Assigné à mis à b b

#6 Mis à jour par cedric - il y a 8 mois

Je ne sais pas si il faut Allow tout /local/cache-gd2/ avec l'impact que du coup toutes les images réduites de tout le site vont se retrouvées parsées et indexées, ou si il faut provisionner un dossier /local/indexable/ (ou meilleur nom à trouver) et un filtre image_indexable qui se charge de faire une copie de l'image dans ce dossier, qu'on rendrait visible du coup ?

#7 Mis à jour par RastaPopoulos ♥ il y a 8 mois

Si c'est seulement pour quelques rares images très précises qu'on sait cibler, c'est sûrement mieux de le demander explicitement dans le code oui…

#8 Mis à jour par jean marie il y a 7 mois

Sur certains sites (photographes, architectes, graphistes...) c'est intéressant de retrouver les images dans les moteurs.

Pour ce qui tes des dossiers, chez moi, j'ai 3 cas :
  • /local/cache-vignettes/
  • /local/cache-gd2/
  • /IMG/png/NOM_DU_FICHER-respXXX.png (XXX étant la taille de l'image)

Le dernier cas, c'est https://plugins.spip.net/image_responsive.html qui le gère à coups d'URL Rewriting (cf https://zone.spip.org/trac/spip-zone/browser/_plugins_/image_responsive/ajouter_a_htaccess.txt ).
Les deux 1ers, je n'arrive pas bien à voir la différence : cache-vignettes pour les images de contenu (insérées par les rédacteurs) et cache-gd2 pour les images du squelette ?

#9 Mis à jour par nico d_ il y a 7 mois

avec l'impact que du coup toutes les images réduites de tout le site vont se retrouvées parsées et indexées

Et c'est pas bien ?
C'est le choix qui a été fait par défaut dans le robots.txt, mais je ne sais pas vraiment pourquoi.
Performance ? confidentialité ?

#10 Mis à jour par Franck D il y a 5 mois

cedric - a écrit :

Je ne sais pas si il faut Allow tout /local/cache-gd2/ avec l'impact que du coup toutes les images réduites de tout le site vont se retrouvées parsées et indexées, ou si il faut provisionner un dossier /local/indexable/ (ou meilleur nom à trouver) et un filtre image_indexable qui se charge de faire une copie de l'image dans ce dossier, qu'on rendrait visible du coup ?

Hello :-)
"Si" la raison historique, c'est une histoire de "confidentialité", alors faut garder cette possibilité !
Par contre, ne faudrait-il pas un bouton "indexation" dans un sous-menu du menu "configuration" ?
Un truc du genre "Indexation de tous les documents oui/non" ? Cela permettrait de garder le fonctionnement actuel car il serait pas défaut, mais aussi que les simples utilisateurs aient le choix ?

Après, à ceux qui auraient un besoin "particulier" de faire un plug pour "affiner" l'indexation (uniquement les logos, ou que certains documents qui serait dans la médiathèque ( via l’apparition d'une case à cocher/décocher dans /ecrire/?exec=documents par exemple)

#11 Mis à jour par jean marie il y a 5 mois

Franck D a écrit :

"Si" la raison historique, c'est une histoire de "confidentialité", alors faut garder cette possibilité !

Faudrait sans doute voir quels sont les cas où la confidentialité prime sur l'indexation et si ces cas sont majoritaires ou pas, non ?
Dans mon cas, à partir du moment où une image est visible sur une page, je considère qu'elle doit être indexée car c'est du contenu et un point d'entrée au même titre que le texte (recherche par image).
Toujours dans mon cas, les cas de confidentialités sont gérés en empêchant les robots d'indexer l'intégralité du site ou via des zone avec le plugin Accès Restreint.
En fait, j'ai du mal à voir les cas où la confidentialité primerait mais il y en a surement.

L'autre raison évoquée sont les perfs. Là pareil, je dirais que l'indexation prime.

#12 Mis à jour par b b il y a 5 mois

Hop,

Dans mon cas, à partir du moment où une image est visible sur une page, je considère qu'elle doit être indexée car c'est du contenu et un point d'entrée au même titre que le texte (recherche par image).

C'est plus fin que ça, autoriser l'indexation de local/ ferait que toutes les tailles de vignettes d'une images seraient indexées par les moteurs alors que l'image originale l'est déjà (ce qui suffit amplement). De plus, cela pourrait générer pas mal de trafic en plus sur les sites uniquement pour indexer des images "non utiles aux visiteurs", bref ça ne serait pas super écolo :p

#13 Mis à jour par RastaPopoulos ♥ il y a 5 mois

Par ailleurs ça ne change rien aux restrictions : tu aurais beau restreindre des contenus, et donc y compris des documents, avec Accès Restreint, et bien les images transformées dans local/ elles ne seront pas restreintes, jamais.

Formats disponibles : Atom PDF