mardi, 27 juin 2006

Tags

Je lis sur plusieurs blogues H&F que certains blogueurs regrettent les communautés et ne comprennent strictement rien au fonctionnement des tags ou étiquettes. Les communautés présentaient énormément de défauts. Il fallait déjà les créer, puis s'y abonner pour pouvoir y écrire. C'est un mode fort rigide. Cela donnait des petits groupes fermés, repliés sur eux-mêmes et fonctionnant en boucle. En outre, les intitulés de la plupart de ces communautés étaient tout ce qu'on veut sauf clairs et intelligibles : ils ressemblaient plus à un titre qu'à un mot clé ou un centre d'intérêt. Enfin, ces communautés n'étaient pas vraiment bien indexées par les moteurs de recherche.

Lorsque quelqu'un créait une communauté, il pouvait la détruire à tout instant. Les abonnés se retrouvaient devant une page inexistante. Ce n'est plus possible : il n'y a plus de propriétaire unique d'une étiquette. Le système est totalement ouvert et libre. La création d'une étiquette prend juste le temps d'écrire le mot. En outre, on peut choisir des étiquettes qui correspondent bien à des mots clés pertinents et adaptés à chaque billet. Cette souplesse fait peur à certains. Les anciennes communautés ont été reprises dans les archives des étiquettes, mais on peut voir encore ces groupuscules aux noms obscurs qui continuent à vivre. En tout cas, l'archivage a gagné en clarté puisque désormais les étiquettes sont accessibles par mois différents.

Cependant, il y a un problème : les étiquettes fonctionnent assez bien sur Yahoo! qui est le moteur par défaut de H&F, mais elles ne sont pas encore reconnues chez Technorati qui est pourtant lié maintenant à Yahoo! Sont reconnues alors comme étiquettes les catégories. Mais c'est sans doute une question de temps. Je n'ai pas encore fait le tour des moteurs spécialisés ou des agrégateurs pour voir les reprises. Je sais seulement que mes limericks ont gagné d'un coup en visibilité chez Yahoo! alors qu'ils étaient très mal référencés.

Pour les intitulés des étiquettes, il y a un nombre limité de thèmes. Le premier est la politique, premier mot clé et un quart des étiquettes, peut-être un tiers si on prend les termes associés. Mais ce qui concerne la littérature occupe une large place aussi, troisième mot clé et environ un dixième des étiquettes. Je suis frappé par deux faits. A) Les mots clés génériques dominent. Les catégories politique, littérature ou enseignement sont extrêmement vastes et cela donne un fourre-tout où il ne sera pas facile de se repérer. Il y a aussi des mots clés assez confus comme écriture, ce qui ne veut rien dire. Parfois on a la reprise d'une catégorie prédéfinie comme blog dont on ne sait pas ce qui se range dedans. B) Il y a une faible minorité de termes très spécifiques qui sont associés soit à des personnes, des blogueurs, soit à une ancienne communauté. Le fait va durer à mon avis puisque ce système d'étiquettes est mal compris de la part des personnes qui sont en dehors du Web DeuxPointZéro et elles sont nombreuses. Il existe aussi des doublons par exemple photographie, photographies, photo, photos, etc. C'est inévitable à partir du moment où on multiplie les graphies pour être bien référencé. Je me suis demandé d'ailleurs si je ne devais pas livrer une version anglaise de mes étiquettes.

Personnellement, j'ai apprécié de voir dans l'interface H&F des termes associés, de pouvoir naviguer par analogie ou bien de voir les blogues les plus actifs avec une étiquette, de savoir s'il y a des photos. J'ai été aussi agréablement surpris de voir une de mes étiquettes rares figurer parmi les cent premières, celle sur le surréalisme, mais c'est parce qu'elle en a croisé d'autres identiques et dans la même période de temps (la période d'activité compte). En revanche, les autres étiquettes associées à ce billet n'ont pas été mises en avant car elles étaient sans doute uniques. Les rapprochements de blogues sont décloisonnés par ce système et c'est une excellente chose tellement les communautés sentaient le moisi. Mais cela suppose de la prudence, on ne va pas écrire un texte assassin sur le FN ou le MPF en lui posant les étiquettes utilisées par les gens de cette tendance, ou alors on risque de gros désagréments et on doit être prêt à manier le manche de pioche et la batte de base-ball. Cela demande donc de la réflexion et de l'adaptation au moment de la publication du billet et non plus des approches mécaniques comme avec les communautés.

lundi, 26 juin 2006

Indexations pourries

C'est un article de Libération qui signale la condamnation d'un médecin pour référencement abusif :

Un informaticien lui explique qu'il est victime d'un procédé vieux comme Internet, le spamindexing, très utilisé par les sites porno notamment. La technique consiste à inscrire des mots-clés dans un bloc de texte caché : ils sont enregistrés en caractères minuscules, de même couleur que le fond d'écran. Invisibles pour le visiteur, ils amènent l'internaute vers le site en question à chaque fois qu'ils sont tapés sur un moteur de recherche. De vraies balises de guidages.

Jean Véronis a fort bien expliqué la manœuvre dans ses études pornométriques. J'en suis moi-même victime, avec d'autres blogues ou sites qui m'ont lié. Si on cherche le Petit Champignacien, on obtient entre 48 000 et 62 000 pages qui correspondent pour une faible part à la mention du titre dans des pages d'archives, des liens, des agrégateurs, des annuaires.