vendredi, 09 juin 2006
Autogooglerie
Je ne me livre pas au jeu des googleries comme d'autres blogueurs, ma plateforme ne permet pas de voir les requêtes. En revanche, il m'arrive de faire de l'autogooglage pour voir un peu où je serais cité. Comme d'habitude, j'ai pris Google, Yahoo! et MSN pour voir ce que l'on a retenu de l'adresse ou du titre. 1) Moteurs configurés avec les pieds et dont les pages miroirs sont reprises ailleurs
Je suis cité dans une demande sur le paranormal ! Allan Kardec, sors immédiatement de ce blogue et de Lycos ! J'ai parlé de la couleur orange comme adjectif d'un point de vue grammatical et c'est pris dans le moteur de Cegetel pour une demande sur les générateurs de codes de cartes chez Orange ! J'avais écrit un texte sur la graphie de pâtisserie (avec ou sans accent) et il se retrouve dans une recherche sur paticerie. Le fait d'avoir écrit que ce ne serait pas un Skyblog me vaut l'honneur d'être dans Omopo pour une recherche étrange : mare de Skyblog à poil. Gada (une sorte de métamoteur) me cite dans une demande sur le PRG et je me demande si j'ai parlé un jour du Parti radical de gauche. Un moteur ramène le Champignacien à propos du haut Jura vu par Ramuz, je n'ai pas compris le sens de la demande depuis la dernière fois : delice de la mer au bleu du haut Jura. Plus loin, on a un très mauvais moteur : je suis cité pour camion 1974 détours (cela commence à faire tout un film, peut-être de Duras ou de Spielberg). Il s'agit en fait de trois textes distincts où se trouvent les trois mots. Les autres recherches avec ce moteur sont : ajouter obscur musique page l'usine, accentuer table luminaire, village alpestre du département 56 (le Morbihan !), archiver le cavalier facile de revue. Je m'interroge sur les motivations des personnes qui ont formulé de telles demandes. Le texte sur les blogues de bébé a eu des conséquences : je suis dans la recherche bébé homonyme énumérer (tous ces mots sont sans doute dans plusieurs billets d'une même archive).
2) Textes volés
Un courrier de Jean-Claude qui parle de sa femme se retrouve en texte caché dans un site qui parle de photos femmes nues vestiaire douche. Jean-Claude n'aimera pas. Un texte sur les Skyblogs pour une page où on évoque les putte maroc (le mot clé qui a été pris est blog). Quelques passages qui ont été passés à la moulinette d'un générateur de texte brut pour une bande défilante : Petit Champignacien mon Dicomoche fil bénéficiez du on rendre , des sort de magie noire , nature (site de salope noire). C'est pire que lire un roman de William Burroughs tout en cut-up ! J'ai encore Penetration bites chatte, ce qui ne laisse pas de m'interroger. Ah ! et plus de femmes rousses maintenant, on respire !
Mon constat est assez net pour cette troisième revue. Les moteurs de recherche ont fourni un vrai effort pour éliminer les sites de margoulins qui placent du texte brut en cache sous le texte image. Plus de sites de médicaments, d'herbes, de bouffe, de régime, etc. Le ménage a été fait en grande partie. Les quatre sites pornos qui ont volé du texte sont tous récents et les anciens ne sont plus présents, je n'ai vu aucune occasion de rencontre gay par exemple cette fois. Google était particulièrement à la traîne en acceptant de relayer les pages miroirs de requêtes effectuées sur de petits moteurs mal configurés, elles n'apparaissent pratiquement plus, mais au vu du nombre de pages revendiquées (huit à dix fois plus que Yahoo!) il doit y avoir une quantité de pages miroirs qui ne sont pas montrées, mais qui sont bien indexées dans sa base de références. En revanche, MSN est le moteur qui filtre le moins et qui était déjà en bas du classement. Google me semble meilleur pour la recherche avec citation précise, mais toujours aussi tricheur sur ses chiffres.
Un autre problème est celui du bruit. En dehors des associations surréalistes de mots qui figurent en fait dans des billets différents et qui se retrouvent dans des demandes invraisemblables, il y a certains mots qui vont forcer des rapprochements de moteurs en miroir parce que ce sont des mots de recherches fréquentes comme femme, bébé, Skyblog. Le parasitage est mineur et n'intervient qu'assez tard, après les cent premières occurrences pour Google, mais on n'a pas accès aux pages qui se trouvent dans l'index des moteurs pour voir s'il n'y a pas de fausses occurrences (les pages provisoires de recherche sur d'autres moteurs) un peu cachées pour gonfler les chiffres. Je crois que le gros problème des moteurs sera le fait de faire référence à d'autres moteurs, comment et sous quelle forme, avec quels filtres ?
21:53 Publié dans La vie des blogues | Lien permanent | Commentaires (1) | Envoyer cette note



Commentaires
L'une de mes googleries les plus mémorables : "jeu écrivain flash". Je me demande encore si la personne qui a tapé ça cherchait un jeu animé en Flash pour se mettre dans la peau d'un écrivain, ou un jeu à gratter express à l'effigie d'écrivains célèbres...
Écrit par : Irène Delse | samedi, 10 juin 2006
Écrire un commentaire