mardi, 22 décembre 2009
De la métamorphose du captcha
Certains de mes commentateurs ont dû apercevoir ou saisir déjà un morceau de code si l'on voulait publier un commentaire. Cela porte un nom, c'est un captcha. Un rétro-acronyme d'origine anglo-saxonne pour Completely Automated Public Turing Test To Tell Computers and Humans Apart forgé en 2000 à partir des expressions "I catch you" et "I gotta you", soit "vous êtes piégé". En gros, un essai automatique pour voir si vous êtes un être humain et non un robot publicitaire ou une machine voulant extraire des données, le nom de Turing est là pour faire bien et se situer dans l'histoire informatique avec un grand symbole. Le captcha peut dépendre du bloguemestre ou de son serveur, mais on le trouve aussi dans des sites de paiement en ligne. Comme je n'ai pas de compte payant chez monsieur Hautetfort, je ne maîtrise pas du tout l'irruption d'un captcha et je suis aussi obligé de m'y soumettre : cela dépend seulement des attaques de pourriels chez mon fournisseur.
Le captcha a le don d'irriter les lecteurs ou parfois les acheteurs en ligne qui y voient parfois une forme de censure déguisée ou de protection abusive. Il faut dire que d''abord le code mélange le plus souvent chiffres et lettres, les lettres étant aussi bien en bas de casse qu'en capitale, comme dans tout bon code qui se respecte, et le tout n'ayant strictement aucun sens dans aucune langue. C'est un principe de base de la cryptographie. Mais il y a pis ! Le captcha pour ne pas être lu par les machines est écrit en signes légèrement ou énormément déformés sur le même principe que le WordArt (pour ceux qui ont fait de la pré-PAO ou de la PAO). Or les déformations graphiques présentent beaucoup de défauts : parfois les caractères sont trop petits pour être lus correctement, parfois elles sont trop proches, parfois les couleurs trop pâles ne permettent pas la reconnaissance, parfois les signes sont similaires à d'autres puisque cela ne respecte plus les conventions habituelles. Je suppose que bien des personnes se sont énervées devant ces codes à faire rentrer, mais qui étaient systématiquement refusés puisque non valides. Pour les personnes souffrant d'un déficit visuel (le terme recouvre un très grand nombre de situations), c'est un handicap supplémentaire.
Le captcha est donc un emmerdeur. Bien plus grave, il se révèle à présent assez inefficace pour les machines qui peuvent reconstituer les signes de départ, les pourrielleurs et les pirates ont toujours un temps d'avance sur la technique que l'on tente de leur opposer. C'est pourquoi depuis disons environ trois mois, la plateforme de blogues de Google, Blogspot, est venue à des captcha plus aisément reconnaissables et surtout syllabisés : par exemple, je lis sur un blogue de Blogger citions, cloonel, preeph, nolitzo. Cela n'a pas de sens et un seul de ces codes se trouve dans un dictionnaire français, mais c'est un pur hasard. L'algorithme utilisé par Google ne génère plus des signes de manière totalement aléatoire comme cela se fait pour un bon code, les signes sont moins déformés, il n'emploie plus que des bas de casse afin d'éviter les confusions entre signes apparemment identiques comme I et 1 ou O et 0 et surtout il pratique une construction totalement syllabique afin de pouvoir être prononcé par des humains. C'est, je pense, un très grand changement vu la place de Google, parce que cela veut dire que le captcha n'existe plus comme tel et que la protection de ses données doit se trouver ailleurs et autrement qu'avec une formule magique.
11:43 Publié dans La vie des blogues | Lien permanent | Commentaires (0) | Trackbacks (0) | Envoyer cette note | Tags : web, blog, langue française, cryptographie


