lundi, janvier 31, 2005

Technologies du Langage: Web: Comptes bidons chez Google ?


Suite a l'excellent article de Jean Véronys, toujours troublé par l'arbitraire (et l'absolu.. ;) ),
Je me suis demandé quel était le premier site présent dans l'index international et pas dans l'index "english only".

En effet dans la version anglaise (advanced english only) lorsque l'on tape "the" on a
(en tout cas pour moi) 74.500.000 réponses et dans la version .com mondiale on a 8.000.000.000 de réponses (1 beau chiffre rond!).

Il doit donc y avoir des résultats en plus dans l'index international!

Et donc un premier site qui apparait dans l'index de la recherche mondiale et pas dans l'index english only.

En toute logique il doit s'agir d'un site non anglophone.

Ceci dit, comme, comme J.Véronys l'a bien montré, il y a forcément des sites anglophones oubliés.
Ceci ne peut être qu'arbitraire au vue de l'objet recherché ("The" est neutre).

Robin des bois dans l'ame, je m'en vais moi Loran défendre le Faible encore inconnu face au fort GOOGLE, en dénoncant l'imposture. En trouvant ce pauvre site en anglais mangé a la sauce de google.


Le premier résultat est le site de la maison blanche dans les deux cas.
Continuons... pas de différences jusqu'a la page 6...
Que des sites en anglais des deux cotés ... logique....

Le premier résultat étonnant et le 54 ème. Puisqu'il s'agit
du site du Louvre....
Qui a dans les deux cas comme titre de lien: "Site Officiel du Musée du Louvre"
et comme description: " Site officiel du musée du Louvre".

C'est sans doute une petite coquille liée au fait que le moteur affiche la page
de la racine du site...
Mais bon dans la recherche uniquement en anglais, ca fait désordre.


Et ensuite trois résultats plus loin patatra.... C'est la faute de carre....

D'un coté (page anglophone) on a "the internet archive" (url www.archive.org)
et de l'autre ..... microsoft (www.microsoft.com)...


Donc reprenons le classement de cette 6 eme page pour la version english only:

51 - weatherpixie.com
52 - www.discovery.com
53 - www.hwg.org
54 - www.louvre.fr
55 - www.historychannel.com
56 - www.bl.uk/index.shtml
57 - www.archive.org
58 - www.biblegateway.com
59 - www.theatlantic.com
60 - www.redcross.org/



pour la version internationale:

51 - weatherpixie.com
52 - www.discovery.com
53 - www.hwg.org
54 - www.louvre.fr
55 - www.historychannel.com
56 - www.bl.uk/index.shtml
57 - www.microsoft.com
58 - www.archive.org
59 - www.biblegateway.com
60 - www.theatlantic.com


Dans l'index English only pas de MS!
Or cet index est en général en avance en terme d'implémentation de nouveaux algos.
Serait ce a dire qu'on aura peut-etre, bientot, le meme resultat dans l'index mondial?


Une pensée fugace traverse mon esprit partial....
"Et si finalement je denoncais rien du tout!" :o)


Bon continuons... A partir de la, en toute logique on doit avoir
au moins un decalage de 1.... puisque d'un cote on a Microsoft
et de l'autre on l'a pas...
En suivant cette logique, dans la version internationale on doit avoir en 61 the redcross...
Fébrile je clique sur next....

Patatra again:

Des deux cotés on a Sun... (java.sun.com) en 61.

"La main invisible" de Google a enlevé Microsoft pour le remplacer
par La croix rouge.

Finalement je vais rien dire du tout!! :)

(Je sais j'y vais peut etre un peu fort, les googleboys n'ont pas forcement volontairement
enlevé de la recherche sur "the" Microsoft. Mais bon il est quand meme curieux qu'au moment
ou MS devient concurrent de Google, on ait ce genre de phénomène. Je sais ce n'était pas testé avant).

Continuons, puisque ca redevient pareil allonz'y voir ou ca dérape encore...


Résultat surprenant au vu de ce qu'on a eu précédement on a des 2 cotés:
69 - www.microsoft.com/windows/ie/ (Internet Explorer Home)


Et ensuite a partir de 71 on a une divergence marquée avec d'un cote (Anglais):

71 - www.the-dma.org

et de l'autre

71 - www.thesun.co.uk


Sans pouvoir bien expliquer pourquoi mais bon...

au gnouf donc ma cape et mon épée rédemptrice...
En voulant sauver la veuve, j'ai mis la main sur un complot mondial!!
:o)





mardi, janvier 25, 2005

LE Google Blog

ou on apprend qu'un nouvel attribut rel="nofollow" va etre promu afin de de ne plus permettre de google bombing grace, entres autres, aux commentaires de blogs.

Ceci provoque une réaction indignée de la dark SEO team. a Lire ici

lundi, janvier 24, 2005

Netcraft: What future for Google?

Je bloggue cet article exhaustif (qui date un peu) sur google ici.
Cela permettra de remettre facilement la main dessus.
Un article passionnant du Monde

L'auteur Jean-Noël Jeanneney, explique en quoi un moteur comme Google represente un danger pour la pluralité des idées.

IL conclut en lancant un appel au politique, pour une réaction européenne.

A retenir, entres autres, basé sur son expérience personnelle (il a organisé certaines des festivités du bicentenaire de la révolution en 1989):

"Le vrai défi est ailleurs, et il est immense. Voici que s'affirme le risque d'une domination écrasante de l'Amérique dans la définition de l'idée que les prochaines générations se feront du monde. Quelle que soit en effet la largeur du spectre annoncé par Google, l'exhaustivité est hors d'atteinte, à vue humaine. Toute entreprise de ce genre implique donc des choix drastiques, parmi l'immensité du possible. Les bibliothèques qui vont se lancer dans cette entreprise sont certes généreusement ouvertes à la civilisation et aux ?uvres des autres pays. Il n'empêche : les critères du choix seront puissamment marqués (même si nous contribuons nous-mêmes, naturellement sans bouder, à ces richesses) par le regard qui est celui des Anglo-Saxons, avec ses couleurs spécifiques par rapport à la diversité des civilisations.

Je garde en mémoire l'expérience du Bicentenaire de la Révolution, en 1989, quand j'en dirigeais les manifestations. Il eût été délétère et détestable pour l'équilibre de la nation, pour l'image et la connaissance qu'elle avait d'elle-même, de son passé, des événements, lumineux ou sombres, qu'il nous revenait de commémorer, d'aller chercher dans les seules bases de données anglaises ou américaines un récit et une interprétation qui y étaient biaisés de multiples façons : Le Mouron rouge écrasant Quatre-vingt-treize, les vaillants aristocrates britanniques triomphant des jacobins sanguinaires, la guillotine occultant les droits de l'homme et les intuitions fulgurantes de la Convention. "

...

vendredi, janvier 21, 2005

Technologies du Langage

Sympa! Notamment un article sur les bizarreries logiques de Google...

Du ET au OU en passant par l'exclusion l'"outil de referrence" se melange des fois un peu les pinceaux.



jeudi, janvier 20, 2005

Passionnant!! parle d'identité numérique
IE VS Firefox

A votre avis qui gagne?
(Et encore l'auteur ne parle pas des fabuleux plugins de FF comme
livehttpheaders, adblock, mouse gesture, Live bookmark/Sage etc etc etc.....)

Une etude qui met en avant la securite accrue de Linux

Au dela de la polemique, il est interessant de constater que le modele de developpement Opensource, ? priori tres idealiste et revolutionnaire, permet de faire progresser la sécurité.

Cela est a rapprocher avec le succes des Wikis.



samedi, janvier 15, 2005

"Des communistes d'un genre nouveau veulent se débarrasser des mesures incitatives dont bénéficient les musiciens, les cinéastes et les créateurs de logiciels"
Cette extrait d'une interview de Bill Gates (le patron de Microsoft) ne manque pas de sel. Et ce pour au moins deux raisons:

- Microsoft n'a cessé ces derni?res années d'expliquer a ses clients que technologiquement et économiquement parlant Windows était indubitablement meilleur (CF ce memo de Steve Balmer ), et a ses actionnaires que c'était bien la, la seule chose qui comptait pour faire du business avec des decideurs IT responsables, tr?s loin des préocupations des geeks.

Quel besoin alors d'introduire une problematique politique?


- Les motivations des développeurs de logiciels libres sont variées. Il est incontestable qu'en Europe notamment une partie de la "communaute du libre" est mue par une volonté politique engagee (CF cette manifestation anti-brevet recuperee/ noyautee par la Trotskyste CNT qui a fait jaser sur tous les forums Linux Francophone ).
Ce n'est cependant pas, tres loin s'en faut, une generalite dans cette communaute, qui est souvent poussée par des "geeks" , hackers (pas crackers) en herbe dont les r?ves ne sont peuplés que de boucles, watchdogs et autres caches, et qui étaient souvent a peine nés quand le mur de Berlin est tombé...

Et c'est encore moins le cas pour certains des leaders les plus respectes qui flirtent avec le libertarisme.
Pour eux, au contraire, il s'agit avec le logiciel libre de se réaproprier une liberte individuelle fondamentale, confisquée par des groupes monopolistiques étatiques...
Il suffit pour s'en convaincre d'aller faire un tour sur le site web de l'américain Eric Raymond.
Celui ci declare entres autres -multiples- choses (comme un playdoyer pour la guerre en Irak):

"I've taken some public flak in the hacker community for vocally supporting firearms rights — and received a lot of private support. It's all about freedom. It's all about keeping the power to defend yourself, the power to revolt, the power to say no in the hands of individuals. No hacker should have any trouble understanding this."


A travers ses attaques redoutables contre Microsoft connues sous le nom d'halloween,
E.Raymond souligne, avec acharnement, tous les ecarts du groupe de Bill Gates avec les regles de la libre concurrence et du marche.

Le monde du logiciel vient donc de montrer, qu'en ce bas monde, on est toujours le communiste de quelqu'un... ;o)


vendredi, janvier 14, 2005

Heroes' Chronicles et la vrai vie

Heroe's Chronicle HC est un jeu sur le net, virtuel donc.
Les joueurs cachés derriere leurs avatars et leurs super pouvoirs s'affranchissent du réél.

Dans cette news on apprend que :
" La toute premiere rencontre IRL (In Real Life pour les anglophones et Dans La Vraie Vie pour les anglophobes) va avoir lieu samedi 22 janvier 2005 (oui oui, cette annee) a Clermont-Ferrand."

Un pont vers le réél.... Marrant.....


mercredi, janvier 12, 2005

L'air du temps de Google: Zeitgeist

Google expose ici les mots clefs les plus recherchés par ses clients.
On connait donc enfin les préocupations des gens. Les connues et les autres!

Cela rejouira les voyeurs, les sociologues et .... les publicitaires!

On le savait, mais cela resouligne que, pour peu qu'il exploite les possibilités offertes par son cookie qui n'expire jamais, et le moteur sera (est?) capable de vous faire correspondre un profil de consommateur en fonction de vos centres d'intérets (Déterminés par les recherches que vous avez effectuées).

De la a en profiter pour mettre en avant des produits google proofed, lorsque vous vous connectez sur son interface en fonction de votre profil, il y a pas loin.

Google ne s'en cache meme pas, c'est meme (presque) le business model mis en avant pour GMail.

On a donc un moteur de recherche qui vous presente et vend, ce que vous acheterez bientot (lui sait que vous l'acheterez).

Les militaires et la police utilisent deja ces techniques...

Souriez...vous n'etes plus seulement un numéro.


mardi, janvier 11, 2005

Google Observatoire En francais vraiment pas mal
Google Search: inurl:"view/index.shtml"
Vous cherchez une webcam sur le web.... cherchez dans google....
Les blogs un site qui parle des blogs suivant 3 directions:
- La pratique
- Le phénoméne
- Le Business
a explorer
Yahoo sort son "Desktop search"

lundi, janvier 10, 2005

Un article de Libération sur les blogs
Le journal explique comment les bloggeurs ont participé a l'election presidentielle americaine. Il decrit ensuite le changement de fonctionnement des medias americains qui integrent de plus en plus une relation de dialogue avec leurs lecteurs.

samedi, janvier 08, 2005

mozdev.org - : /pipermail/livehttpheaders/2004-October/000153


Mon post etant assez abscon, je vais essayer d'etre plus clair:

Le "Google Desktop Search tool" est un outil recent ( Octobre 2004) qui permet de faire de la recherche dans les fichiers contenus sur les disques de la machine sur lequel il est installé.
Il indexe le contenu du disque en tache de fond, et permet donc d'effectuer une recherche rapide dans la base qu'il a créé lorsqu'on en a besoin. Ce n'est pas le premier outil du genre, d'autres comme celui de Coppernic, sont, selon l'avis dominant des experts du genre :o) , plus efficaces. La force du "Google Desktop Search tool" est:
1) De provenir des labs du merveilleux (a tous les sens du terme) Google
2) De s'integrer tres facilement dans l'environnement des postes de travail( La strategie actuelle des "big players" etant d'integrer le end-user le mieux possible dans le reseau -cf Longhorn-, Google frappe fort avec cet outil.).

Cependant de nombreux problemes de securite/confidentialite ont ete souleves lors de la sortie de l'outil.
L'arguement le plus representé étant que, comme pour son grand frere en ligne, l'outil de recherche local possede un cache solide qui permet, notament dans le cas de pcs partages, d'acceder par ce biais a des informations, soit deja effaces, soit inaccessibles avec son Login/password. Il s'agit ici a mon sens plus d'un probleme lié a Windows et a la gestion de la sécurité, par defaut ouverte que d'un probleme lie a l'outil de Google.

Un autre point plus fondé a mon sens, mais moins représenté est que l'outil de google pour fonctionner installe localement un webserveur (!) . Lorsque vous realisez une recherche, celle ci se fait a travers un navigateur qui attaque ce webserver local (http://127.0.0.1:4664/&s=3027456573). Ce qui veut dire que Google est en train de deployer des milliers (millions?) de webserveurs sur des workstations sans vraiment le dire. L'acces a ces serveurs est blinde (attaque locale uniquement, pas de signature du Ws ....) , ceci dit c'est quand meme un (gros) trou potentiel.

Un troisieme point, et c'etait la l'objet de mon post, a été peu (pas?) evoque.
Lorsque l'on se connecte a google (le web www.google.com ou Fr) , l'interface change si l'on a le
"Google Desktop Search tool " installé sur la machine!

La question est donc de savoir comment Google fait pour savoir que l'outil est installé sur votre poste.

Revoici donc le post avec quelques commentaires :

Here is the real trame ( Photo prise avec Ethereal):


GET http://www.google.com/ HTTP/1.1
Host: www.google.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.0;
rv:1.7.3; Google-TR-1) Gecko/20041001 Firefox/0.10.1

Here is the livehttp picture (Photo prise avec Livehttp)....

http://www.google.com/

GET http://www.google.com/ HTTP/1.1
Host: www.google.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.0;
rv:1.7.3) Gecko/20041001 Firefox/0.10.1


As you can see the "Google-TR-1" indication is
missing.
For me this means that the google bar is listening the

Ethernet card and is modifiing the packets on the fly.
What do you think?

La question reste ouverte....




vendredi, janvier 07, 2005

The Angryarab
Un blog, en anglais qui commente (essentiellement) l'actualité du Moyen Orient. Pourquoi ce lien ici?
Les blogguers etant majoritairement WASPs ou au moins occidentaux...
Les points de vue les plus representés dans la blogosphere sont ceux des Wasps / Occidentaux.
(Ceci dit, je ne lis que des langues occidentales, mais bon quand meme :o)! )

Le Blog de the angryarab, defend un point de vue original (sur la toile ) et sous representé tout en restant, a mon sens mesuré.

Ce faisant, ll souligne en relief, que le web est politiquement tres partial...
Un site qui vaut vraiment le detour:
Outils Froids
"Outils froids" pour "cool tools"

Son objectif est:
Ce blog a pour but d'informer les "knowledge workers" des nouveaux outils, usages, methodologies, concepts, pouvant les aider a améliorer leur productivite personnelle au quotidien.


On y retrouve notamment les rubriques suivantes
Rubriques principales

* Cartographie d'information
* Creativite
* Intelligence économique
* Information literacy
* Information overload
* Knowledge management
* Knowledge worker
* Mind mapping
* Moteurs de recherche web
* Renseignement
* Social softwares et business
* Veille