mercredi, juillet 30, 2008

Les bouillons Knols...





Jean-Marie Le Ray vient de poster un article très efficace sur le conflit d'intéret entre les différents services de Google.

En résumant très rapidement, Google qui est en position quasi monopolistique sur la recherche risque de favoriser les Knols dans ses résultats au détriment d'autres fournisseurs de contenus comme wikipédia (par exemple).

Je suis tout à fait d'accord avec Jean-Marie. Il y a cependant un aspect sur lequel j'aimerais revenir: en favorisant artificiellement les knols, Google prend le risque de faire perdre en pertinence son moteur de recherche (qui est le coeur de son activité).

Et ce pour plusieurs raisons:

1) Rien ne prouve que les knols seront, en général, de qualités. C'est même plutôt l'inverse qui risque de se produire. A titre d'exemple on trouve 33 pages de tests, qui ont un contenu avec peu de valeur ajoutée...

2) Les premiers knols sont pour beaucoup copiés d'autres sites et souvent de Wikipédia. Le meilleur exemple est sans doute ce Knol sur Wikipedia (On notera dans les commentaires de cet article des remarques instructives, à confirmer, sur l'incompatibilté entres les licenses de WP et de Knol.).
Ne vaut il pas mieux, dans ce cas chercher directement dans Wikipédia pour avoir la dernière version, par l'intermédiaire, pratique, du search de son navigateur?


3) Il est possible de gagner de l'argent grâce aux google Ads, disposés sur les knols. La tentation est alors grande de créer des knols uniquement destinés à exploiter la longue queue. Peu de valeurs par knol, mais beaucoup de knols. On peut même le scripter assez facilement, en prenant du contenu ailleurs (wikipédia?).
Et tant qu'on y est à scripter, pourquoi ne pas faire des faux clics...
Le coeur du business de google est mis en danger si cela arrive.




Wait and see donc...

vendredi, juillet 18, 2008

Consommation d'internet

Quelques chiffres sur la consommation d'Internet dans 25 ans.

EDIT du 23 Juillet:
J'ai remis la main sur cet article de France-info que je stocke ici (à noter l'interview de Jancovici attachée à l'article)...

jeudi, juillet 10, 2008

Petit calcul matinal autour de Google

Autour d'une discussion matinale est apparu LE problème de la journée: quelle est la consommation électrique de Google?

Quelques recherches dans Google justement montrent que d'autres se sont déja essayés à l'exercice. Le Monde par exemple a pondu en Juin 2007 un excellent article sur le sujet. Leur calcul, il y a un an, donnait -avec comme hypothèses 450 000 serveurs et une moyenne de 250W par serveur-:
"Google consommerait donc 2,1 terawattheures par an, l'équivalent de deux centrales nucléaires"

A nous maintenant de jouer!

  1. Le nombre de serveurs

    D'abord le nombre de serveurs de Google. Le nombre de serveurs détenus par Google est un des secrets les mieux gardés de la planête. Une chose est certaine ils en ont beaucoup.
    Certains parlent de 450 000 (chiffre avancé par Le vénérable New-york times en Juin 2006 dans cet article par exemple), d'autres vont jusqu'à parler, mais le chiffre est peu repris, en Juillet 2007 (en reprenant Gartner) d'1 Million de serveurs.

    Trois chiffres semblent peu discutés, 8000 serveurs en 2001, 100000 en 2003 et 450000 en 2006 donc. Le nombre de datacenters ayant augmenté (36 sont recensés ici aujourd'hui) il est probable que le nombre de serveurs aussi.
    A quelle vitesse? Mystère...
    Une régression linéaire entre 2001 et 2006 nous permet d'extrapoler le chiffre de 620 000 serveurs aujourd'hui.
    La même régression linéaire entre 2003 et 2006 donne 680 000 serveurs.

    Une approximation avec un pôlynome de type aX*X + bX+C résolu à l'aide des trois points que nous avons ( 2001, 2003 et 2006) donne pour 2008, 824 667 serveurs
    (avec a=14133.33, b=-10533.32 et c=4399.99).


  2. La quantité d'électricité consommée par serveur

    Cette donnée est moins confidentielle que le nombre de serveur lui même.
    Le monde parle de 250Watts par machine. Cette étude de J.G Koomey parle de 200Watts par machine. Une chose est certaine, google fait beaucoup d'effort pour réduire sa consommation (voir ceci par exemple).

    Retenons donc 200 Watts comme chiffre possible.

  3. La quantité d'électricité nécessaire pour refroidir ces serveurs
    Le rapport ci dessus parle de 1 watt consommé par les serveurs = 1 watt utilisé en cooling. Un chiffre admis dans l'entreprise est de 0.7Watts tout compris.

  4. Quantité d'électricité consommée
    En considérant que les serveurs sont allumés en permanence on en arrive donc au chiffre made in Loran: 200*1.7*24*365*824667= 2 456 188 192 800 Watts Heure en 2008.

    En 2008 la consommation énergétique de google serait donc de 2.456 TWH/an.

    (Ce qui est cohérent avec le calcul du monde d'il y a un an 2.1 TWH/an en tenant compte de l'augmentation du nombre de serveurs.)


EDIT du 21/10/2008: un calcul actualisé avec une modification des hypothèses est disponible ici

mardi, juillet 08, 2008

La vérité qui dérange

Génial, passionnant et inquiétant, Jancovici donne des cours, en streaming, sur l'énergie aux mines de Paris.