jeudi, mai 18, 2006

un document Secret Defense est en ligne!

De l'arrivée fracassante du NET dans la gestion des petits secrets de la république...




Pour protester contre l'arrestation, par la DST, de son président,
l'association "sortir du nucléaire", qui est souvent confrontée a EDF, publie en ligne, (avec d'autres Greenpeace...), un document secret défense.

Ce document met en cause la sécurité des centrales nucléaires.

L'article du monde est très complet:
Le Monde.fr : Un document "secret défense" sur la sécurité des réacteurs nucléaires publié sur la Toile

L'état aurait pu imposer un blocus médiatique, il y a encore 10 ans.
Avec Internet ce n'est plus possible...

Edifiant et inquiétant.

lundi, mai 15, 2006

La loi DADVSI passe au Sénat...

La loi de DonneDIEU était déja terrible.
Les sénateurs l'amendent... et suppriment le seul amendement, qui allait un peu dans le sens du partage.

Que dire?
Rien d'autres que de constater l'impotence intelectuelle de nos vénérables élus...




A propos d'impotence intelectuelle, la palme revient à Benoit du groupe Kyo, à propos des sites non francais qui ne respecteraient pas les décisions de nos respectables institutions:
"On peut empêcher ces sites d'être utilisables en France.Ils le font bien en Chine".

vendredi, mai 12, 2006

les .XXX n'existeront (peut etre) pas.

Martin Lessard écrit un billet clair sur les enjeux du .xxx (extension pour sites pour adultes).

ZERO SECONDE: ICANN refuse d'ouvrir le .xxx


Un seul bémol, il conclut en disant:
"Ceux qui ne le voient pas encore doivent s'ouvrir les yeux. Internet est un produit américain et ils ne sont pas prêt de lâcher le morceau."
Je ne suis pas tout à fait d'accord, rien n'empèche l'UE de monter une infra DNS paralelle. J'en parlais ici.

Les enjeux sont énormes.

mardi, mai 09, 2006

Quand Google, Yahoo et Msn se lancent dans la botanique


Des chercheurs allemands, ont eu une idée étonnante.
Ils ont créé un site web composé de 2,147,483,647 pages .
Toute ces pages sont reliées à 3 pages seulement. 1 a un niveau au dessus et deux en dessous.
Il s'agit d'un arbre binaire.
Il y a une très grande profondeur a cet arbre.
Ils ont donc laissé ce site en ligne sans rien faire pendant 1 an. En conservant bien sur les logs de visites. L'objectif étant d'essayer de comprendre comment les principaux moteurs exploraient l'ensemble.

Les résultats sont très intéressants:
overall statistics by search engine

Yahoo! Google MSN
total number of pageviews 1,030,396 20,633 4,699
number of nodes crawled 105,971 7,556 1,390
percentage of tree crawled 0.0049% 0.00035% 0.000065%
number of indexed nodes 120,000 554 1
indexed/crawled ratio 113.23% 7.33% 0.07%


Ou l'on constate que le meilleur (en terme de pages vues) d'entres eux, Slurp de Yahoo,
n'a exploré que 0.0049% de l'ensemble...
(Imaginons cela à l'echelle du web, même si ce n'est pas exactement transposable...)

Les auteurs ont également constaté, que, si Yahoo est celui qui a indexé le plus de pages, il n'est pas le plus rationnel. Google semble plus cohérent, et semble respecter le pagerank même pour les visites (Plus une page à un PR élévé, plus le robot se vient la visiter souvent).

MSN semble un peu faiblard.

Une analyse des commentaires (qui étaient ouverts), et qui sont pour la plupart automatiques, a été faite. La plupart visent à vendre des médicaments. Le Viagra, est le grand gagnant.

Enfin, une corrélation entre le nombre de pages crawlées et le nombre de pages renvoyées par les interfaces de recherches existe sans doute. Yahoo annonce par exemple autour de 120 000 pages dans son cache pour l'ensemble du site.

Les auteurs notent, sournoisement, que cela n'est pas possible :

"Yahoo reported 120,000 pages in it's index (current value). This may seem impossible since it only visited 105,971 nodes, but every node is available on two different domain names: www.drunkmenworkhere.org and drunkmenworkhere.org."

Ceci est à rapprocher des études de Jean Véronis sur les comptes bidonnés de Google l'année dernière.

Google, modeste, en renvoie 550.
MSN un seul (ce qui n'est ici pas forcément un mauvais point).

L'étude est la.
Je l'ai découverte grâce à affordance.info: Arbres de connaissance (Merci)

Un seul regret, il aurait été intéressant, de savoir comment Exalead se comportait...




mercredi, mai 03, 2006

Une startup pleine d'avenir!!

Une entreprise vient de me sécher... Elle fait mieux que Google!!
Cette entreprise terrible, c'est "les pages jaunes"....
Oui oui, le botin... Il y a maintenant la possibilité d'avoir une vu aérienne de l'endroit ou on veut aller... et la définition est bien meilleure que celle de Google Maps!

J'ai vu les deux voitures garées devant mon garage!!
Si on ajoute a cela l'interface de mappy qui s'est considérablement améliorée, et ca laisse baba. Il est simplement dommage que ce ne soit que Francofrancais.
En tout cas Bravo!!
pagesjaunes.fr, demandez c'est trouvé !

jeudi, avril 06, 2006

Internet et anonymat

Un article complet sur Agoravox revient sur les lois votées en catimini qui obligent les FAI a stocker les logs pendant de looongues années.
Alors que l'anonymat sur internet était deja plus que relatif...

Dans la foulée l'auteur nous fournit un checker de Proxy vraiment bien fait: PROXY checker results

mercredi, janvier 25, 2006

Google, les autres et bigbrother suite...

Google qui vient de se voir demander par le gouvernement américain un accès à ses logs de recherches, ouvre une interface dédiée à la Chine. Google.cn, donc.

Et le Guardian, nous apprends dans l'article dédié à cette news que:

"Now, however, Google will actively assist the government to limit content. There are technical precedents. In Germany, Google follows government orders by restricting references to sites that deny the Holocaust. In France, it obeys local rules prohibiting sites that stir up racial hatred. And in the US, it assists the authorities' crackdown on copyright infringements.

The scale of censorship in China is likely to dwarf anything the company has done before. According to one internet media insider, the main taboos are the three Ts: Tibet, Taiwan and the Tiananmen massacre, and the two Cs: cults such as Falun Gong and criticism of the Communist party. But this list is frequently updated.


In a statement, Google said it had little choice: "To date, our search service has been offered exclusively from outside China, resulting in latency and access issues that have been unsatisfying to our Chinese users and, therefore, unacceptable to Google. With google.cn, Chinese users will ultimately receive a search service that is fast, always accessible, and helps them find information both in China and from around the world.""



J'en retiens deux choses:

1) Les résultas de Google France (et Allemagne) ne sont pas toujours "naturels"! ( Cela induit cette question:
sont ce des sites en Francais, qui sont exclus de l'annuaire?
Ou sont ce des sites dans l'annuaire qui ne sont pas donnés en réponse à des internautes identifiés comme Français -cf google videos théoriquement non accessible aux francais- ?)

2) Les réactions de la firme suite à la demande du gouvernement américain de fournir les logs de recherche ont été véhémentes .
"L'éthique, l'éthique, l'éthique!!"... Enfin en Chine et ailleurs on peut s'arranger...

Big brother? (l'article de Buck est illustrant ;) , a lire aussi l'article très complet d'Affordance.

lundi, janvier 23, 2006

La loi sur les droits d'auteurs: un combat d'arrière garde?

Un site tout a fait légal, propose des albums entiers à télécharger pour 1Euro.
Comment c'est possible? Le site est dans un pays (Russie) ou la législation le permet...

Je ne crois pas qu'il soit illégal d'acheter de la musique à l'étranger...
Une discussion assez riche est apparue à ce sujet sur LinuxFR.




Comme le dit Laurent Bernat, qui a trouvé le lien:
"Depuis le temps qu'on nous dit qu'Internet est un réseau mondial... Il va peut-être falloir intégrer ça un jour, non ?"

vendredi, janvier 20, 2006

le gouvernement américain demande a Google ses logs de recherche

Cet article de bloomberg nous apprends que:

"Google Inc., the most-used Internet search engine, was sued by the Justice Department after it refused to turn over information that may help the government monitor sexually explicit material on the Web."
et plus loin:
" The Justice Department said it asked for all Google queries for a week and for 1 million Internet addresses in the company's database. According to the lawsuit, other search engines have complied with similar requests, ``and have not reported that they encountered any difficulty or burden in doing so.'' "



Pour peu que l'on bloggue sur blogger, et que l'on utilise GMail et/ou Google Analytics voire le portail google/ig, la quantité d'informations nominatives disponibles qui seraient données au gouvernement néocons est quand meme un peu inquiétante.

mercredi, janvier 18, 2006

Chercher des images... en dessinant!

RetrievR est un moteur de recherche un peu particulier... Il permet de rechercher dans l'immense base d'images de FlickR. L'originalité est qu'en général on cherche avec des mots, même des images.

La non. On dessine l'image que l'on cherche!! Le moteur interpréte votre image et vous livre les images (photos) qui lui ressemblent le plus!!
retrievr - search by sketch

Forcément, vu mes talents en dessin, pour moi c'est pas gagné, mais bon... A essayer!!