jeudi, décembre 15, 2005

Wikipédia VS Brtiannica



Wikipédia l'encyclopédie collaborative a été très critiquée depuis un mois.

Deux affaires de vandalisme ont ébranlé sa crédibilité. Vous trouverez tous les détails un peu partout, et notamment sur le site de l'Urfist.

La bonne nouvelle vient de la revue Nature, qui a fait comparer en aveugle, par des experts, sur des sujets disparates, des articles venant de Wikipédia et d'autres venant de l'encyclopédie Britannica (qui est l'équivalent de notre encyclopédia universalis).
Et Wikipédia s'en sort très très honorablement.
Le nombre d'erreurs entre les deux encyclopédies est comparable!

Et ce sachant que Wikipédia n'a que quelques années d'existence, et n'est écrite que par des bénévoles.

mercredi, novembre 23, 2005

Web 2.0 : le billet qui recadre

Fred Cavazza, republie une note sur le web2.0 (notion dont j'ai déja parlé ici).

Il y explique devant un auditoire sceptique (cf les commentaires du billet) que:




1) Le web a subi de tels changements dans son utilisation qu'il n'a plus grand chose a voir avec le web de 1994. D'ou un nouveau nom pour marquer cette évolution (révolution?). Web2.0 donc.

Il cite les exemples d'applications ayant transformé le rapport de l'utilisateur au net (blogs, wiki, portails....)

2) Il finit en précisant qu'il parle bien de changement des usages et pas des technologies.



Sa note éclairante mérite d'être lue.

jeudi, novembre 17, 2005

Google laisse Baba(se) !

Un nouveau service Google assez effrayant et impressionnant a été lancé Mardi soir.
Comme d'habitude c'est gratuit.

Ce service, nommé Google base, n'a pas d'autre ambition que d'être capable de tout stocker et en plus, de tout retrouver...


Un peu comme un super EBay, capable de stocker des articles, des petites annonces, des photos, des descriptions d'objets à vendre... n'importe qu'elle forme de contenu numérique en somme!

Affordance et surtout l'atelier en parlent très bien.

Les skyblogs, les émeutes et la censure

Les 3.24 Millions (!!!) de Skyblogs ont été très médiatisés durant les événements qui viennent de se dérouler en France.



Pour certains, le lien entre l'organisation des émeutes et les blogs n'est pas avéré.

Le site Smartmobs a pour objectif la recherche de liens entre les technologies émergentes et les nouvelles formes d'organisations sociales. Smartmobs, dans une courte note, qui s'appuie sur un article de Libération et un article de la BBC semble penser que le lien existe.

De fait Mr Villepin lui même lors d'une intervention télévisée a dit:
"Nous avons également accru notre effort dans le domaine du renseignement pour surveiller les blogs, les échanges sur Internet, et anticiper ainsi le mouvement des bandes"
Le rôle des blogs dans les émeutes semblent donc être admis par les plus hautes sphères de l'état. Etat, qui a donc décidé de s'attaquer au problème en arrétant certains bloggueurs trop vindicatifs et en exercant une censure sur les blogs les plus virulents..

Et de fait, la suppression des billets très violents (que j'ai moi même appelé de mes voeux), a été exercée sous nos yeux.

Le blog dont je parlais, a été supprimé. Et ce n'est pas, très loin s'en faut un cas isolé.
Selon skyrock c'est le lot de 10 skyblogs et de 6000 notes par jours.
A titre d'exemple, les commentaires, du skyblog cite2france ont tous été supprimés.

Des événements graves ont secoué la France, les blogs hébérgés sur la platforme francaise skyrock, effrayée de devoir rendre des comptes à des consommateurs Francais et a l'état francais, ont été très rapidement et massivement censurés. Ce n'est pas nouveau et c'est extrémement discutable.

Mais c'est une affaire franco-francaise.
Et c'est cela qui est étonnant...

Je ne crois pas qu'il existe d'autres démocraties dans le monde, à l'exception des USA, dans lesquels quasiment tous les blogs des jeunes soient hébérgés par une entreprise locale.

Et si tous ces blogs avaient été hébérgés par MSN ou Blogspot ou tout autre entreprise soumise au droit Etats-unisien, administrée par des gens très loin de notre réalité, que se serait il passé?


La réponse est simple cette censure rapide ne se serait pas exercée...



L'état et tous ceux qui pensent que dans des cas graves, une forme de contrôle rapide, est parfois nécessaire, peuvent dire merci à Skyrock d'avoir réussi à mettre en place une plateforme d'hébergement aussi populaire.

La question d'une forme de contrôle étatique sur le net reste néanmoins entiére.

lundi, novembre 14, 2005

Bloggons, bloggons...



Dans la vraie vie, quelqu'un qui parle très fort de choses pas intéressantes devant des dizaines de gens qui s'en foutent, c'est un cas psychiatrique. Sur internet, c'est juste un blog.







Lu sur Nonal.net grâce à Aixtal...

Web, le loup est dans le bois...

Un mémo "secret" de Bill Gates, himself, fait la une du web:
- Le New York Times

- le blog Media et tech

- Zero seconde
...


En simplifiant, Billou décide d'investir massivement les services webs, en misant sur la publicité comme source de revenus.




Un deuxième mémo, de Ray Ozzie, le nouveau CTO de MS,
entre dans les détails. Il est assez long. Je l'ai, pour l'instant, lu en travers. Mais il est très interessant, tous les mots à la mode sont présents (AJAX...) ;o)

Un mot pour rappeler, que MS, a aussi lancé sa plateforme "monweb 2.0", qui s'appelle live.com.
Cette plateforme est bien palichonne comparée à celle de netvibes.com.
Moins modulaire, moins fluide, moins paramétrable, que Netvibes, et en plus c'est du MS... A éviter pour l'instant donc.

un dictionnaire sur votre site

La société Memodata, propose sur son site (un peu touffu) de télécharger un bout de code à insérer dans votre site. Ce bout de code, très efficace, permet d'attaquer une grosse base de données dictionnaire.





Comme, la fonction est en place sur le blog de Loran, vous pouvez dorénavant double cliquer sur n'importe quel mot, pour avoir rapidement, accés à ce dictionnaire.


La fonctionnalité la plus intéressante, étant sans doute, le fait de pouvoir traduire les mots à la volée en changeant le dictionnaire "destination".

C'est de l'"AJAX". Une preuve de plus que le web2.0 est en marche! ;o)

Et merci à Aixtal!

lundi, novembre 07, 2005

Trois arrestations pour incitation à l'émeute sur "blog" - Yahoo! Actualités

3 personnes qui lancaient des appels à l'émeute par skyblogs interposés viennent d'être interpellés.

La news est ici

Les politiques se demandent beaucoup si ces émeutes sont organisées et coordonnées.

A la lecture des skyblogs, celui ci par exemple, il s'avère qu'une espèce d'organisation anarchique est en place.

Ce blog, qui recense toutes les banlieues de France est décrit par son auteur comme suit:

"Description du Skyblog :
Moi j'blogue pour les Noirs, les Arabes et les Blancs
Saches que je suis pas de ceux qu'effrait la différence
Ta couleur de peau pour moi ne fait aucune différence


Toutes les banlieues s'ressemblent alors j'voudrais que toutes les banlieues s'rassemblent !"


Toutes les banlieues sont prises en photos, si possible avec des jolis montages incluant des voitures brulées... Le blog est assez populaire, on y trouve 16536 commentaires... Commentaires, qui sont en général des invectives de "jeunes" d'une banlieue, vers d'autres d'une autre...


Et si le changement d'échelle de ces émeutes, que l'on connait depuis 20 ans, étaient aussi une conséquence de l'avènement des blogs?
Pas dans les causes bien sur , mais dans les moyens.
Il est "enfin" possible pour ces jeunes, de se synchroniser en dehors de structures traditionnelles.



samedi, novembre 05, 2005

Aulnay sous bois dans les blogs

Les banlieues parisiennes brulent.
Qu'en disent les blogs?

Une recherche sur Technorati de "Aulnay sous bois" en Francais annonce 20 posts recensés dans les dernières 24 heures.

Au vue de la gravité des événements c'est peu. Et encore dans ces posts, ils s'avèrent qu'une partie est en anglais.

Quand au contenu, c'est tout de même assez "high level", très politique et souvent des reprises de presse ou des impressions. Peu de réelle proximité.
On trouve tout de même monaulnay.com et aussi, le blogaloutre

C'estfinalement sur la plateforme skyblog que l'on comprend le mieux ce qu'il se passe.

En cherchant (un peu), on trouve par exemple ce blog d''un jeune habitant de " aulnay sous bois les 3000"

Sur la première page, un petit film,qui montre une bande avec des armes...

Le titre du post est:" kan il fo se défendre"

"tkt pa con é tous calibré du magnum o béréta du bon o bon fusil..."


Juste en desous a gauche trône l'emblème cybercop de Sky....
Le post date de Septembre...


Les posts précedents, montrent bagarres, voitures de police brulées ou coupures de presse commentées comme celle ci:
















Une saine émulation se met donc en place, aux vues de tout le monde!

De la cyber police privée de la radio, aux vrais policiers,
il y a peut etre un petit problème de moyens, la!
Il suffit de connaitre le nom de la cité, pour tout savoir.

Heu Messieurs de Skyrock ca ne mériterait pas d'être censuré ca?
Monsieur le Ministre de l'intérieur, y'aurait pas quelque chose à faire aussi?
Et si la fracture numérique, touchait finalement plus le ministère de l'intérieur, que les "sauvageons" du 93...

J'aimerais finir en citant le blogaloutre, qui s'est "bêtement" rendue a Aulnay voir sa famille:

" On dit toujours que c'était mieux avant. On le dit peut être parce que c'est un peu vrai, finalement.

...

Aujourd'hui, quand je regarde les jeunes de 15 piges qui se réunissent sur un lieu défini pour aller brûler des voitures, piller des magasins et aller casser du pompier, ben oui, j'ose le dire "c'était mieux avant".
Aujourd'hui, celui qui est bien sous tous rapports est un fils de biiiiiip et un mec qu'il ne faut surtout pas approcher, il est pas assez "in".
Aujourd'hui, le mec bien, c'est celui qui a un accent de banlieusard à la con (oui à la con, je déteste ça), qui fume du shit et qui traîne dans les cités.

Alors, oui, par rapport à avant, on a gagné une certaine liberté d'expression. Mais si la liberté d'expression, c'est empêcher les gens d'aller bosser le matin parce qu'un petit biiiiiiip a trouvé ça chanmé de cramer sa bagnole ou alors de brûler son usine pour protester pour une raison totalement obscure...alors je n'en veux plus.
"

jeudi, octobre 27, 2005

Le monde tel qu'il est?

Je parlais il y a peu, de l'étude de Technorati sur l'état de la blogsphère en ce mois d'octobre.

Deux lectures récentes m'amènent à en reparler. D'abord, la barre des 20 Millions de blogs recensés vient d'être franchie. Détail amusant, c'est un blog en français d'une petite école élémentaire de Reims qui a permis de passer la barre symbolique. Toute la blogosphère en parle, mais apparement les administrateurs ne sont pas (encore) conscients du succès blogsphèrique de leur marathon.

La deuxième raison qui m'amène à reparler de cette étude est que je suis tombé hier, sur le blog
Zero Seconde qui l'analyse en profondeur.

En s'appuyant notament sur le graphique ci dessous, l'auteur écrit:

N'est-il pas étrange que le Tsunami ait suscité moins de billets que le Superbowl? C'est la nature humaine, diriez-vous. Il sera toujours plus facile de commenter un match de foot qu'un drame humain. Mais alors que penser de Katrina? Pourquoi ce surplus de posts pour cette catastrophe ? Réfléchissons.

Impliqué / pas impliqué

En regardant les autres thèmes d'actualité, on voit bien
que ce ne sont que les sujets d'actualité des États Unis d'Amérique qui tirent la couverture blogosphèrique. À drame humain / catastrophe écologique similaire, Katrina recolte plus que son lot de commentaires.

On ne peut que constater :
  1. la blogosphère est encore déformée majoritairement par les américains;
  2. les blogueurs ne commentent que l'actualité qu'ils vivent: si on n'est que spectateur lointain, on observe; si on est un spectateur impliqué, on commente.


Et plus loin d'écrire:

Avec la montée des blogs chinois, si technorati continue de les classer dans le même graphique, ils finiront à court terme par modifier systématiquement les statistiques de volume de billets publiés.

Soit que nous allons voir avec surprise des "peeks" de billets sur des sujets chinois complètement locaux (corruption à Pékin, élection à Shanghai, match sportif à Taipei), soit Technorati va séparer les données par région.


C'est avec cela en tête que je suis allé voir ce matin le "nuage" de Tags de Technorati.
Les tags sont des mots associes à un billet d'un blog permettant ainsi de le "catégoriser".
Ces mots sont librement choisis par les utilisateurs de Technorati. Cela permet donc de décrire
et de classer le contenu de ces articles. La présentation en "nuage", permet en jouant sur la taille de la police de certains mots, de montrer leur degrés de popularité. Ainsi,
dans le graphe ci dessous on voit que " Entertainement" est un tag populaire ce matin, un peu moins toutefois que " ?????." (désolé blogger mange les caratères chinois, il faudra donc se contenter de ? en lieu et place des lettres) !

Les blogs se développant partout dans le monde, voici donc ce a quoi pensaient les 20 Millions de terriens bloggueurs ce matin:



On trouve donc, c'était prévisible, des tags en Anglais bien sur, en Francais, en Espagnol...

Ce qui m'a surpris, c'est que plus de la moitié des tags, sont écrits dans des langues non occidentales!

Et certains "lisibles" mais inconnus, comme FF11 (si quelqu'un sait de quoi il s'agit?) sont plus populaires que Katrina!

J'ai l'impression d'être devant une photo du monde. Celui que je connais, ou au moins que j'imagine, et l'autre, dont je n'avais jusqu'à aujourd'hui pas entendu parlé.

En tout cas, bonjour les gens! (heu D2R2 on va avoir besoin de ton interface de traduction la)

mercredi, octobre 26, 2005

lundi, octobre 24, 2005

Les blogs vus par Olivier Ertzscheid

Olivier Ertzscheid (affordance.info), nous livre ici,
un article concis sur le phénomène des blogs, qui explique les raisons du phénomène, puis, les perspectives qui en découlent déja, et celles qui viendront.

mercredi, octobre 19, 2005

Apparition...



Au petit jeu, très prisé par les temps qui courrent, de la recherche de sites exceptionels sur la terre grâce à Google Maps, un anonyme à frappé un grand coup ici.

Trouvé grâce à Zorgloob

Iz goud!

Je n'ai pas vérifié, dans mon billet d'hier sur le Google Bombing, quel était le positionnement du film Iznogoud à la requète "Nicolas Sarkozy".

L'inverse (on cherche le mot Iznogoud) donnait hier, comme classement pour le CV de Mr Sarkozy, le 3eme rang.

Et donc aujourd'hui, je cherche "Nicolas Sarkozy" et .....









Preums!!







"Nicolas Sarkozy" - Recherche Google

mardi, octobre 18, 2005

Google bombing

Le google bombing est selon Wikipédia:

"une technique de référencement visant à influencer le classement d'une page dans les résultats du moteur de recherche Google.

Cette technique exploite une caractéristique du moteur PageRank de google qui accorde un certain poids au texte avec un hyperlien vers une page.

Ce poids peut varier en fonction de l'algorithme utilisé par Google. Si plusieurs sites utilisent le même texte pour pointer sur la même cible, Google additionne ce poids et il devient possible de faire apparaître la page cible dans les résultats d'une recherche sur le texte contenu dans les liens pointant vers elle."



De manière régulière par protestation ou par jeu, des "bombardements de Google" sont organisés.

Suite à un envoi massif, mal contrôlé (c'est un euphémisme voir par exemple cette réaction) de mails de recrutement pour l'UMP, la nouvelle cible est Nicolas Sarkozy!




L'objectif est simple, faire en sorte que la requete "Iznogoud" nous amène
non pas sur la bigraphie officielle de Mr Sarkozy, mais bel et bien sur la page web du film www.Iznogoud-lefilm.com !
(Et inversement!)

Le résultat se mesurant donc bien sur sur Google:
iznogoud - Recherche Google.






A l'heure ou j'écris ces lignes la biographie de Nicolas Sarkozy n'apparait pour l'instant qu'en troisieme position....














Courage "la pente est raide, mais la route est droite"!! ;o)

lundi, octobre 17, 2005

La taille de la blogosphere double tous les 5 mois....

Technorati publie aujourd'hui une étude sur l'évolution de la blogosphère.

La croissance exponentielle est vraiment impressionnante...
La blogosphère double tous les 5 mois!
Aujourd'hui un blog se crée toutes les secondes... Copieurs!!






Et moi et moi et moi?










Cette étude très intéressante, mesure aussi (entres autres...):
- le phénomène du splog (faux blogs fait pour créer artificiellement des liens vers de vrais sites)
- les effets de l'actualités sur le nombre de posts
-...

Pi-Search Results

Un petit jeu (trouvé grace a Vtech) ....

Le moteur Pi-search, permet de vérifier si une chaine de chiffres est trouvable dans le nombre PI (en fait pas vraiment PI -qui est infini-, juste les premières 200 Millions de décimales :o) ). Les deux premières sont bien sur 14 puisque l'on a Pi=3.14.......





J'ai la fierté de vous annoncer que la chaine 02011973 (ma date d'anniversaire)... se trouve a la position 72,731,137.

La chaine autour de ma date d'anniv est : 37450908981891809959 02011973 75628629460503853974

Ca c'est un signe des dieux.
Si ca se trouve c'est lié à mon saturne.

dimanche, octobre 09, 2005

Taille du web

Google n'indexerait, selon Eric Schmidt (un grand chef made in google) que 0.0034% du Web. Avec la puissance de calcul actuelle de Google, il faudrait 300 ans pour indexer la totalité...


Ce qui dit autrement signifie qu'il n'indexe "que" 170 Terabytes, la taille du web supposée étant de 5 Millions de Terabytes...

C'est pour cela que, comme l'a montré la société Dogpile, les résultats d'une même recherche, faite sur plusieurs moteurs, sont de plus en plus disjoints.

vendredi, octobre 07, 2005

Controle d'Internet la suite

Il était question Vendredi du refus ferme des USA de partager la gestion des ROOT DNS (qui permettent de gérer la structure du web).




Le Gardian affirme que l'Europe va réagir à ce refus en poussant à la mise en place d'une structure DNS Root indépendante.

La discussion sur le sujet est extrémement vive sur le forum de Slashdot.

Tous les aspects de la discussion sont couverts dans ces commentaires (Politique, Technologique, droits de l'homme.).
(Comme d'habitude pour Slashdot il convient de ne lire que les commentaires les mieux notés (5).)

jeudi, octobre 06, 2005

AgoraVox - le journal citoyen

Bon d'accord j'arrive un peu après la bataille...
Mais je viens de tomber sur Agora News.
L'ouverture de ce site en Juin, a été largement relayée par les médias.

Très inspiré du Ohmynews.com coréen, ce site de journalisme citoyen, s'apparente aussi un peu aux actualités de wikipédia.
Le principe est simple, tout le monde peu devenir un reporter et publier un article. Cela me fait aussi un peu penser à indymédia.

Ceci dit quand on regarde la liste impressionante des contributeurs, qui sont surement aussi des "early adopters", il apparait qu'on n'a pas à faire, pour l'instant, à un nouvel organe du prolétariat.

mercredi, octobre 05, 2005

Un nouveau portail RSS

24eyes - The Premium RSS Dashboard on the Internet.
Un peu comme netvibes avec des tab en plus (Mais moins joli).

mardi, octobre 04, 2005

une suite bureautique en ligne?

Cette petite news sur slahdot, reprend et extrapole ce que J. Schwartz CEO de Sun, annonce sur son blog.

Schwartz dit: "
... Value is returning to the desktop applications, and not simply through Windows Vista. ...

If I were a betting man, I'd bet the world was about to change. And that what just happened in Massachusetts, when a state government made what was to me a very rational statement - we will pick an open standard to protect the right of our citizens to access data and services; ....

Strap on your seatbelts. Volume and value are about to speak... "


Ce qui fait dire a Slashdot, quir recoupe différents posts que : "Google & Sun [are] Planning Web Office".

Ca à l'air de rien, mais si vous pouvez accéder à votre suite burautique à travers un client léger (qu'est n'importe quel Navigateur), ca ouvre un paquet de possibilités!

La première d'entre elle est que l'OS, pour être un pc de bureau, ne doit fournir qu'une seule fonctionnalité: savoir gérer un accès web.

Et voila deux arlésiennes qui ressortent: le google OS et
les Network Computer que pourraient bien être bientot les téléphones portables (qui seront aussi PDAs, Montre, console de jeu,....).

Wait and see!

samedi, octobre 01, 2005

Webcam live sur un point d'eau en Afrique

Une webcam live sur un point d'eau en Afrique a été mise en ligne par le national geographic ici


A l'heure ou je vous parle, un éléphant se prelasse lascivement au soleil, pendant que des antilopes et un tapir(?) passent... Y'a des oies (heu en tout cas c'est des oiseaux) aussi!!!!

C'est vraiment magique!!

vendredi, septembre 30, 2005

" U.S. Insists On Keeping Control Of Internet"

Cet article de Slashdot , reprend la citation suivante:
'We will not agree to the U.N. taking over the management of the Internet,' said Ambassador David Gross, the U.S. coordinator for international communications and information policy at the State Department.

Le management d'internet fait en fait (essentiellement) référence à la gestion des DNS serveurs. DNS pour Domaine Name Server sont les serveurs qui permettent de faire le lien entre un nom de domaine et une adresse IP.
Lorsque l'on tape http://lemonde.fr dans son browser, votre ordinateur interroge (je simplifie un peu) un serveur DNS, qui lui donnera soit directement l'adresse IP (80.67.81.136 par exemple) soit le nom d'un serveur DNS capable de donner cette adresse IP.

Les serveurs DNS sont organisés de manières hiérarchiques. Le serveur qui gère toutes les associations xxxx.toto.fr/ips (appelons le petittoto) est féodé a celui qui gère les domaines en xxxx.fr (grandtoto) .

Ceci donne un grand pouvoir aux gestionnaires du DNS grandtoto sur ceux du DNS petittoto. En effet s'ils le décident, ils peuvent décréter que le DNS petittoto n'est pas le DNS serveur compétent pour gérer le domaine xxxx.toto.fr.... Donc si le serveur DNS configuré sur votre pc n'est pas petittoto, et bien la résolution titi.toto.fr ne sera jamais faite en suivant la régle de correspondance définie par le DNS évincé.

Cela n'empèche théoriquement pas l'accés aux ressources contenues dans le sous domaine xxx.toto.fr, il pourrait suffire de connaitre directement les IPs.
Ceci dit, en plus du fait qu'il existe des cas ou les IPs ne sont pas fixes, il est plus simple de se rappeler que l'on veut accéder lemonde.fr que 80.67.81.136...

Concrétement les USA, qui ont en charge la gestion des plus haut serveurs DNS, n'ont toujours pas redonné la gestion de l'extension .iq aux autorités iraquiennes...
Cela signifie également que les US, décident unilatéralement de créer une extension en .XXX qui sera dédiée aux sites pornographiques (les légitimant de facto).
A ce sujet le Brésil a répondu à l'ICANN (Institut qui gére aux US les noms de domaines):

"For those that are still wondering what Triple-X means, let's be specific, Mr. Chairman. They are talking about pornography. These are things that go very deep in our values in many of our countries. In my country, Brazil, we are very worried about this kind of decision-making process where they simply decide upon creating such new top-level generic domain names."


Lorsque l'on parle du management d'Internet, il y a également une autre notion qui mériterait d'être attentivement étudiée: celle des plages d'adresses IPs. Les premiers arrivés ont été les premiers servis. Or la technologie actuellement utilisée pour codifier les IP, appelée IPV4, fournit peu d'identifiants uniques (2exp32 soit environ 4.3 Milliards).

Les IPs sont donc devenues avec la généralisation du Net une denrée rare. Denrée qui appartient en majorité ceux qui ont fait partit du premier rush. HP possède par exemple suite à sa fusion avec Compaq deux plages d'adresses IP primaires (15.* et 16.*) ce qui représente 32 Millions d'adresses.

Une solution pour dépasser ce problème existe, il s'agit de la technologie dite IPV6.
Il manque cependant une réelle volonté de l'implémenter.

jeudi, septembre 29, 2005

Le Web 2.0

Le web 2.0: Késako?
Le web évolue. Le web d'aujourd'hui commence à regorger d'applications que les ancêtres (1998/2002) n'envisageaient pas ;o) .
Le web a changé, il lui faut un nouveau nom! Facile: Web 2.0

Fred Cavazza sur son blog donne une première définition de ce que cela peut être.

En fait il n'est pas vraiment le premier. Wikipédia en propose une définition en Anglais depuis le 11 Aout. En cherchant un peu on en trouve même des anti-diluviennes (31 Juillet 2005! ).
J'ai arrété la fouille là. Ceci dit je suis certain qu'il est possible de trouver des traces de la notion début Juillet et peut être même à la fin du mois de Juin!!!!

Comme Fred Cavazza le dit lui même:
"
Le web 2.0 c'est... enfin ça veut dire... ça... heu... ça désigne... bon OK je cale. Il existe bien une définition sur Wikipedia mais elle ne me satisfait qu'à moitié. Regardons la vérité en face, le web 2.0 est pour l'instant une notion un peu fourre-tout. "


Revenons malgré l'avis incrédule du sus nommé à la source de toute chose: pour Wikipédia (que son nom soit sanctifié ;o) ), le Web 2.0 est un composé de tout ce qui est Webbeux sans etre du html ou du classique code serveur.
Autant dire qu'il ya des choses a mettre dans la catégorie! Les blogs, le rss, les logiciels sociaux, le désormais incontournable AJAX et de manière générale tous les web services, les Wikis. Le Web2.0 est si je lis bien trés respectueux des standards.

Pour Cavazza, c'est moins le cas puisqu'il va jusqu'à citer Flash!!
Pour Cavazza, le Web2.0 n'est pas une (ou des) Technologies. C'est une volonté.

"Et le danger est là : pas d'innovation = pas de séduction = pas de croissance = les chinois / indiens produisent la même chose pour 5 fois moins cher = destruction de valeur. Pour maintenir une croissance il faut un souffle nouveau, une expérience plus riche, des services plus performant. Et c'est là où le web 2.0 entre en scène."



Comme il n'y a pas encore prescription, je vais me permettre donner la mienne de définition.
Ou plutôt, voici une liste non exhaustive de sites qui réalisent pour moi un saut qualitatif important avec les Web des Dinausores et qui méritent donc de faire partie du WEB2.0!


googlemaps (mais pas GMail)
Page de démo donnée sur le site de Cavazza
Netvibes Un portail extrêmement personalisable (Touvé grâce au blog de OE Affordance.info)
et
playdocam (Trouvé grâce à Dahoud
on contrôle un Arkanoid grâce à sa webcam en bougeant les mains!!

Mais aussi bien sur
Wkipédia (que son nom soit sanctifié... ;o) ). L'encyclopédie universelle, modifiable par tous est non seulement une
réussite technologique, mais en plus une merveille de collaboration sociale.

Et tous les blogs. Un exemple? Le blog de Loran ;o) (Rhooo c'est bon d'être cité!!)

J'ajouterai aussi dans cette catégorie 2.0 les logiciels sociaux comme Viaduc

Je me demande même si on ne pourrait pas ajouter les avancées réalisées par certains clients web. Je pense à Firefox et
à toutes ces extensions, qui font que la machine locale disparait peu à derrière le browser.

mercredi, septembre 28, 2005

Le Parlement européen s'interroge sur les rapports entre blogs et médias

Le Monde.fr : Le Parlement européen s'interroge sur les rapports entre blogs et médias

"les médias traditionnels sont-ils menacés par les pages personnelles mises en ligne, les blogs, qui se développent sur la Toile à une vitesse vertigineuse ?" ... That is the question....

We will win the Web

S.Ballmer, le CEO de Microsoft, a dit: "We won the desktop. We won the server. We will win the Web. We will move fast, we will get there. We will win the Web."

Je peux le tourner comme je veux, je n'aime pas cette volonté hégémonique de Microsoft.
Elle est effrayante.

Le problème est simple, si pour browser le web de demain il est nécessaire d'utiliser Windows vista/IE7, cela verrouille complétement l'accés au web.

Avec tout ce que cela implique... quelques majors se mettent d'accord... partagent le gateau et étouffent toute expression culturelle non alignée ou tous les concurrents commerciaux. Un TF1 bis à l'echelle de la planète... ou plutot une "major" (au sens de l'industrie du disque) monopolistique qui controle l'accès à la culture de masse (sous toute ses formes) et au commerce...

Réjouissant... C'est pour cela que la "guerre des standards" est si importante. C'est la clef de voûte de cette domination.
Le principe de la domination est simple: la majorité des gens utilisent la suite Office (Word, Power point..), qui génére des pages webs hypracools, animées en 3D, qui réagissent a la voix.
Un seul probleme: il s'agit d'un standard propriétaire et donc pour les voir, il faut utiliser Internet Explorer. Et pas autre chose. La machine est enclenchée.

Et voila tout le monde avec IE (Qui marche bien, le problème n'est pas là).
Une seule contrainte, à l'installation, la page par defaut est WWW.MSN.com. sur 10 utilisateurs, 9 ne savent pas comment la changer. On peut même imaginer qu'elle est inchangeable.
En plus MSN, présente toutes les qualités! Un search engine, des news, un blogger, un webmail, un Instant messenger, une liste de sites de vente en ligne y tout y tout.
Oui mais voila, quid de la pluralité de la presse? et bien elle n'est plus visible... elle disparait. Quid du concurrent qui fait de la vente en ligne de fleur pour la Saint Valentin, et bien il est invisible et donc inexistant...

Et je vous épargne le couplet sur le bouillon culturel insipide basée sur des bimbos a gros seins ou des beau barraqués, bien barraqués imposé à tout le monde... Même à ceux qui viennent d'horizon culturels complètement différents...




La phrase de Balmer a été lue ici. L'article essaie d'expliquer, longuement et laborieusement, quels sont les problemes potentiels de Microsoft pour y arriver... (Reference prise sur standblog.org)

jeudi, septembre 22, 2005

World Of Warcraft: Une epidemie echappe aux createurs du jeu...

World Of Warcraft (Wow pour les inititiés) est un MMORPG (Jeu Massivement Multijoueurs persistant). Cela signifie que des centaines de milliers de gens jouent en meme temps avec un personnage dans un monde virtuel.

Wow est un des jeux phares de la societe Blizzard, et les plus jeunes d'entres nous y depensent, par grand nombre, la plus grande partie de leur energie (Jean-Marc ceci est un message subliminal ;o) ...

Ce jeu est donc (theoriquement) sous le controle des programmeurs de Blizzard qui introduisent tous les jours de nouvelles fonctionnalités.

Et voila t'y pas que chronic'art (Merci Nico pour le lien), nous apprends que:
" un virus s'est répandu à vitesse grand V dans le monde du très populaire MMORPG World of warcraft. Exterminant instantanément les levels en dessous de 50 et tuant assez rapidement les niveaux supérieurs, le virus en question a transformé la plupart des grandes villes en charnier et a même obligé les GM (maîtres de jeu) a créer des quarantaines (où ils retiennent, tant bien que mal, les joueurs infectés) pour ralentir sa propagation. A l'origine de la catastrophe, des joueurs / coders qui ont trouvé le moyen de détourner le sort d'un boss ajouté via le dernier patch de Blizzard..."

Et Chronic'art plus loin d'écrire:

"Les créateurs du jeu ne savent toujours pas comment stopper l'épidémie et s'en excusent dans ce communiqué surréaliste : "Apparement le patch remède créé dans le but d'éradiquer la contagion d'Azeroth ne donne pas les résultat escomptés. En ce moment, notre équipe médicale continue ses recherches pour trouver un médicament efficace. Nous faisons tout notre possible pour assurer la santé et la vitalité des citoyens d'Azeroth dans un futur proche"."


Une video qui montre la propagation du virus peut etre vue ici.

On pourrait pas brancher les spécialistes épidémiologiques de la grippe aviaire sur Wow?


mardi, septembre 20, 2005

Opera devient gratuit

Opera est un browser -comme Firefox ou Internet Explorer- , extrèmement efficace et plaisant.

Contrairement à Firefox, il ne s'agit pas d'open source. Ceci dit si Firefox ne vous a pas convaincu et que vous vous trainez toujours avec le pénible Internet Explorer, je vous conseille de l'essayer.

La version gratuite intégrait jusqu'a présent des bandeaux de pub qui rendait l'utilisation d'Opéra un peu lourde. Ils n'y sont plus! :o)

(ceci dit moi je reste sour FireFox).

mercredi, septembre 14, 2005

Google Blog Search

Google vient de sortir son moteur de recherche de blogs!!!
ici: http://blogsearch.google.com/blogsearch

2 remarques rapides:
1) C'est globalement une bonne nouvelle vu les ratées de Technoratti, Feedster et autres
2) Il est extremement interessant de voir que Google choisit de faire un moteur de blogs independant de son moteur traditionnel.
La technologie est donc la même mais l'objet est différent :). Ceci dit ce n'est guere étonnant, tant les logiques sous tendant les blogs et les sites webs "classiques" sont differentes.


A tester donc!
(premiere bonne nouvelle Le blog de Loran est indexé! ;) )

lundi, septembre 12, 2005

c'est parti mon kiki!

Je sens qu'on pas fini de voir les collègues à la télé... :o(
Voici le communiqué de presse des syndicats, que je viens de recevoir...


COMMUNIQUE DE PRESSE
INTERSYNDICAL DU GROUPE HP EN France

1240

Le 12 septembre 2005

"8 semaines après l?annonce par le nouveau CEO Mark Hurd de 14 500 suppressions de poste au niveau mondial chez HP, la direction française a annoncé aux syndicats aujourd?hui lors d?un Comité de Groupe extraordinaire le chiffre concernant la France : 1 240 postes supprimés soit 25% des effectifs. 2,5 fois la moyenne mondiale qui est de 10% ! Presque 1,5 fois la moyenne européenne qui est de 15% ! La France est proportionnellement le pays le plus touché au monde.

Ce chiffre imposé à la filiale est choquant et injustifiable au regard de la charge de travail des employés et de la place d?HP sur le marché Français.

Depuis plusieurs années, les résultats de l?entreprise sont remarquables comme le montrent ceux du troisième trimestre (plus de 1 Milliard de dollars de bénéfice).

Les prévisions pour le quatrième trimestre sont optimistes.

La trésorerie du groupe est de 14.5 Milliards de dollars!

Ce chiffre annonce clairement une accélération des délocalisations, un recours massif à la sous-traitance et à l?intérim qui sont déjà largement utilisés.

Avant même son arrivée le premier avril 2005 et sans jamais s'y déplacer, Mark Hurd avait déjà ordonné à chaque entité la réduction permanente et continue des emplois dans tous les pays qu'il estime "à coûts élevés" et l'accélération de l'embauche dans les pays "à bas coûts". Facteur aggravant, la filiale française est tout particulièrement victime de la perte d'influence des managers français comme le montre le remplacement fin juillet de Bernard Méric, ancien Président d'HP Europe.

A la destruction des emplois s?ajoute la remise en cause des conditions de travail.

Pour l?intersyndicale d?HP cette annonce inadmissible montre que le véritable PDG de cette entreprise est le cours de l'action. La société parie avant tout sur les licenciements et la réduction d'avantages sociaux pour augmenter ses profits (5% net actuellement soit plus de 4 Milliards de $ par an) et utilise ensuite ces mêmes milliards de dollars pour racheter ses propres actions ! C?est une erreur stratégique de massacrer les emplois dans les pays au modèle social développé car ce sont ceux où HP fait le plus de business.

Il n'y a plus de responsabilité citoyenne, le comble du cynisme est que ceux qui prennent et exécutent ces décisions -qui frappent les employés en les stressant, les appauvrissant ou jetant certains dans la précarité- gagnent et vont gagner des milliers voire des millions de dollars grâce à leurs nombreuses stock options en plus de salaires déjà très confortables.

L?intersyndicale d?HP dénonce ce plan scandaleux de la direction américaine et européenne visant tout particulièrement la France et l?Europe de l?Ouest. Nous allons unir nos forces avec les autres syndicats français, européens et américains.

Nous alerterons les pouvoirs publics locaux et nationaux et utiliserons toutes les possibilités offertes par le Code du Travail.

Nous comptons également sur la mobilisation des salariés pour faire échec à ce plan comme lors du débrayage du 8 septembre où la majorité des salariés s?est mobilisée.

Nous souhaitons qu'HP réussisse sur le marché français et européen, mais avec ses salariés ! HP ne dispose que de quelques jours pour rétablir son image de marque d'entreprise "responsable et citoyenne"

vendredi, septembre 09, 2005

Le second souffle de l'Internet vu par Libé et une disgression

Décidement tout le monde s'y met....

Après le Monde, après le Times,
c'est le tour de Libé qui fait ses choux gras sur le renouveau du net.

L'article est intéressant et présente les "nouvelles" tendances.
On y parle de recherche verticale (recherche dans un domaine plutôt que sur l'ensemble des documents du webs), de social networking et bien sur de mobilité podcastienne.

L'article est sobre et reste globalement focalisé sur les conséquences en terme de marché de ces technos.

L'internet 2.0 n'est-il qu'un outil économique?

On peut lire sur le blog Motrech:
"Soyons pragmatiques, ajoutons petit à petit les briques fonctionnelles nous permettant de resserrer les communautés humaines".
Tristan Nitot dans son blog écrit : "....la formidable puissance de l'intelligence collective, quand elle trouve des façons de s'organiser" et plus loin "Il y a aussi la culture du don. Je blogue pour mon plaisir, je publie mes photos sous Creative Commons, je retouche un article Wikipedia avec gourmandise, je m'éclate à contribuer au projet Mozilla, et je ne suis pas le seul...

Concernant "l'intelligence collective" et "la culture du don" (qui n'en est pas vraiment une) , il est a noter que vient d'être traduit en francais l'excellent "Smart Mobs" renommés en "foules intelligentes", dont je ne saurais que trop conseiller la lecture, qui traite ces sujets en expliquant notament pour "la culture du don" qu'il s'agit "d'un jeu a somme non nulle", tout le monde donne à la collectivité et finalement, tout le monde a plus (et en à conscience).

Des raisons et de la raison, donc. Même si le "resserrer les communautés humaines" a un élan
très enthousiaste.

Il y a quand même un truc qui me chiffonne. La passion qui entoure le développement de ces technologies, pour preuve l'échange musclé (Troll dans le langage internet) qui a eu lieu hier, et qui a secoué toute la blogosphère technique, à propos du "respect des standards" du web,
ne cache t'il pas quelque chose de beaucoup plus profond que le bien être économique et l'accessibilité des personnes handicapées au web?

Je ressens moi même cette passion, par "ressens" je veux dire que je la vis.
Je m'introspecte (AIE!! ;o) ), et je me demande, si tout cela n'est pas finalement une recherche de sens plus qu'autre chose.


Le sociologue Philippe Breton a d'ailleurs écrit un essai qui s?appelle ?le culte de l?internet". Ou il essaie de mettre en évidence la "religiosité" développée autour du net.

A propos de toute cette histoire de standard T.Nitot écrit d'ailleurs :" Ca n'est plus une discussion, c'est une fatwa, ça n'est plus de la technologie, c'est de la religion" ...


Si quelqu'un a un avis ?

mardi, septembre 06, 2005

Open Source.... Hardware!

Découvert grâce a un billet sur le blog de Pisani ici.

L'émergence du concept de Fab Labs.
L'idée, défendue par un lab du MIT est de produire des machines capables de fabriquer à peu prés n'importe quoi à partir de:
1) matière première (bien sur!)
2) plans numériques trouvés sur le web.

Une des caractéristiques des ces machines à fabriquer universelles, étant que leur
coût est lui même faible. Ceci étant rendu possible par la généralisation des ordinateurs et des programmes Open sources qui permettent à un faible coût d'avoir de l'intelligence.
L'électronique et les éléments Hard des machines étant eux même peu cher.

Cela ouvre des perspectives impressionantes... De même que les foyers sont (en général) aujourd'hui équipés de PCs imaginons qu'ils soient demain équipés de ces Fab Labs...

Et cela ouvre une ère ou l'on n'achète plus les objets manufacturés... on les fabrique!
A partir de quoi? Et bien à partir de plans trouvés sur le web.... Et cela pose le problème de la propriété intelectuelle des ces plans...

D'ou l'idée d'Hardware Open Source. C'est à dire de plans, utilisables et modifiables par tous sans risquer de poursuites judiciaires pour plagiat...

Oui Monsieur ma Byciclette est GNU/GPL/Artistic art! :o)

Cela pose également un gros problème aux "Majors" manufacturiers (et à leurs employés),
leur travail s'en trouvant massivement transformé.

Une autre vision un peu inquiétante peut également être développée, imaginons que ces "Fabs Labs" soient capables de s'auto repoduire à partir de plans... Et l'on a des robots capables de se reproduire à l'infini (le futur aura t'il besoin de nous?) ....

lundi, septembre 05, 2005

Les commandos anti 4x4 attaquent - Standblog

Retour de vacances :O/ en douceur ...
et lecture donc de Standblog...

avec cet article sur les 4*4

Un engagement tous azimuts, T.Nitot est vraiment un homme (pas cynique :o) ) a suivre!

vendredi, août 05, 2005

Dans la main invisible du Net

Une projection ( à lire vite si on est pas abonné) dans Le Monde ici:

Dans la main invisible du Net, par Yves Eudes


Un peu polar, didactique, et bien renseigné, juste avant de partir en longues vacances, j'adore!
On y entrevoit l'open source et l'"open content" comme une des bases de cette nouvelle société.

Et en plus l'auteur n'a pas peur de faire des paris sur la future architecture de l'Internet, on y lit:
"
Sur cette base, un consortium d'universités et de laboratoires américains lança un programme baptisé IRIS (Infrastructure for Resilient Internet Systems), visant à transformer en profondeur l'infrastructure du Net pour en faire un réseau intégralement peer-to-peer.

Aujourd'hui, les serveurs centralisés hébergeant des grandes masses d'informations sont en voie de disparition : le contenu du Net est éparpillé de façon fluide et invisible dans la mémoire des milliards de machines connectées au réseau sans que leurs propriétaires aient à s'en soucier."




Les travaux de l'Iris peuvent être trouvés ici.

jeudi, août 04, 2005

Firefox perd il son âme?

Lu sur le blog de Tristan Nitot et un peu partout dans la presse (d'ailleurs T.Nitot en fait une liste exhaustive ici.)

La fondation Mozilla se réorganise pour créer une entité commerciale qui permettrait de gérer
les projets qui lui sont soumis.

Le vocabulaire employé par T.Nitot (dont je pense en général le plus grand bien) frôle la langue de bois technocratique américaine.
"agile " c'est marrant ce mot creux pour markéteux est souvent utilisé pour que les avanies est une meilleure odeur.

Et la fin n'est pas meilleure:
"This is just one more reason for me to appreciate the Mozilla Project as a whole: great products, awesome technology, created by smart and deeply honest people working for the greater good."

Et sur le fond quoi?
Et bien rien d'autre que la création d'une société qui va vendre du service et payer des impôts aux US.
Et ceci en continuant à demander des dons et du bénévolat, comme le Samu Social ou les Restos du coeur,...

Il ne faudra pas s'étonner si les vocations altruistes qui ont fait le succès de Mozilla s'éssoufflent!

Je veux bien espérer que la bonne volonté qui a permis d'imposer un browser libre et ouvert à tous, même au plus pauvre, va perdurer, mais je ne vois vraiment pas la "great news".

mercredi, août 03, 2005

Le nombre de résultats communs entre les moteurs diminue de plus en plus

L'excellent blog Influx fait état d'une étude réalisée par le méta-moteur Dogpile (les méta-moteurs sont des moteurs qui cherchent dans les résultats des autres moteurs) qui montrent que les moteurs ne renvoient pas souvent les même résultats lors d'une recherche sur un mot.

Ceci n'est pas étonnant le web grossi, le choix de renvoyer tel ou tel résultat dans la première page est forcément subjectif.

influx - Le nombre de résultats communs entre les moteurs diminue de plus en plus

mardi, août 02, 2005

vendredi, juillet 29, 2005

msnbetter thangoogle

Un petit mot rapide pour dire que le blog de Loran soutient officiellement la candidature de
msnbetter thangoogle!!

Mais kes donc que ce truc la?

Il s'agit d'un site qui participe au concours de positionnement organisé en Pologne.

Comme j'en parlais avant hier, une problèmatique importante pour "exister" sur le net est d'être
bien classé sur certaines requêtes par les moteurs de recherche.

La règle est la suivante il faut finir premier dans google.pl (et oui c'est sur le google polonais que cela est mesuré) à une certaine date sur la requète msnbetter thangoogle.

Un détail amusant les règles étant écrites en Polonais nous ne sommes absoluement pas
surs de les respecter! ;) Mais Msnbetter thanGoogle vaincra quand même ;) !

Que le meilleur msnbetter thangoogle gagne! ;)
Mia? lepszy msnbetter thangoogle wygrywa? (zwyci??a?; zwyci?stwo)!
;)

mercredi, juillet 27, 2005

Google encore....

Les articles ci dessous décortiquent le brevet "Information retrieval based on historical data".

Ce brevet, déposé en Mars 2005, est attribué à Google.
Il est intéressant pour au moins 2 raisons:
- Les généralités et les flous qui s'y trouvent illustrent à merveille, la limite des brevets logiciels.
- Il permet de mieux comprendre les critères sur lesquels Google s'appuie pour classer un site web sur certaines requêtes.

Pour les gens extérieurs au domaine, cela peut ne pas paraitre évident (c'est en tout cas ce que les enquètes menées sur les internautes montrent), mais d'énormes sommes d'argent se jouent sur le classement des sites dans Google.

D'ou la tentation de comprendre comment on peut optimiser son site pour qu'il soit mieux classé,
et donc plus accédé par les internautes.
Puisque les internautes cherchent pour 80% (en France) d'entres eux avec Google, et qu'ils cliquent majoritairement sur les premiers liens et rarement sur ceux de la deuxième page, il convient d'être là si on a quelque chose à vendre!
C'est le coeur même du (dur) métier de SEO (Search Engine Optmizer).

Et comme Google veut d'une part garder la pertinence de ses résultats, et d'autre part vendre des publicités aux sites mal placés qui veulent avoir du traffic, on assiste à un jeu de chat et de souris entre les SEO et le moteur.

Google "invente" et brevète (parfois) des techniques pour lutter contre ce qu'il considère être du spam,
et les SEO ou tous ceux qui ont un intérêt à voir leur site bien positionné essaie de comprendre comment le moteur fonctionne....
ici donc:
Graywolf's Wolf-Howl: Google Patent Analysis

ou ici sur SEOMOZ.ORG

mardi, juillet 26, 2005

Google fait la une de Libé

Google fait la une du journal Libération...
qui remarque, un peu inquiet, que le " chiffre d'affaires publicitaire [de Google] devrait représenter 1,5 fois celui du New York Times en 2005."

Tout aussi pathétique la remarque de S.Balmer le patron de M$,
que je ne connaissais pas: "Google est une bulle sur le point d'exploser" ... C'est peut-être ce que disait les patrons d'IBM il y à 15 ans à propos de MS...

Libération : Google met la télé dans son moteur

lundi, juillet 25, 2005

manhack.net : un must

Manhack.net est un outil php développé par Jean Marc Manach

Il a, à partir d'une interface unique, recensé des centaines de sites
qui permettent d'analyser un site web sous toutes ses coutures.

A l'interface initiale un peu touffue, a été ajoutée une entrée pour débutants (?) plus simple.

On est pas loin de l'exhaustivité. Moi J'adore.
?Whois & Cie? : la veille (encore) simplifiée

samedi, juillet 23, 2005

Les couts cachés de l'offshoring

Un article qui détaille en profondeur les problèmatiques de l'offshoring (qui consiste à mettre dans un pays pas cher, tout ou partie de sa main d'oeuvre informatique) en s'appuyant sur des exemples.

L'article montre notament que le ratio de réduction de coûts à périmêtre constant, n'est pas de 20$ en Inde pour 100$ aus US.
Le ratio serait plus proche de 80$ pour 100$ après une longue période de stabilisation.
Ce qui semble effectivement plus conforme à ce que l'on constate, tristement, quotidiennement.


Hidden Costs of Offshore Outsourcing - staff transitioning and managing offshore contract may be costly - calculate hidden costs of moving jobs overseas - cultural differences can stymie best-laid contract specs - CIO Magazine Sep 1,2003

mercredi, juillet 20, 2005

Web invisible (suite)

Un papier en Francais d'une grande qualité....
je l'avais raté... mea culpa...
invisible Web / Web invisible

Mes fils RSS

L'auteur du blog BlogOKat a eu l'excellente idée de partager les fils RSS qu'il lit.

J'ai eu le plaisir de constater que pas mal d'entres eux étaient dans ma liste.

J'ai décidé de faire pareil.
Et si cela ne sert pas à quelqu'un cela me permettra au moins d'avoir un backup ;)

Comme j'utilise Sage comme lecteur RSS et que celui est complètement intégré à Firefox,
j'en profite pour partager tous mes bookmarks. Les fils RSS se trouvant sous l'entrée "Sage Feeds".

Bookmarks et FillsRss.htm

lundi, juillet 18, 2005

Le web profond (suite )

Pour faire suite au post de la semaine dernière sur le web profond
Une grosse base de base trouvée grâce au blog Totem
ici: NIST Scientific and Technical Databases - Online Scientific Databases

mercredi, juillet 13, 2005

Un article qui cartographie le Web du referendum

rtgi - réseaux, territoires & géographie de l'information - les productions

Un délice!!! à consommer sans modération!!

et des liens fort intéressants vers deux études (dont une provenant en partie d'HP :o) ):
http://www.blogpulse.com/papers/2005/AdamicGlanceBlogWWW.pdf

ou par la cité des sciences et de l'industrie:
http://www.utc.fr/rtgi/documents/WebCSTIAnalyseduDomaine.pdf

samedi, juillet 09, 2005

Le web profond (suite)

La notion de web profond (deep web) aussi appelé web invisible (invisible web) était un peu confuse dans mon esprit embrumé, je me suis plongée sur le sujet, voila ce que j'en retiens.

Wikipédia définit le web profond comme suit:

"Les ressources vers lesquelles les hyperliens sont créés dynamiquement pour répondre à une interrogation échappent aux robots d'indexation. En effet, un robot n'est pas capable d'émettre des interrogations pertinentes, aucun hyperlien n'est donc créé lors de sa visite."


Cette définition est un peu obscure... Allons voir toujours sur Wikipédia mais en anglais ce que ca dit...

"The deep web (or invisible web or hidden web) is the name given to pages on the World Wide Web that are not indexed by search engines. It consists of pages which are not linked to by other pages, such as Dynamic Web pages based on responses to database queries. The Deep Web also includes sites that require registration or otherwise limit access to their pages. It should not be confused with the term dark web or Dark internet which refers to machines or network segments not connected to the Internet. While deep web content is visible to people but not to search engines, dark internet content is accessible by neither people nor search engines."


C'est quand même plus clair!
Le web profond est donc l'ensemble des pages et documents, qui sont accessibles par les internautes, mais non accessibles aux robots d'indexations des moteurs de recherche.
Ce sont ces robots d'indexations qui permettent la constitution des indexs de recherche.

Il s'agit donc des documents, pourtant accessibles aux internautes, que l'on ne trouvera pas en cherchant dans un moteur de recherche classique (Google par exemple).

Le "web profond" s'oppose au "web surfacique".


Voilà la représentation qu'en fait BrightPlanet (les bateaux représentant les moteurs "profonds").


La limite entre web "surfacique" et web profond est bien entendue floue et changeante...
Elle dépent des moteurs et de leurs limites techniques.
Des bases s'ouvrent, les moteurs indexent de plus en plus de documents.
Ne serait que parceque certaines pages générées dynamiquement sont directement liées à partir de pages statiques exterieures.
Et puis certains formats comme le PDF, qui étaient hier "profonds", sont aujourd'hui faciles à "lire" pour les moteurs.

A contrario, l'acroissement, très rapide de la taille du web, est un problème pour les moteurs qui ont du mal à indexer complètement le contenu des tous les sites dont ils connaissent pourtant les urls d'entrées et qui n'opposent pas de problèmes techniques particuliers.
Ce problème d'indexation lié à la "profondeur" (c'est à dire à leur taille et pas à des contraintes techniques) des sites, est admis par les moteurs qui cherchent des solutions. Google a, par exemple, lancé de facon expérimentale " Google Sitemaps" .
Le webmaster fourni un plan du site en XML, qui permet au moteur d'apréhender plus facilement le contenu et les changements de structure.


Quant aux très grosses bases qui constituent le coeur du deep web, les moteurs traditionnels (Google, Yahoo, Askjeeves, Exalead, Msn) essaient de trouver des solutions pour les indexer et proposer leurs riches contenus à leurs utilisateurs (cf ces billets concernant Yahoo (lu sur le blog de yahoo) et Google (lu sur Betanews)).


Ou l'on parle du web profond (ceci n'est pas exhaustif):
Web invisible, web caché, web profond: Sur le site Intelligence center.
Il s'agit d'un dossier très complet, en francais, et clair sur le sujet (Malheureusement pas datée, mais elle semble assez récente). A lire!

invisible Web / Web invisible Jean-Pierre Lardy (Mars 2002)
Clair, assez concis et exhaustif. A lire.

Bases Publications Le site web de la société Bases Publications.
Le sous titre de ce site est "Connaitre et bien utiliser le web visible et invisible".
On y trouve des liens et des fiches pratiques bien faites, qui n'ont toutefois pas forcément toujours un rapport avec le "web profond".

Getting the most from the Internet and Deep d'August Jackson (Juin 2005).
Un cookbook sur comment organiser une recherche sur le net, plus qu'une analyse des sources que l'on ne trouve pas avec google...

Deep Web white paper de Michael K. Bergman (Juillet 2001).
Quoique la vesion PDF soit assez illisible, cet article est très intéressant, il quantifie et qualifie de manière expérimentale le web profond. Le chiffre quantifiant le web profond de 500 plus étendu que le web "surfacique" vient de là. On y trouve également la liste des "sources profondes" sur lesquelles l'auteur a travaillé.

Crawling the hidden web de
Sriram Raghavan et Hector Garcia-Molina de Décembre 2000
(trouvé grâce Cam qu'il en soit vivement remercié).

Illuminating the web (Time) Un article assez général du Time

Llrx.com à peut être atteind l'exhaustivité du recensement de ce qui existe... On y trouve une base énorme de réferrences (à explorer). Ce site est tenu par
Marcus Zillman tout comme:

Le blog deepwebresearch.info, qui possède lui aussi de très nombreuses références.


Annotation for the Deep Web est un article écrit en Mai 2003 par
Siegfried Handschuh, Raphael Volz, Steffen Staab, qui parle de la génération automatique ou semi automatique de méta-datas.


"Sources profondes" :)

  • Sources pour trouver des "sources pofondes" Fr
URFIST un point d'entrée vers de très nombreuses ressources et qui pointe entres autres vers:
  • DADI Répertoire des bases de données scientifiques disponibles sur Internet.
Persée ("portail de revues scientifiques en sciences humaines et sociales")
APIGuide Une liste énorme de site FR non (ou pas bien) indexables sur le site.
Serveur de preprint Hébérgé par l'université de Clermont Ferrand

Sources US ou autres
La liste des sources (largest deepweb sites) utilisées par Brightplanet
The invisible web
The invisible web revealed (Une présentaion couplée d'une liste de ressources)
Science Research (Ce moteur est spécialisé dans la recherche de sources venant du monde scientifique).
AccessMylibrary (Un moteur pour bibliothécaire?)