Introduction-old

Le contexte de l'information sur Internet Les mécanismes de la recherche web L'accès aux contenus et aux ressources tels que les pages web, les fichiers, les images,..., demandent la plupart du temps de recourir à un outils de recherche. Ce sont des moteurs de recherches centralisés qui trient et classent les résultats des requêtes selon plusieurs critères de sélection et d'analyses des données et restituent des solutions aux requêtes (des propositions sous formes d'adresses URL à consulter) par ordre de pertinence supposée. Des requêtes trop généralistes, des analyses qui ne tiennent pas assez compte du point de vue de l'utilisateur/trice; de son comportement, des données de ses historiques et de recherches empêche de cibler avec plus de pertinence ce qu'il/elle pourrait rechercher. La position de l'utilisateur/trice Les nouvelles technologies digitales en réseau ont transformé la position du spectateur qui consommait passivement des contenus produits par d'autres, en utilisateur/trice interactif producteur de ses contenus et les partageant avec ses pairs. C'est un élément fondamental de transformation sociale et culturelle. Nous distinguons deux types d'architectures qui ont particulièrement mis en avant le partage, la communauté, la participation et la distribution dans la construction et l'échange des connaissances.  Les applications du web 2.0 Les plateformes sociales et collaboratives des wikis ( Wikipedia, Wiktionnary, Wikimediation, Culture Libre, etc), des blogs, ou des sites d'échanges de contenus (YouTube, Flickr, Twitter, etc.) ont permis aux utilisateur/trices d'interagir avec les contenus et également entre eux. Elles modifient radicalement le paysage d'Internet.  les réseaux pair à pair [P2P] sont différents des réseaux centralisés par la modularité de leurs architectures. Ils permettent de décentraliser des services et de mettre à disposition des ressources dans un réseau de pair à pair, chaque pair devenant à la fois client et serveur et offrant ses ressources sans l'intermédiaire d'un serveur ou d'une architecture réseau centralisée.   Savoir captif ou savoirs distribués Les données circulant sur Internet constituent pour une part la mémoire collective du Web. Elles servent à comprendre la nature et la provenance des informations et participent également à l'évolution d'une historiographie. Les sociétés commerciales participent à une captation privée de ces données; les algorithmes et les logiciels utilisés sont brevetés, les données récupérées sur les serveurs sont privatisées et échappent à l'utilisateur/trice. Elles font évidemment l'objet de convoitises économiques et politiques -- échange des données, publicités ciblées, filtrage, traçage, techniques de surveillance de l'opinion [veille Internet], voire censure. Pour ces entreprises, la captation, l'analyse et la non-divulgation de ces données du réseau va renforcer leur position,jusqu'à créer des situations de monopoles. Par leur position et par les informations qu'elles détiennent sans les divulguer, elles peuvent r tracer les utilisateur/trices, et contrôler le réseau -- voire dans le futur, le manipuler ? Pour l'utilisateur/trice, ces données qu'il crée et qu'il envoie sur le réseau restent totalement fragmentaires voir inutilisables et ne lui appartiennent tout simplement pas, ou il n'y a pas accès. Nous proposons de restituer ces informations; les historiques de recherches, les liens, les adresses URL, les analyses de contenus dans un réseau public distribué, dans lequel les pairs ( les utilisateur/trices consentants et membres du réseau) s'échangent leurs informations dans un esprit coopératif, organisés en communautés d'intérêts partagés, collaborant à la construction d'un savoir collectif distribué. Nous postulons que ces communautés ouvriront de nouvelles topologies, des alternatives à celles que veulent bien nous restituer les réseaux centralisés, et dont les résultats seront plus dynamiques; plus complexes et plus diversifiés. Le système Le système est un réseau pair à pair distribué structuré, organisé en deux couches, basé sur une architecture déjà active dans de nombreux projets développés à l'EPFL (voir développement). Pour les utilisateurs il s'agit surtout d'un plug-in installé sur le navigateur « Firefox» (Firefox add-on) qui communiquera avec le système. architecture en réseau Le réseau est un serveur P2P, une architecture décentralisée, souple, fiable et constante, respectant les principes de confidentialité et de confiance.   Le réseau de proximité les pairs réguliers ou volatiles, les utilisateur/trices, membres du réseau, qui se connectent et quittent le réseau à tout moment.   Le réseau d'indexation – les pairs stables [backbone peers]; des machines institutionnelles, connectées en permanence qui stockent et enregistrent les données globales envoyées par les pairs sur le réseau(profils, signatures, historiques de recherches et liens) et qui sont responsables de la sécurité du réseau.   Une personne doit devenir membre du réseau (un pair) pour utiliser le système de recherche. Les pairs partagent leurs informations avec d'autres, selon un système d'intérê t communs. Ils « votent » pour des sites; ils envoient des données, des URL, dans le réseau. Ils peuvent chercher des informations comme dans n'importe quel système de recherche. Leurs requêtes sont filtrées et analysées par indice de popularité et de co-occurance [recommander system -voir filtre de co-occurance FAQ]. Le but est de renvoyer aux pairs des réponses et des liens intéressants dans le processus de recherche. Lorsque les pairs font des recherches par le réseau, et activent les hyperliens, cela génère des résultats triés par les filtres du système. Une topologie d'intérêts communs se dessine. Comme les intérêts d'une personnes sont hétérogènes, multiples et temporels selon ses activités, les réseaux d'URL ainsi créés forment autant de topologies variées et dynamiques du web qu'une simple liste d'un moteur de recherche basé sur les algorithmes des recherches par graphes et par mots clefs, ne pourra jamais montrer. Profil de l'utilisateur Un profil est créé pour chaque pair. Il est établi par calcul en tenant compte des historiques de navigation, des historiques de recherches, des favoris [bookmarks]du pair. Ce profil va permettre aux pairs institutionnels de déterminer ses centres d'intérêts, et de quelles communautés il est proche. protection de la sphère privée, confidentialité et anonymat Le profil de l'utilisateur est confidentiel et non manipulable. Il reste stocké sur la machine du pair. Seules les données de login sont stockées dans une partie du système, variable pour chaque utilisateur-trice, de manière à protéger l'anonymat des personnes. Les pairs adhèrent au réseau en créant un login selon une méthode standard de validation par e-mail(un email = un humain)et un formulaire contenant un script captcha(séries de lettres et chiffres à reproduire à la main pour la validation). Une clef de cryptage réseau protège les données sensibles contre des intrusions de l'extérieur.  Les informations - les «votes» Lorsqu'un pair active un lien dans son processus de recherche, il est automatiquement enregistré dans l'historique de son navigateur. C'est cette information qui sera traitée par le système et qu'on appèle métaphoriquement un vote. Seule l'information est intéressante et non l'adresse d'où elle provient (la personne qui l'envoie). Cette information sera fragmentée et encryptée dans sysème pour rendre impossible à qui que ce soit de reconstituer l'identité physique d'un pair, ou l'adresse IP de sa machine. La visualisation de l'information La visualisation de l'information est un méta-langage qui contient l'information et un discours sur l'information(sa représentativité). elle traduit en une représentation les rapports de temps et de granularité de l'information, elle offre une interaction avec l'information, elle transforme la connaissance en rendant visible des données qui sont souvent au delà des quatre dimensions visibles à l'oeil humain et donc compréhensibles. La représentation visuelles des réseaux et de leurs topologies fait partie de cette exploration. Depuis les années 1990, des artistes en ont expérimenté les possibilités, ils ont apporté à cette recherche des réflexions touchant à l'esthétique, au sensible, et au domaine de l'aléatoire. Par défaut, les pairs pourront naviguer dans une interface graphique du réseau; sous la forme d'un environnement dynamique cartographié et mis à jour périodiquement, une représentation visuelle des structures réticulaires et dynamiques des réseaux.