Project-developpement

about buzzaar
English version buzzaar-development-en 1.Le système de buzzaar Buzzaar est un réseau pair à pair distribué structuré, organisé en deux couches, basé sur une architecture déjà active dans de nombreux projets développés à l'EPFL, basé sur des langages open-source comme LUA et Ruby.. Pour les utilisateurs-trices il s'agit surtout d'un plug-in installé sur le navigateur « Firefox» (Firefox add-on) qui communiquera avec le système. Un tel réseau requiert la création et la gestion de profils d'utilisateurs-trices, la gestion de la politique d'adhésion, de la sécurité et la confidentialité des données privées. (principe de non manipulabilité et non tracabilité -  voir point 3 anonymat et non manipulabilité).

Le système doit gérer deux niveaux d'informations qui demande chacun une approche et un traitement différent. L'architecture du réseau est donc construite sur deux couches réseaux. 2.architecture du réseau La couche de proximité constitués des pairs réguliers ou volatiles

Les pairs dits volatiles sont les utilisateurs-trices, membres du réseau. D'un point de vue informatique, ils sont non fiables et inconstants dans le sens que leur niveau d'attrition [churn-rate] est élevé; ils peuvent quitter et entrer dans le réseau à tout moment. Ce sont eux qui fournissent les contenus dans le réseau ( les liens de leurs historiques de navigation, que l'on va appeler «les votes»). Par leur nature volatile, ils forment une structure de réseau auto-émergente. Ces réseaux auto-émergent sont plus à même de gérer des pairs instables parce que leur maintenance est plus facile.

La couche de proximité gère les données locales associées à chaque utilisateur-trice. A cause de la grande variabilité de ces données et de leur aspect confidentiel, elles sont enregistrées et stockées dans la machine de l'utilisateur-trice. Seules les données qu'il-elle autorise sont partagées et utilisées. La couche d'indexation les pairs stables [backbone peers]

Cette couche est composées de machines dites «institutionnelles» des serveurs connectées en permanence qui stockent et enregistrent les données globales envoyées par les pairs sur le réseau (profils,  historiques de recherches et liens).

La couche d'indexation gère l'index global,les statistiques des sites visités,les identités des membres du réseau (création et récupérations), les processus d'adhésion ou de résiliation et les redirections des scores de visites des sites. Elle représente le squelette du réseau [backbone], construite sur le système SPLAY, elle utilise des indices structurés ( Une table de hashage, distribuée [Distributed Hash Table] ). Cela permet d'obtenir un système efficace d'enregistrement et de récupération des données. 3.Anonymat et non manipulabilité Une personne doit devenir membre de buzzaar (un pair) pour pouvoir utiliser les possibilités du réseau. Les membres partagent leurs informations. Ils « votent » pour des sites; ils envoient des données, des URL, dans le réseau. Anonymisation – protection de la sphère privée.

Lorsqu'un pair active un lien dans son processus de recherche, il est automatiquement enregistré par le logiciel (le plug-in) «buzzaar-toolbar». C'est cette information qui sera traitée par le système et qu'on appelle métaphoriquement un vote. Seule l'information est intéressante et non l'adresse d'où elle provient (la personne qui l'envoie). Cette information sera fragmentée et encryptée dans le système pour rendre impossible à qui que ce soit de reconstituer l'identité physique d'un pair, ou l'adresse IP de sa machine. '''Non manipulabilité : Protection et sécurisation des données. '''

Les pairs adhèrent au réseau en créant un login selon une méthode standard de validation par e-mail(un email = un humain) et un formulaire contenant un script captcha(séries de lettres et chiffres à reproduire à la main pour la validation). Un profil est créé pour chaque membre, il conserve les données de login, le mot de passe l'historique de ses recherches sur réseau et des préférences diverses.

Une clef de cryptage réseau protège les données sensibles contre des intrusions de l'extérieur du réseau. Chaque membre peut envoyer un nombre x de données dans le réseau par x temps. c'est ce que l'on nomme le «processus de vote» et les «bulletins de votes» sont délivrés par le système (le système valide les données envoyées par le membre). Le mécanisme de traitement des données envoyées protège le système contre le spam (envois massifs de données en temps limite) et contre la manipulation des données (ranking) par tiers, comme il protège l'anonymat du membre qui envoye les informations. 4.La visualisation de l'information – les cartographies Les membres du réseau peuvent visualiser leurs recherches. Ils créent ainsi leurs cartes en partant d'une adresse de leur choix. Le «résultat» est filtré par popularité sur la base des sites les plus cliqués et les plus visités par l'ensemble des membres du réseau, et  par co-occurance, c'est à dire par proximité d'intérêt: les sites selectionnés par d'autres membres du réseau ayant fait des choix similaires - [voir filtre de co-occurance FAQ].

Les résultats peuvent être visualisés dans une échelle de temps; l'utilisateur-trice peut remonter dans le temps et voir le résultat de sa recherche x-temps avant etc. Ce facteur temporel restitue l'idée de la fluidité et de la re-combination permanente des données dans le réseau.

L'objectifs est que chacun créent ses propres réseaux en agissant directement sur la carte, en recombinant les filtres et les résultats. Les cartes peuvent être partagées, envoyées par mail et exportées sous forme d'image ou ré-actualisées sous forme de ficher actif... Comme les intérêts d'une personnes sont hétérogènes, multiples et temporels selon ses activités, les réseaux d'URL ainsi créés forment autant de topologies variées et dynamiques du web qu'une simple liste d'un moteur de recherche basé sur les algorithmes des recherches par graphes et par mots clefs, ne pourra jamais montrer.

La visualisation de l'information est un méta-langage qui contient l'information et un discours sur l'information(sa représentativité). elle traduit en une représentation les rapports de temps et de granularité de l'information, elle offre une interaction avec l'information, elle transforme la connaissance en rendant visible des données qui sont souvent au delà des quatre dimensions visibles à l'oeil humain et donc compréhensibles.

La représentation visuelles des réseaux et de leurs topologies fait partie de cette exploration. Depuis les années 1990, des artistes en ont expérimenté les possibilités, ils ont apporté à cette recherche des réflexions touchant à l'esthétique, au sensible, et au domaine de l'aléatoire.

Par défaut, les pairs pourront naviguer dans une interface graphique du réseau; sous la forme d'un environnement dynamique cartographié et mis à jour périodiquement, une représentation visuelle des structures réticulaires et dynamiques des réseaux.