La donnée (data)

La donnée, kécécé ?

Une donnée sur Internet, c'est l'heure à laquelle vous vous êtes connectés à Facebook, votre adresse e-mail que vous avez utiliser pour vous créer un compte sur Pôle-Emploi.fr, le film que vous avez choisi de regarder en vidéo à la demande. Une donnée ça peut être beaucoup de chose : infographie ou illustration si on en trouve.

Serge Abiteboul, professeur à l'ENS de Cachan, nous explique ce qu'est une donnée : "Une donnée est une description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par exemple une observation ou une mesure. À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens. En comprenant le sens de l’information, nous aboutissons à des connaissances, c’est-à-dire à des « faits » considérés comme vrais dans l’univers d’un locuteur, et à des « lois » (des règles logiques) de cet univers."

Cette donnée se matérialise dans le monde numérique par des « bits » (contraction des mots anglais binary digit), des variables pouvant prendre la valeur de 0 ou 1. Par exemple , il est possible de représenter la position d'un ascenseur dans un immeuble de 6 étages avec 3 bits :

  • 000 pour le rez-de-chaussé

  • 001 pour le premier

  • 110 pour le sixième

« Très bien, et alors ? » Et alors, ces données que vous produisez lors de votre navigation sur Internet ou lorsque vous utiliser un service en ligne peuvent avoir un intérêt dans de nombreux domaines pour comprendre, expliquer ou anticiper des actions humaines. Ce sont des outils pour améliorer la compréhension de notre monde.

Comme nous l'explique très justement Dominique Cardon, sociologue spécialiste d'Internet :

"Greffés à nos écrans, les classements, palmarès, compteurs, cartes, recommandations et notes de toutes sortes figurent les pointes émergées de la calculabilité des traces de nos activités. A partir de données toujours plus inattendues (déplacements, tickets de caisse, clics sur Internet, consommation électronique, temps de lecture d'un livre sur les tablettes électroniques, nombre de pas enregistrés par un podomètre), les algorithmes chiffrent le monde, le classent et prédisent notre avenir" (p12) (à mettre en citation avec un encart).

La donnée : le nouvel or noir

Ces données produites revêtent aujourd'hui un intérêt majeur pour nombres d'acteurs économiques, politiques ou associatifs. En effet, nous assistons à croissance exponentielle des données produites. Le nombre de données numériques que nous produisons a déjà dépassé le volume total des écrits depuis que nous avons découvert l'écriture.

Dominique Cardon, La vie rêvée des algorithmes : « Chaque jour, 3,3 milliards de requêtes sont effectuées sur les 30 000 milliards de pages indexées par Google ; plus de 350 millions de photos et de pages sont échangés par 3 milliards d'internautes. Si l'on numérisait toutes les communications et les écrits depuis l'aube de l'humanité jusqu'en 2003, il faudrait 5 milliards de gigabits pour les mettre en mémoire. Aujourd'hui, nous générons ce volume d'informations numériques en deux jours ! » (p11)

Cette masse de données, une fois traitées, peut permettre différentes applications concrètes. Voici quelques exemples :

  • Marketing, commerce : Facebook peut proposer à une marque d'afficher un nouveau produit pour une tranche d'âge très précise.

  • Santé : une start-up américaine, dont Google est un des investisseurs, recherche à identifier précisement les causes de cancer en analysant les données de plusieurs millions de patients (Source : http://www.frenchweb.fr/e-sante-jusquou-ira-le-big-data-pour-nous-soigner/186343)

  • A compléter avec d'autres exemples (Sport, Transports notamment)

Cette multiplication de la collecte de données constitue dans certains cas une manne financière non négligeable. Les réseaux sociaux les plus connus disposent de chiffres d'affaires de plusieurs milliards de dollars sur une année https://www.nextinpact.com/news/93906-facebook-35-milliards-chiffre-daffaires-et-14-milliard-dutilisateurs.htm

Il s'agit d'un élément essentiel pour bon nombre d'entreprises. Il convient par ailleurs de noter que ces données sont produites par chaque internaute et vient confirmer un adage de plus en plus partagé : « Si c'est gratuit, c'est que tu es le produit ! »

On notera ici un point de divergence fondamental entre les grands groupes éditeurs et le monde du logiciel libre quant au stockage et à l'utilisation des données qui transitent par les outils numériques. Dans le cas des grands groupes, les données produites sont collectées et stockées dans des serveurs qui appartiennent aux maisons éditrices des logiciels utilisés, qui en deviennent dès lors propriétaires sans aucune contrepartie. De fait elles disposent d'informations sur les utilisateurs, informations qui en étant retravaillées et recoupées avec d'autres permettent de "profiler" ces derniers. Des opérations de revente de ces informations auprès de services commerciaux et marketing d'autres entreprises peuvent avoir lieu, interrogeant sur la préservation de la vie privée des utilisateurs. Dans le cas des outils Open Source les éditeurs s'engagent à ne pas ré-utiliser les données récoltées à des fins commerciales.

Mais les entreprises ne sont pas les seules à produire et utiliser les données numériques...

Les enjeux de l'open data

En effet, les administrations publiques produisent aussi de nombreuses données numériques. Par exemple, un hôpital produit des chiffres sur sa fréquentation, un gestionnaire de transport public peut connaître grâce à des données numériques les surcharge s en temps réel. Les administrations publiques peuvent donc comme nous l'avons vu auparavant, se saisir de ces données pour améliorer certaines manière de faire.

Et les administrations peuvent aussi choisir de rendre publique les données qu'elles produisent et permettre à chacun de s'en saisir. C'est-ce qu'on appelle l'Open Data. Initié en France à la fin des années 1970, le mouvement de l'Open Data s'est grandement amplifié depuis 2010 grâce à de nombreux acteurs civiques comme Regards Citoyens, Open Street Map ou LiberTIC et une prise de conscience des pouvoirs publics. En octobre 2016, la France a pris la tête du Partenariat pour un Gouvernement Ouvert qui rassemble 69 pays pour favoriser la libération de données publiques autour de principes communs

https://www.etalab.gouv.fr/le-sommet-mondial-du-pgo-a-paris-souvre-le-20-avril

Un des exemples les plus abouti en France de réutilisation de l'Open Data est l'initiative https://www.lafabriquedelaloi.fr/ portée par l'association Regards Citoyens (Retravailler la présentation de l'outil) + Insérer une image de la data visualisation de la construction du projet de loi République Numérique.

Les conditions d'utilisation des outils que nous utilisons

La neutralité du net, le respect des droits d'auteur, les biens communs

results matching ""

    No results matching ""