Synthèses des conférences

De Challenge4Cancer
Aller à : navigation, rechercher

Workshop Big Data & Ethique, Futur en Seine, Cnam, 11.06.15

Est-il possible d’associer ces deux termes ? Peut-on faire du business avec les Big Data tout en protégeant les données ?

Le Big Data entre continuité et rupture

La nécessaire remise en contexte du Big Data

Le traitement de données n’est pas disruptif en soi. La nouveauté réside dans les nouvelles technologies qui nous permettent de capter et de traiter plus rapidement les données volumineuses et hétérogènes.

⇒ Plus une accélération qu’une capacité nouvelle.

Les mêmes fondamentaux pour l’entreprise

La confiance reste primordiale pour les relations BtoC et BtoB et le Big Data reste dans la même logique d’améliorer la connaissance client. C’est également la confiance qui va permettre d’engranger plus de données.

⇒ Cercle vertueux.

Les Big Data répondent à une logique de performance et de perfectibilité des services. La puissance nouvelle des traitements permettent avant tout de mieux cibler les services, ce qui est très important dans des marché concurrentiels.


Les citoyens & entreprises face aux Big Data

L’imaginaire collectif lié aux Big Data

Importance de la connotation négative : image de contrôle, de manipulation, de surveillance, etc. Big Data serait la face obscure de l’activité des entreprises. Or, les données liées aux Big Data ne sont pas uniquement personnelles, contrairement à l’image de Big Brother.

⇒ Permettent des projets, des actes extrêmement positifs (ex : projet lié aux problématiques climatiques).

La méconnaissance des entreprises

L’attitude générale vis-à-vis des Big Data s’explique par deux points qui sont intimement liés :

  • La méconnaissance, mère des craintes qui autour du Big Data
  • L’autocensure des entreprises comme conséquence

Cette attitude est due au manque de compétences et d’expériences sur ces questions dans les entreprises et startups. De plus, ces dernières ne veulent parfois pas consulter la CNIL par peur d’être sanctionnées.

⇒ Présence aujourd’hui d’un enjeu d'éducation sur les données anonymisées, les données à caractère personnel.


Processus de traitement des Big Data

Technique de chiffrement et protection des données

Importance des méthodes et les algorithmes mis en place. Les données personnelles ne sont pas que nominatives. Elles recoupent aussi ce qu’on pourrait appeler des méta-data.

Les difficultés rencontrées dans les différents processus de traitement :

  • Les données individuelles peuvent être désidentifiées tout en restant personnelles avec l’utilisation d’un pseudo.
  • Les techniques de chiffrement permettent de protéger les messages transmis mais il se pose le problème de la conservation.
  • L’anonymisation se retrouve complexifiée pas les possibles recoupements.

⇒ Anonymat total très long et difficile voire même impossible.

De l’absolu au relatif

Même si les meilleures mesures techniques sont mises en place dans l'entreprise, il n'y a jamais aucun risque. Face à cette relativité, ce qui prime est finalement l’analyse de risque, le type de traitement mis en place et la finalité du process.

Distinction :

  • Données pseudonymisées : pseudonymisation est une mesure technique qui limite les risques mais la réidentification est possible (individualisation, corrélation, inférence, etc.). Les pseudonymes sont reconnus par le nouveau règlement.
  • Données anonymisées : présence d’ensemble de méthodologies techniques mais anonymisation n’est pas absolue. L’anonymisation est couplée avec la contingence géographique puisqu’il se pose la question de savoir à partir de quand un ensemble de données est anonymisé. La réponse n’est pas la même en fonction des pays.

Le Big Data, entre challenge et nécessité

Le traitement du Big Data est nécessaire. Les entreprises, et plus particulièrement les françaises, doivent s’y mettre afin de ne pas se faire doubler par les géants du type GAFA. Néanmoins, ce traitement doit répondre de la question de la privacy. Pour se faire, les entreprises sont amenées, par exemple, à travailler avec la CNIL, afin de travailler dans un cadre juridique et éthique.


Une difficile relation : les Big Data & le juridique

“Vérité en deçà des Pyrénées, erreur au-delà”, Pascal

La complexité des Big Data est notamment liée au fait que les data ne sont pas fixes géographiquement parlant et il n’y a pas de cloud souverain.

⇒ Les Big Data se posent comme une problématique mondiale mais ils ne sont pas traités comme telle.

Présence d’un modèle européen de la régulation des données et de leur traitement mais, par exemple, aux Etats-Unis, les lois sont sectorielles et il y a un lobbying militant et très actif sur les questions ayant à trait à la protection des données.

Cette contingence pose des problèmes en termes de compétitivité. Si l’Union européenne impose, par exemple, l’obligation d’une finalité précise, alors la démarche exploratoire des Big Data est impossible. De plus, les entreprises des pays non régis par cette loi pourront faire l’exploration de leurs données et exporter leurs découvertes sous forme de services en Europe.

Les difficultés rencontrées par la loi

Les principes énoncés par la loi, face aux Big Data ne donnent pas des réponses pré-établies. Néanmoins, s’il y avait une législation très précise sur cette question, elle serait vite obsolète car la législation est moins rapide que la technologie.

Par conséquent, les entreprises doivent faire preuve d’autorégulation et démontrer leur conformité à ces grands principes. Or, ces derniers étant généraux, elles peuvent en jouer.


Le concept de finalité & la CNIL

La finalité

Face à cette difficulté de faire loi, on se tourne plus vers une responsabilisation des entreprises et donc vers l’éthique.

La question de la finalité quant à l’utilisation des Big Data peut paraître paradoxale voire même obsolète. Le traitement des Big Data peut se présenter comme une exploration sans finalité précise, et c’est cette inconnue posée comme prémisse qui fait la valeur de la démarche.

⇒ La question de la finalité ne doit pas être enfermante.

Il faut avant tout que les réutilisations des données soient compatibles avec les raisons de leur recueillement. Cette question de la finalité doit être jumelée avec celle de sécurité : transparence et maîtrise des données par les individus.

La CNIL, sa conception des Big Data

Rôle de la CNIL est d’accompagner les projets liés aux Big Data et de veiller à leur conformité.

Elle ne se place pas dans une conception rigide des textes ; leur application doit avant tout être intelligente et pertinente.

⇒ La Cnil est ouverte à des approches Big Data qui présentent un intérêt légitime.


Des réponses à l’impuissance juridique : l’éthique & l’éducation

L’éthique au secours du juridique

L’éthique se pose comme une contrainte interne à l’entreprise. Elle désigne le fait pour l’entreprise de mettre en place un ensemble de valeurs communes à ses différents acteurs.

⇒ L'éthique vis-à-vis des Big Data en entreprise, c’est avant tout se mettre d'accord en interne sur un ensemble de règles qui vont régir l’ensemble des services et des offres.

Ces dernières vont notamment se fonder, être contraintes par l’ensemble des règles juridiques mais peuvent également les dépasser et compenser les impasses de la loi. Par exemple:

  • Manque d’incitations vis-à-vis des entreprises pour aller vers la privacy.
  • Impossible pour l’utilisateur de lire les Terms & Conditions.

Face à l’impuissance de la loi, l’éducation des citoyens ?

Il est ompossible de tout contraindre par la loi. Il est possible de penser que :

  • La loi doit être la plus nécessaire et suffisante possible pour les entreprises
  • Cette lacune doit être avant tout compensée par l’éducation des consommateurs, des citoyens quant aux données, aux Big Data.

⇒ L’éducation doit compléter la réglementation.

Cette éducation serait d’autant plus nécessaire qu’il est aujourd’hui difficile de parler de consentement, notamment vis-à-vis de données qui sont très indirectement nominatives. Comment informer les personnes ? Cela est d’autant plus complexe que, bien souvent, on récolte des données sans savoir pour quoi elles vont être utilisées.