Traçages et fusions

, par  DMigneau , popularité : 0%

Traçages et fusions

Du danger d’enrichir les bases de données de " réseaux sociaux "

Dans le cadre de la lutte contre la contamination, tout pousse au renforcement du traçage par fusion de bases de données. Or, cette fusion est le nouveau " modèle d’affaires " des plateformes de « réseaux sociaux » en ligne, propulsées par " l’intelligence artificielle " et la conception de nouvelles institutions.

Du traçage à l’enrichissement des données relationnelles

À partir de sa défense de l’utilisation de modèles épidémiologiques tenant compte de la structure des interactions sociales, Gianluca Manzo parvient à la conclusion que des applications comme " StopCovid " aideraient à éteindre la dynamique de l’épidémie, à « concevoir des interventions ciblant des (petits groupes d’) individus infectés et des chemins particuliers reliant plusieurs individus infectés ».

Ces interventions ciblées seraient une alternative au confinement généralisé. Ainsi les tendances à la " fermeture triadique " des « réseaux sociaux  » (par exemple, du fait que " les amis de mes amis sont mes amis ") combinées avec l’« homophilie » (" qui se ressemble s’assemble ") accélèrent la création de foyers locaux.

Les données du traçage et leurs analyses permettraient d’identifier ces foyers locaux et surtout des individus " super-diffuseurs " qui circulent entre ces foyers et contribuent activement au processus de contamination.

Il importerait beaucoup plus d’identifier et d’isoler ces " intermédiaires " que d’infliger le confinement à toute une population qui engendre peu d’interactions " inter-ilots ". La dernière phrase de ce texte affirme au sujet de l’acceptation du traçage : « Ne pas consentir à cette petite contribution à la vie collective nous expose à nous contraindre toutes et tous à des privations de libertés infiniment plus lourdes ».

Au-delà des limites des modèles mathématiques, je souhaite réagir contre l’idée que l’acceptation du traçage est une " petite contribution à la vie collective ". Le contexte d’urgence pousse peut-être à la simplification par souci de rapidité et d’efficacité. Il faut cependant se rendre compte du fait que les modèles épidémiologiques ne pourront pas s’arrêter à des mesures simples du nombre de contacts enregistré par chaque smartphone et à celles de leur " co-présence " en chaine.

Ce qui est modélisable au niveau collectif ne peut pas donner systématiquement lieu à des décisions au niveau individuel. À un moment ou à un autre, on cherchera à comprendre de quelle " homophilie " il s’agit, basée sur quel critère... autrement dit , comment et pourquoi cette " co-présence ".

En effet, tenir compte de la structure sociale de manière précise à l’échelle des individus sans rien connaître d’autre à leur sujet que la structure de leurs contacts est une promesse qui ne pourra pas être tenue.

Le mécanisme d’infection est trop multidimensionnel, voire inconnu dans ses détails, sujet à trop d’aléas pour que tracer anonymement des contacts individuels puisse en soi permettre d’agir au niveau de l’individu et de son entourage.

Dans la mesure où des individus qui ont contracté le virus peuvent transmettre l’infection avant d’avoir des symptômes, connaître les contacts de quelqu’un ne peut pas fournir de certitudes sur son « statut d’infection » : l’aléatoire dans le processus de transmission peut correspondre à une " goutte accidentelle " qui va plus loin que d’habitude, des incertitudes concernant les distances physiques entre les personnes, etc.

C’est pourquoi les spécialistes seront très vite demandeurs d’un enrichissement des données de réseau collectées par l’algorithme de traçage et tentés par la recherche d’autres données.

Mais ce souci d’efficacité sur le terrain ne sera pas la seule raison d’une demande d’enrichissement des données de réseaux d’interactions. Dans ce domaine comme dans tant d’autres, une autre force pousse à l’enrichissement des données récoltées par une seule application et à la fusion de ces données (ou d’une partie d’entre elles) avec des bases de données complémentaires utilisant un identifiant commun, supposé " solide ".

Il se trouve que cette propension à l’enrichissement des données par croisements ou fusions est une des spécialités des grandes « plateformes » qui construisent et accumulent les données relationnelles dans leurs serveurs (joliment appelés « clouds » ou " nuages ") et qui rendent les applications locales interopérables.

Ces plateformes sont un ensemble de grandes entreprises américaines bien connues que l’on peut appeler " Big Relational Tech ", ou BRT.

La domination technologique et l’accumulation des bases de données de réseaux par BRT est un élément important et complexe du contexte actuel.

Fusionner des bases de données relationnelles avec d’autres bases est devenu une étape importante du " modèle d’affaires " de BRT qui – au-delà de ses revenus publicitaires – se conçoit comme l’équivalent d’un " service public " privé qui a vocation à intervenir de plus en plus dans la conception, la mise en œuvre et l’évaluation de politiques publiques, tout cela au service - ou à la place - des « pouvoirs publics ».

Pour cette intervention directe dans le domaine politique (concernant la santé, l’urbanisme, la finance (création de monnaie), etc.), l’accumulation et la fusion des bases de données est un avantage concurrentiel décisif contre d’autres entreprises de consultants.

Cette propension est d’autant plus forte que les développements actuels de l’intelligence dite " artificielle " proposent des analyses inductives puissantes et rapides de bases de données relationnelles massives en temps réel.

C’est aussi cette capacité d’intervention qu’il est nécessaire d’évoquer pour juger de la question de savoir si participer au traçage n’est qu’une " petite contribution à la vie collective ".

En effet, eu égard à la fusion de bases de données propulsée par " l’intelligence artificielle ", BRT n’a pas froid aux yeux. Quelques exemples " d’appariement " de bases de données de réseaux d’interactions et de relations avec d’autres bases peuvent être instructifs.

Le danger de fusion pour gérer les comportements individuels

Un premier exemple de fusion de bases de données illustre ce contexte où le croisement de données biologiques et données de « réseaux sociaux » aboutissent à la gestion serrée des comportements individuels.

Ce croisement a été opéré par " Google " et par " 23andMe ", société de biotechnologie américaine qui propose une analyse du code génétique aux particuliers.

Pour une centaine de dollars, à partir de cette analyse du génome personnel, " 23andMe " informe sur les ascendants généalogiques du client et sur sa santé.

La fusion de ces données génétiques et des bases de données provenant de profils relationnels du type BRT ont été en théorie proscrites, mais l’émergence d’une industrie des capteurs corporels, ou « système électronique épidermique » enregistrant les variables neuro-végétatives du corps, initialement développée à des fins thérapeutiques, militaires et sportives, a relancé l’accumulation et le croisement de ces données.

Ces capteurs mesurent aujourd’hui bien plus que le taux de glucose chez les patients diabétiques : ils surveillent la température corporelle, l’activité cérébrale, la voix, le rythme cardiaque, les activités musculaires et de nombreuses autres variables dans le cadre de programmes d’« augmentation » du corps.

Le coût économique des capteurs a tellement diminué que la recherche biomédicale et épidémiologique s’en sert pour équiper non seulement des cohortes de soldats sur le champ de bataille, d’athlètes de haut niveau ou de personnes souffrant de syndromes " post-traumatiques ", " d’épuisement professionnel " et de dépression, mais aussi des échantillons représentatifs de la population ou des clients de services spécifiques : voyageurs sur de longs vols, adolescents jouant à des jeux en ligne, etc. .

Un suivi à long terme de ces cohortes a déjà été lancé dans différents pays et vient enrichir leurs bases de données de manière régulière et continue.

C’est en direction des compagnies d’assurance " santé ", en particulier, que BRT a développé de telles fusions et croisements.

Ces compagnies incitent leurs clients à porter ces capteurs, souvent de manière ludique, en échange de réductions de primes. L’analyse de « réseaux sociaux » et l’analyse biologique sont rapprochées à des fins thérapeutiques mais aussi économiques.

Il n’a pas échappé aux assurances maladie privées – dont le marché était en danger de s’effondrer si les risques représentés par chaque personne deviennent mesurables du fait du séquençage génétique, conduisant au refus de mise en commun de ces risques – qu’elles pouvaient utiliser ces informations.

Notamment pour mieux connaître les risques tout en continuant à les mutualiser mais en renégociant tout de même les primes à l’échelle d’individus séparés et sans connaissances en génétique.

Mais la fusion des bases sert aussi à repenser les prescriptions médicales en conditionnant le remboursement des soins à des changements relationnels dans la vie du patient.

Par exemple, exiger d’une personne alcoolique qu’elle cesse d’entretenir des relations avec d’autres personnes elles-mêmes alcooliques et habituellement rencontrées dans tel café, à tel moment de la journée.

Au début, les individus sont tentés de " jouer le jeu " de cette " ingénierie relationnelle " avec les assurances. Mais à terme, la population y perd en termes d’affaiblissement des systèmes de protection sociale de la santé, de contrôle et de démocratie – même si ces individus n’y pensent pas à leur échelle propre.

Ici – comme dans les bases de données du traçage qui enregistrent et combinent, pour l’individu, l’information sur l’infection par le virus et sur ses interactions et relations sociales – les conséquences pour la protection sociale peuvent devenir très réelles, au point de changer ses règles en la conditionnant encore davantage aux changements de pratiques et de relations.

Le danger de fusion pour gérer les comportements collectifs

Un second type de fusion de bases de données de « réseaux sociaux » avec d’autres données (y compris biologiques) va plus loin encore dans le sens de l’intervention, cette fois pour gérer la composition et la gestion de collectifs.

C’est le cas, par exemple, de la mise au travail d’équipes " digitalisées ", c’est-à-dire équipées de manière à faire dépendre leur direction et leurs actions communes en temps réel de modèles puisant leurs informations dans un grand nombre de bases re-formatées pour être " interopérables ".

Les informations recherchées peuvent être, pour chaque individu, des variables médicales, psychologiques et émotionnelles, comportementales, mais aussi relationnelles, qui sont considérées comme essentielles pour la " maintenance " de chacun en tant que membre du groupe.

L’exemple du modèle militaire de l’ " essaim humain " organisé par un équipement numérique sophistiqué concerne le téléguidage des actions des groupes de soldats sur le champ de bataille.

Le lien entre ces développements militaires et les solutions de traçage réside, par exemple, dans le fait que ces modèles gèrent les interactions entre soldats en les maintenant à la " bonne " distance physique et du même coup, sociale.

L’ajout et la fusion avec des données de « réseaux sociaux » s’inspire de l’observation des essaims d’animaux (d’abeilles, d’oiseaux, jusqu’aux bancs de poissons) qui fascinent les militaires car ces essaims peuvent éviter et défier des prédateurs.

Par exemple, Reynolds (1987) - et bien d’autres depuis - modélisent le mouvement des oiseaux dans un essaim en le représentant comme un réseau de distances physiques à maintenir constantes.

Les essaims d’étourneaux fonctionnent notamment en essayant de maintenir cette distanciation constante avec cinq voisins (devant, à gauche, à droite, au-dessus, en dessous).

Lorsqu’un oiseau se rapproche " trop " d’un voisin, les deux sentent le danger de collision et produisent des phéromones. La capacité à sentir cette odeur déclenche une correction de la distance par répulsion.

La modélisation des essaims – par exemple par des calculs de réalignement sur une position dynamique moyenne des voisins, mais aussi en prenant en compte une conscience de distances plus longues (pointe de l’essaim) – n’occupe pas seulement la recherche académique en zoologie.

Les armées cherchent à modéliser ces essaims de manière suffisamment maniable pour organiser les troupes sur le champ de bataille, notamment en améliorant la coordination hiérarchique par une coordination basée sur des interactions impersonnelles pré-programmées et adaptables en temps réel.

La " digitalisation " du travail des soldats sur le terrain permettrait de contrôler à distance les unités de l’armée (des pelotons jusqu’au niveau des bataillons) et de neutraliser éventuellement les formes traditionnelles de contestation interne et " solidarités oppositionnelles " que ces unités peuvent développer dans ces contextes le plus souvent chaotiques (Shibutani, 1978).

La connaissance par traçage et la modélisation des conditions dans lesquelles les membres d’un collectif enfreignent les règles de distanciation physique et refusent de se soumettre à ces contraintes peuvent concerner, à terme, toutes sortes d’organisations, jusqu’aux entreprises dont la technologie militaire a longtemps façonné les environnements de travail et la vie sociale.

Dans leur livre " War and Society ", Centeno et Enriquez (2016) rappellent comment les guerres et la préparation des guerres transforment les sociétés, donnent forme aux structures organisationnelles, sociales et politiques.

Aujourd’hui, cette préparation mène à la conception et à la maîtrise de nouvelles technologies qui, comme hier, sont rapidement utilisées dans la société civile.

Le traçage requiert de vrais changements institutionnels

Les bases de données relationnelles sont donc au cœur de nouvelles technologies d’intervention sociale au niveau des individus et au niveau des collectifs, et tout pousse BRT à les apparier avec d’autres bases de données.

Malgré l’urgence, il est aussi nécessaire de mettre l’accent sur le contexte dans lequel le traçage des interactions aura lieu et les conséquences de sa mise en place à grande échelle. Parce que les données relationnelles sur l’entourage de l’individu ne concernent pas seulement ces individus, leurs données personnelles et leurs libertés personnelles.

Elles ont des conséquences au-delà du domaine de la « santé publique », notamment celui des institutions de protection sociale et celui de l’équilibrage des pouvoirs en démocratie, un équilibrage déjà très mal en point.

Dans la mesure où ces fusions sont de plus en plus caractéristiques de notre contexte industriel et politique, le fonctionnement d’une application de traçage des interactions et des relations, puisqu’il fera partie de la " stratégie de déconfinement ", devrait aussi requérir une stratégie de renouvellement des institutions.

Tant que ce renouvellement n’est pas mis en route, la réaction à l’urgence par le traçage numérique risque de nous accoutumer encore davantage à la surveillance généralisée, voire nous enfoncer davantage dans un système « techno-totalitaire » comme celui qu’illustrent les deux exemples ci-dessus, et non pas seulement - par exemple - le fonctionnement du « crédit social » à la chinoise (Al Amoudi et Lazega, 2019) : la participation au traçage n’est pas qu’une " petite contribution à la vie collective ".

Il est heureux que le débat sur les libertés individuelles potentiellement menacées par les applications de traçage se poursuive. Les autorités qui mettent en place l’application assurent qu’il sera impossible de savoir qui a été infecté et qui a infecté qui.

Les données de connexion entre " smartphones " seraient facilement " pseudonymisables " ou " anonymisables " pour celles et ceux qui recevront les alertes ; elles ne seraient pas conservées " plus que nécessaire ", en application de la réglementation qui encadre la protection et le traitement des données personnelles (RGPD), même " pseudonymisées " et " anonymisées ".

Enfin, l’application n’a pas vocation à durer : elle ne servira plus une fois l’épidémie résorbée.

Les associations de défense des libertés civiles anticipent que ces systèmes technologiques implantent et enracinent de nouvelles formes de surveillance gouvernementale et privées (BRT) : à l’échelle où il faut le construire, un tel système devient difficile à démanteler.

La « Ligue des Droits de l’Homme » souligne que cette application représente « le risque d’une habituation à une surveillance généralisée, banalisée et pérenne  ».

Au-delà du débat indispensable sur les libertés individuelles, il ne faut donc pas « décontextualiser » le traçage numérique. Puisque les pouvoirs doivent se contrôler entre eux en démocratie, il faut souligner dans le débat public que la question de la régulation de ces industries n’est pas seulement la question de la protection de la vie privée et du développement de nouveaux marchés.

Il s’agit de la question politique du pilotage du développement de la société et de l’innovation, qu’elle soit technique, sociale ou politique.

Dans le contexte des transitions contemporaines (environnementales, technologiques, démographiques, géopolitiques, etc.), où la crise du " coronavirus " est souvent publiquement liée au " changement climatique ", cela équivaut également à faire de cette crise une fenêtre d’opportunité pour des changements institutionnels.

Dans ce contexte, BRT – pour qui l’action collective est désormais un champ d’intervention majeur – accumule et apparie interactions impersonnelles, relations personnelles et caractéristiques de milliards de personnes (combinées aux données sur leurs affiliations, leur production, leurs choix de consommation, leurs normes et représentations, leurs activités collectives, etc.), souvent au nom de " très bonnes " intentions et de valeurs très " vertueuses ".

Or, les données relationnelles ne sont pas des données " comme les autres ". Elles sont à la fois individuelles et collectives.

Elles permettent d’identifier et de caractériser des collectifs, de mesurer leur capacité d’entrepreneuriat institutionnel, de mobilisation, de création de coalitions, de résilience dans la " société civile ".

Ainsi, même si l’application de traçage n’était pas intrusive en elle-même, elle arrive dans un contexte où la construction de bases de données et le développement de capacités d’analyses liées à " l’intelligence artificielle " fait de la fusion la norme et le " modèle d’affaire " de cette industrie qui s’engage de plus en plus dans le marché de la « consultance » en matière de politique publique.

C’est la résistance à cette fusion des bases qui constitue la " contre-norme ". Un des indicateurs de ce développement est que BRT brevète de manière agressive dans le domaine de " l’intelligence artificielle " pour protéger ses innovations en matière de capacité d’analyse de bases de données de plus en plus grandes et complexes.

Même si le traçage pourra, dans un premier temps, rester " light ", à terme il y a de fortes chances qu’il contribue à cette dynamique.

Une caractéristique majeure des données d’interactions et des modèles topologiques de la physique statistique appliquée et de l’épidémiologie (et ailleurs) est leur pauvreté, leur insuffisance pour comprendre la structure sociale.

Pour comprendre la réalité sociale, on ne peut pas s’appuyer sur des modèles qui simplifient la structure sociale en acceptant une conception de l’être humain que Barabási (2010) a formulé ainsi : " Think of yourself as a dreaming robot on autopilot, and you will be much closer to the truth " [" Représentez-vous à vous-mêmes comme un robot rêveur sur pilote automatique et vous serez bien plus près de la vérité "].

Cette simplification n’est pas anodine : elle pousse à la fusion avec d’autres bases de données au fur et à mesure que ses limites se font jour. Cet enrichissement par fusion avec d’autres bases, c’est précisément le " modèle d’affaires " de ces plateformes et de leur usage de " l’intelligence artificielle ".

L’émergence de la " révolution digitale " et de BRT, avec ses données privatisées sur les relations et interactions, requiert un débat public plus poussé sur ses capacités en " ingénierie sociale " et en conseil à destination de toutes sortes d’institutions et industries cherchant à peser sur les formes d’action collective et de responsabilité collective utilisées dans nos sociétés « organisationnelles ».

BRT comme pouvoir inédit en termes d’ " intervention " en développement social ne connaît pas encore de vrais contre-pouvoirs. Malgré tous les mérites de la RGPD, notre société n’est donc pas prête, sur le plan institutionnel, pour ce traçage.

Pour l’instant, la société " démocratique " n’a pas encore créé les institutions d’équilibrage des pouvoirs adaptées à cette nouvelle réalité et ces rapports de force. Il s’ensuit que si les « pouvoirs publics » actuels veulent un BRT français ou européen au nom de la " souveraineté numérique ", il faudrait aussi concevoir et mettre en place des institutions qui régulent et sauvegardent la démocratie que tout BRT menace avec son " modèle d’affaires " d’entrepreneuriat institutionnel.

Pour disposer de cette industrie de manière autonome, il faut des investissements économiques considérables, mais aussi des changements institutionnels tout aussi considérables pour " environner " ces investissements, pour réguler BRT comme on régule les centrales nucléaires ou comme on surveille " le lait sur le feu ".

Ce qui peut - ou doit - être attendu des institutions existantes doit être réévalué dans ce contexte émergent, avec de nouveaux rôles, notamment, pour les documentalistes, informaticien.nes, " société civile ", " sciences sociales ", etc. capables de mobiliser des connaissances précises sur BRT et ses méthodes.

Dans le contexte actuel, ce traçage ne peut donc pas se faire qu’au prix d’une " petite contribution à la vie collective ".

On sait que l’usage totalitaire délibéré d’informations sur les infrastructures relationnelles de la société, mais aussi les décisions commerciales négligentes dans ce domaine, intentionnelles ou non, peuvent avoir des conséquences sociales dévastatrices.

Certes, qu’il y ait des précédents dans d’autres contextes n’implique pas partout des effets identiques. On peut croire que ces données seront supprimées, on peut mal percevoir l’accoutumance à laquelle contribue cette technologie promue par la pandémie.

Mais dans le contexte actuel d’émergence de BRT, des incertitudes sur les bénéfices épidémiologiques de l’information sur la proximité physique, le choix de ne pas participer au traçage est moralement tout aussi défendable, procédant d’intérêts collectifs réels, d’incertitudes et de craintes tout aussi légitimes.

En attendant, avec autant d’incertitude sur l’efficacité et les risques du traçage, mieux vaut continuer à renforcer les services publics, trouver les ressources pour redonner vie et lits aux hôpitaux publics et soutenir ses personnels, et plus généralement donner la priorité à la justice sociale et à la réduction des inégalités encore dramatiquement creusées par la crise.

Emmanuel LAZEGA

LaViedesIdées.fr