Une décennie d’exploitation des mégadonnées aux fins du développement durable

Pulse Lab Kampala is working on a project to gauge via radio the quality of health-service delivery in Uganda, March 2017.           ©UN Global Pulse

Pulse Lab Kampala travaille sur un projet pour évaluer la qualité de la fourniture des services de santé en Ouganda par le biais de la radio. Mars 2017. © UN Global Pulse 


Les progrès en matière de technologies de l’information et de la communication (TIC) provoquent des changements dans notre société, allant de la façon dont nous communiquons aux forces qui façonnent notre économie et nos comportements. Les perspectives créées par les mégadonnées transforment déjà de nombreux domaines. Grâce aux données mobiles fournies par les réseaux mobiles, il est possible de connaître l’ampleur des déplacements après la survenue d’une catastrophe et d’anticiper la propagation des maladies infectieuses, tandis que les achats de crédit d’appel peuvent servir d’indicatif supplétif des dépenses alimentaires. Les matériaux de couverture des toitures visibles de l’espace permettent de discerner les poches de pauvreté, les changements dans l’utilisation des cartes de débit indiquent l’impact d’une crise et les fichiers postaux sont utilisés pour estimer les flux commerciaux. En même temps, l’évolution rapide des capacités de l’intelligence artificielle (IA) offre de nouvelles opportunités à la valorisation des mégadonnées dans la prise de décision davantage dictée sur des données factuelles pouvant accélérer les progrès en vue de la réalisation des objectifs de développement durable (ODD).  

Les Nations Unies ont plaidé pour une révolution des données avant même que le terme n’existe et se sont attachées à travailler sur les applications des mégadonnées dès que le concept est né. En 2009, lorsque la crise économique mondiale a atteint son paroxysme, la communauté internationale œuvrait déjà depuis près d’une décennie à la réalisation des objectifs du Millénaire pour le développement (OMD). Cette crise mondiale a réveillé les consciences, dévoilant deux défis importants : non seulement nous avions été incapables d’anticiper où et à quel moment les risques mondiaux constitueraient une menace, mais nous n’avions également pas pu prévoir qui serait touché et sous quelle forme. En fait, nous ne disposions pas d’informations détaillées sur les facteurs de stress parmi les populations vulnérables dans des délais qui auraient permis aux décideurs d’intervenir efficacement. 

L’initiative Global Pulse de l’ONU a été créée en 2009 pour apporter un appui aux Nations Unies dans l’exploitation des mégadonnées et l’analyse des données utilisées pour le développement durable et l’action humanitaire. Nous avons fait des expériences avec des données mobiles provenant des médias sociaux pour comprendre comment les transformer en informations utiles. En 2011, nous avons publié le premier rapport novateur1 qui analysait comment les mégadonnées pouvaient être utilisées en faveur du développement. Afin d’assurer que notre recherche était fondée sur la réalité des communautés que nous essayions d’aider, nous avons créé un réseau de centres d’innovation que nous avons appelé Pulse Labs. Créé en 2009, Pulse Lab New York est notre siège social. Pulse Lab Jakarta a été établi en 2012, suivi de Pulse Lab Kampala en 2014. 

En mai 2013, le Groupe de haut niveau chargé du programme de développement pour l’après-2015 a appelé à une révolution des données afin que personne ne soit laissé pour compte. En réponse, le Secrétaire général des Nations Unies Ban Ki-noon a créé un Groupe consultatif d’experts indépendants afin de donner des conseils et de formuler des recommandations sur les moyens d’accélérer la révolution des données aux fins du développement durable. Plusieurs recommandations importantes figurent dans le rapport final2, et sont déjà devenues une réalité : la création d’un Partenariat mondial pour les données du développement et l’organisation du Forum mondial des Nations Unies sur les données3 en 2018.  

Avec l’adoption des ODD en septembre 2015 et leur mise en œuvre qui a suivi, des efforts significatifs ont été déployés pour créer de nouvelles sources de données. Pourtant, les innovations s’appuyant sur les données et l’adoption de l’analytique par les institutions accusent un certain retard, freinées par de nombreux facteurs. D’un côté, le manque de mesures prises pour inciter le secteur privé à les partager ainsi que des obstacles systématiques liés à la vie privée ont empêché l’émergence d’un environnement propice à l’innovation. De l’autre, les exemples de projets opérationnels mobilisateurs montrant comment les applications de mégadonnées peuvent être utilisées et reproduites sont peu nombreux.  

ENCOURAGER LA PHILANTROPIE DES DONNÉES D’ENTREPRISE  

Depuis sept ans, l’initiative Global Pulse fait participer le secteur privé à sa démarche de philanthropie des données à laquelle nous collaborons avec les entreprises pour accéder à leurs données, à leurs outils technologiques et à leurs compétences pour des projets d’intérêt public. En 2013, nous nous sommes associés au fournisseur de téléphonie mobile Orange pour lancer l’initiative Données pour le développement4. Pour la première fois, une base de données mobiles a été anonymisée et accessible aux chercheurs pour développer des applications aux fins du développement durable. 

Des entreprises cherchent actuellement des moyens de mettre les mégadonnées recueillies au service des ODD. Récemment, nous avons collaboré avec neuf entreprises privées – BBVA Bank, Crimson Hexagon, Earth Networks, Nielsen, Orange, Planet, Plume Labs, Schneider Electric et Waze — pour que la communauté scientifique internationale puisse exploiter leurs données en vue de la réalisation de l’ODD 13 dans le cadre de l’initiative « Data for Climate Action5 ». Nous travaillons avec la banque BBVA en Espagne, en utilisant les transactions effectuées sur les cartes de débit anonymes et agrégées afin de mesurer les incidences d’une catastrophe naturelle et évaluer le délai nécessaire pour que les différentes communautés puissent se relever6. Nous avons aussi signé un accord7 avec Twitter afin de fournir au système des Nations Unies un accès à ses données et plusieurs organismes de l’Organisation ont déjà inclus cette ressource dans leurs projets. 

À l’échelle de l’ensemble du secteur, la technologie mobile est la plus avancée. En 2017, GSMA, l’association des opérateurs mobiles, a collaboré avec les Nations Unies pour élaborer une stratégie spécifiquement conçue pour mettre les mégadonnées mobiles au service des ODD. Actuellement, 19 opérateurs mobiles participent au programme sur les mégadonnées pour le bien social de la GSMA, appelé BD4SG8. Il s’agit d’un modèle prometteur que nous pouvons utiliser dans d’autres secteurs qui utilisent des mégadonnées, comme le commerce en ligne, les offres de services financiers, l’industrie manufacturière, les transports, etc. Mais le problème est qu’en dehors des situations extrêmes, comme les interventions dans les situations d’urgence humanitaire et la prévention des actes de terrorisme, il n’existe pas de répertoire de règles concernant les données pour le bien public. Il ne fait aucun doute que les initiatives comme le Règlement général sur la protection des données de l’Union européenne9 ouvrent la voie à l’utilisation des nouvelles technologies tout en atténuant les risques liés à l’utilisation des données.  

CONFIDENTIALITÉ, PROTECTION ET ÉTHIQUE DES MÉGADONNÉES  

Aux Nations Unies, nous nous employons actuellement à accélérer le développement et l’adoption des applications des mégadonnées protégeant la vie privée qui peuvent transformer la façon dont nous agissons et aidons les communautés à réaliser les ODD partout dans le monde. L’initiative Global Pulse a co-fondé et présidé l’UN Privacy Policy Group interinstitutions (UN PPG). Les principaux objectifs du groupe sont les suivants : (i) favoriser le dialogue et le partage de l’information sur des questions essentielles liées à la confidentialité et à la protection des données au sein du système des Nations Unies; (ii) centrer les efforts existants sur la confidentialité et la protection des données; et (iii) développer un cadre pratique à l’échelle du système de l’ONU pour la confidentialité et la protection des données10. En 2018, UN PPG a défini des principes de haut niveau régissant la protection et la confidentialité des données personnelles11, qui ont été officiellement adoptés par le Comité de haut niveau sur la gestion (HLCM). En 2017, nous avons été le fer de lance d’efforts qui ont conduit à l’élaboration d’une note d’orientation sur les mégadonnées à l’appui de la réalisation du Programme 203012 qui a été adopté par le Groupe des Nations Unies pour le développement. Un grand nombre de nos instruments politiques bénéficient des contributions d’un groupe consultatif d’experts sur la confidentialité des données13 établi en 2015 par l’initiative Global Pulse et qui comprend des experts en confidentialité et en éthique des données, des législateurs et des universitaires. 

Nous intégrons la confidentialité, la protection et l’éthique des données dans nos projets d’innovation en effectuant une évaluation des risques, des préjudices et des avantages14 afin de cerner les questions éthiques et celles relatives aux droits de l’homme qui peuvent se poser à une étape quelconque d’un processus d’innovation des données. L’outil permet aussi d’élaborer une stratégie en matière d’atténuation des risques et de s’assurer que ceux-ci ne surpassent pas les avantages d’un projet donné. Avec l’International Association of Privacy Professionals, nous venons de publier un article15 donnant des orientations aux entreprises qui comptent participer à l’utilisation éthique des mégadonnées et à des projets en matière d’intelligence artificielle.  

DÉVELOPPER DES APPLICATIONS DE MÉGADONNÉES AU SERVICE DU BIEN SOCIAL  

Heureusement, les laboratoires d’innovation des universités, les gouvernements, la communauté internationale, la société civile et le secteur privé utilisent les mégadonnées et l’intelligence artificielle pour développer un vaste éventail d’applications. Ces cas individuels représentent des innovations modestes, mais importantes pour connaître le monde qui nous entoure. Toutefois, le fait que ces applications sont rarement transposées à une plus grande échelle ou suffisamment fiables à long terme indique qu’il existe encore des lacunes dans le secteur.  

Au cours des deux dernières années, nous nous sommes employés, par le biais de Pulse Labs, à créer des méthodologies et des outils pouvant être reproduits et transposés à une plus grande échelle à des fins multiples et dans des lieux différents. À Jakarta, nous avons mis au point Haze Gazer16, un outil d’analyse et de visualisation des crises conçu pour signaler les feux de forêts et de tourbières. Il a été adopté et installé dans le centre opérationnel stratégique du Président d’Indonésie. En nous appuyant sur ce concept, nous mettons actuellement au point CycloMon17, une plate-forme interactive qui collecte des données tirées des médias sociaux et les combine avec les données météorologiques, ce qui peut être adapté au niveau mondial afin de fournir des informations avant, pendant et après la survenue des cyclones. 

L’un des domaines pour lesquels nous sommes particulièrement enthousiastes est la reconnaissance vocale dont beaucoup d’entre nous ont certainement fait l’expérience par le biais de l’enregistrement de la dictée vocale ou dans nos interactions avec les technologies comme Alexa. Il y a trois ans, nous avons débuté un programme expérimental en Ouganda visant à saisir les voix dans les émissions radiophoniques18. Bien que l’initiative Global Pulse continue de faire avancer ses activités dans l’analyse des médias sociaux, le fossé numérique est réel. Dans les régions rurales d’Ouganda, comme dans la majorité des pays en développement, les habitants ont rarement accès aux plates-formes de réseaux sociaux ou aux smartphones, et téléphonent ou envoient plutôt des messages textes pendant les émissions de débats radiophoniques ou les programmes d’actualité afin de signaler des événements qui surviennent dans leur communauté ou d’en discuter. Certaines émissions sont destinées aux jeunes mères de famille, aux agriculteurs et aux personnes atteintes du VIH/sida. Les informations diffusées lors de ces débats publics sont tout aussi pertinentes que celles diffusées sur Facebook ou sur Twitter. 

Convertir ce contenu en pratique pose, toutefois, des problèmes techniques, car ces communications sont vocales et non écrites, et dans des langues autochtones. Or on en dénombre environ 40 en Ouganda seulement. Nous avons engagé une équipe d’ingénieurs en reconnaissance vocale et d’experts en IA qui ont utilisé la technologie des réseaux de neurones à convolution afin de créer la première trousse d’outils de reconnaissance vocale automatique pour les langues ougandaises locales, en commençant par l’anglais parlé avec l’accent ougandais, l’acholi et le luganda. Nous disposons actuellement d’un ensemble de capacités solide qui permettent d’écouter simultanément des dizaines de stations de radio, d’attirer l’attention sur les contenus pertinents lorsque des mots clés spécifiques sont mentionnés, de générer une transcription pour une analyse plus détaillée et de grouper les segments audio à des fins d’analyse par l’homme. L’aspect le plus intéressant est que cela se produit dans des communautés isolées desquelles, jusqu’alors, nous ne recevions que des données sporadiques et non fiables. Soudain, nous pouvons obtenir des informations publiques en temps réel sur l’incidence des inondations sur les récoltes, le prix des denrées alimentaires et les comportements face à la vaccination. Nous cherchons à étendre le projet à d’autres pays où les sources d’information sont rares. 

Il y a dix ans, le terme « expérimentation » avait généralement des connotations négatives lorsqu’il était employé pour des activités au sein du secteur public, impliquant un risque, une utilisation irresponsable des ressources publiques. Par contraste, il est clair qu’aujourd’hui le plus grand risque est de ne pas adopter une approche d’apprentissage fondée sur le changement organisationnel. Dans le monde entier, les laboratoires d’innovation réalisent des progrès considérables au sein d’organisations gouvernementales et de développement. Les stratégies d’innovation ont mûri, allant de la fantaisie et de l’emballement à la fourniture d’une valeur réelle sous la forme d’outils pratiques, adaptables en passant par une culture d’ouverture aux nouvelles idées et à de nouvelles façons de travailler.  

Au début de l’année, lors du Sommet mondial sur l’intelligence artificielle au service du bien social19 et, plus récemment, lors du Forum mondial des Nations Unies sur les données, qui s’est tenu du 22 au 24 octobre 2018 à Doubaï, aux Émirats arabes unis, nous avons vu comment ces technologies viennent compléter les informations statistiques pour une meilleure planification, des réponses plus rapides et des programmes ainsi que des projets plus efficaces. La Stratégie du Secrétaire général en matière de nouvelles technologies20, lancée en 2018, décrit notre approche de l’innovation pour aller de l’avant. Une partie de cette stratégie comprend la création d’un laboratoire d’innovation rattaché au Cabinet du Secrétaire général, et l’initiative Global Pulse appuie activement cette action. 

Cependant, nous devons être conscients des risques potentiels et des questions posées par l’adoption généralisée des mégadonnées et de l’IA. Il n’existe actuellement aucune norme internationale en matière d’anonymat, de partage et d’utilisation responsable des mégadonnées dans les industries prioritaires. En même temps, ne pas utiliser ces capacités représente un risque élevé pour le public. Si l’utilisation des mégadonnées et de l’intelligence artificielle à des fins abusives peut causer des préjudices, les occasions manquées peuvent aussi causer des préjudices évitables, entraînant la perte en vies humaines, des souffrances inutiles et des revers dans le développement. 

La voie à suivre doit être inclusive. La réalisation du Programme de développement durable à l’horizon 2030 nécessite que toutes les parties prenantes soient réunies pour créer un environnement propice à l’adoption de cadres responsables et au développement d’outils inclusifs. La nomination à point nommé du Groupe de haut niveau sur la coopération numérique21 offre de nouvelles possibilités de faire progresser ces objectifs. Pour tirer pleinement parti de la révolution des données, il nous faudra garantir une utilisation responsable des nouvelles technologies ainsi qu’une approche axée sur les droits afin de faire respecter le principe de responsabilité à la fois en matière d’utilisation et d’analyse des données à des fins abusives et pour les occasions manquées, en veillant à ne laisser personne de côté.    

Notes 

1 L’initiative Global Pulse, « Big data for development: challenges and opportunities »(New York, 2012). Disponible sur le site http://www.unglobalpulse.org/sites/default/files/BigDataforDevelopment-UNGlobalPulseJune2012.pdf

2 Groupe consultatif d’experts indépendants sur la révolution des données pour le développement durable, « A world that counts: mobilising the data revolution for sustainable development », rapport (novembre 2014). Disponible sur le site https://repositorio.cepal.org/bitstream/handle/11362/40319/AWorldThatCou...

3 Pour plus d’informations, voir https://undataforum.org/

4 Jennifer Poole, « Data for development (D4D) challenge at Net Mob 2013 » (UN Global Pulse Blog, 1er mai 2013). Disponible sur le site https://www.unglobalpulse.org/D4D-NetMob

5 Pour plus d’informations, voir http://dataforclimateaction.org/. 

6 Pour plus d’informations, voir Elena Alfaro Martinez et al., « Measuring economic resilience to natural disasters with big economic transaction data », Bloomberg Data for Good Exchange Conference, 25 septembre 2016. Disponible sur le site https://arxiv.org/ftp/arxiv/papers/1609/1609.09340.pdf

7 Nations Unies, « Twitter, UN Global Pulse announce data partnership », Objectifs de développement durable, 26 septembre 2016. Disponible sur le site https://www.un.org/sustainabledevelopment/blog/2016/09/twitter-and-un-gl...

8 Pour plus d’informations, voir GSMA, « Big data for social good », #BetterFuture. Disponible sur le site https://www.gsma.com/betterfuture/bd4sg (consulté le 16 novembre 2018). 

9 Union européenne, le Règlement général sur la protection des données (GDPR) est le changement le plus important en matière de réglementation de la confidentialité des données depuis 20 ans. Disponible sur le site https://eugdpr.org/ (consulté le 16 novembre 2018). 

10 Pour plus d’informations sur l’UN Data Privacy Policy Group (UNPPG) et ses objectifs, voir le site Web du Conseil des chefs de secrétariat des organismes des Nations Unies pour la coordination https://www.unsceb.org/principles-personal-data-protection-and-privacy

11 Pour plus d’informations sur les principes, voir https://www.unsceb.org/principles-personal-data-protection-and-privacy

12 Confidentialité, éthique et protection des donnéesnote d’orientation du GNUD concernant les mégadonnées à l’appui de la réalisation du Programme 2030. Disponible sur le site https://undg.org/wp-content/uploads/2017/11/UNDG_French_BigData_final.pd...

13 Pour plus d’informations sur le Groupe consultatif sur la confidentialité des données de Global Pulse des Nations Unies, voir son site Web https://www.unglobalpulse.org/data-privacy-advisory-group

14 Initiative Global Pulse, « Data innovation risk assessment tool », 2016. Disponible sur le site https://www.unglobalpulse.org/privacy/tools. 

15 UN Global Pulse et International Association of Privacy Professionals, « Building ethics into privacy frameworks for big data and AI ». Disponible sur le site https://iapp.org/resources/article/building-ethics-into-privacy-frameworks-for-big-data-and-ai/

16 Pour plus d’informations, voir Haze Gazer, a Real Time Analysis and Visualization Tool for Enhanced Crisis Management à http://hazegazer.org/

17 Pour plus d’informations, voir CycloMon, une plate-forme d’analyse et de visualisation développée par Pulse Lab Jakarta pour suivre les interventions avant /pendant/après la survenue de cyclones tropicaux dans le monde à http://cyclomon.org/

18 Initiative Global Pulse, « Using machine learning to analyse radio talk in Uganda », Septembre 2017. Disponible sur le site http://unglobalpulse.org/sites/default/files/Radio%20Analysis%20Report_Preview%20%283%29.pdf

19 Pour plus d’informations, voir I’Union internationale des télécommunications, « Sommet mondial 2018 sur l’intelligence artificielle au service du bien social » à https://www.itu.int/en/ITU-T/AI/2018/Pages/default.aspx

20 Pour plus d’informations, voir « Stratégie du Secrétaire général en matière de nouvelles technologies », septembre 2018 à http://www.un.org/en/newtechnologies/images/pdf/SGs-Strategy-on-New-Technologies-FR.pdf

21 Pour plus d’informations, voir Nations Unies, « Groupe de haut niveau sur la coopération numérique du Secrétaire général ». Disponible sur le site http://www.un.org/fr/digital-cooperation-panel/index.html (consulté le 20 novembre 2018).