On ne compte plus les débats cherchant à déterminer si le big data mérite vraiment d’être considéré comme le nouveau pétrole. Certains affirment que les données deviennent peu à peu la ressource pour laquelle tous les pays s’affronteront à l’avenir. Certains considèrent, à rebours, que l’importance des données ne saurait être comparée à celle de l’« or noir ». Quel que soit le point de vue adopté, il semble en tout cas que le big data soit devenu un enjeu stratégique pour lequel de nombreux acteurs sont prêts à se battre.
Cette idée a été renforcée par les déclarations du président russe, en 2017. Dans un discours à des étudiants, évoquant la question de l’intelligence artificielle, Vladimir Poutine a déclaré nettement que « quiconque deviendrait leader dans ce domaine deviendrait maître du monde[1] ». Toutefois, « pour bâtir une IA de qualité, il faut des données[2] ». De fait, l’IA dépend lourdement du big data (on parle aussi de données massives ou mégadonnées), en particulier pour le deep learning. Il semble donc clair que les données fourniront à ceux qui savent les amasser un avantage de poids. En conséquence, quiconque ambitionne de diriger le monde doit d’abord s’assurer un accès à la plus grande quantité de données possible pour nourrir ses systèmes d’IA.
L’importance stratégique du big data
Les États-Unis et la Chine ont déjà saisi l’importance stratégique de disposer de flux de données massifs, en particulier depuis qu’ils s’opposent ouvertement pour s’assurer une position de leadership en matière d’IA[3].
Le fait est que l’IA constitue un marché très prometteur qu’aucun pays ne souhaite laisser échapper. L’IA touche tous les aspects de notre vie et son influence va continuer à croître, ce qui créera des opportunités dans de multiples domaines : emploi, R&D, éducation, santé, transports, défense, finance, communication et même agro-alimentaire – pour n’en citer que quelques-uns. L’IA exploite déjà les gigantesques flux de données à sa disposition pour apprendre elle-même et s’améliorer.
« Le volume de données que nous produisons double chaque année. […] Chaque minute, nous produisons des centaines de milliers de recherches Google et de posts Facebook, qui contiennent des informations à même de révéler le fonctionnement de nos pensées et de nos émotions. »[4]
C’est une réalité que nous devons accepter et à laquelle nous devons surtout nous ajuster. La Chine possède incontestablement un avantage sur ce terrain. En premier lieu, du fait de sa population considérable (1,4 milliard d’habitants) et de ses 730 millions d’internautes, elle a accès à une masse de données considérable. En second lieu, étant donné le peu d’intérêt de la Chine pour les questions de vie privée et de protection des données personnelles, il est beaucoup plus aisé d’y collecter des données que dans des pays où la législation protège les citoyens contre des collectes intrusives.
Le « profond réservoir de données[5] » de la Chine lui permettra presque infailliblement de damner le pion aux États-Unis et de parvenir aux objectifs fixés dans son programme de 2017 : faire de l’IA le principal moteur de son industrie d’ici 2025 et « occuper le haut du pavé en matière de technologie IA » d’ici 2030.[6]
Un rapide coup d’œil aux chiffres permet de comprendre sans peine pourquoi la Chine déploie une stratégie aussi agressive pour prendre la tête en matière d’IA. Selon une étude du cabinet PwC, « les plus grands gains apportés par l’IA seront sans doute observés en Chine (avec un bond de 26 % du PIB en 2030) et en Amérique du Nord (bond potentiel de 14 %)[7] ». L’impact de l’IA serait sensible à l’échelle de la planète, puisqu’elle contribuerait à ajouter « 15,7 milliards à l’économie globale en 2030[8] ». Pour profiter pleinement de l’IA, « l’accès aux données et la façon dont elles sont utilisées constitueront la première des richesses[9] ».
Il est donc clair que les données sont la nouvelle ressource que les pays ne peuvent pas se permettre d’ignorer. Plus encore : ils auront certainement à lutter pour ces données.
Les acteurs publics ne sont pas seuls dans l’arène du big data : de nombreuses entreprises et acteurs privés sont avides de données supplémentaires, que ce soit pour accroître leurs ventes en améliorant leur stratégie marketing, pour être plus spécifiques dans leur ciblage ou pour offrir de nouveaux produits précisément adaptés aux besoins de leurs clients. Le big data est synonyme de big money, ce qui fait des données une ressource très précieuse et profitable.
« Les techniques d’intelligence artificielle (IA) comme le machine learning extraient encore plus de valeur des données. Les algorithmes peuvent prédire le moment où un consommateur est prêt à acheter, où un réacteur d’avion a besoin d’entretien, où un individu est exposé à une maladie. Des géants de l’industrie comme GE ou Siemens se présentent désormais comme des entreprises de données. »[10]
Les données ont donc dépassé le pétrole comme ressource la plus stratégique dans certains secteurs, et ne constituent pas seulement un actif que les entreprises veulent détenir : elles sont aussi devenues un produit extrêmement lucratif pour qui sait les vendre.
Pour prendre un exemple, Avast, entreprise basée en Tchéquie et dont le logiciel antivirus est utilisé par 400 millions de personnes à travers le monde, vend les données de ses utilisateurs depuis 2013, par exemple à des investisseurs.[11] La question est de savoir ce que valent les données et de quelle façon leur prix va évoluer quand on connaît l’appétit croissant des systèmes d’IA. Nous sommes déjà dans un cercle – vertueux ou vicieux, selon les points de vue – car « en collectant davantage de données, une entreprise est plus à même d’améliorer ses produits, ce qui attire de nouveaux consommateurs, ce qui génère encore plus de données et ainsi de suite[12] ».
Quoi qu’on pense à leur sujet, les données sont une réalité, tout comme la compétition pour y avoir accès. Évidemment cette bataille pour les données s’accompagne de nombreuses préoccupations sur leur utilisation finale et le respect de la vie privée des utilisateurs. Pour autant, de nouveaux usages prometteurs contrebalancent ces inquiétudes.
Ressource préoccupante ou prometteuse ?
Les acteurs publics sont tout aussi conscients des avantages du big data que les acteurs privés. Ils ont naturellement intérêt à soutenir l’activité économique dans le secteur industriel et le commerce, fût-ce en encourageant l’exploitation de données et le développement de systèmes d’IA par des entreprises privées. Les profits réalisés par ces entreprises sont source d’emploi, de consommation, de rentrées fiscales et de nouveaux investissements qui seront à leur tour bénéfiques pour la société et, au bout du compte, pour les gouvernants. Dans ce sens, soutenir la collecte massive de données semble positif et prometteur.
Le big data offre aussi d’autres avantages aux gouvernements qui veulent conserver un contrôle étroit sur leur population et ses activités. La façon dont le pouvoir chinois se sert de données amassées via un système de reconnaissance faciale en est une illustration parfaite. Pour autant, l’utilisation de données par l’État n’est pas le privilège de la Chine ou des pays considérés comme autoritaires ou peu fréquentables par les puissances occidentales. La collecte de données est aussi pratiquée en Europe et en Amérique du Nord. Même quand cette pratique est encadrée par des normes légales, ces données n’en sont pas moins collectées et peuvent être employées à des fins, bonnes ou mauvaises, dont nous n’avons aucune idée.
Dans certains endroits comme le Japon, la collecte de données via un réseau de caméras et de capteurs est même vue comme une façon d’améliorer la qualité de vie.
« Les résidents ne sont pas seulement moins inquiets pour leurs proches : le taux de criminalité à Kakogawa est tombée sous la moyenne de la préfecture de Hyōgo pour la première fois depuis novembre 2018.[13] »
Les données peuvent aussi être un atout majeur pour des pays confrontés à un manque de main-d’œuvre lié au vieillissement de leur population. Toujours au Japon, des robots équipés en système d’IA permettent déjà de palier le manque d’employés dans les maisons de retraite[14] et sont même utilisés dans des magasins entièrement automatisés[15].
L’IA possède déjà une importance majeure dans certaines opérations militaires, et notamment pour le combat en milieu urbain où la collecte de données permet aux troupes de terrain ou à des stratégistes de prendre des décisions plus intelligentes et plus rapides. Des robots envoyés sur le théâtre sont capables de fournir des données essentielles grâce à des actions de surveillance, de tracking, d’exploration des zones urbaines, de modélisation des zones environnantes. En l’occurrence, la reconnaissance faciale permettrait de distinguer les combattants des non-combattants, et donc d’éviter de tuer des innocents.
Les promesses de l’IA sont nombreuses, cela ne fait aucun doute. On peut l’utiliser pour apprendre à des machines comment accomplir des tâches dangereuses ou tout simplement ennuyeuses, à la place des humains ; pour améliorer notre efficacité en termes de consommation ou de productions alimentaires, et donc limiter le gaspillage et le volume de déchets déversés dans la nature ; pour améliorer la sécurité en repérant les comportements dangereux[16] et même en prédisant les actes de terrorisme[17] ; pour anticiper les catastrophes naturelles ; pour aider les personnes âgées en leur offrant des compagnons avec lesquels interagir et échapper à la solitude ; pour améliorer l’efficacité logistique dans les smart-ports[18] ou même « limiter les dommages collatéraux » en temps de guerre[19].
Bien sûr, si l’optimisme est permis, nous ne devons pas être naïfs. La guerre pour les données conduira également à beaucoup d’usages préoccupants. Il suffit de penser au scandale de Cambridge Analytica. Dans cette affaire, intérêts public et privé se sont chevauchés, et des données ont manifestement été utilisées d’une façon que les électeurs ne pouvaient pas prévoir, c’est-à-dire « pour manipuler les élections en diffamant des candidats via des histoires fabriquées afin de faire pencher les élections en faveur des candidats soutenus par l’entreprise[20] ». On notera que ce scandale ne s’est pas produit en Chine, ni en Russie ou dans un pays aux pratiques politiques contestables.
Les géants de la tech, les fameux GAFAM (Google, Apple, Facebook, Amazon, Microsoft), de même que leurs rivaux chinois, les BATX (Baidu, Alibaba, Tencent, Xiaomi), collectent, génèrent, stockent et analysent une quantité titanesque de données[21], pour le meilleur ou pour le pire.
Des pays comme la Chine et les États-Unis, qui affichent clairement leur volonté de leadership dans le secteur de l’IA, feront assurément tout leur possible pour atteindre leur but. Étant donné les enjeux, il est impensable qu’ils se contraignent. Pékin et Washington veulent se tailler la part du lion dans cet énorme gâteau. D’autres concurrents, comme la France, le Royaume-Uni, le Canada ou l’Allemagne, sont résolus à en avoir un morceau. La lutte sera aussi âpre que la lutte pour le pétrole l’est depuis des décennies.
Les données sont le carburant de l’IA. Elles constituent un actif stratégique pour les entreprises. Comme le dit Mick Lévy : « rendre cet actif plus productif est la question clé » des années à venir[22]. Les données ne sont peut-être pas le « nouveau pétrole » à proprement parler. Néanmoins, elles sont devenues une ressource stratégique qui va façonner le futur de l’humanité. Notre dépendance à la technologie et à l’IA va rendre les données encore plus stratégiques et rendre leur commerce toujours plus lucratif. Dans ce sens, la comparaison avec le pétrole demeure pertinente. Nous aurons autant besoin de données (si ce n’est déjà le cas) que nous avons besoin de pétrole. Désormais, « une question sérieuse se pose : combien valent ces données ?[23] » La réponse à cette question va façonner la bataille pour les données.
Conclusion
Nous devons accepter que le big data est une forme de « nouveau pétrole ». Les données sont déjà une ressource stratégique, au même titre que le pétrole. Elles vont devenir de plus en plus stratégiques à mesure que l’IA va évoluer et nécessiter des quantités toujours plus importantes de données. De larges pans des activités humaines vont s’appuyer sur l’IA, qui va dépendre à son tour de flux de données encore plus importants.
Il faut nous délivrer d’un point de vue manichéen sur le potentiel du big data. Comme pour le pétrole, il conduira à de bonnes comme à de mauvaises conséquences. Comme pour le pétrole, il existera des usages moralement acceptables et des usages moralement inacceptables. Comme pour le pétrole, il y aura des leaders qui fixeront les règles et des suiveurs qui devront les accepter. Comme pour le pétrole, notre dépendance aux données sera telle que nous continuerons à les utiliser, quels que soient les risques. Qu’on tienne la situation pour un progrès ou une régression, l’IA est en train de refaçonner notre monde et les données en sont le carburant. Quiconque entend dominer le monde dans les années qui viennent aura besoin de l’IA et devra donc avoir accès à des quantités massives de données. Ce sera la boussole morale de bien des acteurs sur la scène internationale dans les décennies à venir.
S’il existe des préoccupations légitimes sur la façon dont les données seront utilisées par les acteurs publics et privés, il est utile de souligner une nouvelle fois que « toutes ces données peuvent améliorer (et améliorent déjà) le monde d’une myriade de manières[24] ». Lors de sa déclaration le président Poutine a d’ailleurs souligné que l’IA « est le futur non seulement de la Russie mais de toute l’humanité » et qu’elle « est porteuse d’opportunités colossales[25] ». Dans la mesure où l’IA est alimentée par le big data, on peut aisément inférer que les données sont la porte qui ouvre sur ces opportunités. « Le pétrole est source de pollution mais il a aussi permis de sortir une vaste majorité de la population mondiale de l’extrême pauvreté[26] ». Les perspectives ouvertes par le big data sont du même ordre : à la fois préoccupantes et prometteuses.
Si le pétrole a reçu le nom d’« or noir », il ne semble pas excessif de désigner les données comme un « pétrole digital ». Et oui, les données sont la nouvelle ressource stratégique pour laquelle tout le monde est amené à se battre. Les données sont le nouveau pétrole.
[1] Vladimir Poutine, Discours du Président de la Fédération russe aux étudiants pour le début de l’année scolaire, leçon inaugurale, Iaroslav, 1er septembre 2017.
[2] James Vincent, « China and the US are battling to become the world’s first AI superpower”, The Verge, 3 août 2017.
[3] Pour un bon tableau des leaders actuels et de leurs rivaux les plus sérieux dans la course à l’IA, voir le Global AI Index : https://www.tortoisemedia.com/intelligence/ai/
[4] Dirk Helbing et al., « Will democracy survive big data and artificial intelligence ? », Towards digital enlightenment, Springer, Cham, 2019, pp. 73-98.
[5] « China may match or beat America in AI », The Economist, 15 juillet 2017.
[6] Chine State Council, Notice of the State Council issuing the new generation of Artificial Intelligence Development Plan, State Council Document, n° 35, 8 juillet 2017.
[7] « Sizing the prize. What’s the real value of AI for your business and how can you capitalise ? », PwC Report, 2017, p. 1.
[8] Idem, p. 5.
[9] Idem, p. 23.
[10] « The world’s most valuable resource is no longer oil, but data », The Economist, 6 mai 2017.
[11] Thomas Brewster, « Are you one of Avast’s 400 million users ? This is why it collects and sells your web habits », Forbes, 9 décembre 2019.
[12] The Economist, article cité.
[13] « Data governance and smart cities are helping improve quality of life in Japan », 21 janvier 2020.
[14] Jean-Simon Gagné, « Japon : les robots à la rescousse d’une société vieillissante », Le Soleil, 3 novembre 2019
[15] Taiki Asakawa, « Fukuoka firm to open Japan’s first store fully automated at night », The Mainichi, 11 décembre 2018.
[16] Chris Baraniuk, « Exclusive : UK police wants AI to stop violent crime before it happens », New Scientist, 26 novembre 2018 ; Julian Ryall, « Japan developing ‘pre-crime’ artificial intelligence to predict money laundering and terror attacks », South China Morning Post, 31 août 2018.
[17] Kayla Stoner, « Predicting terror activity before it happens. New model utilizes data science to predict terror groups’ lifetime lethality after first 10 attacks », Northwestern Now, 7 octobre 2019.
[18] Luka Riester, « How is the port of Antwerp optimising logistics with data science ? », The Blog of Business & Decision, 6 décembre 2019.
[19] Larry Lewis, « Killer robots reconsidered : could AI weapons actually cut collateral damage ? » Bulletin of the Atomic Scientists, 10 janvier 2020.
[20] Court Stroud, « Cambridge Analytica : the turning point in the crisis about big data », Forbes, 30 avril 2018.
[21] Juan-Carlos Miguel De Bustos, « GAFAM, media and entertainment groups and big data », Les enjeux de l’information et de la communication, 27 décembre 2017.
[22] https://www.linkedin.com/pulse/data-7-sujets-chauds-pour-2019-mick-levy/
[23] Antonio Garcia Martinez, « No, Data is not the new oil », Wired, 26 février 2019.
[24] Kiran Bhageshpur, « Data is the new oil – and that’s a good thing », Forbes Technology Council, 15 novembre 2019.
[25] Vladimir Poutine, op. cit.
[26] Antonio Garcia Martinez, op. cit.