Le Big Data est-il mauvais pour l’environnement ?

Selon certains médias, internet serait un danger pour la planète et l’écolo connecté, le roi des hypocrites. Gaz à effet de serre (GES), diminution de ressources non renouvelables, éco-toxicité, les conséquences de notre activité en ligne sont nombreuses. ​Zoom sur les sources de pollution et ordre de grandeur avec notre experte Laura Dupuis, product owner à la Factory Data IA.

Publié le 27 septembre 2022 par Com itnovem

Le Big Data est-il mauvais pour l’environnement ?

​​L’industrie IT est responsable d’environ 4% des émissions mondiales de GES, plus que le secteur aérien (1). Plus inquiétant  : ce chiffre devrait doubler d’ici 2025. Pourtant, tout le monde est loin de se douter qu’en appuyant sur le bouton “Rechercher” de Google, nous émettons l’équivalent de 5 à 7 grammes de CO². Faut-il pour autant faire une croix sur notre vie connectée ? Pour vous aider à y voir plus clair, un retour sur les dernières études sur le sujet s’impose. S’il semble difficile de contenir l’ampleur que le numérique prend dans nos vies, il est possible de limiter ses impacts négatifs voire de l’utiliser pour améliorer notre existence : bienvenue dans le monde du Green IT.​

​​​L’essor du numérique et du Big Data 

En ces temps étranges de Corona, l’industrie IT a encore une fois montré la place essentielle qu’elle occupe dans nos vies. Côté pile, parce que la maîtrise des données et l’analyse prédictive est une arme pour endiguer l’épidémie. Côté face, parce que l’utilisation du streaming vidéo, des réseaux sociaux ou de marketplaces a explosé. Que ça soit pour ne pas mourir d’ennui, pour rester connecté avec sa grand-mère ou pour acheter un tapis de sport, nous avons tous utilisé les services des géants du net. Amazon, par exemple, a triplé son bénéfice au troisième trimestre 2020 (2), Facebook a vu son utilisation doubler tandis que Netflix a renforcé sa position de leader sur le marché du streaming. 

Toutes ces entreprises tirent leur force du Big Data, ou dit autrement, la faculté de produire, d’analyser et d’exploiter un plus grand volume de données, de nature très diverse, à une vitesse sans précédent. Le début du web, l’augmentation de la disponibilité des données liée notamment à la baisse des coûts de stockage et l’apparition de calculateurs très performants marque la naissance du phénomène dans les années 2000. Que ça soit des commentaires laissés sur des réseaux sociaux, des vidéos, des parcours d’utilisateurs sur internet, des flux d’informations d’objets connectés, toute donnée, même non structurée est potentiellement analysable. L’intelligence artificielle va s’appuyer sur l’explosion de données et cette puissance de calcul nouvelles pour se démocratiser. Des modèles algorithmiques prédictifs permettent alors aux entreprises d’améliorer leurs services (temps de réponse réduit, personnalisation des recommandations) voire même d’anticiper les désirs des utilisateurs pour adapter leur stratégie. Mais si l’essor du numérique semble inéluctable, est-ce le cas de la pollution qui l’accompagne ?​​​

La pollution cachée du Big data ​

Prenons l’exemple de Paul qui veut visionner sur Youtube le clip de « Gangnam Style ». En cherchant par mot clé sa chanson préférée sur son smartphone, il va faire une requête transmise via un réseau 4G au data center de Google qui héberge la vidéo. Cette information est ensuite traitée par les serveurs du centre de données qui lui renvoient les propositions de vidéos pertinentes. Paul peut en quelques micro secondes danser sur sa musique préférée. Mais l’utilisation de ces technologies à un coût énergétique : Paul, notre aficionado de K-pop est loin d’imaginer que le​ visionnage massif de « Gangnam Style » a consommé l’équivalent de la production annuelle d’une petite centrale nucléaire (3). Outre la consommation électrique, c’est également la fabrication des terminaux utilisateurs, des réseaux ou des data centers qui épuise des ressources naturelles (énergies primaires, ressources abiotiques) et est responsable d’émission de gaz à effet de serre (GES) ce qui participe au réchauffement climatique.  

Topito des sources de pollution (4)                                  ​ 

Source : Rapport de l’étude de Green IT – Empreinte environnementale du numérique (2019) 

          1. Les terminaux utilisateurs  ​

Prêtons attention au cycle de vie de votre smartphone, ordinateur ou tablette. Leur fabrication implique l’extraction de matières premières à l’aide de techniques et produits nocifs et potentiellement l’exploitation d’enfants dans des mines en RDC ou en Chine (5). Mais ce n’est pas tout : une fois utilisés, ils consomment de l’électricité, deuxième source majeure de pollution. Enfin, une fois cassés ou remplacés, vos terminaux atterrissent dans une décharge à ciel ouvert, dans une des nombreuses « poubelles de l’occident » en Afrique ou en Asie comme la majorité des déchets d’équipements électriques et électroniques (DEEE) qui sont exportés illégalement, polluant sols et l’air. Le phénomène d’obsolescence programmé ne fait qu’amplifier ces problématiques.  

Et demain ? La population mondiale augmente et les pays moins industrialisés sautent à pieds joints dans le numérique : le nombre de terminaux devrait donc quintupler d’ici 2025. Les pays en développement (PED) ont un désir légitime d’avoir un niveau de vie comparable aux pays développés, ce qui induit de nouveaux besoins en énergie, de nouvelles technologies et donc une empreinte carbone qui s’envole. Aujourd’hui, les plus pauvres de la planète n’émettent que 10% des rejets polluants mais en souffrent le plus (6). ​

          ​2. ​​​La pollution des data centers et des réseaux  

Les centres informatiques, ces pharaoniques lieux de stockage et de traitement de données, sont des gouffres énergétiques : d’une part à cause de la consommation électrique primaire des équipements (logique) mais aussi à cause de leur système de refroidissement très énergivore. Tout comme votre vieil ordinateur, un data center chauffe. Et plus le volume de données stocké est important, plus les traitements sont longs et complexes, plus le data center consomme. Par exemple, l’intelligence artificielle et plus particulièrement le deep learning (7) ont un coût de calcul conséquent (8).  

Les fournisseurs de cloud ont tout de même fortement optimisé la performance énergétique de leur centre de données (principalement pour des questions de rentabilité économique). Les mauvais élèves (IBM, Amazon, Netflix, Samsung) sont épinglés régulièrement par Greenpeace (9). Ainsi, Amazon a fortement recours au charbon, au gaz et choisit son énergie principalement en fonction de son bas prix (10). D’autres organisations comme Google ou Microsoft ont fait le choix d’augmenter la part d’énergies renouvelables. Des nouveaux systèmes ingénieux ont été créés pour récupérer la « chaleur fatale », l’énergie émise lors de processus de production et qui ne peut être récupérée. Résultat, des logements sont aujourd’hui chauffés grâce à des data centers. 

Ce qui pose surtout problème, c’est moins la pollution des centres de stockage, qui sont de plus en plus optimisés, mais surtout celle du réseau, notamment 4G et Wifi. Doit-on alors redouter l’impact écologique de la 5G ? A priori, oui. Certes, ce réseau est moins énergivore, mais il va susciter un effet rebond : l’augmentation des usages va annuler les gains énergétiques. Ainsi, en Corée du Sud, la 5G est disponible depuis 2019 et les usagers ont consommé beaucoup plus de streaming, de jeux vidéo, bref des applications utilisant beaucoup de bande passante. Par ailleurs, sa mise en place nécessite l’installation de nouveaux équipements réseau et l’achat de smartphones compatibles dont la fabrication est, vous l’aurez compris, polluante.  

          ​3. Ordres de grandeurs – usages & pollution numérique  

Maintenant que vous savez pourquoi le numérique pollue, penchons-nous sur les usages sont les plus nocifs et énergivores : s’agit-il du stockage de nos mails ? De nos recherches google ? du visionnage de Netflix ? De l’écoute d’un podcast ? En partant du postulat que plus le volume de données traité / stocké est important, plus les Data centers / réseau consomment du C02, on peut avoir des ordres de grandeurs intéressants sur différents usages numérique.  

Source : https://raphael-lemaire.com/2019/11/02/mise-en-perspective-impacts-numerique/ 

On remarque que c’est bien le streaming vidéo qu’il faudrait diminuer pour avoir un impact écologique conséquent. Et même si l’impact d’une vidéo en ligne est le plus important parmi nos comportements numériques, il n’en reste pas moins que comparé à d’autres sources d’émission de CO2 du quotidien, il reste relatif (même si cet usage va de toute évidence augmenter avec l’arrivée de la 5G). Faut-il pour autant binge-watcher toutes les saisons de Rick et Morty en HD ? Ce n’est pas raisonnable sachant que ce calcul ne prend pas en compte les autres externalités externes du numérique comme le coût environnemental de votre mobile ou ordinateur qui est désastreux. Pour le bien de la planète, la première chose à faire est donc de lutter contre l’obsolescence programmé et ne pas renouveler son téléphone ou ordinateur avant usure complète. Vous pouvez également acheter du matériel informatique de seconde main. Ensuite, vous pouvez baisser la résolution de vos vidéos ! 

Source : https://rap​hael-lemaire.com/2019/11/02/mise-en-perspective-impacts-numerique/ 

Pour conclure, la pollution numérique a de beaux jours devant elle : le nombre d’utilisateurs, les usages augmentent et l’obsolescence programmée est toujours d’actualité. A quel niveau doit-on agir pour avoir le plus d’impact ? Un changement des habitudes individuelles est-il suffisant ? Et si au final, le numérique était une des clés pour sortir de la crise écologique majeure actuelle ?

(1) https://www.franceinter.fr/emissions/le-telephone-sonne/le-telephone-sonne-23-octobre-2019 
​(2) https://www.lesechos.fr/industrie-services/conso-distribution/amazon-affiche-une-sante-insolente-dopee-par-le-coronavirus-1261044 
​(3) https://www.europe1.fr/societe/internet-pollue-autant-quun-grand-pays-industriel-le-cri-dalarme-de-greenpeace-2946473 
​​(4) https://www.greenit.fr/wp-content/uploads/2019/10/2019-10-GREENIT-etude_EENM-rapport-accessible.VF_.pdf 
(​5) https://www.amnesty.org/fr/latest/campaigns/2016/06/drc-cobalt-child-labour/ 
​​(6) https://www.cairn.info/revue-de-l-ofce-2020-1-page-35.htm 
(7) https://www.futura-sciences.com/tech/definitions/intelligence-artificielle-deep-learning-17262/ 
​(8) https://blog.link-value.fr/quelle-est-lempreinte-%C3%A9cologique-des-entra%C3%AEnements-de-mod%C3%A8les-en-data-science-25aa07beb7a3 
​(9) https://www.usinenouvelle.com/article/greenpeace-epingle-amazon-netflix-ibm-ou-samsung-pour-leur-faible-consommation-d-energies-renouvelables.N486254 (10) https://www.franceinter.fr/societe/pollution-numerique-greenpeace-pointe-du-doigt-les-mauvais-eleves