● Compte tenu de sa consommation électrique et du nombre massif d’utilisateurs, l’environnement numérique mondial est aujourd’hui un important générateur de gaz à effet de serre.
● La tâche complexe d’évaluer votre empreinte carbone est devenue un objectif spécifique pour la recherche universitaire.
● La puissance considérable exigée par les méthodes d’apprentissage statistique en intelligence artificielle a rendu ce problème encore plus urgent.
Les internautes ont du mal à imaginer qu’interagir avec ChatGPT ou regarder des vidéos recommandées par YouTube crée de réelles émissions de gaz à effet de serre. Pour les chercheurs, en revanche, l’empreinte carbone créée par les ordinateurs et autres appareils numériques est un sujet brûlant à notre époque de réchauffement climatique. Et ils tiennent à rappeler que les combustibles fossiles (charbon, pétrole et gaz) sont brûlés pour générer de l’électricité sur le réseau où nous chargeons nos batteries et branchons nos machines, et n’oublions pas toute l’infrastructure réseau et internet, en particulier les centres de données. qu’ils stockent nos données et nos applications, qui consomment d’énormes quantités d’énergie dans le monde.
En France, la question fait l’objet d’un débat national Programme Numérique et Environnement publié par l’Institut français de recherche en informatique et en automatique en 2022. Et les inquiétudes qu’il a suscitées sont partagées dans le monde entier, notamment en raison de l’ampleur stupéfiante des émissions numériques que nous sommes censés générer à l’avenir. Plus tôt cette année, Soumya Sudhakar, Vivienne Sze et Sertac Karaman du Massachusetts Institute of Technology (États-Unis) ont présenté le des résultats alarmants d’un modèle qui simulait les émissions potentielles du traitement des données embarquées dans les véhicules autonomes alimentés à l’électricité, qui utilisait largement les capteurs et l’intelligence artificielle (IA). Ils ont notamment conclu que l’informatique nécessaire à une flotte mondiale d’un milliard de véhicules autonomes aurait une empreinte carbone au moins aussi importante que celle générée actuellement par tous les centres de données du monde.
Un problème rendu encore plus urgent par l’essor de l’IA
POUR étude publiée à la mi-février 2023 ont modélisé les émissions générées par l’apprentissage automatique entre 2012 (une année révolutionnaire dans le domaine) et 2021. Les deux auteurs, un chercheur spécialiste travaillant pour l’entreprise Hugging Face et un étudiant postdoctoral à l’Institut québécois d’intelligence artificielle, ont sélectionné 95 algorithmes ML mentionnés dans 77 articles scientifiques tirés de cinq domaines : la classification d’images, la détection d’objets, la traduction automatique, les agents conversationnels ou chatbots, et la reconnaissance d’entités nommées (un aspect du traitement du langage naturel) qui consiste à classer les mots en catégories : les personnes , lieux, sociétés, dates, quantités, adresses, etc.).
Il est vraiment difficile de collecter toutes les informations nécessaires pour faire des estimations détaillées de l’empreinte carbone.
L’idée n’était pas d’évaluer la quantité exacte de dioxyde de carbone liée à chacun d’eux, mais plutôt d’esquisser les grandes tendances. “Il est vraiment difficile de collecter toutes les informations nécessaires pour faire des estimations détaillées de l’empreinte carbone”, note Sasha Luccioni de Hugging Face. «Les documents d’IA ont tendance à ne pas révéler la quantité de puissance de calcul utilisée, ni où la formation a eu lieu.”
Des niveaux de performance inférieurs ne signifient pas nécessairement des émissions inférieures
Le projet s’est concentré sur la phase d’apprentissage des modèles d’apprentissage, qui nécessitait une grande puissance de calcul. La première constatation était que 73 des 95 modèles ont été entraînés à l’aide d’électricité produite principalement à partir de charbon, de gaz naturel et de pétrole. A titre d’illustration, les modèles alimentés au charbon ont généré en moyenne 512 g d’équivalent CO2 par kilowattheure, contre 100,6 g pour ceux alimentés principalement par l’hydroélectricité (générant plusieurs gaz à effet de serre mais convertis en équivalent CO2 pour fournir un chiffre unique). Deuxièmement, dans ce contexte, il est important de noter qu’une consommation d’électricité plus élevée n’impliquait pas nécessairement une empreinte carbone plus élevée, étant donné les faibles émissions des modèles fonctionnant à l’hydroélectricité. Une autre découverte était que lors de la comparaison de deux modèles alimentés par des combustibles fossiles, les performances n’étaient pas nécessairement corrélées à une empreinte carbone plus faible.
L’empreinte carbone des algorithmes de traduction automatique a diminué depuis 2019
Cependant, les chercheurs n’ont pas observé “une augmentation systématique des émissions de carbone pour les tâches individuelles.” Les empreintes générées par les modèles de classification d’images et les chatbots ont continué de croître, mais celles des algorithmes de traduction automatique ont diminué depuis 2019.
Cependant, le fait qu’il y ait eu une augmentation globale était indéniable. Les modèles d’apprentissage ont généré en moyenne 487 tonnes d’équivalent CO2 en 2015-2016. Pour 2020-2022, ce chiffre, qui ne concernait que la formation, a atteint 2 020 tonnes. Le déploiement a également eu un grand impact. Une seule requête ChatGPT peut certes être satisfaite avec un coût énergétique minime, mais les millions de requêtes adressées chaque jour à un nombre toujours croissant de chatbots sont bien plus problématiques. “C’est ce sur quoi je travaille en ce moment.” dit Sasha Luccioni. “Cependant, cela reste une tâche complexe, car la manière dont les modèles sont mis en œuvre, le matériel utilisé et la mise à l’échelle, etc., ont une grande influence sur l’énergie requise et le carbone émis.”
“Introverti hardcore. Pionnier de la bière. Amoureux d’Internet. Analyste. Spécialiste de l’alimentation. Passionné de médias sociaux.”