Bytesnet datacenter in Groningen, by Sjaak Kempe

Préambule

L’évaluation environnementale du numérique est un sujet nouveau et immature. Face à sa complexité, il nous paraît important:

  • De documenter les hypothèses choisies et les limites constatées.
  • De fournir toutes les données utilisées dans l’évaluation (hypothèses choisies, limites constatées, calculateur, facteurs d’impact) pour favoriser la critique et la construction des connaissances.
  • De communiquer les résultats avec humilité

C’est dans cet état d’esprit que nous publions cet article. Tout retour critique et constructif sera fortement apprécié.

Introduction

En août 2020, le Ministère de la Transition écologique et le Ministère de l’Économie, des Finances et de la Relance ont confié à l’ADEME et l’Arcep une mission commune visant à mesurer l’empreinte environnementale du numérique en France et à identifier des leviers d’actions et des bonnes pratiques pour la réduire.

Les deux organisations ont remis en janvier 2022 les deux premiers volets consacrés à la mesure de l’ensemble de cette empreinte en 2020 [1]. Quels enseignements peut-on retenir de cette étude ?

Le titre du premier chapitre du dossier de presse [2] est explicite :

“L’état des lieux en 2020 : nos équipements et leur durée de vie, premiers responsables de l’empreinte environnementale du numérique. “

Cette conclusion est illustrée par l’infographie suivante :

Infographie extraite du dossier de presse sur l’Etude ADEME – Arcep sur l’empreinte environnementale du numérique en 2020, 2030 et 2050 [2]

Infographie extraite du dossier de presse sur l’Etude ADEME – Arcep sur l’empreinte environnementale du numérique en 2020, 2030 et 2050 [2]

Pourtant, cette étude de grande qualité a un angle mort qui n’est pas visible si on ne lit pas attentivement le rapport et notamment les limites qui sont décrites :

“Les équipements et infrastructures informatiques situés à l’étranger sont exclus, quand bien même associés à des usages français.” (page 20 du rapport [1]_ )._

Dit autrement, seuls les datacenters et réseaux opérés en France sont pris en compte.

Si l’étude inclut bien les phases de fabrication hors France du matériel IT, elle exclut les services (applicatifs ou hébergement) qui sont déployés et administrés hors de la France mais bien utilisés sur le territoire.

L’objet de cet article est donc de tenter de combler cet angle mort en proposant une première approche pour estimer le volume et l’impact des datacenters extérieurs dédiés à un usage français.

Il est important de noter que nous ne traitons pas (encore):

  • la partie importée des réseaux
  • la partie internationale et mutualisée comme les câbles sous-marins
  • les datacenters opérés en France pour un usage à l’étranger

Approche méthodologique

Approche consommation vs Approche production

L’analyse territoriale de l’impact environnemental du numérique peut suivre deux approches :

L’approche consommation

On évalue les impacts environnementaux de l’ensemble des usages numériques individuels collectifs et industriels sur un territoire donné délimité par ses frontières géographiques. Cette évaluation implique des étapes du cycle de vie qui se sont potentiellement produites en dehors de ses frontières (production, fin de vie, transport, utilisation externe au territoire…). Dans une approche carbone on parle d’empreinte.

On privilégiera cette approche pour mettre en évidence l’affectation des impacts liés à la chaîne de valeurs globale sur un territoire donné.

L’approche production

On évalue les impacts environnementaux liés à la production de biens et services numériques sur un territoire donné délimité par ses frontières géographiques. Dans une approche “carbone” on parle d’émission.

On privilégiera cette approche dans des territoires à forte intensité de production liés à la fabrication des produits (Asie du sud-est), à leur fin de vie (Afrique de l’Ouest, Asie du sud-est, …), ou à la production de services (Silicon Valley, technopoles…).

Ces deux approches peuvent être complémentaires et s’alimenter, mais ne peuvent pas être agrégées pour éviter une double comptabilité.

Approche consommation et prise en compte de ressources externes

Dans le cas d’une approche consommation, la phase d’usage détermine l’affectation ou non des ressources. En d’autres termes, toutes ressources (équipements et services à toutes les phases de leur cycle de vie) nécessaires à l’existence des processus numériques sur le territoire doivent être imputées au territoire, au moins partiellement en cas d’usages multiples.

Modèle production vs modèle consommation

L’approche consommation se définit donc comme suit :

  • [A] La ressource est produite et consommée sur le territoire.
    Action : L’impact de la ressource est totalement affecté à l’impact du territoire.

  • [B] La ressource est produite sur le territoire et consommée à l’extérieur du territoire
    Action : Les impacts de la ressource ne sont pas imputés aux impacts globaux du territoire.

  • [C] La ressource est consommée sur le territoire et produite à l’extérieur du territoire
    Action : Les impacts de la ressource doivent être imputés aux impacts globaux du territoire.

Dans la littérature

Les études qui évaluent les impacts environnementaux du numérique mondiaux considèrent l’ensemble des ressources sans différencier une approche production ou consommation. En d’autres termes, dans un référentiel monde [C] = [B] = [A], car le système est fermé.

Les études menées par le consortium Nega-Octet sur le territoire Européen (The Green - EFA [3]) et Français (ADEME-ARCEP [1]) suivent une approche consommation si on définit le numérique par les équipements alors qu’elle devient incomplète si on définit le numérique par les usages — et donc les services associés.

En effet, sont exclus de [C] tous les usages extérieurs au territoire dont bénéficie le territoire (Utilisation de ressources d’infrastructure externe, R&D et production de services extérieurs, …).

Cela est dû à une difficulté méthodologique à les intégrer. L’exclusion des impacts liés au datacenters externes semble être une limite importante à combler, notamment à cause de l’éloignement de ces ressources des zones d’usage, qui rend (a priori) une grande partie des impacts d’une région dépendante de datacenters externes. Ceci est encore plus le cas quand la zone géographique analysée se réduit avec un potentiel de divergence entre les approches consommation et production qui grandit, les centres de données n’étant pas également répartis sur les territoires.

Application aux datacenters

Par cohérence avec la littérature et surtout l’étude nationale ADEME/ARCEP [1], nous avons utilisé la même typologie de datacenters, tout en les regroupant :

  1. Datacenters internes ou traditionnels qui regroupent :
  • Public local : datacenters internes dédiés à l’hébergement du système d’information des organisations publiques des territoires (Conseils Régionaux, Conseils Départementaux, SDIS, COMUE, Communautés d’Agglomération, Communautés Urbaines, Métropoles, mairies de plus de 30 000 habitants, CHRU, CHU et centres hospitaliers) [1]
  • Public national : datacenters internes dédiés à l’hébergement du système d’information de l’Etat, des Ministères, des Administrations centrales (ODAC) et des entreprises publiques (EPIC) [1]
  • Entreprises : datacenters internes dédiés à l’hébergement du système d’information des entreprises [1]
  • HPC ou High Performance Computing : datacenters aussi appelés supercalculateurs dédiés aux opérations de calcul intensif [1]
  1. Datacenters “Cloud” qui regroupent :
  • Colocations : datacenters opérés par un tier, pouvant héberger le système d’information de plusieurs entités clientes qui ont chacune leurs propre parc informatique, les clients pouvant être des entreprises (dont des entreprises du digital) ou des organisations publiques [1]
  • Les Hyperscalers : datacenters opérés par et pour un fournisseur de services cloud. Ces datacenters ont généralement une capacité d’hébergement IT plus importante car conçus pour l’hypercroissance. Les optimisations et innovations en termes d’urbanisation des salles, de refroidissement et de taux d’utilisation des ressources IT sont aussi supposées plus importantes que dans un datacenter de collocation, notamment car les fournisseurs de services cloud ayant une envergure suffisante pour gérer leurs propres datacenters ont un budget R&D important et des cas d’application concrets facilement accessibles.

Pour les datacenters les modèles Production et Consommation se déclinent comme suit :

Les modèles production et consommation appliqués aux datacenters

Ce qui est considéré dans l’étude nationale ADEME/ARCEP correspond au modèle production suivant :

Le modèle production considéré dans le rapport ADEME/ARCEP

Et ce que nous souhaitons estimer correspond au modèle consommation suivant :

Le modèle consommation qui nous intéresse

Les pistes considérées

Le modèle “Trafic France”

Ce modèle est documenté dans l’étude Citizing “Empreinte carbone du numérique en France Sénat” [4].

Les hypothèses du modèle :

Il se base sur l’évaluation du trafic français vers l’international (Cisco/ITU), et sur la consommation électrique des datacenters à l’international pour ce trafic.

Les conclusions :

  • “55% du trafic de données vers les utilisateurs en France provient de l’étranger, en particulier des centres informatiques des GAFAM implantés aux États-Unis, en Irlande”.
  • 5,5% du trafic des datacenters situés en France alimente un usage à l’étranger.

Les limites :

  • Sources anciennes et plus disponibles,
  • Modèle non reproductible,
  • L’efficacité énergétique des datacenters à l’étranger apparaît très importante (10 fois supérieure aux datacenters français) et insuffisamment documentée.
  • Le trafic n’est pas forcément un bon indicateur de l’usage des datacenters (c’est le cas par exemple de l’usage des videos qui nécessitent en proportion beaucoup plus d’usage de la bande passante)..

On peut illustrer les résultats de ce modèle avec le schéma suivant :

Résultats du modèle consommation

Le modèle “Energétique Monde”

Ce modèle est celui de l’étude “Recalibrating global data center energy use estimates.” de Masanet, E., Shehabi, A., Lei, N., Smith, S., and J.G. Koomey (2020) [5].

Les hypothèses du modèle :

Les principales hypothèses de l’étude sont les suivantes :

  • Les datacenters sont définis comme des déploiements de serveurs dans des armoires ou des salles machines internes à l’organisation ou externalisés dans des centres de données plus ou moins haut de gamme, jusqu’aux hyperscalers.1

  • Ces types de datacenters sont organisés en méta-catégories: datacenters traditionnels ou cloud selon les conventions d’analyse de marché de Cisco. La catégorie Cloud est ensuite subdivisée en deux sous catégories: hyperscalers et cloud (non hyperscalers).2
    Sur la base d’une modélisation des datacenters (serveurs, stockage, réseau et PUE) et de l’évolution de la charge (workload) par type de datacenter (cloud, hyperscaler et traditionnel) le modèle Masanet évalue l’évolution de la consommation d’énergie.

Le modèle Masanet

Les résultats pour les années 2019 et 2020 sont les suivants:

Le résultats du modèle Masanet pour 2019 et 2020

Nous nous focaliserons maintenant sur l’année 2020 qui est l’année de référence de l’étude ADEME/ARCEP.

L’objectif est de comparer la répartition entre type de datacenters (traditionnel, cloud) pour les périmètres Monde (Masanet) et France (ADEME/ARCEP).

Hypothèses:

  • le modèle Masanet étant à l’échelle mondiale, les modèles de consommation et de production sont identiques.
    dans une approche consommation, la France a une répartition Traditionnel/Cloud similaire au modèle monde
  • les datacenters traditionnels installés en France ont un usage externe (hors France) négligeable
  • les datacenters externes utilisés en France sont exclusivement de type Cloud
  • la consommation des datacenters de type Cloud opérés en France pour un usage extérieur à la France:
    sera moins impactante - au moins pour l’indicateur GWP - que son équivalent opérée à l’étranger (mix électrique plus défavorable)
    semble limitée (estimée à 5,5% dans l’étude Citizing [4] )
    est donc exclue de l’évaluation

Pour le modèle Monde de Masanet, en regroupant le “Cloud” et les “Hyperscalers” pour l’année 2020, nous obtenons :

DC TraditionnelsCloud
Total (TWh)51145
Modèle Energétique Monde (Masanet)26,07%73,93%

En utilisant les mêmes catégories de datacenters, l’étude nationale ADEME/ARCEP fournit les résultats suivants :

DC TraditionnelsCloud
Total (TWh)5,975,62
%51,51%48,49%

Nous avons ensuite appliqué le modèle énergétique de Masanet à la France pour l’année 2020.

Voici la démarche avec les hypothèses choisies3 :

La démarche

En appliquant les hypothèses définies ci-dessus, voici en synthèse le Modèle de consommation Monde de Masanet appliqué à la France :

DC TraditionnelsCloud France → FranceCloud Monde → France
Total (TWh)5,975,6211,31
Modèle Énergétique France26,07%24,54%49,39%

Synthèse des modèles étudiés

Sur la proportion des datacenters opérés à l’extérieur du territoire et utilisés en France, les modèles par “trafic” (France) ou par “consommation énergétique” (Monde) convergent sur un chiffre significatif, environ 50%.

Cela conforte l’intérêt de considérer aussi une approche par consommation en complément de l’approche production choisie dans le rapport national (ADEME/ARCEP) [1] .

Compte tenu des incertitudes sur la nature et valeurs des données échangées pour le modèle “trafic” et de la disponibilité dans le rapport ADEME/ARCEP des consommations énergétiques par type de datacenter, l’application du modèle “énergétique” nous apparaît comme plus pertinente.

Mieux comprendre le modèle Masanet

Les grands principes du modèle Masanet peuvent se résumer ainsi:

  • Périmètre : Il prend en compte tous les types de datacenters, des hyperscalers aux datacenters localisés dans les entreprises, en passant par les datacenters de colocation.

  • Approche bottom-up : Il utilise une approche bottom-up pour estimer la consommation d’énergie, ce qui signifie qu’il prend en compte la consommation d’énergie des composants unitaires des centres de données, tels que les serveurs, les disques de stockage, les ports réseau et l’infrastructure sous jacente (systèmes de refroidissement, …)

  • Couverture géographique : Il couvre les datacenters dans toutes les régions du monde, en mettant l’accent sur les principaux marchés de centres de données tels que l’Amérique du Nord, l’Europe et l’Asie.

  • Transparence : Il est transparent, ce qui signifie que ses inputs, ses hypothèses et ses calculs sont accessibles en open data .

  • Sources de données : Il utilise un large éventail de sources de données, y compris des enquêtes sectorielles d’institutions ou d’analystes, des données issues d’acteurs du réseau (CISCO) ou des opérateurs de datacenters. Le modèle intègre également des données sur l’efficacité énergétique des équipements informatiques, des systèmes de refroidissement et d’autres infrastructures.
    Cependant, l’essentiel des données provient de deux sources principales: CISCO et notamment le “Cisco Global Cloud Index: Forecast and Methodology, 2016-2021: White Paper, 2018” et le rapport “United States Data Center Energy Usage Report” (modèle Shehabi).

Les principaux paramètres du modèle sont:

  • les estimations et prévisions de “workloads” réparties par type de datacenter (traditionnel ou cloud). Note: un workload correspond à un élément virtualisé (VM ou container). Ces données sont principalement issues des rapports CISCO.
    L’approche méthodologique de CISCO est documentée dans le rapport GCI 2016-2021:
Les données Cisco

Il est clairement indiqué que la “baseline” des workloads installées provient de rapports d’analystes (Gartner, IDC, Juniper, Ovum etc …). Ces données n’étant pas ouvertes et disponibles, il est difficile de les vérifier et de les valider !

  • le taux de virtualisation par serveur, exprimé en nombre de workloads / serveur. Ces hypothèses sont également issues des rapports CISCO:
Workloads par serveur (chiffres CISCO)
Type de data center20162021
Traditional2,43,8
Cloud8,813,2
  • la proportion d’hyperscalers dans les datacenters de type cloud. Ces données proviennent également des rapports CISCO.
  • la modélisation des serveurs (puissance, capacité de stockage, équipements réseau, ..) et des datacenters (type, PUE, ..). Ces données sont principalement issues du modèle “Shehabi” (rapport “United States Data Center Energy Usage Report”)

Les résultats du modèle Masanet aboutissent aux consommations d’énergie suivantes:

Les résultats du modèle Masanet

Si on regroupe les catégories en Traditionnel et Cloud on obtient pour l’année 2020 et à l’échelle mondiale: 26% de la consommation énergétique des datacenters provient des datacenters traditionnels et 74% des datacenters Cloud.

L’ouverture des données permet de faire varier des paramètres pour effectuer des Analyses de Sensibilité (AS). Par exemple, si on fait varier le taux de virtualisation (nombre de workloads par serveur) pour les serveurs des datacenters traditionnels, on obtient les résultats suivants pour la répartition de consommation énergétique sur l’année 2020:

Analyse de sensibilité sur l’année 2020

On constate que la variation de ce paramètre ne change pas drastiquement la répartition de la consommation énergétique entre datacenters de types Cloud et Traditionnels.

Les résultats

Rappel des résultats de l’étude nationale (modèle production)

Les résultats globaux mettent en avant la répartition des impacts par tier considéré [1] :

Résultats de l’étude nationale (modèle production)

Si on se focalise sur les datacenters, la répartition par type de datacenter est la suivante4 :

Résultats de l’étude nationale pour les datacenters (modèle production)

Si on regroupe les différentes catégories dans les deux principales, “Traditionnel” et “Cloud” la répartition devient:

Résultats de l’étude nationale pour les datacenters, traditionnels ou Cloud (modèle production)

L’étude ADEME/ARCEP [1] décrit précisément l’inventaire des datacenters présents sur le territoire français:

DC traditionnelsCloud France
Public LocalPublic NationalEnterpriseHPCColocation
m2813906500031180010800414174
Densité kW/baie34,54155
IT TWh0,320,362,190,343,63
PUE1,931,931,931,171,55
Conso Total TWh0,660,694,220,45,62
Conso Totale consolidée TWh5,975,62

Cela nous permet d’exploiter les facteurs d’impacts par m2 et/ou par TWh en fonction des types de datacenter [1]:

Impacts par m²

Résultats du modèle consommation

Hypothèses & limites

  • On utilise les mêmes facteurs d’impact pour la phase de fabrication des datacenters colocation/cloud qu’ils soient internes ou externes au territoire.
  • Il serait pertinent de valider cette hypothèse en comparant l’impact de fabrication de datacenters dans plusieurs pays.
  • On utilise un mix électrique 50% Europe et 50% US pour la phase d’usage faute de facteurs d’impact multicritères pour un mix électrique Monde.
  • Il faudrait en théorie un mix moyen de chaque pays au prorata de ses capacités en datacenter

Les données de l’étude ADEME/ARCEP nous permettent d’obtenir des ratios de consommation par m2 et par type de datacenter:

Conso elec (kWh)m2conso/m2 (kWh)
Datacenters public local6,60E+08813908,11E+03
Datacenters public national6,90E+08650001,06E+04
Datacenters entreprises4,22E+093118001,35E+04
Datacenters colocation5,62E+094141741,36E+04
Datacenters HPC4,00E+08108003,70E+04

Nous utiliserons les mêmes ratios pour les datacenters de colocation qu’ils soient internes ou extérieurs.

Impact des datacenters, répartition par catégorie

L’intégration des datacenters extérieurs aboutit à la répartition suivante5 :

Intégration des datacenters extérieurs

Constats

L’impact des datacenters extérieurs est majoritaire pour l’ensemble des indicateurs (jusqu’à 73,5% pour le Potentiel de Changement Climatique), sauf sur l’indicateur de Radiations Ionisantes.

Analyses

L’importance de l’impact des datacenters extérieurs s’explique par leur proportion (on a ajouté plus de 49% sur la base du modèle Masanet) et par le mix électrique plus défavorable (sauf pour l’indicateur de Radiations Ionisantes)

Impact des datacenters, répartition par phase du cycle de vie

Répartition par phases du cycle de vie - Modèle Production 6

Répartition par phases du cycle de vie - Modèle Production

Répartition par phases du cycle de vie - Modèle consommation 7

Répartition par phases du cycle de vie - Modèle consommation

Constats :

L’impact de l’usage devient majoritaire pour l’ensemble des indicateurs sauf pour l’Épuisement des Ressources Abiotiques non fossiles (ADPe) et la Production de Déchets.

Par exemple, pour l’indicateur de Potentiel de Changement Climatique, la part d’usage passe de 28% (modèle production) à 60% (modèle consommation).

Analyses :

La prise en compte des datacenters cloud extérieurs, associée au mix électrique choisi ( 50% Europe et 50% US), inverse l’importance de l’impact des phases d’usage et de fabrication.

Analyse de sensibilité sur le pourcentage de datacenters extérieurs

Compte tenu des incertitudes sur la proportion des datacenters importés dans un usage français, nous avons considéré deux scenarii alternatifs au modèle Masanet appliqué à la France:

  • le scénario “consommation bas” qui évalue la part de consommation des datacenters extérieurs à 30% du total
  • le scénario “consommation haut” qui évalue la part de consommation des datacenters extérieurs à 70% du total
Analyse de Sensibilité sur le pourcentage de datacenters extérieurs
Epuis. des res. abiotiques - élémentsEpuis. des res. abiotiques - fossilesAcidificationEcotoxicitéChangement climatiqueRadiations ionisantesEmissions de particules finesCréation d'ozone photochim.MIPSProduction de déchetsConsommation d'énergie primaireConsommation d'énergie finale (usage)
Scenario de consommation (55% importé)206%188%375%349%377%131%221%357%302%205%188%197%
Scenario "production" (0% importé) - référence100%100%100%100%100%100%100%100%100%100%100%100%
Scenario de consommation "bas" (30% importé)158%148%250%236%252%117%166%241%211%157%148%153%
Scenario de consommation "haut" (70% importé)235%212%450%417%454%139%254%428%358%234%212%224%

Constats :

On observe une forte variation des impacts en fonction du pourcentage de datacenters importés (par ex : jusqu’à 454% sur le critère changement climatique Vs approche production dans le cas d’usages de datacenters à 70% importés)

Analyses :

Cette analyse de sensibilité illustre l’importance de progresser dans la quantification de la consommation des datacenters extérieurs. La croissance en part de marché des hyperscalers pour le IAAS et des éditeurs (souvent américains) pour le SAAS, soulignée notamment par les rapports GXI d’Equinix, devrait accentuer ce besoin de quantification.

Résultats du modèle consommation sur le périmètre global

Résultats du modèle production sur le périmètre global
Résultats du modèle consommation sur le périmètre global
Epuis. des res. abiotiques - élémentsEpuis. des res. abiotiques - fossilesAcidificationEcotoxicitéChangement climatiqueRadiations ionisantesEmissions de particules finesCréation d'ozone photochim.MIPSProduction de déchetsConsommation d'énergie primaireConsommation d'énergie finale (usage)
Modèle production9E+058E+1110E+073E+112E+1010E+101E+034E+076E+102E+108E+112E+11
Modèle consommation105%124%153%148%156%109%130%148%139%110%126%131%

Constats:

On note une évolution sensible sur l’ensemble des indicateurs, de +5% sur l’épuisement des ressources abiotiques non fossiles jusqu’à plus 56% sur l’indicateur de Potentiel de Changement Climatique.

Ramené à un français, l’impact de potentiel de Changement Climatique passe de 252 à 394 kg CO2eq / an.

Analyses:

Même s’il existe des incertitudes, la prise en compte des services importés (ici au travers des datacenters) apparaît indispensable compte tenu de l’importance estimée de leurs impacts.

Périmètre Global - Analyse de sensibilité sur le pourcentage de datacenters extérieurs

Nous utilisons les mêmes scenarii que pour les datacenters mais avec un focus sur le périmètre global.

Analyse de sensibilité sur le pourcentage de datacenters extérieurs
Epuis. des res. abiotiques - élémentsEpuis. des res. abiotiques - fossilesAcidificationEcotoxicitéChangement climatiqueRadiations ionisantesEmissions de particules finesCréation d'ozone photochim.MIPSProduction de déchetsConsommation d'énergie primaireConsommation d'énergie finale (usage)
Scenario de consommation (55% importé)104%118%142%138%145%106%123%138%131%108%119%123%
Scenario "production" (0% importé) - référence100%100%100%100%100%100%100%100%100%100%100%100%
Scenario de consommation "bas" (30% importé)102%110%123%121%125%103%113%121%117%105%111%113%
Scenario de consommation "haut" (70% importé)106%123%154%148%157%108%130%149%140%111%125%129%

Constats:

La prise en compte des datacenters importés dans l’évaluation globale, entraîne une croissance importante des impacts pour l’ensemble des indicateurs.

Par exemple, la croissance de l’impact sur le potentiel de changement climatique varie de 125% à 157% par rapport au modèle production.

Analyses:

La facilité d’usage des solutions cloud (principalement extérieures à la France), favorise leur adoption et leur développement. Le poids de l’infrastructure apparaît en croissance et il semble indispensable de mieux quantifier ce phénomène.

Répartition par Tier pour l’indicateur GWP - Analyse de sensibilité sur le pourcentage de datacenters extérieurs

Si on se focalise sur le seul indicateur de potentiel de changement climatique, voici les variations de la répartition par tier en fonction des scenarii considérés:

Répartition par Tier pour l’indicateur GWP
Scenario de consommation "de référence" (55% importé)Scenario "production" (0% importé)Scenario de consommation "bas" (30% importé)Scenario de consommation "haut" (70% importé)
Devices & IoT54%78%63%50%
Réseau4%5%4%3%
Datacenters42%16%33%47%

Constats:

La prise en compte des datacenters importés modifie sensiblement la répartition des impacts par tier.

En fonction des scenarii, le poids du tier 3 (datacenter) pour le potentiel de changement climatique passe de 16% (modèle production) à 33% (scenario bas) ou 47% (scenario haut).

Analyses:

L’utilisation d’un modèle “consommation” met en évidence le poids relatif potentiellement important de l’infrastructure. Même s’il existe des incertitudes sur le pourcentage des datacenters importés, il semble important de poursuivre cette analyse pour valider cette croissance relative de l’impact des datacenters.

Quelle comparaison avec les autres publications ?

Pour comparer nos résultats, nous nous sommes focalisés sur les études qui fournissent une répartition entre les différents tiers considérés (terminaux, réseau, datacenters).

A noter que cette comparaison se focalise sur le seul indicateur de Potentiel de Changement Climatique.

“The real climate and transformative impact of ICT: A critique of estimates, trends, and regulations , Charlotte Freitag, Université de Lancaster” 8 présente une bonne synthèse des principales études qui adressent un périmètre global (sur les 3 tiers). On y retrouve les travaux de 3 principaux groupes de recherche:

  • Andrae and Edler 9
  • Belkhir and Elmeligi 10
  • Malmodin and Lundén 11

Voici une synthèse des ’études présentées pour l’année 2020 [8]:

Synthèse des études pour l’année 2020

Si on élimine les télévisions pour pouvoir les comparer avec un périmètre le plus proche possible, on obtient la répartition suivante pour chaque étude ([9], [10] et [11]), pour l’année 2020 :

Synthès des études pour 2020, sans les TV

Seule l’étude de Malmodin estime que la part des appareils utilisateur est plus élevée que celle des datacenters.

Selon Charlotte Freitag, cela s’explique principalement par le fait que les estimations de Malmodin concernant les réseaux et les centres de données sont inférieures à celles des autres études.8

Pour comparer notre modèle “Consommation” français avec les résultats de ces 3 études, il nous faut définir les hypothèses suivantes:

  • Pour les terminaux, on retire l’impact des télévisions pour se rapprocher le plus possible du même périmètre. L’étude ADEME/ARCEP [1] estime l’impact GWP des télévisions à 13,7% de l’impact total auquel on peut ajouter l’impact des BoxTV, évalué à 2% de l’impact total.
  • On applique un mix électrique “global” sur l’ensemble des usages. A défaut de mix monde récent, on utilisera un mix 50% Europe / 50% US avec les données publiques de l’étude ADEME/ARCEP. Il correspond à un impact de 0,479 kgCO2eq / kWh.
    Limites:
  • Il existe une incertitude des périmètres de chaque étude - notamment sur celui des terminaux.
  • Le taux d’équipements et plus globalement l’usage du numérique varient en fonction des pays. On peut imaginer que la France est certainement un pays plus équipé que la moyenne en terminaux numériques.
  • Il faudrait en théorie un mix moyen de chaque pays au prorata de son usage du numérique
  • L’utilisation d’un mix Monde identique aux autres études serait pertinent. Pas évident à ce stade qu’ils soient disponibles. Si c’est le cas, cela pourra faire l’objet d’une mise à jour.
  • Le modèle consommation n’a pas été appliqué au réseau dans cette étude.

Avec ces hypothèses, voici les répartitions par tier que l’on obtient pour le modèle Consommation avec un mix électrique WorldWide (WW) et en retirant la catégorie Télévision. La partie Réseau est grisée car non spécifiquement traitée dans cette étude. L’intérêt principal est de comparer l’évolution de la part des datacenters et éventuellement de comparer le ratio datacenters/terminaux les deux étant traités sur un modèle consommation.

Consommation worldwide sans la catégorie Télévision

Pour information et analyse, voici la synthèse de toutes les variantes (modèles Production ou Consommation, mix électrique FR ou WW, avec ou sans TV):

Modèle production - Répartition par tier pour l’indicateur GWP (Global Warming Potential):

Modèle production - répartition part Tier pour l’indicateur GWP

Modèle consommation- Répartition par tier pour l’indicateur GWP (Global Warming Potential):

Modèle consommation - répartition part Tier pour l’indicateur GWP

En conclusion, si on applique nos résultats au contexte des autres études (mix électrique “Monde” et sans télévision) on constate que:

  • le modèle production semble surestimer le poids des terminaux par rapport à toutes les études et particulièrement par rapport à celles de Andrae et Belkhir (67% vs 32% pour Andrae et 37% pour Belkhir).
  • le modèle consommation semble relativement cohérent avec les études de Andrae et Belkhir concernant l’impact relatif des datacenters (35% dans notre étude, 33% pour Andrae et 41% pour Belkhir).

Il faut cependant noter que:

  • Le modèle consommation n’a pas été appliqué au réseau dans cette étude. C’est une évolution à envisager. Toutefois, cela ne modifie pas sensiblement le poids relatif des terminaux par rapport aux datacenters.
  • Ces conclusions sont à prendre avec prudence compte tenu des limites identifiées ci-dessus, notamment le périmètre exact des terminaux.

Conclusion

L’initiative de cette étude s’est fondée sur le besoin de compléter l’étude ADEME/ARCEP sur l’empreinte environnementale du numérique en France. Cette étude, très riche, est sans conteste le document de référence sur le sujet. Il nous apparaissait important de combler son angle mort principal, la non prise en compte des datacenters importés, pour plusieurs raisons :

  • la conclusion que le poids des terminaux est largement majoritaire dans l’empreinte du numérique en France est reprise massivement, sans nécessairement comprendre ou indiquer les limites (documentées !) de l’étude.
  • la croissance forte des démarches “Move to Cloud”, souvent à l’international, accentue l’importance de la prise en compte de leur impact.

Notre travail nous a permis de progresser sur plusieurs points:

  • l’approche méthodologique à appliquer à un territoire : approches production ou consommation,
  • l’étude des modèles d’évaluation de la littérature: Masanet, Andrae, etc.,
  • l’application concrète des modèles à notre cas d’usage.

Outre ces progrès, nous avons également tiré de ce travail différents enseignements dont voici les principaux :

  • L’impact des datacenters situés à l’étranger et associés à des usages français sont importants. Notre estimation sur l’indicateur de Potentiel de Changement Climatique aboutit à une évolution de + 270% à l’échelle des datacenters et de + 45% à l’échelle de l’usage global du numérique en France.
  • La répartition entre les terminaux et les datacenters sur ce même indicateur est sensiblement modifiée : on passe de 79% terminaux / 16% datacenters à 54% terminaux / 42% datacenters.
Synthèse de l’évolution des conclusions
  • La comparaison de la répartition terminaux/datacenters en termes d’empreinte carbone semble cohérente avec les principaux modèles connus à l’échelle Monde, notamment ceux de Belkhir et d’Andrae, même si ces comparaisons sont à prendre avec précaution.
  • Notre estimation est imparfaite. Nous avons défini et documenté plusieurs hypothèses et limites qui peuvent être remises en cause. Nous sommes conscients qu’appliquer les mêmes modèles à des territoires France et Monde amène des incertitudes. Mais ces premiers résultats montrent néanmoins qu’il est plus que jamais indispensable de progresser sur la prise en compte des services numériques importés.

Enfin, ce premier travail ouvre de nombreuses perspectives:

  • définir plus précisément la part des datacenters importés, en définissant par exemple un protocole d’enquête auprès d’un échantillon représentatif d’entreprises,
  • étendre cette démarche à la partie réseau pour obtenir l’impact réel de l’infrastructure dans l’usage du numérique,
  • exploiter ces résultats pour progresser sur l’évaluation territoriale,
  • développer des modèles paramétriques de nos travaux et de ceux de la littérature pour faciliter les évaluations prospectives.

Si vous pensez pouvoir nous aider à prolonger ou affiner cette étude d’une quelconque façon, n’hésitez pas à nous contacter : contact@hubblo.org

Bibliographie

Annexe

Modèle Production - Répartition par type de datacenter
Epuisement des ressources abiotiques naturelles - éléments - kg Sb eq.Epuisement des ressources abiotiques naturelles - fossiles - MJAcidification - mol H+ eq.Ecotoxicité - CTUeChangement climatique - kg CO2 eq.Radiations ionisantes - kBq U235 eq.Emissions de particules fines - Disease occurrenceCréation d'ozone photochimi que - kg NMVOC eq.MIPS - kgProduction de déchets - kgConsommation d'énergie primaire - MJConsommation d'énergie finale (usage) - MJ
Datacenters public local2,20E+039,28E+097,63E+052,21E+091,39E+081,15E+091,21E+013,30E+055,58E+089,60E+071,02E+102,36E+09
Datacenters public national2,20E+039,82E+098,13E+052,20E+091,48E+081,20E+091,28E+013,45E+055,51E+089,23E+071,08E+102,50E+09
Datacenters entreprises1,23E+045,92E+104,80E+061,27E+108,76E+087,23E+097,70E+012,02E+063,12E+095,08E+086,52E+101,52E+10
Datacenters colocation2,05E+048,28E+108,16E+062,15E+101,47E+099,77E+091,13E+023,38E+065,05E+098,28E+089,07E+102,03E+10
Datacenters HPC1,75E+035,95E+096,27E+051,57E+091,12E+086,92E+088,22E+002,54E+053,61E+086,18E+076,51E+091,44E+09

Tableau1

Modèle Consommation - Répartition par type de datacenter
Epuisement des ressources abiotiques naturelles - éléments - kg Sb eq.Epuisement des ressources abiotiques naturelles - fossiles - MJAcidification - mol H+ eq.Ecotoxicité - CTUeChangement climatique - kg CO2 eq.Radiations ionisantes - kBq U235 eq.Emissions de particules fines - Disease occurrenceCréation d'ozone photochimi que - kg NMVOC eq.MIPS - kgProduction de déchets - kgConsommation d'énergie primaire - MJConsommation d'énergie finale (usage) - MJ
Datacenters public local2,20E+039,28E+097,63E+052,21E+091,39E+081,15E+091,21E+013,30E+055,58E+089,60E+071,02E+102,36E+09
Datacenters public national2,20E+039,82E+098,13E+052,20E+091,48E+081,20E+091,28E+013,45E+055,51E+089,23E+071,08E+102,50E+09
Datacenters entreprises1,23E+045,92E+104,80E+061,27E+108,76E+087,23E+097,70E+012,02E+063,12E+095,08E+086,52E+101,52E+10
Datacenters colocation2,05E+048,28E+108,16E+062,15E+101,47E+099,77E+091,13E+023,38E+065,05E+098,28E+089,07E+102,03E+10
Datacenters HPC1,75E+035,95E+096,27E+051,57E+091,12E+086,92E+088,22E+002,54E+053,61E+086,18E+076,51E+091,44E+09
Datacenters colocation exterieurs4,11E+041,46E+114,16E+079,98E+107,60E+096,15E+092,70E+021,63E+071,95E+101,67E+091,60E+11k4,07E+10
Total8,00E+043,13E+115,68E+071,40E+111,03E+102,62E+104,93E+022,26E+072,91E+103,25E+093,44E+118,25E+10

Tableau 2

Répartition par phases du cycle de vie - Datacenters - Modèle production
Epuisement des ressources abiotiques naturelles - éléments - kg Sb eq.Epuisement des ressources abiotiques naturelles - fossiles - MJAcidification - mol H+ eq.Ecotoxicité - CTUeChangement climatique - kg CO2 eq.Radiations ionisantes - kBq U235 eq.Emissions de particules fines - Disease occurrenceCréation d'ozone photochimi que - kg NMVOC eq.MIPS - kgProduction de déchets - kgConsommation d'énergie primaire - MJConsommation d'énergie finale (usage) - MJ
Fabrication, distribution et fin de vie99,06%11,23%70,57%86,37%71,67%0,00%21,98%71,06%80,52%100,00%11,50%0,00%
Usage0,94%88,77%29,43%13,63%28,33%100,00%78,02%28,94%19,48%0,00%88,50%100,00%

Tableau 3

Répartition par phases du cycle de vie - Datacenters - Modèle consommation
Epuisement des ressources abiotiques naturelles - éléments - kg Sb eq.Epuisement des ressources abiotiques naturelles - fossiles - MJAcidification - mol H+ eq.Ecotoxicité - CTUeChangement climatique - kg CO2 eq.Radiations ionisantes - kBq U235 eq.Emissions de particules fines - Disease occurrenceCréation d'ozone photochimi que - kg NMVOC eq.MIPS - kgProduction de déchets - kgConsommation d'énergie primaire - MJConsommation d'énergie finale (usage) - MJ
Fabrication, distribution et fin de vie99,18%12,98%40,08%51,86%40,19%0,40%21,53%42,04%55,29%100,00%13,17%0,00%
Usage0,82%87,02%59,92%48,14%59,81%99,60%78,47%57,96%44,71%0,00%86,83%100,00%

Tableau 4

Notes


  1. “Data centers are defined as global server deployments in server closets, server rooms, and localized, mid-tier, high-end, and hyperscale data centers” (United States Data Center Energy Usage Report. Lawrence Berkeley National , 2016 [6]). ↩︎

  2. “These data center types are organized under the meta-categories of traditional and cloud data centers per Cisco market analysis conventions” (Cisco Global Cloud Index : Forecast and Methodology, 2016-2021, White Paper 2018 [7]). “Cloud is further subdivided in this analysis into hyperscale and cloud (non-hyperscale) data centers.” ↩︎

  3. Merci à Gauthier Roussilhe pour sa contribution ! ↩︎

  4. Tableau 1 en Annexe ↩︎

  5. Tableau 2 en Annexe ↩︎

  6. Tableau 3 en Annexe ↩︎

  7. Tableau 4 en Annexe ↩︎

  8. “Note that Malmodin’s estimate of the share of user devices is highest; this is mostly because Malmodin’s network and data center estimates are lower than those of the other studies.” The real climate and transformative impact of ICT: A critique of estimates, trends, and regulations , Charlotte Freitag, Université de Lancaster” [8↩︎