ECCC Kiosk 2023 Charter FR
You can also read this Charter in English.
Environnement et Changement climatique Canada
Centre d’expertise en science et en analyse des données
Executive Summary
La Feuille de route de la Stratégie de données pour la fonction publique fédérale de 2018 et la Stratégie relative aux données et à l’analyse d’Environnement et Changement climatique Canada (ECCC) ont souligné la nécessité de traiter les données comme un actif stratégique et d’exploiter la puissance des données pour générer des aperçus. La science des données et l’analyse des données sont des techniques d’innovation en matière de données qui permettent de plonger en profondeur dans les données pour découvrir des tendances cachées, des corrélations inconnues et faire des prévisions explicites en tenant compte de plusieurs facteurs dans de nombreuses disciplines.
Un centre d’expertise muni de connaissances sur les méthodologies modernes en matière de science des données crée des possibilités pour utiliser des mécanismes avancés d’analyse, de statistiques, d’apprentissage machine (automatique) et d’apprentissage profond dans toute l’organisation. Au sein d’ECCC, le Bureau du dirigeant principal des données (BDPD), qui relève de la Direction générale de la politique stratégique, abrite le Centre d’expertise en science et en analyse des données (le Centre d’expertise), qui vise à soutenir le Ministère et à promouvoir l’utilisation de la science des données et de l’analyse des données pour permettre d’extraire de la valeur des ressources de données d’ECCC.
La présente charte permet de clarifier la raison d’être du Centre d’expertise, les services qu’il offre ainsi que le moment et la façon de faire appel à ces services.
Mission
La mission du Centre d’expertise est de favoriser une culture axée sur les données au sein du Ministère grâce à l’utilisation de l’innovation en matière de données.
Vision
ECCC génère des idées grâce à des techniques en matière de science des données pour tirer une plus grande valeur publique des données et améliorer les services et les opérations.
Mandat
Le Centre d’expertise du BDPD travaille avec les directions générales et les programmes dans les domaines de la veille économique, de la prise de décisions fondée sur des données probantes et de l’analyse propre à la science afin de :
- Promouvoir les utilisations possibles de la science des données et de l’analyse des données pour appuyer la prise de décisions et les priorités, et communiquer la valeur opérationnelle des prototypes de science et d’analyse des données.
- Élaborer des prototypes et des validations de principe de l’innovation axée sur les données à l’appui des priorités ministérielles, y compris les services et l’élaboration des règlements.
- Transmettre les méthodologies, les algorithmes et les tableaux de bord élaborés par le Centre d’expertise aux autres membres d’ECCC.
- Fournir des conseils sur l’élaboration de canaux de science et d’analyse des données efficaces et réalisables, de visualisations de données et d’intelligence artificielle.
- Coordonner les projets et les initiatives de science et d’analyse des données et en faire part au Ministère et à l’ensemble de la fonction publique fédérale.
- Apporter des solutions et des conseils en matière de gouvernance de projet afin d’étendre de façon durable les projets de science et d’analyse des données au sein d’ECCC.
Principes fondamentaux
Toutes les activités du Centre d’expertise sont guidées par les principes suivants :
- Vision organisationnelle : Nous sommes prêts à explorer toutes les idées novatrices et tous les cas d’utilisation avec tout promoteur opérationnel à ECCC.
- Ouverture à la tolérance au risque élevé : Nous définirons une échelle de risque avant d’accepter un projet. Nous soutenons un portefeuille de risques dans nos projets d’innovation, selon lequel plusieurs innovations présentant un risque d’échec plus élevé seront jugées aptes à mettre en œuvre.
- Attention portée à la sécurité : Nous créons des innovations nouvelles mais sûres en adhérant à toutes les normes de sécurité pertinentes.
- Concrétisation des avantages : Nous définissons toujours la valeur d’un projet du point de vue d’ECCC, du client et, dans la mesure du possible, des Canadiens.
- Adaptation à l’utilisation prévue : Nous reconnaissons que même si la science et l’analyse des données ont un potentiel incroyable pour résoudre des problèmes que nous n’avons jamais pu résoudre auparavant, elles ne sont pas appropriées pour TOUS les problèmes. Notre priorité est de déterminer si un problème s’aligne sur nos capacités en matière de science et d’analyse des données et non de trouver des moyens de résoudre les problèmes avec la science et l’analyse des données lorsqu’ils ne sont pas en adéquation.
- Au service de notre mandat : Dans notre travail, nous nous efforçons de comprendre et d’établir notre lien, direct ou indirect, avec le mandat principal d’ECCC et la façon dont nous contribuons à mieux servir les Canadiens.
- Esprit d’entreprise : Dans tout ce que nous développons, nous portons notre attention à élaborer des solutions compatibles et axées sur l’entreprise qui apportent une valeur immédiate et locale.
- Orientation sur l’éthique et la protection de la vie privée : Les préoccupations en matière d’éthique et de protection de la vie privée seront toujours évaluées et abordées tout au long du travail effectué.
- L’innovation est MULTIPLIÉE par l’exécution : Le Centre d’expertise en science et en analyse des données comprend que favoriser l’innovation est bien plus qu’un simple encouragement de la créativité; l’exécution constitue également un élément primordial.
Objectifs opérationnels et en matière d’innovation
Le Centre d’expertise se concentre sur les objectifs opérationnels et en matière d’innovation. Ce Centre d’excellence est particulièrement bien placé pour influer sur le mandat principal d’ECCC en tirant parti des ressources de données du Ministère et en utilisant l’innovation en matière de données pour aider à résoudre des problèmes que nous n’avons pas été en mesure de résoudre efficacement dans le passé. Dans l’ensemble, notre intention est de soutenir les directions générales et les programmes à l’aide de la science et de l’analyse des données afin de mieux servir les Canadiens. Nous encourageons les directions générales et les programmes à développer leur propre expertise en matière de science et d’analyse des données. Cela permettra au Ministère de se doter d’une capacité fédérée en matière de science des données, où le Centre d’expertise agira en tant qu’entité centrale qui promeut, soutient, donne des conseils et démontre l’innovation en matière de données.
Structure et gouvernance
Structure de l’équipe et interdépendances
Équipe principale
Le Centre d’expertise en science et en analyse des données du BPDP est constitué d’une équipe interdisciplinaire de scientifique des données possédant une expertise dans l’application de l’intelligence artificielle, de l’apprentissage machine et d’autres méthodes relatives à la science des données pour soutenir les initiatives transversales des directions générales, permettant au Ministère de devenir un chef de file dans l’exploitation de ses ressources de données. Nous avons de nombreux domaines de spécialisation, notamment l’application de la programmation informatique et des connaissances scientifiques, les mathématiques, les statistiques, l’intégration des données, la narration ou la visualisation des données et les algorithmes d’apprentissage machine. L’équipe est composée de groupes de classification EC (économiste) et PC (spécialiste des sciences physiques).
Interdépendances
En tant que centre d’expertise qui fait la promotion et la démonstration de l’innovation, le Centre d’expertise en science et en analyse des données dépend des autres pour réussir. Nous comptons sur d’autres unités opérationnelles pour nos besoins en matière d’infrastructure informatique; par exemple, le Bureau de la dirigeante principale de l’information (BDPI) pour l’infonuagique. Le Centre d’expertise en science et en analyse des données n’est pas responsable de l’opérationnalisation des validations de principe réussies concernant la science des données. Si une validation de principe doit passer à la production, les experts en la matière dans les directions générales et les programmes devront s’adresser au BDPI pour discuter des étapes nécessaires à l’opérationnalisation. Le Centre d’expertise est disponible pour soutenir l’opérationnalisation en documentant la méthodologie et les approches adoptées dans une validation de principe. La préparation et la gestion des données sont un aspect plus large qui n’est pas sous la responsabilité directe du Centre d’expertise.
Difficultés cernées
Nous avons cerné les difficultés suivantes pour assurer la réussite du Centre d’expertise :
- Risque lié à l’innovation : Toute innovation demande l’acceptation d’un certain niveau de risque. Certains projets peuvent ne pas être en mesure de passer par toutes les étapes du cycle de vie (élaboration, mise à l’essai, production).
- Approche d’atténuation : Le Centre d’expertise consigne les approches utilisées et toutes les difficultés. Ces connaissances sont appliquées lors des phases d’idéation et de réception des futurs travaux.
- Maturité des processus : Les validations de principe élaborées exigent que le client s’approprie le processus et décide de la meilleure façon de l’intégrer. Le client peut ne pas être prêt ou en mesure de moderniser entièrement ses processus pour intégrer l’innovation. Si un client souhaite qu’une validation de principe soit rendue opérationnelle, les étapes suivantes peuvent nécessiter le soutien du BDPI.
- Approche d’atténuation : Des mesures sont prises dès la réception d’un projet pour comprendre et mettre en évidence les limites du contexte opérationnel du client.
- Maturité du client : Les validations de principe élaborées par le Centre d’expertise exigent que le client soit prêt à soutenir et à utiliser le produit final. Le Centre d’expertise fournit une documentation détaillant les méthodologies et les approches, mais n’offre pas de formation sur les techniques relatives à la science des données et à la programmation informatique.
- Approche d’atténuation : Des mesures sont prises dès la réception d’un projet pour comprendre les limites ou les possibilités concernant les connaissances, la capacité et le niveau de ressources du client. Le Centre d’expertise soutient la communauté des scientifiques des données au sein du Ministère (communauté de la science et de l’analyse des données GCconnex d’ECCC) et peut offrir un soutien en matière de terminologie pour le recrutement de scientifiques des données.
- Préparation des données : Toutes les données ne sont pas prêtes pour l’application des techniques relatives à la science et à l’analyse des données.
- Approche d’atténuation : Le Centre d’expertise évaluera l’état de préparation des données (y compris la qualité et l’accessibilité) en tant qu’élément du processus de réception d’une demande de projet.
- Obstacles liés à la culture : Les nouvelles techniques visant à comprendre et visualiser les données se heurtent parfois à une certaine résistance.
- Approche d’atténuation : Le Centre d’expertise accordera la priorité à l’explication des concepts et des mesures de rendement d’une technique relative à la science des données afin de soutenir la discussion et les décisions concernant l’innovation.
Services du Centre d’expertise, catégorisation et réception des projets
Le Centre d’expertise offre les services suivants :
- Séances de remue-méninges et d’idéation sur la façon dont la science et l’analyse des données pourraient appuyer les programmes ou les directions générales.
- Élaboration de validations de principe ou de prototypes dans les domaines de la science des données, de l’extraction de données et de l’analyse prédictive. Parmi les exemples, citons l’apprentissage machine tel que les réseaux neuronaux, le regroupement et le traitement automatique du langage naturel.
- Élaboration de tableaux de bord et de visualisations.
- Élaboration de méthodes pour la vision par ordinateur; par exemple, la classification des images et la reconnaissance optique des caractères.
- Prestation d’expertise et de conseils sur les meilleures pratiques en matière de science des données et d’analyse des données ou sur le recrutement.
- Sensibilisation à la Directive sur la prise de décisions automatisée.
Toutes les initiatives du Centre d’expertise sont classées dans les domaines suivants :
- Innovation et expérimentation
- Administration
- Programme environnemental
- Renforcement des capacités en matière de science et d'analyse des données
Pour faire une demande au Centre d’expertise, les clients peuvent communiquer avec le gestionnaire du Centre d’expertise en science et en analyse des données et décrire ses besoins. Le gestionnaire évaluera ensuite les éléments suivants :
- Si la portée de la demande correspond à l’offre de service du Centre d’expertise.
- Le type de projet demandé.
- Si le Centre d’expertise dispose de l’expertise et de la capacité nécessaires pour entreprendre le projet.
- S’il existe une incidence opérationnelle quantifiable.
- Si la solution potentielle offre la faisabilité technique en tant que validation de principe ou de prototype.
- Si les données requises sont disponibles et de qualité suffisante.
Une fois le concept du projet accepté, le client sera invité à examiner et à approuver un formulaire de réception de projet avec une personne-ressource du Centre d’expertise désignée. La personne‑ressource discutera avec le client des options et lui communiquera les détails et les jalons du projet.
Les demandes de projet qui relèvent de l’expertise du Bureau de la dirigeante principale de l’information seront transmises à une personne-ressource appropriée. Le Centre d’expertise n’est pas responsable de la passe opérationnelle ou de la maintenance ni du stockage des données à long terme. Les validations de principe et les prototypes sont livrés au client sous forme de tableaux de bord, de code de programmation et de documentation sur les méthodes et les résultats. Dans le cas d’un projet d’innovation réussi en matière de science et d’analyse des données demandant l’opérationnalisation, il faudra communiquer avec le BDPI.
Exemples de projets de science des données du Centre d’expertise en science et en analyse des données
Projet | Objectif | Méthodologie | Valeur opérationnelle |
CQ de l’humidité du sol (SMC) | Évaluer le potentiel de l’utilisation de l’apprentissage machine pour aider au processus de contrôle de la qualité (CQ) des données sur l’humidité du sol provenant du réseau de Kenaston. | Faire appel aux modèles de classificateurs de forêts aléatoires entraînés pour prédire quels cas de l’ensemble de données doivent être retirés et pourquoi. | Réduire les efforts et le temps nécessaires au contrôle de la qualité. |
Détection de l’utilisation malveillante du code du système harmonisé (SH) (Direction générale de l’application de la loi [DGAL]) | Détecter l’utilisation malveillante du code SH (une norme internationale maintenue par l’Organisation mondiale des douanes [OMD] pour le classement des produits faisant l’objet d’un commerce). | Le modèle prédit des ensembles appropriés de code SH pour détecter les valeurs aberrantes. | Contribuer à réduire l’utilisation malveillante du code SH. |
Modèle d’identification analogique et PAIRS d’IBM (SMC) | Le Service météorologique du Canada (SMC) travaille avec IBM pour élaborer un modèle d’identification analogique utilisant l’IA. | Faire des prévisions en comparant les régimes météorologiques actuels à des régimes similaires du passé. | Obtenir des prévisions météorologiques plus rapides et plus précises grâce aux analogues. |
Extraction automatisée de données (SMC) | Automatiser l’extraction des données de Twitter en utilisant des outils de moissonnage du Web. | Récupérer des données de Twitter à l’aide de la technique du moissonnage Web et de l’extraction de données. | Réduire la charge de travail manuelle et améliorer le processus global. |
Propension à la non-conformité dans les installations de l’INRP (DGAL)
REMARQUE : Ce projet a été terminé en raison de la non-disponibilité d’une quantité suffisante de données. |
Trouver des indicateurs de non-conformité généralisables à l’ensemble des industries dans l’ensemble de données autodéclarées de l’Inventaire national des rejets de polluants (INRP). | Utiliser un modèle basé sur la régression pour prédire le pourcentage de propension à la non-conformité. | Créer des données de l’INRP plus propres et faciliter les caractéristiques généralisables dans toutes les industries.
Réduire la charge de travail manuelle pour le nettoyage et l’analyse des données. |
Prédicteur de la qualité de l’eau | Explorer l’application de l’apprentissage machine pour prédire la qualité de l’eau (coliformes fécaux) dans les lieux d’assainissement des mollusques et crustacés. Les caractéristiques prises en compte sont les précipitations et l’utilisation des terres. | Neuf algorithmes d’apprentissage machine différents ont été évalués. | Résumer les données provenant de diverses sources et fournir des capacités de prévision sur un paramètre de qualité de l’eau. |
Futurs travaux et possibilités
Compte tenu de sa création en 2019, le Centre d’expertise en science et en analyse des données est relativement nouveau au sein du Ministère et reconnaît qu’il existe des possibilités de croissance. Les sujets suivants ont été relevés lors de discussions avec des partenaires et des clients sur les domaines où nous pourrions élargir notre offre de services au Ministère :
- Fournir des conseils et de l’expertise sur l’utilisation éthique de l’IA.
- Soutenir le Ministère au sujet de la Directive sur la prise de décisions automatisée.
- Définir les normes et les meilleures pratiques concernant les projets en matière de science et d’analyse des données.
- Cerner les améliorations des processus administratifs pour automatiser les flux de données et les capacités d’analyse.
- Soutenir les directions générales pour nettoyer et transformer les données.
En outre, la gouvernance, les processus et les rôles/responsabilités dans l’espace d’innovation des données continuent d’évoluer au sein du Ministère.
Domaines à améliorer :
- Orientation sur la stratégie de gouvernance pour les différents projets de science des données à ECCC afin de permettre la variabilité dimensionnelle.
- Comprendre les rôles et les responsabilités des opérations d’apprentissage machine avec le Bureau de la dirigeante principale de l’information.
- Élaborer un modèle de financement pour soutenir l’innovation et les interactions avec les directions générales et les programmes.
Paramètres
Les paramètres constituent une composante essentielle de ce Centre d’expertise, car ils permettent de mesurer la réussite. Ils nous donnent un aperçu de la croissance, de l’incidence et de l’efficacité du travail que nous accomplissons et nous permettent de nous adapter et d’évoluer rapidement et de manière significative.
Nos paramètres s’efforcent de définir le Centre d’expertise en s’appuyant sur un cadre complet de suivi des projets et de l’innovation tout au long du cycle de vie, en alignant les résultats et les critères de réussite sur la composante de gestion de l’innovation (du cadre de responsabilisation de gestion [CRG] 2022-2023) pour plus de visibilité et de transparence.
Les paramètres ci-dessous sont utilisés pour suivre les progrès et sont basés sur les meilleures pratiques de l’industrie.
Paramètres du lancement
- Validation de principe ou tableau de bord au cours d’une année financière donnée
- Nombre de projets lancés
- Nombre de projets présentés à des comités décisionnels au niveau de la direction
- Nombre de projets classés dans la catégorie des projets d’innovation
- Ratio de l’innovation par rapport au nombre total de projets
- Nombre d’intervenants mobilisés pendant l’idéation
- Sources de financement
- Nombre d’équivalents temps plein (ETP) engagés
- Avantage attendu
Paramètres d’exécution
- Durée du cycle de vie de la demande à l’exécution du projet
- Temps passé en phase
- Nombre de projets en cours
- Capital investi
- Dépenses réelles par rapport au budget
Paramètres de clôture
- Nombre de projets terminés
- Nombre de projets soumis pour le financement de l’opérationnalisation
- Avantages/résultats obtenus pour les Canadiens ou les fonctionnaires
Compte tenu des contraintes et des processus de gouvernance existants, les paramètres ci-dessous seront prioritaires à court et à moyen terme, dans l’espoir d’augmenter la collecte de données et le suivi de mesures supplémentaires au fil du temps.
Le cadre ci-dessous combine les thèmes stratégiques avec le cycle de vie typique d’un projet, démontrant les paramètres pertinents à chaque étape qui faciliteront l’établissement de rapports en fonction des critères du CRG.
Thème stratégique/cycle de vie du projet | Réception | Élaboration | Mise à l’essai | Production |
Affectation des ressources | Coûts de fonctionnement et d’entretien investis
Nombre d’équivalents temps plein (ETP) engagés |
|||
Générer des preuves rigoureuses | Nombre de projets lancés | Nombre de projets en cours
|
Nombre d’analyses de rentabilité ultérieures | |
Décisions fondées sur des données probantes | Avantage réalisé par phase |
Les mesures qualitatives seront enrichies par les données probantes qualitatives et les leçons tirées de chaque initiative, ce qui permettra d’améliorer continuellement le service du Centre d’expertise offert aux directions générales, aux directions et aux unités, et de renforcer les interactions au sein d’ECCC.
Annexe
Caractère essentiel de la terminologie
Les données n’ont jamais été aussi importantes ou intégrées dans notre vie professionnelle et personnelle qu’aujourd’hui. La disponibilité des données, ainsi que les outils de visualisation, de partage et de collaboration offrent d’immenses possibilités pour ECCC. Les données présentent également des défis nouveaux et importants. Le principal défi est l’absence d’un vocabulaire commun concernant les données. La présente charte fournira une référence pour la terminologie commune concernant les données afin de permettre de rationaliser les conversations dans l’ensemble d’ECCC à propos de la science et de l’analyse des données. Elle comprendra les terminologies fréquemment utilisées comportant un langage commun et aligné sur celui du secteur.
Terminologie
ID du terme | Nom de terme | Description du terme |
CDR.01 | Analyse des données | L’analyse (analytique) des données est l’analyse computationnelle systématique des données ou des statistiques. Elle est utilisée pour la découverte, l’interprétation et la communication de tendances significatives dans les données. Il s’agit également d’appliquer les tendances des données pour assurer une prise de décisions efficace. Elle peut être utile dans des domaines où une grande quantité de données est sauvegardée; l’analyse des données est fondée sur l’application simultanée de la statistique, de la programmation informatique et de la recherche opérationnelle et permet de quantifier l’information sur le rendement. (Wikipedia - Analytics, n.d.) |
CDR.02 | Analytique et analyse | L’analyse des données se concentre sur le processus d’examen des données antérieures par la compréhension des activités, la compréhension des données, la préparation des données, la modélisation et l’évaluation, ainsi que le déploiement. Il s’agit d’un sous-ensemble de l’analyse (analytique) des données, qui fait appel à plusieurs processus d’analyse des données pour se concentrer sur la raison pour laquelle un événement s’est produit et sur ce qui pourrait se produire à l’avenir en se fondant sur les données précédentes. L’analyse des données est utilisée pour formuler des décisions organisationnelles plus larges.
|
CDR.03 | Science des données | La science des données est un domaine interdisciplinaire qui utilise des méthodes et des algorithmes scientifiques pour extraire des renseignements et acquérir des connaissances au moyen de divers types de données. Il combine une spécialisation dans le domaine, des compétences en programmation et des connaissances en mathématiques et en statistiques pour résoudre des problèmes analytiques complexes. (Statistique Canada - Terminologie pour la science des données, n.d.) |
CDR.04 | Projets | Validations de principe, prototypes ou visualisations sous forme de code, d’algorithmes, de résultats et de tableaux de bord partageables. |
CDR.05 | Intelligence artificielle | L’intelligence artificielle (IA) est un domaine de l’informatique consacré à la résolution des problèmes cognitifs communément associés à l’intelligence humaine, comme l’apprentissage, la résolution de problèmes, la perception visuelle et la reconnaissance de la parole et des formes. (Statistique Canada - Terminologie pour la science des données, n.d.) |
CDR.06 | Apprentissage automatique (machine) | « L’apprentissage automatique est la science qui consiste à faire en sorte que les ordinateurs apprennent automatiquement à partir de données constituant leur expérience et de généraliser les connaissances acquises à de nouveaux contextes, au lieu de s’appuyer sur des règles explicitement programmées. »
Équipe d’apprentissage automatique de la Commission économique des Nations Unies pour l’Europe (rapport de 2018). The use of machine learning in official statistics (en anglais seulement) En substance, l’apprentissage automatique permet d’automatiser le développement de modèles analytiques au moyen d’algorithmes d’optimisation et des paramètres qui peuvent être modifiés et affinés. (Statistique Canada - Terminologie pour la science des données, n.d.) |
CDR.07 | Traitement du langage naturel (TLN) | Le traitement du langage naturel (TLN) est une méthode de traduction entre le langage informatique et le langage humain. Il s’agit d’une méthode permettant à un ordinateur de lire une ligne de texte de manière compréhensible sans que l’ordinateur soit alimenté par une sorte d’indice ou de calcul. En d’autres termes, le TLN automatise le processus de traduction entre les ordinateurs et les humains. (Techopedia - NLP, 2022) |
CDR.08 | Centre d’expertise | Un centre d’expertise est constitué d’une équipe unique qui concentre la vision, la stratégie et l’infrastructure d’une discipline. Cela est particulièrement utile pour la science des données en raison des compétences et des technologies de niche que la discipline requiert. L’équipe d’un centre d’expertise agit généralement comme un consultant interne, travaillant avec plusieurs divisions de l’organisation pour cerner et exploiter les possibilités en matière de science des données. Un centre d’expertise n’est peut-être pas la seule équipe à exercer la science des données dans une organisation, mais il joue un rôle de leader, d’innovateur et de normalisateur. En outre, l’équipe d’un centre d’expertise qui réussit servira souvent de ressource d’apprentissage pour les personnes pratiquant la science des données en dehors de l’équipe. (Logic 2020 - Data Science CoE, n.d.) |
CDR.09 | Gestion des données | La gestion des données correspond à l’élaboration, l’exécution et la supervision des plans, politiques, programmes et pratiques qui fournissent, contrôlent, protègent et améliorent la valeur des ressources de données tout au long de leur cycle de vie. (DAMA-I DMBoK2, n.d.) |