Changes

Ajout de sections additionnelles
Line 1: Line 1:  +
You can also read this Charter [[ECCC Kiosk 2023 Charter|in English]].
 +
 
==Environnement et Changement climatique Canada <br> Centre d’expertise en science et en analyse des données==
 
==Environnement et Changement climatique Canada <br> Centre d’expertise en science et en analyse des données==
    
[[File:Charter image.jpg|1000px|center]]
 
[[File:Charter image.jpg|1000px|center]]
 +
 +
=== Executive Summary ===
 +
La Feuille de route de la Stratégie de données pour la fonction publique fédérale de 2018 et la Stratégie relative aux données et à l’analyse d’Environnement et Changement climatique Canada (ECCC) ont souligné la nécessité de '''traiter les données comme un actif stratégique''' et d’'''exploiter la puissance des données pour générer des aperçus'''. La science des données et l’analyse des données sont des techniques d’innovation en matière de données qui permettent de plonger en profondeur dans les données pour découvrir des tendances cachées, des corrélations inconnues et faire des prévisions explicites en tenant compte de plusieurs facteurs dans de nombreuses disciplines.
 +
 +
Un centre d’expertise muni de connaissances sur les méthodologies modernes en matière de science des données crée des possibilités pour utiliser des mécanismes avancés d’analyse, de statistiques, d’apprentissage machine (automatique) et d’apprentissage profond dans toute l’organisation. Au sein d’ECCC, le Bureau du dirigeant principal des données (BDPD), qui relève de la Direction générale de la politique stratégique, abrite le Centre d’expertise en science et en analyse des données (le Centre d’expertise), qui vise à soutenir le Ministère et à promouvoir l’utilisation de la science des données et de l’analyse des données pour permettre d’extraire de la valeur des ressources de données d’ECCC.
 +
 +
La présente charte permet de clarifier la raison d’être du Centre d’expertise, les services qu’il offre ainsi que le moment et la façon de faire appel à ces services.
    
===Mission===
 
===Mission===
Line 29: Line 38:  
# '''Orientation sur l’éthique et la protection de la vie privée :''' Les préoccupations en matière d’éthique et de protection de la vie privée seront toujours évaluées et abordées tout au long du travail effectué.
 
# '''Orientation sur l’éthique et la protection de la vie privée :''' Les préoccupations en matière d’éthique et de protection de la vie privée seront toujours évaluées et abordées tout au long du travail effectué.
 
# '''L’innovation est MULTIPLIÉE par l’exécution :''' Le Centre d’expertise en science et en analyse des données comprend que favoriser l’innovation est bien plus qu’un simple encouragement de la créativité; l’exécution constitue également un élément primordial.  
 
# '''L’innovation est MULTIPLIÉE par l’exécution :''' Le Centre d’expertise en science et en analyse des données comprend que favoriser l’innovation est bien plus qu’un simple encouragement de la créativité; l’exécution constitue également un élément primordial.  
      
===Objectifs opérationnels et en matière d’innovation===
 
===Objectifs opérationnels et en matière d’innovation===
Line 37: Line 45:  
<br>
 
<br>
 
[[File:Innovation goals fr.png|750px|center]]
 
[[File:Innovation goals fr.png|750px|center]]
 +
 +
== Structure et gouvernance ==
 +
 +
=== Structure de l’équipe et interdépendances ===
 +
 +
==== ''Équipe principale'' ====
 +
Le Centre d’expertise en science et en analyse des données du BPDP est constitué d’une équipe interdisciplinaire de scientifique des données possédant une expertise dans l’application de l’intelligence artificielle, de l’apprentissage machine et d’autres méthodes relatives à la science des données pour soutenir les initiatives transversales des directions générales, permettant au Ministère de devenir un chef de file dans l’exploitation de ses ressources de données. Nous avons de nombreux domaines de spécialisation, notamment l’application de la programmation informatique et des connaissances scientifiques, les mathématiques, les statistiques, l’intégration des données, la narration ou la visualisation des données et les algorithmes d’apprentissage machine. L’équipe est composée de groupes de classification EC (économiste) et PC (spécialiste des sciences physiques).
 +
 +
==== ''Interdépendances'' ====
 +
En tant que centre d’expertise qui fait la promotion et la démonstration de l’innovation, le Centre d’expertise en science et en analyse des données dépend des autres pour réussir. Nous comptons sur d’autres unités opérationnelles pour nos besoins en matière d’infrastructure informatique; par exemple, le Bureau de la dirigeante principale de l’information (BDPI) pour l’infonuagique. Le Centre d’expertise en science et en analyse des données n’est pas responsable de l’opérationnalisation des validations de principe réussies concernant la science des données. Si une validation de principe doit passer à la production, les experts en la matière dans les directions générales et les programmes devront s’adresser au BDPI pour discuter des étapes nécessaires à l’opérationnalisation. Le Centre d’expertise est disponible pour soutenir l’opérationnalisation en documentant la méthodologie et les approches adoptées dans une validation de principe. La préparation et la gestion des données sont un aspect plus large qui n’est pas sous la responsabilité directe du Centre d’expertise.
 +
 +
=== Difficultés cernées ===
 +
Nous avons cerné les difficultés suivantes pour assurer la réussite du Centre d’expertise :
 +
 +
* '''Risque lié à''' '''l’innovation :''' Toute innovation demande l’acceptation d’un certain niveau de risque. Certains projets peuvent ne pas être en mesure de passer par toutes les étapes du cycle de vie (élaboration, mise à l’essai, production).
 +
** '''Approche d’atténuation :''' Le Centre d’expertise consigne les approches utilisées et toutes les difficultés. Ces connaissances sont appliquées lors des phases d’idéation et de réception des futurs travaux.
 +
* '''Maturité des processus :''' Les validations de principe élaborées exigent que le client s’approprie le processus et décide de la meilleure façon de l’intégrer. Le client peut ne pas être prêt ou en mesure de moderniser entièrement ses processus pour intégrer l’innovation. Si un client souhaite qu’une validation de principe soit rendue opérationnelle, les étapes suivantes peuvent nécessiter le soutien du BDPI.
 +
** '''Approche d’atténuation :''' Des mesures sont prises dès la réception d’un projet pour comprendre et mettre en évidence les limites du contexte opérationnel du client.
 +
* '''Maturité du client :''' Les validations de principe élaborées par le Centre d’expertise exigent que le client soit prêt à soutenir et à utiliser le produit final. Le Centre d’expertise fournit une documentation détaillant les méthodologies et les approches, mais n’offre pas de formation sur les techniques relatives à la science des données et à la programmation informatique.
 +
** '''Approche d’atténuation :''' Des mesures sont prises dès la réception d’un projet pour comprendre les limites ou les possibilités concernant les connaissances, la capacité et le niveau de ressources du client. Le Centre d’expertise soutient la communauté des scientifiques des données au sein du Ministère (communauté de la science et de l’analyse des données GCconnex d’ECCC) et peut offrir un soutien en matière de terminologie pour le recrutement de scientifiques des données.
 +
* '''Préparation des données :''' Toutes les données ne sont pas prêtes pour l’application des techniques relatives à la science et à l’analyse des données.
 +
** '''Approche d’atténuation :''' Le Centre d’expertise évaluera l’état de préparation des données (y compris la qualité et l’accessibilité) en tant qu’élément du processus de réception d’une demande de projet.
 +
* '''Obstacles liés à la culture :''' Les nouvelles techniques visant à comprendre et visualiser les données se heurtent parfois à une certaine résistance.
 +
** '''Approche d’atténuation :''' Le Centre d’expertise accordera la priorité à l’explication des concepts et des mesures de rendement d’une technique relative à la science des données afin de soutenir la discussion et les décisions concernant l’innovation.
 +
 +
=== Services du Centre d’expertise, catégorisation et réception des projets ===
 +
Le Centre d’expertise offre les services suivants :
 +
 +
* Séances de remue-méninges et d’idéation sur la façon dont la science et l’analyse des données pourraient appuyer les programmes ou les directions générales.
 +
* Élaboration de validations de principe ou de prototypes dans les domaines de la science des données, de l’extraction de données et de l’analyse prédictive. Parmi les exemples, citons l’apprentissage machine tel que les réseaux neuronaux, le regroupement et le traitement automatique du langage naturel.
 +
* Élaboration de tableaux de bord et de visualisations.
 +
* Élaboration de méthodes pour la vision par ordinateur; par exemple, la classification des images et la reconnaissance optique des caractères.
 +
* Prestation d’expertise et de conseils sur les meilleures pratiques en matière de science des données et d’analyse des données ou sur le recrutement.
 +
* Sensibilisation à la Directive sur la prise de décisions automatisée.
 +
 +
Toutes les initiatives du Centre d’expertise sont '''classées''' dans les domaines suivants :
 +
 +
* Innovation et expérimentation
 +
* Administration
 +
* Programme environnemental
 +
* Renforcement des capacités en matière de science et d'analyse des données
 +
 +
Pour faire une demande au Centre d’expertise, les clients peuvent communiquer avec le gestionnaire du Centre d’expertise en science et en analyse des données et décrire ses besoins. Le gestionnaire évaluera ensuite les éléments suivants :
 +
 +
* Si la portée de la demande correspond à l’offre de service du Centre d’expertise.
 +
* Le type de projet demandé.
 +
* Si le Centre d’expertise dispose de l’expertise et de la capacité nécessaires pour entreprendre le projet.
 +
* S’il existe une incidence opérationnelle quantifiable.
 +
* Si la solution potentielle offre la faisabilité technique en tant que validation de principe ou de prototype.
 +
* Si les données requises sont disponibles et de qualité suffisante.
 +
 +
Une fois le concept du projet accepté, le client sera invité à examiner et à approuver un formulaire de réception de projet avec une personne-ressource du Centre d’expertise désignée. La personne‑ressource discutera avec le client des options et lui communiquera les détails et les jalons du projet.
 +
 +
Les demandes de projet qui relèvent de l’expertise du Bureau de la dirigeante principale de l’information seront transmises à une personne-ressource appropriée. Le Centre d’expertise n’est pas responsable de la passe opérationnelle ou de la maintenance ni du stockage des données à long terme. Les validations de principe et les prototypes sont livrés au client sous forme de tableaux de bord, de code de programmation et de documentation sur les méthodes et les résultats. Dans le cas d’un projet d’innovation réussi en matière de science et d’analyse des données demandant l’opérationnalisation, il faudra communiquer avec le BDPI.
 +
 +
=== Exemples de projets de science des données du Centre d’expertise en science et en analyse des données ===
 +
{| class="wikitable"
 +
|'''Projet'''
 +
|'''Objectif'''
 +
|'''Méthodologie'''
 +
|'''Valeur  opérationnelle'''
 +
|-
 +
|'''CQ de l’humidité  du sol (SMC)'''
 +
|Évaluer le potentiel de l’utilisation  de l’apprentissage machine pour aider au processus de contrôle de la qualité  (CQ) des données sur l’humidité du sol provenant du réseau de Kenaston.
 +
|Faire appel aux modèles de  classificateurs de forêts aléatoires entraînés pour prédire quels cas de l’ensemble  de données doivent être retirés et pourquoi.
 +
|Réduire les efforts et le temps  nécessaires au contrôle de la qualité.
 +
|-
 +
|'''Détection  de l’utilisation malveillante du code du système harmonisé (SH) (Direction  générale de l’application de la loi [DGAL])'''
 +
|Détecter l’utilisation malveillante  du code SH (une norme internationale maintenue par l’Organisation  mondiale des douanes [OMD] pour le classement des produits faisant l’objet d’un  commerce).
 +
|Le modèle prédit des ensembles  appropriés de code SH pour détecter les valeurs aberrantes.
 +
|Contribuer à réduire l’utilisation  malveillante du code SH.
 +
|-
 +
|'''Modèle d’identification  analogique et PAIRS d’IBM (SMC)'''
 +
|Le Service météorologique du Canada  (SMC) travaille avec IBM pour élaborer un modèle d’identification analogique  utilisant l’IA.
 +
|Faire des prévisions en comparant  les régimes météorologiques actuels à des régimes similaires du passé.
 +
|Obtenir des prévisions  météorologiques plus rapides et plus précises grâce aux analogues.
 +
|-
 +
|'''Extraction  automatisée de données (SMC)'''
 +
|Automatiser l’extraction des  données de Twitter en utilisant des outils de moissonnage du Web.
 +
|Récupérer des données de Twitter à  l’aide de la technique du moissonnage Web et de l’extraction de données.
 +
|Réduire la charge de travail  manuelle et améliorer le processus global.
 +
|-
 +
|'''Propension  à la non-conformité dans les installations de l’INRP (DGAL)'''
 +
 +
'''REMARQUE :'''  Ce  projet a été terminé en raison de la non-disponibilité d’une quantité  suffisante de données.
 +
|Trouver des indicateurs de  non-conformité généralisables à l’ensemble des industries dans l’ensemble de  données autodéclarées de l’Inventaire national des rejets de polluants  (INRP).
 +
|Utiliser un modèle basé sur la  régression pour prédire le pourcentage de propension à la non-conformité.
 +
|Créer des données de l’INRP plus  propres et faciliter les caractéristiques généralisables dans toutes les  industries.
 +
 +
Réduire la charge de travail  manuelle pour le nettoyage et l’analyse des données.
 +
|-
 +
|'''Prédicteur  de la qualité de l’eau'''
 +
|Explorer l’application de l’apprentissage  machine pour prédire la qualité de l’eau (coliformes fécaux) dans les lieux d’assainissement  des mollusques et crustacés. Les caractéristiques prises en compte sont les  précipitations et l’utilisation des terres.
 +
|Neuf algorithmes d’apprentissage  machine différents ont été évalués.
 +
|Résumer les données provenant de  diverses sources et fournir des capacités de prévision sur un paramètre de  qualité de l’eau.
 +
|}
 +
 +
=== Futurs travaux et possibilités ===
 +
Compte tenu de sa création en 2019, le Centre d’expertise en science et en analyse des données est relativement nouveau au sein du Ministère et reconnaît qu’il existe des possibilités de croissance. Les sujets suivants ont été relevés lors de discussions avec des partenaires et des clients sur les domaines où nous pourrions élargir notre offre de services au Ministère :
 +
 +
* Fournir des conseils et de l’expertise sur l’utilisation éthique de l’IA.
 +
* Soutenir le Ministère au sujet de la Directive sur la prise de décisions automatisée.
 +
* Définir les normes et les meilleures pratiques concernant les projets en matière de science et d’analyse des données.
 +
* Cerner les améliorations des processus administratifs pour automatiser les flux de données et les capacités d’analyse.
 +
* Soutenir les directions générales pour nettoyer et transformer les données.
 +
 +
En outre, la gouvernance, les processus et les rôles/responsabilités dans l’espace d’innovation des données continuent d’évoluer au sein du Ministère.
 +
 +
Domaines à améliorer :
 +
 +
* Orientation sur la stratégie de gouvernance pour les différents projets de science des données à ECCC afin de permettre la variabilité dimensionnelle.
 +
* Comprendre les rôles et les responsabilités des opérations d’apprentissage machine avec le Bureau de la dirigeante principale de l’information.
 +
* Élaborer un modèle de financement pour soutenir l’innovation et les interactions avec les directions générales et les programmes.
 +
 +
= Paramètres =
 +
Les paramètres constituent une composante essentielle de ce Centre d’expertise, car ils permettent de mesurer la réussite. Ils nous donnent un aperçu de la croissance, de l’incidence et de l’efficacité du travail que nous accomplissons et nous permettent de nous adapter et d’évoluer rapidement et de manière significative.
 +
 +
Nos paramètres s’efforcent de définir le Centre d’expertise en s’appuyant sur un cadre complet de suivi des projets et de l’innovation tout au long du cycle de vie, en alignant les résultats et les critères de réussite sur la composante de gestion de l’innovation (du cadre de responsabilisation de gestion [CRG] 2022-2023) pour plus de visibilité et de transparence.
 +
 +
Les paramètres ci-dessous sont utilisés pour suivre les progrès et sont basés sur les meilleures pratiques de l’industrie.
 +
 +
'''Paramètres du lancement'''
 +
 +
* Validation de principe ou tableau de bord au cours d’une année financière donnée
 +
* Nombre de projets lancés
 +
* Nombre de projets présentés à des comités décisionnels au niveau de la direction
 +
* Nombre de projets classés dans la catégorie des projets d’innovation
 +
* Ratio de l’innovation par rapport au nombre total de projets
 +
* Nombre d’intervenants mobilisés pendant l’idéation
 +
* Sources de financement
 +
* Nombre d’équivalents temps plein (ETP) engagés
 +
* Avantage attendu
 +
 +
'''Paramètres d’exécution'''
 +
 +
* Durée du cycle de vie de la demande à l’exécution du projet
 +
* Temps passé en phase
 +
* Nombre de projets en cours
 +
* Capital investi
 +
* Dépenses réelles par rapport au budget
 +
 +
'''Paramètres de clôture'''
 +
 +
* Nombre de projets terminés
 +
* Nombre de projets soumis pour le financement de l’opérationnalisation
 +
* Avantages/résultats obtenus pour les Canadiens ou les fonctionnaires
 +
 +
Compte tenu des contraintes et des processus de gouvernance existants, les paramètres ci-dessous seront prioritaires à court et à moyen terme, dans l’espoir d’augmenter la collecte de données et le suivi de mesures supplémentaires au fil du temps.
 +
 +
Le cadre ci-dessous combine les thèmes stratégiques avec le cycle de vie typique d’un projet, démontrant les paramètres pertinents à chaque étape qui faciliteront l’établissement de rapports en fonction des critères du CRG.
 +
{| class="wikitable"
 +
|'''Thème  stratégique/cycle de vie du projet'''
 +
|'''Réception'''
 +
|'''Élaboration'''
 +
|'''Mise à l’essai'''
 +
|'''Production'''
 +
|-
 +
|'''Affectation des ressources'''
 +
| colspan="3" |Coûts de fonctionnement et d’entretien  investis
 +
 +
Nombre d’équivalents temps plein (ETP)  engagés
 +
|
 +
|-
 +
|'''Générer des preuves rigoureuses'''
 +
|Nombre de projets lancés
 +
| colspan="2" |Nombre de projets en cours
 +
 +
 +
Nombre de projets présentés à l’échelle  de la direction
 +
 +
 +
Nombre de projets terminés
 +
|Nombre d’analyses de rentabilité  ultérieures
 +
|-
 +
|'''Décisions fondées sur des données  probantes'''
 +
| colspan="4" |Avantage réalisé par phase
 +
|}
 +
Les mesures qualitatives seront enrichies par les données probantes qualitatives et les leçons tirées de chaque initiative, ce qui permettra d’améliorer continuellement le service du Centre d’expertise offert aux directions générales, aux directions et aux unités, et de renforcer les interactions au sein d’ECCC.
 +
 +
= Annexe =
 +
 +
=== Caractère essentiel de la terminologie ===
 +
Les données n’ont jamais été aussi importantes ou intégrées dans notre vie professionnelle et personnelle qu’aujourd’hui. La disponibilité des données, ainsi que les outils de visualisation, de partage et de collaboration offrent d’immenses possibilités pour ECCC. Les données présentent également des défis nouveaux et importants. Le principal défi est l’absence d’un vocabulaire commun concernant les données. La présente charte fournira une référence pour la terminologie commune concernant les données afin de permettre de rationaliser les conversations dans l’ensemble d’ECCC à propos de la science et de l’analyse des données. Elle comprendra les terminologies fréquemment utilisées comportant un langage commun et aligné sur celui du secteur.
 +
 +
=== Terminologie ===
 +
{| class="wikitable"
 +
|ID du terme
 +
|Nom de terme
 +
|Description du  terme
 +
|-
 +
|CDR.01
 +
|Analyse des données
 +
|L’analyse (analytique) des données est l’analyse computationnelle systématique  des données ou des statistiques. Elle est utilisée pour la découverte, l’interprétation  et la communication de tendances significatives dans les données. Il s’agit  également d’appliquer les tendances des données pour assurer une prise de  décisions efficace. Elle peut être utile dans des domaines où une grande  quantité de données est sauvegardée; l’analyse des données est fondée sur l’application  simultanée de la statistique, de la programmation informatique et de la  recherche opérationnelle et permet de quantifier l’information sur le  rendement. (Wikipedia - Analytics, n.d.)
 +
|-
 +
|CDR.02
 +
|Analytique et analyse
 +
|L’analyse des données se concentre sur le processus d’examen des  données antérieures par la compréhension des activités, la compréhension des  données, la préparation des données, la modélisation et l’évaluation, ainsi  que le déploiement. Il s’agit d’un sous-ensemble de l’analyse (analytique)  des données, qui fait appel à plusieurs processus d’analyse des données pour  se concentrer sur la raison pour laquelle un événement s’est produit et sur  ce qui pourrait se produire à l’avenir en se fondant sur les données  précédentes. L’analyse des données est utilisée pour formuler des décisions  organisationnelles plus larges.
 +
 +
 +
L’analyse (analytique) des données est un domaine multidisciplinaire.  Il est fait une utilisation intensive des compétences informatiques, des  mathématiques, de la statistique, de l’utilisation de techniques descriptives  et de modèles prédictifs pour obtenir des connaissances précieuses à partir  des données grâce à l’analytique.
 +
|-
 +
|CDR.03
 +
|Science des données
 +
|La science des données est un domaine interdisciplinaire qui utilise  des méthodes et des algorithmes scientifiques pour extraire des  renseignements et acquérir des connaissances au moyen de divers types de  données. Il combine une spécialisation dans le domaine, des compétences en  programmation et des connaissances en mathématiques et en statistiques pour  résoudre des problèmes analytiques complexes. (Statistique  Canada - Terminologie pour la science des données, n.d.)
 +
|-
 +
|CDR.04
 +
|Projets
 +
|Validations de principe, prototypes ou visualisations sous forme de  code, d’algorithmes, de résultats et de tableaux de bord partageables.
 +
|-
 +
|CDR.05
 +
|Intelligence artificielle
 +
|L’intelligence artificielle (IA) est un domaine de l’informatique consacré  à la résolution des problèmes cognitifs communément associés à l’intelligence  humaine, comme l’apprentissage, la résolution de problèmes, la perception visuelle  et la reconnaissance de la parole et des formes. (Statistique  Canada - Terminologie pour la science des données, n.d.)
 +
|-
 +
|CDR.06
 +
|Apprentissage automatique (machine)
 +
|« L’apprentissage automatique est la science qui consiste à faire  en sorte que les ordinateurs apprennent automatiquement à partir de données  constituant leur expérience et de généraliser les connaissances acquises à de  nouveaux contextes, au lieu de s’appuyer sur des règles explicitement  programmées. »
 +
 +
Équipe d’apprentissage automatique de la Commission économique des  Nations Unies pour l’Europe (rapport de 2018).
 +
 +
''The use of machine learning in official statistics (en  anglais seulement)''
 +
 +
En substance, l’apprentissage automatique permet d’automatiser le  développement de modèles analytiques au moyen d’algorithmes d’optimisation et  des paramètres qui peuvent être modifiés et affinés. (Statistique  Canada - Terminologie pour la science des données, n.d.)
 +
|-
 +
|CDR.07
 +
|Traitement du langage naturel (TLN)
 +
|Le traitement du langage naturel (TLN) est une méthode de traduction  entre le langage informatique et le langage humain. Il s’agit d’une méthode  permettant à un ordinateur de lire une ligne de texte de manière  compréhensible sans que l’ordinateur soit alimenté par une sorte d’indice ou  de calcul. En d’autres termes, le TLN automatise le processus de traduction  entre les ordinateurs et les humains. (Techopedia  - NLP, 2022)
 +
|-
 +
|CDR.08
 +
|Centre d’expertise
 +
|Un centre d’expertise est constitué d’une équipe unique qui concentre  la vision, la stratégie et l’infrastructure d’une discipline. Cela est  particulièrement utile pour la science des données en raison des compétences  et des technologies de niche que la discipline requiert. L’équipe d’un centre  d’expertise agit généralement comme un consultant interne, travaillant avec  plusieurs divisions de l’organisation pour cerner et exploiter les  possibilités en matière de science des données. Un centre d’expertise n’est  peut-être pas la seule équipe à exercer la science des données dans une  organisation, mais il joue un rôle de leader, d’innovateur et de  normalisateur. En outre, l’équipe d’un centre d’expertise qui réussit servira  souvent de ressource d’apprentissage pour les personnes pratiquant la science  des données en dehors de l’équipe. (Logic 2020  - Data Science CoE, n.d.)
 +
|-
 +
|CDR.09
 +
|Gestion des données
 +
|La gestion des données correspond à l’élaboration, l’exécution et la  supervision des plans, politiques, programmes et pratiques qui fournissent,  contrôlent, protègent et améliorent la valeur des ressources de données tout  au long de leur cycle de vie. (DAMA-I  DMBoK2, n.d.)
 +
|}