Difference between revisions of "Découvrez plus sur les données"

From wiki
Jump to navigation Jump to search
m
 
(65 intermediate revisions by 2 users not shown)
Line 56: Line 56:
  
 
}}
 
}}
 
+
<p style="text-align:left; padding: 10px; background-color: #fff; padding: 10px; margin-top: -10px; width:1130px"><strong>[https://wiki.gccollab.ca/Discover_more_about_data English]</strong></strong></p>
<p style="text-align:right; background-color: #fff; padding: 10px; margin-top: -10px; width:1130px"><strong>[https://wiki.gccollab.ca/Discover_more_about_data English]</strong></strong></p>
 
 
[[Image:DCCD-2022-FR.png |100%|Conférence sur les données 2022: Valoriser les données et leur interprétation pour servir la population canadienne, 23 + 24 février 2022]]
 
[[Image:DCCD-2022-FR.png |100%|Conférence sur les données 2022: Valoriser les données et leur interprétation pour servir la population canadienne, 23 + 24 février 2022]]
 
<p style="background-color: #f18f34; padding: 5px; margin-top: -10px; width:1130px""><small>
 
<p style="background-color: #f18f34; padding: 5px; margin-top: -10px; width:1130px""><small>
<strong>[https://www.csps-efpc.gc.ca/events/data-conference2022/index-fra.aspx Inscrivez-vous ]</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
+
<strong>[https://vexpodev.z9.web.core.windows.net/fr/#/2203/accueil Exposition virtuelle]</strong>&nbsp;&nbsp;|&nbsp;&nbsp;
<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Ordre_du_jour Ordre du jour]</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
+
<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Ordre_du_jour Ordre du jour]</strong>&nbsp;&nbsp;|&nbsp;&nbsp;
<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Conférenciers Conférenciers]</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
+
<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Conférenciers Conférenciers]</strong>&nbsp;&nbsp;|&nbsp;&nbsp;
<!--<strong>Visitez l'Expo</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-->
+
<strong>[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Objectifs_de_r%C3%A9seautage Objectifs de réseautage]</strong>&nbsp;&nbsp;|&nbsp;&nbsp;
<!--<strong>Rencontrez les participants à la conférence</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-->
+
<strong>[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_du_GC_2023/D%C3%A9couvrez-en_plus_sur_les_donn%C3%A9es Découvrez-en plus sur les données 2023]</strong>&nbsp;&nbsp;|&nbsp;&nbsp;
<!--<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Objectifs_de_réseautage Téléchargez vos objectifs de réseautage]</strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-->
+
<strong>[https://wiki.gccollab.ca/Conférence_sur_les_données_2022_-_Annonces Annonces]</strong>
 
</small></p>
 
</small></p>
  
Line 81: Line 80:
 
<p><strong>[https://www.csps-efpc.gc.ca/catalogue/courses-fra.aspx?code=I561 Un guide autodirigé pour comprendre les données]</strong> (En ligne, à rythme libre)</p>
 
<p><strong>[https://www.csps-efpc.gc.ca/catalogue/courses-fra.aspx?code=I561 Un guide autodirigé pour comprendre les données]</strong> (En ligne, à rythme libre)</p>
 
<p><strong>[https://www.csps-efpc.gc.ca/catalogue/courses-fra.aspx?code=I511 Le rôle des données dans un gouvernement numérique]</strong> (Classe virtuelle)</p>
 
<p><strong>[https://www.csps-efpc.gc.ca/catalogue/courses-fra.aspx?code=I511 Le rôle des données dans un gouvernement numérique]</strong> (Classe virtuelle)</p>
 +
<p class="recco">Recommandé par l'École de la fonction publique du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.csps-efpc.gc.ca/digital-academy/index-fra.aspx Académie du numérique]</h3>
 +
<p>L'École de la fonction publique du Canada (EFPC) a créé l'Académie du numérique de l'EFPC en 2018. L'objectif de ce secteur d'activité est d'apprendre aux fonctionnaires fédéraux du Canada les compétences, les approches et les mentalités numériques nécessaires pour transformer les services publics en cette ère numérique. L'Académie du numérique soutient les principes de l'initiative Au-delà de 2020 pour un milieu de travail agile, inclusif et mieux outillé, et milite pour une approche axée sur la numérique qui s'harmonise aux normes numériques du gouvernement du Canada.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://catalogue.csps-efpc.gc.ca/catalog?pagename=Catalog&cm_locale=fr École de la fonction publique du Canada Catalogue d'apprentissage]</h3>
 +
<p>Consultez le catalogue complet de l'École, qui propose des cours, des événements, des programmes et des outils d'apprentissage. Pour voir les produits d'apprentissage recommandés par thème ou par communauté, consultez nos parcours d'apprentissage.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/afc/litteratie-donnees Initiative de formation sur la littératie des données de Statistique Canada]</h3>
 +
<p>La littératie des données est la capacité de tirer des renseignements utiles des données. Elle met l'accent sur les compétences nécessaires pour travailler avec les données, y compris les connaissances et les compétences requises pour les lire, les analyser, les interpréter, les visualiser et les communiquer ainsi que pour comprendre comment elles sont utilisées dans la prise de décisions.</p>
 +
<ul>
 +
<li><strong>[https://www.statcan.gc.ca/fra/afc/litteratie-donnees/competences Compétences en littératie des données]</strong>: Les compétences en matière de littératie des données sont les compétences et les connaissances dont vous avez besoin pour travailler efficacement avec les données.</li>
 +
<li><strong>[https://www.statcan.gc.ca/fra/afc/litteratie-donnees/cheminement Cheminement des données]</strong>: Le cheminement des données représente les étapes clés du processus appliqué aux données, allant de la recherche et de l'exploration des données jusqu'à la présentation de l'histoire des données.</li>
 +
<li><strong>[https://www.statcan.gc.ca/fra/afc/litteratie-donnees/catalogue Catalogue d'apprentissage]</strong>: Formation sur la littératie des données disponible de Statistique Canada.</li>
 +
</ul>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<!-- *** ARTICLES + POSTS *** -->
 +
 +
<h2>Articles</h2>
 +
 +
<h3 style="text-decoration:none;">[https://arxiv.org/abs/1811.10154 Arrêtez d'expliquer les modèles d'apprentissage automatique de la boîte noire pour les décisions à fort enjeu et utilisez plutôt des modèles interprétables]</h3>
 +
<p class="author">[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Cynthia_Rudin Cynthia Rudin]</p>
 +
<p>(En anglais - titre original : <strong>Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead</strong>) Des modèles d'apprentissage automatique en boîte noire sont actuellement utilisés pour des prises de décision à fort enjeu dans toute la société, causant des problèmes dans les soins de santé, la justice pénale et d'autres domaines. Certaines personnes espèrent que la création de méthodes permettant d'expliquer ces modèles boîte noire atténuera certains des problèmes, mais essayer d'expliquer les modèles boîte noire, plutôt que de créer des modèles interprétables en premier lieu, risque de perpétuer les mauvaises pratiques et peut potentiellement causer un grand tort à la société. La voie à suivre consiste à concevoir des modèles qui sont intrinsèquement interprétables. Cette perspective clarifie le gouffre entre l'explication des boîtes noires et l'utilisation de modèles intrinsèquement interprétables, souligne plusieurs raisons clés pour lesquelles les boîtes noires explicables devraient être évitées dans les décisions à fort enjeu, identifie les défis de l'apprentissage automatique interprétable et fournit plusieurs exemples d'applications où les modèles interprétables pourraient potentiellement remplacer les modèles de boîtes noires dans la justice pénale, les soins de santé et la vision par ordinateur.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://eur-lex.europa.eu/legal-content/FR/TXT/?uri=COM:2017:134:FIN Cadre d’interopérabilité européen– Stratégie de mise en oeuvre]</h3>
 +
<p class="author">Commission européenne</p>
 +
<p>Le cadre d'interopérabilité européen (CIR) fait partie de la communication (COM(2017)134) de la Commission européenne adoptée le 23 mars 2017. Ce cadre donne des orientations spécifiques sur la manière de mettre en place des services publics numériques interopérables.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://towardsdatascience.com/how-i-would-learn-data-science-if-i-had-to-start-over-f3bf0d27ca87 Comment j'apprendrais la science des données (si je devais recommencer)]</h3>
 +
<p class="author">Ken Jee, sur Towards Data Science</p>
 +
<p>(En anglais - titre original : <strong>How I Would Learn Data Science (If I Had to Start Over)</strong>) Lessons learned from my data science journey.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees/reseau/visualisations-donnees Créer des visualisations de données convaincantes]</h3>
 +
<p class="author">Alden Chen, Statistique Canada</p>
 +
<p>La visualisation des données est un élément clé de nombreux projets de science des données. Pour certains intervenants, notamment les spécialistes du domaine et les cadres qui ne sont pas nécessairement des experts techniques, il s'agit de la principale voie par laquelle ils voient, comprennent et interagissent avec les projets de données. Par conséquent, il est important que les visualisations communiquent des renseignements aussi clairement que possible. Trop souvent, les visualisations sont entravées par certains défauts courants qui les rendent difficiles à interpréter ou, pire encore, sont trompeuses. Cet article passe en revue trois pièges courants de la visualisation que les communicateurs de données et les consommateurs de données devraient comprendre, ainsi que quelques suggestions pratiques pour les contourner.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://derekalton.medium.com/building-a-framework-to-grow-ecosystems-a-rough-rough-draft-7b93ad73ed08 Construire un cadre pour faire croître les écosystèmes... une ébauche sommaire]</h3>
 +
<p class="author">Derek Alton</p>
 +
<p>(En anglais - titre original : <strong>Building a framework to grow ecosystems… a rough rough draft</strong>) Tout écosystème commence par un socle de base. Ce sont les rivières et les ruisseaux, les montagnes et la terre, le soleil, la pluie et le climat général. C'est à partir de cette base qu'un écosystème se développe. Cette base doit présenter un certain niveau de durabilité pour que la vie s'installe. De même, un écosystème social a besoin d'une infrastructure de base stable et sûre pour se développer. Il peut s'agir d'une infrastructure physique telle que des routes et des bâtiments alimentés en électricité et en énergie hydraulique, mais comme nous vivons à l'ère du numérique, il s'agit de plus en plus d'une infrastructure numérique : des éléments tels que la connexion à large bande et le World Wide Web (et tous les protocoles qui le sous-tendent). Il est important de comprendre quelles sont les infrastructures nécessaires à la prospérité de votre écosystème et de veiller à ce qu'elles soient durablement disponibles.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.ineteconomics.org/perspectives/blog/hijacked-and-paying-the-price-why-ransomware-gangs-should-be-designated-as-terrorists Détournement et paiement du prix - Pourquoi les gangs de rançongiciels devraient être considérés comme des terroristes]</h3>
 +
<p class="author">[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Melissa_Hathaway Melissa Hathaway]</p>
 +
<p>(En anglais - titre original : <strong>Hijacked and Paying the Price - Why Ransomware Gangs Should be Designated as Terrorists</strong>) Les gangs de ransomware ont causé d'importants dégâts. Il est temps que le gouvernement les prenne plus au sérieux.</p>
 +
<p class="recco">Recommandé par la Communauté des données du GC</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.tbs-sct.gc.ca/pol/doc-fra.aspx?id=32592 Directive sur la prise de décisions automatisée]</h3>
 +
<p>Le gouvernement du Canada cherche de plus en plus à utiliser l’intelligence artificielle pour prendre ou aider à prendre des décisions administratives afin d’améliorer la prestation des services. Le gouvernement s’est engagé à le faire d’une manière compatible avec les principes fondamentaux du droit administratif, comme la transparence, la responsabilisation, la légalité et l’équité procédurale. Sachant que cette technologie évolue rapidement, la présente Directive continuera d’évoluer afin de veiller à ce qu’elle soit pertinente.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.turing.ac.uk/news/can-data-trusts-be-backbone-our-future-ai-ecosystem Les fiducies de données peuvent-elles constituer l'épine dorsale de notre futur écosystème d'IA ?]</h3>
 +
<p class="author">Dr Aida Mehonic, sur The Alan Turing Institute</p>
 +
<p>(En anglais - titre original : <strong>Can data trusts be the backbone of our future AI ecosystem?</strong>) Ici, à l'Alan Turing Institute, nous nous intéressons à la façon dont les fiducies de données pourraient contribuer à façonner le futur écosystème de l'intelligence artificielle (IA). À l'heure actuelle, de nombreuses initiatives bien intentionnées visant à créer des algorithmes d'apprentissage automatique échouent en raison du manque d'ensembles de données d'entraînement, et cela est vrai tant dans le secteur privé que dans le secteur public. Un trust de données pourrait permettre un partage sûr et sécurisé des données qui permettrait au Royaume-Uni de développer et de déployer des systèmes d'IA au profit de la société et de l'économie.</p>
 +
<p class="recco">Recommandé par [https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Chantal_Bernier Chantal Bernier], une conférencière de la Conférence sur les données 2022</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.stateofopendata.od4d.net/ L'état des données ouvertes]</h3>
 +
<p class="author">Tim Davies, Stephen B Walker, et Mor Rubinstein, sur Open Data for Development</p>
 +
<p>(En anglais - titre original : <strong>State of Open Data</strong>) Cela fait dix ans que les données ouvertes ont fait leur apparition sur la scène mondiale. Au cours de la dernière décennie, des milliers de programmes et de projets dans le monde entier ont travaillé à l'ouverture des données et les ont utilisées pour relever une myriade de défis sociaux et économiques. Pendant ce temps, les questions liées aux droits et à la confidentialité des données sont passées au centre du discours public et politique. Alors que le mouvement de l'ouverture des données entre dans une nouvelle phase de son évolution, se déplaçant pour cibler des problèmes du monde réel et intégrer la pensée de l'ouverture des données dans d'autres communautés de pratique existantes ou émergentes, de grandes questions demeurent.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.mccarthy.ca/fr/references/blogues/techlex/le-projet-de-loi-95-de-la-volonte-de-letat-quebecois-de-permettre-un-acces-et-une-utilisation-optimale-de-ses-donnees Le projet de loi 95 : De la volonté de l’État québécois de permettre un accès et une utilisation optimale de ses données]</h3>
 +
<p class="author">Karine Joizil</p>
 +
<p>(En français) Dans le monde de la recherche, cette réforme était souhaitée depuis longtemps notamment par le Scientifique en chef du Québec et les fonds de recherche pour qui l’accès à ces données sera d’une grande utilité.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.cigionline.org/publications/patching-our-digital-future-unsustainable-and-dangerous/ Le rafistolage de notre avenir numérique est insoutenable et dangereux]</h3>
 +
<p class="author">[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Melissa_Hathaway Melissa Hathaway]</p>
 +
<p>(En anglais - titre original : <strong>Patching Our Digital Future Is Unsustainable and Dangerous</strong>) Ces dernières années, le monde a été témoin d'un nombre alarmant de cyberincidents très médiatisés, de pratiques préjudiciables dans le domaine des technologies de l'information et des communications (TIC) et d'actes répréhensibles à l'échelle internationale dus à une mauvaise utilisation des TIC. Au cours des 30 dernières années, une vulnérabilité unique et stratégique a été apportée à la société, en permettant à des produits commerciaux prêts à l'emploi, mal codés ou mal conçus, d'imprégner et d'alimenter chaque aspect de notre société connectée. Ces produits et services, qui présentent des faiblesses exploitables, sont devenus le ventre mou des systèmes gouvernementaux, des infrastructures et services essentiels, ainsi que des activités des entreprises et des ménages. La cyber-insécurité mondiale qui en résulte représente un risque croissant pour la santé, la sécurité et la prospérité publiques. Il est essentiel de devenir beaucoup plus stratégique dans la façon dont les nouvelles technologies numériques sont conçues et déployées, et de tenir les fabricants de ces technologies responsables de la sécurité numérique et de la sûreté de leurs produits. L'industrie technologique a rapidement mis sur le marché des produits vulnérables - maintenant, il est crucial de travailler ensemble pour réduire les risques créés et guérir notre environnement numérique aussi vite que la société le peut. Cet article a d'abord été publié dans le cadre de la récente série d'essais du CIGI, Governing Cyber Space during a Crisis in Trust.</p>
 +
<p class="recco">Recommandé par la Communauté des données du GC</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees/ressources Ressources en science des données]</h3>
 +
<p class="author">Réseau de la science des données pour la fonction publique fédérale</p>
 +
<p>Pour les passionnés de science des données : Trouvez des ressources, des formations, des outils et des communautés.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://medium.com/opendatacharter/spotlight-a-plea-from-the-odcs-iwg-data-standardisation-matters-4d26329a18bb Un plaidoyer du Groupe de travail sur la mise en œuvre de la Charte des données ouvertes : la normalisation des données est importante]</h3>
 +
<p class="author">Darine Benkalha</p>
 +
<p>(En anglais - titre original : <strong>A plea from the ODC’s IWG: Data standardisation matters</strong>) Un récapitulatif de la réunion du groupe de travail sur la mise en œuvre de la Charte des données ouvertes qui s'est tenue en septembre 2021.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees/reseau/systemes-automatises Utilisation responsable des systèmes décisionnels automatisés du gouvernement fédéral]</h3>
 +
<p class="author">[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Benoit_Deshaies Benoit Deshaies], Secrétariat du Conseil du Trésor du Canada, et Dawn Hall, Secrétariat du Conseil du Trésor du Canada</p>
 +
<p>Les scientifiques des données jouent un rôle important dans l'évaluation de la qualité des données et la mise au point de modèles pour appuyer les systèmes décisionnels automatisés. Une compréhension du moment où la Directive s'applique et de la manière de satisfaire à ses exigences peut appuyer l'utilisation éthique et responsable de ces systèmes. En particulier, l'exigence en matière d'explication et l'orientation (Ligne directrice sur les services et le numérique, section 4.5.3 ) du Secrétariat du Conseil du Trésor du Canada (SCT) sur la sélection des modèles sont d'une grande importance pour les scientifiques des données.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<!-- *** WEBSITES *** -->
 +
 +
<h2>Sites web</h2>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees Centre de la science des données]</h3>
 +
<p>En cette ère du numérique en croissance rapide, les organismes statistiques doivent trouver des moyens innovants pour exploiter la puissance des données. Statistique Canada adopte les possibilités que la science des données lui offre pour mieux répondre aux besoins d'information des Canadiens.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://opendatacharter.net/ Charte internationale des données ouvertes]</h3>
 +
<p>(En anglais - titre original : <strong>International Open Data Charter</strong>) La Charte des données ouvertes est une collaboration entre plus de 150 gouvernements et organisations qui travaillent à l'ouverture des données sur la base d'un ensemble de principes communs. Nous promouvons des politiques et des pratiques qui permettent aux gouvernements et aux OSC de collecter, partager et utiliser des données bien gérées, afin de répondre de manière efficace et responsable aux domaines d'intérêt suivants : la lutte contre la corruption, l'action climatique et l'équité salariale.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/covid19?HPA=1 La COVID-19 : sous l'angle des données]</h3>
 +
<p>Une série d'articles sur divers sujets qui traitent des répercussions de la COVID-19 sur le plan socio-économique. De nouveaux articles seront diffusés de façon périodique.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://data2x.org/ Data2x]</h3>
 +
<p>(En anglais) Des données importantes sur les femmes et les filles sont incomplètes ou manquantes. Grâce à des partenariats avec des agences des Nations unies, des gouvernements, la société civile, des universitaires et le secteur privé, Data2X œuvre pour le changement.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.reddit.com/r/dataisbeautiful/top/?t=all /r/DataIsBeautiful sur Reddit]</h3>
 +
<p>(En anglais) DataIsBeautiful est destiné aux visualisations qui transmettent efficacement des informations. L'esthétique est une partie importante de la visualisation d'informations, mais les jolies images ne sont pas le seul objectif de ce subreddit.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.thedatalodge.com/ The Data Lodge]</h3>
 +
<p>(En anglais) Les données et l'analytique sont le pivot de la transformation numérique, mais la culture est la partie la plus difficile. La maîtrise des données est le chaînon manquant, et la clé pour déchiffrer le code culturel. Nous pensons que le fondement de la formation d'une main-d'œuvre compétente en matière de données (des cadres supérieurs aux professionnels des données et de l'analyse, en passant par vos collaborateurs de première ligne) est la promotion d'un langage commun autour de l'utilisation des données, ou Information as a Second Language® (ISL).  Et pour briser le code culturel, il faut commencer par rendre ce langage personnel.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.datatothepeople.org/ Data To The People]</h3>
 +
<p>(En anglais) Data To The People sont des experts mondiaux reconnus et des leaders de l'industrie dans le développement et l'entretien de la culture des données. Nous fournissons aux dirigeants et aux organisations les outils nécessaires pour évaluer les compétences individuelles et organisationnelles en matière de données, et nous concevons des programmes sur mesure pour améliorer les compétences de leur personnel dans ce domaine.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.oecd-ilibrary.org/science-and-technology/oecd-digital-economy-papers_20716826 Documents de travail de l'OCDE sur l'économie numérique]</h3>
 +
<p>Les technologies de l'information et de la communication sont largement diffusées et utilisées, ce qui renforce leur incidence économique et sociale. L'OCDE conduit des activités pour aider à mieux comprendre la façon dont les TIC contribuent à une croissance économique et un bien-être social durables, ainsi que leur rôle dans l'évolution vers des sociétés fondées sur la connaissance.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.oecd.org/gov/digital-government/open-government-data.htm Données de l'OCDE sur les gouvernements ouverts]</h3>
 +
<p>(En anglais - titre original : <strong>OECD Open Government data</strong>) Les Données gouvernementales ouvertes (DGO) est une philosophie - et de plus en plus un ensemble de politiques - qui favorise la transparence, la responsabilité et la création de valeur en mettant les données gouvernementales à la disposition de tous. Les organismes publics produisent et commandent d'énormes quantités de données et d'informations. En mettant leurs jeux de données à disposition, les institutions publiques deviennent plus transparentes et plus responsables vis-à-vis des citoyens. En encourageant l'utilisation, la réutilisation et la distribution gratuite des ensembles de données, les gouvernements favorisent la création d'entreprises et de services innovants axés sur les citoyens.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.data.gov/ Données ouvertes du gouvernement américain]</h3>
 +
<p>(En anglais - titre original : <strong>US Government Open Data</strong>) Trouvez des données, des outils et des ressources pour mener des recherches, développer des applications web et mobiles, concevoir des visualisations de données, etc.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://donnees.banquemondiale.org/ Données ouvertes de la Banque mondiale]</h3>
 +
<p>Un accès gratuit et libre à des statistiques sur le développement dans le monde.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://open.canada.ca/fr Gouvernement ouvert du Canada]</h3>
 +
<p>Le gouvernement ouvert vise à rendre le gouvernement plus accessible à tous. Participez à des conversations, trouvez des données et des dossiers numériques, et apprenez-en davantage sur le gouvernement ouvert.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://informationisbeautiful.net/ L'information est belle]</h3>
 +
<p>(En anglais - titre original : <strong>Information is Beautiful</strong>) Données, informations, connaissances : nous les distillons dans des graphiques et des diagrammes beaux et utiles. Information is Beautiful a pour vocation de vous aider à prendre des décisions plus claires et mieux informées sur le monde. Toutes nos visualisations sont basées sur des faits et des données : constamment mises à jour, révisées et révisées.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://theodi.org/ Institut des données ouvertes]</h3>
 +
<p>(En anglais - titre original : <strong>Open Data Institute</strong>) L'Institut des données ouvertes est un organisme à but non lucratif dont la mission est de travailler avec les entreprises et les gouvernements pour construire un écosystème de données ouvert et digne de confiance. Nous travaillons avec un éventail d'organisations, de gouvernements, d'organismes publics et de la société civile pour créer un monde où les données fonctionnent pour tout le monde.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/interagir?HPA=1 Interagir avec les données]</h3>
 +
<p>Trouvez des vidéos, des visualisations de données, des infographies et des cartes thématiques de Statistique Canada.</p>
 +
<p class="recco"><p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.opengovpartnership.org/fr/ Partenariat pour un gouvernement ouvert]</h3>
 +
<p>(En anglais - titre original : <strong>Open Government Partnership</strong>) En 2011, les dirigeants gouvernementaux et les défenseurs de la société civile se sont réunis pour créer un partenariat unique - un partenariat qui combine ces forces puissantes pour promouvoir une gouvernance transparente, participative, inclusive et responsable. Soixante-dix-huit pays et soixante-seize gouvernements locaux - représentant plus de deux milliards de personnes - ainsi que des milliers d'organisations de la société civile sont membres du Partenariat pour un gouvernement ouvert.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www12.statcan.gc.ca/census-recensement/index-fra.cfm?DGUID=2021A000011124 Recensement de la population]</h3>
 +
<p>Un portrait statistique détaillé du Canada et de ses habitants selon leurs caractéristiques démographiques, sociales et économiques.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees/reseau Réseau de la science des données pour la fonction publique fédérale]</h3>
 +
<p>À la recherche d'un espace dynamique pour collaborer et en apprendre davantage sur la science des données? Joignez-vous au nouveau Réseau de la science des données pour la fonction publique fédérale (propulsé par l'intendance de StatCan). Notre vision est de créer une communauté dynamique de passionnés de la science des données et d'offrir un espace de communication permettant aux membres de collaborer et d'en apprendre davantage sur la science des données.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://busrides-trajetsenbus.csps-efpc.gc.ca/fr Trajets en bus]</h3>
 +
<p>Trajets en bus est un produit de l’Académie du numérique de l’École de la fonction publique du Canada et constitue une ressource pour mieux comprendre tout ce qui est numérique et gouvernemental.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">Statistiques</h3>
 +
<ul>
 +
<li><strong>[https://www144.statcan.gc.ca/tdih-cdit/index-fra.htm?HPA=1 Carrefour de données et d'information sur les transports]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/themes-debut/pauvrete Carrefour des dimensions de la pauvreté]</strong></li>
 +
<li><strong>[https://information-energie.canada.ca/fr Centre canadien d'information sur l'énergie]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/sujets-debut/economie_et_societe_numeriques Statistiques sur l'économie et la société numériques]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/sujets-debut/environnement Statistiques sur l'environnement]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/themes-debut/genre_diversite_et_inclusion Statistiques sur le genre, la diversité et l'inclusion]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/sujets-debut/logement Statistiques sur le logement]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/sujets-debut/peuples_autochtones Statistiques sur les peuples autochtones]</strong></li>
 +
<li><strong>[https://www.statcan.gc.ca/fr/sujets-debut/travail_ Statistiques sur le travail]</strong></li>
 +
</ul>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<!-- *** TOOLS *** -->
 +
 +
<h2>Outils</h2>
 +
 +
<h3 style="text-decoration:none;">[https://www150.statcan.gc.ca/n1/pub/89-20-0006/892000062021001-fra.htm Cadre pour l’utilisation des processus d’apprentissage automatique de façon responsable à Statistique Canada]</h3>
 +
<p>Le présent document est un guide pour les utilisateurs qui désirent élaborer et mettre en œuvre des projets d’apprentissage automatique. Il fournit une orientation et des conseils pratiques sur la façon responsable d’élaborer ces processus automatisés au sein de Statistique Canada, mais qui pourrait aussi être adopté par toute autre organisation. Le guide peut s’appliquer au travail de production tout aussi bien qu’au travail de recherche menant à des publications.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
[[Image:Data-interoperatiblity_guide-UN.png|150px|Data Interoperability Guide]]
 +
<h3 style="text-decoration:none;">[https://unstats.un.org/wiki/display/InteropGuide/Introduction Guide d'interopérabilité des données]</h3>
 +
<p class="author">Luis Gonzalez, sur UN Statistics Wiki</p>
 +
<p>(En anglais - titre original : <strong>Data Interoperability Guide</strong>) Au fil des ans, d'innombrables systèmes qui ne communiquent pas entre eux ont été créés au sein des organisations et entre elles dans le but de collecter, traiter et diffuser des données pour le développement. Avec la prolifération de différentes plateformes technologiques, définitions de données et dispositions institutionnelles pour la gestion, le partage et l'utilisation des données, il est devenu de plus en plus nécessaire de consacrer des ressources à l'intégration des données nécessaires pour soutenir l'élaboration des politiques et la prise de décision. L'interopérabilité est la capacité de joindre et de fusionner des données sans perdre de sens (JUDS 2016). En pratique, on dit que les données sont interopérables lorsqu'elles peuvent être facilement réutilisées et traitées dans différentes applications, ce qui permet à différents systèmes d'information de fonctionner ensemble. L'interopérabilité est un catalyseur essentiel pour que le secteur du développement devienne plus axé sur les données.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[http://opendatatoolkit.worldbank.org/fr/ Guide pratique des données ouvertes]</h3>
 +
<p class="author">from Worldbank</p>
 +
<p>Le Guide Pratique des Données Ouvertes a pour but d’aider les pouvoirs publics, le personnel de la Banque mondiale et les utilisateurs à comprendre les principes fondamentaux de l'ouverture des données publiques, et à planifier et mettre en œuvre un programme de ce type en évitant les écueils les plus courants. </p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
[[Image:Data-Ethics-Canvas.jpg|150px|The Data Ethics Canvas]]
 +
<h3 style="text-decoration:none;">[https://theodi.org/article/the-data-ethics-canvas-2021/ Le canevas de l'éthique des données]</h3>
 +
<p class="author">Dave Tarrant, James Maddison et Olivier Thereaux</p>
 +
<p>(En anglais - titre original : <strong>The Data Ethics Canvas</strong>) Le Canevas d'éthique des données est un outil destiné à tous ceux qui collectent, partagent ou utilisent des données. Il permet d'identifier et de gérer les problèmes éthiques - au début d'un projet qui utilise des données, et tout au long de celui-ci. Il vous encourage à poser des questions importantes sur les projets qui utilisent des données, et à réfléchir aux réponses. Le Canevas d'éthique des données fournit un cadre pour développer des conseils éthiques adaptés à tout contexte, quelle que soit la taille ou la portée du projet.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 +
<br>
 +
<br>
 +
 +
[[Image:StatsCAN-appli-FR.png|150px|L'appli StatsCAN]]
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/rb/applications-mobiles L'appli StatsCAN]</h3>
 +
<p class="author">Statistique Canada</p>
 +
<p>Cette application gratuite vous donne accès à des analyses spécialisées, des faits amusants, des produits de visualisation, de brèves histoires et des observations qui rassemblent des données, des outils et des articles pour vous fournir les renseignements les plus récents sur l'économie, la société et l'environnement du Canada.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
<br>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/monstatcan/connexion?HPA=1 Mon StatCan]</h3>
 +
<p class="author">Statistique Canada</p>
 +
<p>Mon StatCan est un portail complet et personnalisable qui vous permet de : mettre un signet à vos articles, rapports, tableaux de données, indicateurs et autres favoris pour y avoir accès rapidement; recevoir par courriel les avis portant sur les données les plus récentes que nous avons diffusées; participer à des discussions en ligne sur le blogue de StatCan, Clavarder avec un expert et la Question du mois.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.canada.ca/fr/gouvernement/systeme/gouvernement-numerique/innovations-gouvernementales-numeriques/utilisation-responsable-ai/evaluation-incidence-algorithmique.html Outil d’évaluation de l’incidence algorithmique]</h3>
 +
<p>L’outil d’évaluation de l’incidence algorithmique (ÉIA) est un outil d’évaluation des risques obligatoire destiné à soutenir la Directive sur la prise de décisions automatisée (« la Directive ») du Conseil du Trésor. L’outil est un questionnaire qui détermine le niveau d’incidence d’un système de décision automatisé. Il est composé de 48 questions sur les risques et de 33 questions sur l’atténuation. Les notes d’évaluation sont fondées sur de nombreux facteurs, y compris la conception des systèmes, l’algorithme, le type de décision, l’incidence et les données.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www150.statcan.gc.ca/n1/pub/71-607-x/71-607-x2020010-fra.htm?HPA=1 L’Explorateur géospatial des statistiques canadiennes ]</h3>
 +
<p class="author">Statistique Canada</p>
 +
<p>L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les données géospatiales de Statistique Canada jusqu'au plus petit niveau de détail disponible, l'aire de diffusion. Les utilisateurs peuvent rechercher, explorer puis exporter des données dans divers formats pour les utiliser dans leurs flux de travail. Les utilisateurs peuvent également personnaliser la carte et modifier les fonds de carte (imagerie satellite, topographie, etc.) pour afficher les données dans un contexte different.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://wiki.gccollab.ca/File:TheDataLodge_Where_to_go_to_learn_more.pdf Où dois-je aller pour en savoir plus, de « The Data Lodge »] <small>(PDF)</small></h3>
 +
<p class="author">[https://wiki.gccollab.ca/Data_Conference_2022_Speakers#Valerie_A_Logan Valerie Logan]</p>
 +
<p>(En anglais) Ressources et webinaires clés sur la maîtrise des données.</p>
 +
<p class="recco">Recommandé par la Communauté des données du GC.</p>
 +
 +
<!-- *** NEWSLETTERS + BLOGS *** -->
 +
 +
<h2>Bulletins, blogs et flux</h2>
 +
[[Image:GCDC-round-EN-FR.png|150px|Communauté des données du GC]]
 +
<h3 style="text-decoration:none;">[https://mailchi.mp/e0872fde637e/gc-data-community-mailing-list-sign-up-inscription-la-liste-de-diffusion-de-la-communaut-des-donnes-du-gc Bulletin mensuel de la Communauté des données du GC]</h3>
 +
<p>Inscrivez-vous pour vous tenir au courant des événements, des communiqués, des emplois et plus encore liés aux données au sein du gouvernement du Canada.</p>
 +
<p class="recco">Recommandé par la Communauté des données du GC.</p>
 +
<br>
 +
<br>
 +
<br>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/science-donnees/reseau/infolettre Bulletin d'information du Réseau de la science des données pour la fonction publique fédérale]</h3>
 +
<p>Tenez-vous au courant des dernières nouvelles dans le monde de la science des données en vous abonnant au bulletin d'information du Réseau : Méli-mélo de la science des données—votre source d'information pour tout ce qui concerne la science des données au sein du gouvernement du Canada et ailleurs.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
[[Image:The-AI-ethics-brief-newsletter.PNG|150px|The AI Ethics Brief]]
 +
<h3 style="text-decoration:none;">[https://brief.montrealethics.ai/ L'éthique de l'IA en bref]</h3>
 +
<p class="author">Institut d'éthique de l'IA de Montréal</p>
 +
<p>(En anglais - titre original : <strong>The AI Ethics Brief</strong>) L'Institut d'éthique de l'IA de Montréal est une organisation internationale à but non lucratif qui démocratise la connaissance de l'éthique de l'IA. Abonnez-vous pour avoir un accès complet à la newsletter et recevoir chaque semaine dans votre boîte de réception les dernières nouvelles du domaine de l'éthique de l'IA. Ne manquez jamais une mise à jour du travail effectué à l'Institut d'éthique de l'IA de Montréal et nos réflexions sur la recherche et le développement dans ce domaine à travers le monde.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www150.statcan.gc.ca/n1/dai-quo/index-fra.htm?HPA=1  Le Quotidien]</h3>
 +
<p class="author">Statistics Canada</p>
 +
<p>En manchette : les communiqués quotidiens.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/o1/fr/plus?HPA=1 StatsCAN Plus]</h3>
 +
<p class="author">Statistics Canada</p>
 +
<p>Restez au courant de l'actualité statistique du pays tout au long de la journée !</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
<!-- *** PODCASTS *** -->
 +
 +
<h2>Balados</h2>
 +
[[Image:Women-in-data-science-podcast.PNG|150px|Women in Data Science podcast, Stanford University]]
 +
<h3 style="text-decoration:none;">[https://www.widsconference.org/podcast.html Balado sur les femmes dans les sciences des données]</h3>
 +
<p>(En anglais - titre original : <strong>Women in Data Science podcast</strong>) Des femmes de premier plan dans le domaine de la science des données partagent leur travail, leurs conseils et les leçons apprises en cours de route avec le professeur Margot Gerritsen de l'université de Stanford. Découvrez comment la science des données est appliquée et a un impact dans un large éventail de domaines, des soins de santé à la finance en passant par la cosmologie et les droits de l'homme, etc.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 +
 +
[[Image:Data-sceptic-podcast.PNG|150px|Data Skeptic podcast]]
 +
<h3 style="text-decoration:none;">[https://dataskeptic.com/ Balado du sceptique des données]</h3>
 +
<p>(En anglais - titre original : <strong>Data Skeptic podcast</strong>) Votre balado de confiance, centré sur la science des données, l'apprentissage automatique et l'intelligence artificielle.</p>
 +
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 +
<br>
  
 +
[[Image:He-coutez-bien-balados-fra.jpg|150px|Hé-coutez bien!]]
 +
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/fr/rb/balados Balado Hé-coutez bien!]</h3>
 +
<p>Soyez à l'écoute du balado Hé-coutez bien! pour faire la connaissance des personnes derrière les données et découvrir les histoires qu'elles révèlent. Soyez des nôtres alors que nous rencontrons des experts de Statistique Canada ainsi que de partout au pays pour leur poser les questions qui comptent pour les Canadiens et entendre leur réponses.</p>
 +
<p class="recco">Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
  
 
<h2>Livres et rapports</h2>
 
<h2>Livres et rapports</h2>
Line 88: Line 384:
 
<h3 style="text-decoration:none;">[https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1140&context=libraryscience Introduction aux données écologiques et environnementales en ligne]</h3>
 
<h3 style="text-decoration:none;">[https://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1140&context=libraryscience Introduction aux données écologiques et environnementales en ligne]</h3>
 
<p class="author">Virginia A Baldwin </p>
 
<p class="author">Virginia A Baldwin </p>
<p>(En anglais - titre original : Introduction to Online Ecological and Environmental Data) L'avènement de l'Internet et la prolifération des documents qu'il contient ont entraîné des changements importants et rapides dans la communication savante. L'affichage des données de recherche en vue de leur partage avec d'autres chercheurs dans le domaine a peut-être été plus progressif. Ce volume décrit plusieurs projets qui ont rendu les données des chercheurs en environnement et en écologie librement accessibles en ligne. Des bibliothécaires de la National Aeronautics and Space Administration (NASA), du United States Geological Survey (USGS), d'une agence régionale basée en Oregon, d'une université et d'une société de recherche décrivent les aspects des projets de données en ligne développés par leurs institutions respectives. Un sixième article, rédigé par un bibliothécaire de l'université de l'État de New York à Buffalo, suit le développement de données de recherche en ligne dans un domaine spécifique, la recherche sur les pluies acides, à partir de divers types de programmes de recherche. Un thème commun à ces articles est l'implication interdisciplinaire des chercheurs qui produisent et utilisent des données dans les domaines des études environnementales et écologiques.</p>
+
<p>(En anglais - titre original : <strong>Introduction to Online Ecological and Environmental Data</strong>) L'avènement de l'Internet et la prolifération des documents qu'il contient ont entraîné des changements importants et rapides dans la communication savante. L'affichage des données de recherche en vue de leur partage avec d'autres chercheurs dans le domaine a peut-être été plus progressif. Ce volume décrit plusieurs projets qui ont rendu les données des chercheurs en environnement et en écologie librement accessibles en ligne. Des bibliothécaires de la National Aeronautics and Space Administration (NASA), du United States Geological Survey (USGS), d'une agence régionale basée en Oregon, d'une université et d'une société de recherche décrivent les aspects des projets de données en ligne développés par leurs institutions respectives. Un sixième article, rédigé par un bibliothécaire de l'université de l'État de New York à Buffalo, suit le développement de données de recherche en ligne dans un domaine spécifique, la recherche sur les pluies acides, à partir de divers types de programmes de recherche. Un thème commun à ces articles est l'implication interdisciplinaire des chercheurs qui produisent et utilisent des données dans les domaines des études environnementales et écologiques.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 95: Line 391:
 
<h3 style="text-decoration:none;">La science des données fédérales : transformer le gouvernement et la politique agricole grâce à l'intelligence artificielle</h3>
 
<h3 style="text-decoration:none;">La science des données fédérales : transformer le gouvernement et la politique agricole grâce à l'intelligence artificielle</h3>
 
<p class="author">Feras A Batarseh et Ruixin Yang</p>
 
<p class="author">Feras A Batarseh et Ruixin Yang</p>
<p>(En anglais - titre original : Federal data science: Transforming government and agricultural policy using artificial intelligence) La science des données fédérales sert de guide aux ingénieurs logiciels fédéraux, aux analystes gouvernementaux, aux économistes, aux chercheurs, aux scientifiques des données et aux responsables de l'ingénierie pour déployer des méthodes d'analyse des données dans les processus gouvernementaux. Poussées par les initiatives de gouvernement ouvert (2009) et de big data (2012), les agences fédérales ont un sérieux besoin de mettre en œuvre des méthodes de gestion intelligente des données, de partager leurs données et de déployer des analyses avancées dans leurs processus. L'utilisation des données fédérales pour une prise de décision réactive n'est plus suffisante, les systèmes de données intelligents permettent des activités proactives qui conduisent à des avantages tels que : l'amélioration des services aux citoyens, une plus grande responsabilité, la réduction des inefficacités de livraison, la réduction des coûts, l'amélioration des connaissances nationales et une meilleure prise de décision. Aucun autre ouvrage consacré au gouvernement n'a été trouvé dans la littérature qui traite de ce vaste sujet. Ce livre présente de nombreux cas d'utilisation, décrit les avantages de la science des données au niveau fédéral et comble les lacunes dans ce domaine critique et opportun.</p>
+
<p>(En anglais - titre original : <strong>Federal data science: Transforming government and agricultural policy using artificial intelligence</strong>) La science des données fédérales sert de guide aux ingénieurs logiciels fédéraux, aux analystes gouvernementaux, aux économistes, aux chercheurs, aux scientifiques des données et aux responsables de l'ingénierie pour déployer des méthodes d'analyse des données dans les processus gouvernementaux. Poussées par les initiatives de gouvernement ouvert (2009) et de big data (2012), les agences fédérales ont un sérieux besoin de mettre en œuvre des méthodes de gestion intelligente des données, de partager leurs données et de déployer des analyses avancées dans leurs processus. L'utilisation des données fédérales pour une prise de décision réactive n'est plus suffisante, les systèmes de données intelligents permettent des activités proactives qui conduisent à des avantages tels que : l'amélioration des services aux citoyens, une plus grande responsabilité, la réduction des inefficacités de livraison, la réduction des coûts, l'amélioration des connaissances nationales et une meilleure prise de décision. Aucun autre ouvrage consacré au gouvernement n'a été trouvé dans la littérature qui traite de ce vaste sujet. Ce livre présente de nombreux cas d'utilisation, décrit les avantages de la science des données au niveau fédéral et comble les lacunes dans ce domaine critique et opportun.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 114: Line 410:
 
<h3 style="text-decoration:none;">[https://www.researchgate.net/publication/327703818_La_modelisation_par_equations_structurelles_avec_Mplus La modélisation par équations structurelles avec Mplus]</h3>
 
<h3 style="text-decoration:none;">[https://www.researchgate.net/publication/327703818_La_modelisation_par_equations_structurelles_avec_Mplus La modélisation par équations structurelles avec Mplus]</h3>
 
<p class="author">Pier-Olivier Caron</p>
 
<p class="author">Pier-Olivier Caron</p>
<p>(En français) La modelisation par equations structurelles s'impose de plus en plus en sciences humaines, que ce soit en psychologie, en sociologie ou en sexologie. L'objectif du present ouvrage est d'offrir aux chercheurs et aux etudiants une introduction a la syntaxe Mplus sous forme d'un guide pratique leur permettant de realiser des analyses de base. Le logiciel Mplus se demarque par la diversite des analyses qu'il offre, sa polyvalence quant a la gestion des donnees (continues, ordinales, binaires, non normales, etc.), son traitement des donnees manquantes et sa simplicite d'utilisation. </p>
+
<p>(En français) La modelisation par equations structurelles s'impose de plus en plus en sciences humaines, que ce soit en psychologie, en sociologie ou en sexologie. L'objectif du present ouvrage est d'offrir aux chercheurs et aux etudiants une introduction a la syntaxe Mplus sous forme d'un guide pratique leur permettant de realiser des analyses de base. Le logiciel Mplus se demarque par la diversite des analyses qu'il offre, sa polyvalence quant a la gestion des donnees (continues, ordinales, binaires, non normales, etc), son traitement des donnees manquantes et sa simplicite d'utilisation. </p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 121: Line 417:
  
 
[[Image:Invisible-Women-cover.jpg|150px|Invisible Women: Data Bias in a World Designed for Men, by Caroline Criado Pérez]]
 
[[Image:Invisible-Women-cover.jpg|150px|Invisible Women: Data Bias in a World Designed for Men, by Caroline Criado Pérez]]
<h3 style="text-decoration:none;">Invisible Women: Data Bias in a World Designed for Men</h3>
+
<h3 style="text-decoration:none;">Femmes invisibles : La partialité des données dans un monde conçu pour les hommes</h3>
 
<p class="author">Caroline Criado Pérez</p>
 
<p class="author">Caroline Criado Pérez</p>
<p>Data is fundamental to the modern world. From economic development, to healthcare, to education and public policy, we rely on numbers to allocate resources and make crucial decisions. But because so much data fails to take into account gender, because it treats men as the default and women as atypical, bias and discrimination are baked into our systems. And women pay tremendous costs for this bias, in time, money, and often with their lives.</p>
+
<p>(En anglais - titre original : <strong>Invisible Women: Data Bias in a World Designed for Men</strong>) Les données sont fondamentales dans le monde moderne. Du développement économique aux soins de santé, en passant par l'éducation et les politiques publiques, nous nous appuyons sur des chiffres pour allouer des ressources et prendre des décisions cruciales. Mais comme de nombreuses données ne tiennent pas compte du sexe, parce qu'elles considèrent les hommes comme la norme et les femmes comme atypiques, les préjugés et la discrimination sont intégrés dans nos systèmes. Et les femmes paient un prix énorme pour ces préjugés, en temps, en argent, et souvent de leur vie. La célèbre féministe Caroline Criado Perez enquête sur les causes profondes et choquantes de l'inégalité des sexes et de la recherche dans <i>Les femmes invisibles</i>, en plongeant dans la vie des femmes à la maison, au travail, sur la place publique, chez le médecin, etc. Fondé sur des centaines d'études menées aux États-Unis, au Royaume-Uni et dans le monde entier, et écrit avec énergie, esprit et intelligence, ce livre est un exposé révolutionnaire et inoubliable qui changera votre façon de voir le monde.</p>
<p>Celebrated feminist advocate Caroline Criado Perez investigates the shocking root cause of gender inequality and research in <i>Invisible Women​</i>, diving into women’s lives at home, the workplace, the public square, the doctor’s office, and more. Built on hundreds of studies in the US, the UK, and around the world, and written with energy, wit, and sparkling intelligence, this is a groundbreaking, unforgettable exposé that will change the way you look at the world.</p>
 
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Inro-to-data-analysis-with-R-for-Forensic-Scientists.jpg|150px|Introduction to data analysis with R for forensic scientists]]
 
[[Image:Inro-to-data-analysis-with-R-for-Forensic-Scientists.jpg|150px|Introduction to data analysis with R for forensic scientists]]
<h3 style="text-decoration:none;">Introduction to data analysis with R for forensic scientists (Vol. 21)</h3>
+
<h3 style="text-decoration:none;">Introduction à l'analyse des données avec R pour les scientifiques de la police scientifique (Vol. 21)</h3>
 
<p class="author">James Michael Curran</p>
 
<p class="author">James Michael Curran</p>
<p>Statistical methods provide a logical, coherent framework in which data from experimental science can be analyzed. However, many researchers lack the statistical skills or resources that would allow them to explore their data to its full potential. Introduction to Data Analysis with R for Forensic Sciences minimizes theory and mathematics and focuses on the application and practice of statistics to provide researchers with the dexterity necessary to systematically analyze data discovered from the fruits of their research. Using traditional techniques and employing examples and tutorials with real data collected from experiments, this book presents the following critical information necessary for researchers: A refresher on basic statistics and an introduction to R Considerations and techniques for the visual display of data through graphics; An overview of statistical hypothesis tests and the reasoning behind them; A comprehensive guide to the use of the linear model, the foundation of most statistics encountered; An introduction to extensions to the linear model for commonly encountered scenarios.</p>
+
<p>(En anglais - titre original : <strong>Introduction to data analysis with R for forensic scientists (Vol. 21)</strong>) Les méthodes statistiques fournissent un cadre logique et cohérent dans lequel les données issues de la science expérimentale peuvent être analysées. Cependant, de nombreux chercheurs ne disposent pas des compétences ou des ressources statistiques qui leur permettraient d'explorer leurs données à leur plein potentiel. Introduction à l'analyse des données avec R pour les scientifiques de la police scientifique minimise la théorie et les mathématiques et se concentre sur l'application et la pratique des statistiques afin de fournir aux chercheurs la dextérité nécessaire pour analyser systématiquement les données découvertes à partir des fruits de leurs recherches. En utilisant des techniques traditionnelles et en s'appuyant sur des exemples et des tutoriels avec des données réelles recueillies lors d'expériences, ce livre présente les informations essentielles suivantes nécessaires aux chercheurs : Une remise à niveau sur les statistiques de base et une introduction à R. Des considérations et des techniques pour l'affichage visuel des données par le biais de graphiques ; Une vue d'ensemble des tests d'hypothèses statistiques et le raisonnement qui les sous-tend ; Un guide complet de l'utilisation du modèle linéaire, le fondement de la plupart des statistiques rencontrées ; Une introduction aux extensions du modèle linéaire pour les scénarios couramment rencontrés.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Systems-immunology.jpg|150px|Systems immunology: an introduction to modeling methods for scientists]]
 
[[Image:Systems-immunology.jpg|150px|Systems immunology: an introduction to modeling methods for scientists]]
<h3 style="text-decoration:none;">Systems immunology: an introduction to modeling methods for scientists</h3>
+
<h3 style="text-decoration:none;">Immunologie des systèmes : une introduction aux méthodes de modélisation pour les scientifiques</h3>
<p class="author">Jayajit Das and Ciriyam Jayaprakash</p>
+
<p class="author">Jayajit Das et Ciriyam Jayaprakash</p>
<p>This book provides a complete overview of computational immunology, from basic concepts to mathematical modeling at the single molecule, cellular, organism, and population levels. It showcases modern mechanistic models and their use in making predictions, designing experiments, and elucidating underlying biochemical processes. It begins with an introduction to data analysis, approximations, and assumptions used in model building. Core chapters address models and methods for studying immune responses, with fundamental concepts clearly defined. Readers from immunology, quantitative biology, and applied physics will benefit from the following: Fundamental principles of computational immunology and modern quantitative methods for studying immune response at the single molecule, cellular, organism, and population levels. An overview of basic concepts in modeling and data analysis. Coverage of topics where mechanistic modeling has contributed substantially to current understanding. Discussion of genetic diversity of the immune system, cell signaling in the immune system, immune response at the cell population scale, and ecology of host-pathogen interactions.</p>
+
<p>(En anglais - titre original : <strong>Systems immunology: an introduction to modeling methods for scientists</strong>) Ce livre offre une vue d'ensemble complète de l'immunologie computationnelle, depuis les concepts de base jusqu'à la modélisation mathématique au niveau de la molécule unique, de la cellule, de l'organisme et de la population. Il présente les modèles mécanistes modernes et leur utilisation pour faire des prédictions, concevoir des expériences et élucider les processus biochimiques sous-jacents. Il commence par une introduction à l'analyse des données, aux approximations et aux hypothèses utilisées dans la construction des modèles. Les chapitres principaux traitent des modèles et des méthodes d'étude des réponses immunitaires, les concepts fondamentaux étant clairement définis. Les lecteurs issus de l'immunologie, de la biologie quantitative et de la physique appliquée bénéficieront des éléments suivants : Les principes fondamentaux de l'immunologie computationnelle et les méthodes quantitatives modernes pour étudier la réponse immunitaire au niveau de la molécule unique, de la cellule, de l'organisme et de la population. Un aperçu des concepts de base de la modélisation et de l'analyse des données. Couverture de sujets pour lesquels la modélisation mécaniste a contribué de manière substantielle à la compréhension actuelle. Discussion sur la diversité génétique du système immunitaire, la signalisation cellulaire dans le système immunitaire, la réponse immunitaire à l'échelle de la population cellulaire et l'écologie des interactions hôte-pathogène.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
 +
[[Image:Les-donnees-administratives-publiques-dans-l-espace-numerique.jpg|150px|Les données administratives publiques dans l'espace numérique]]
 +
<h3 style="text-decoration:none;">[https://www.worldcat.org/title/donnes-administratives-publiques-dans-lespace-numrique/oclc/1281673459/editions?referer=di&editionsView=true Les données administratives publiques dans l'espace numérique]</h3>
 +
<p class="author">[https://wiki.gccollab.ca/Conf%C3%A9rence_sur_les_donn%C3%A9es_2022_-_Conf%C3%A9renciers#Pierre_Desrochers Pierre Desrochers]</p>
 +
<p>(En français) Cet ouvrage a pour objectif d'explorer les enjeux liés à la collecte et à l'utilisation des données administratives. Ces données, accumulées par les ministères et les organismes gouvernementaux lors de leurs activités quotidiennes, deviennent de plus en plus intéressantes à mesure que les outils statistiques et technologiques se développent et permettent leur exploitation. Les données administratives sont celles qui sont recueillies systématiquement lors de l'inscription de personnes ou la réalisation de transactions, ou encore créées lors des activités de tenue de documents liées à la prestation d'un service. Les incidences des mégadonnées, ou Big Data, l'arrivée de l'apprentissage automatique et de l'intelligence artificielle sont importantes pour les organisations et la gouvernance de leur information. Elles soulèvent de nombreux enjeux de qualité, de précision, de protection des renseignements personnels ou encore d'interprétation.</p>
 +
<p class="recco">Recommandé par la Communauté des données du GC.</p>
 
<br>
 
<br>
  
[[Image:Data-Feminism-cover.jpg|150px|Data Feminism, by  Catherine D'Ignazio and Lauren F. Klein]]
+
[[Image:Data-Feminism-cover.jpg|150px|Data Feminism]]
<h3 style="text-decoration:none;">Data Feminism: A new way of thinking about data science and data ethics that is informed by the ideas of intersectional feminism.</h3>
+
<h3 style="text-decoration:none;">Le féminisme des données : Une nouvelle façon de penser la science des données et l'éthique des données qui est informée par les idées du féminisme intersectionne</h3>
 
<p class="author">Catherine D'Ignazio and Lauren F Klein</p>
 
<p class="author">Catherine D'Ignazio and Lauren F Klein</p>
<p>Today, data science is a form of power. It has been used to expose injustice, improve health outcomes, and topple governments. But it has also been used to discriminate, police, and surveil. This potential for good, on the one hand, and harm, on the other, makes it essential to ask: Data science by whom? Data science for whom? Data science with whose interests in mind? The narratives around big data and data science are overwhelmingly white, male, and techno-heroic. In <i>Data Feminism</i>, Catherine D'Ignazio and Lauren Klein present a new way of thinking about data science and data ethics—one that is informed by intersectional feminist thought.
+
<p>(En anglais - titre original : <strong>Data Feminism: A new way of thinking about data science and data ethics that is informed by the ideas of intersectional feminism</strong>) Aujourd'hui, la science des données est une forme de pouvoir. Elle a été utilisée pour dénoncer l'injustice, améliorer les résultats en matière de santé et renverser des gouvernements. Mais elle a également été utilisée pour discriminer, policer et surveiller. Ce potentiel de bien, d'une part, et de mal, d'autre part, fait qu'il est essentiel de s'interroger : La science des données par qui ? La science des données pour qui ? La science des données dans l'intérêt de qui ? Les récits autour du big data et de la science des données sont très majoritairement blancs, masculins et techno-héroïques. Dans <i>Data Feminism</i>, Catherine D'Ignazio et Lauren Klein présentent une nouvelle façon de penser la science des données et l'éthique des données - une qui est informée par la pensée féministe intersectionnelle. [https://mitpress.mit.edu/books/data-feminism <i>Data Feminism</i>] offre des stratégies pour les scientifiques des données qui cherchent à apprendre comment le féminisme peut les aider à œuvrer pour la justice, et pour les féministes qui veulent concentrer leurs efforts sur le domaine croissant de la science des données. Mais le féminisme des données va bien au-delà du genre. Il s'agit du pouvoir, de qui en a et de qui n'en a pas, et de la manière dont ces différences de pouvoir peuvent être remises en question et modifiées.</p>
<p>[https://mitpress.mit.edu/books/data-feminism <i>Data Feminism</i>] offers strategies for data scientists seeking to learn how feminism can help them work toward justice, and for feminists who want to focus their efforts on the growing field of data science. But Data Feminism is about much more than gender. It is about power, about who has it and who doesn't, and about how those differentials of power can be challenged and changed.</p>
 
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 155: Line 455:
 
<p>(En français) Le data mining est un concept jeune qui apparaît en 1989 sous un premier nom de KDD (Knowledge Discovery in Databases, en français ECD pour Extraction de Connaissances à partir des Données). Le terme de « text and data mining » est apparu pour la première fois dans le domaine du marketing au début des années 1990. Ce concept, tel qu’appliqué aux services marketing, est étroitement lié au concept du « one-to-one relationship » (Michael Berry et Gordon Linoff, créateurs du data mining dans le m).</p>
 
<p>(En français) Le data mining est un concept jeune qui apparaît en 1989 sous un premier nom de KDD (Knowledge Discovery in Databases, en français ECD pour Extraction de Connaissances à partir des Données). Le terme de « text and data mining » est apparu pour la première fois dans le domaine du marketing au début des années 1990. Ce concept, tel qu’appliqué aux services marketing, est étroitement lié au concept du « one-to-one relationship » (Michael Berry et Gordon Linoff, créateurs du data mining dans le m).</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 
<br>
 
<br>
 
<br>
 
<br>
  
 
[[Image:Computer-age-statistical-inference.jpg|150px|Computer age statistical inference: Algorithms, evidence, and data science]]
 
[[Image:Computer-age-statistical-inference.jpg|150px|Computer age statistical inference: Algorithms, evidence, and data science]]
<h3 style="text-decoration:none;">Computer age statistical inference: Algorithms, evidence, and data science</h3>
+
<h3 style="text-decoration:none;">Inférence statistique à l'ère de l'informatique : Algorithmes, preuves et science des données</h3>
 
<p class="author">Bradley Efron et Trevor Hastie</p>
 
<p class="author">Bradley Efron et Trevor Hastie</p>
<p>The twenty-first century has seen a breathtaking expansion of statistical methodology, both in scope and in influence. 'Big data', 'data science', and 'machine learning' have become familiar terms in the news, as statistical methods are brought to bear upon the enormous data sets of modern science and commerce. How did we get here? And where are we going? This book takes us on an exhilarating journey through the revolution in data analysis following the introduction of electronic computation in the 1950s. Beginning with classical inferential theories - Bayesian, frequentist, Fisherian - individual chapters take up a series of influential topics: survival analysis, logistic regression, empirical Bayes, the jackknife and bootstrap, random forests, neural networks, Markov chain Monte Carlo, inference after model selection, and dozens more. The distinctly modern approach integrates methodology and algorithms with statistical inference. The book ends with speculation on the future direction of statistics and data science.</p>
+
<p>(En anglais - titre original : <strong>Computer age statistical inference: Algorithms, evidence, and data science</strong>) Le vingt-et-unième siècle a vu une expansion époustouflante de la méthodologie statistique, tant en termes de portée que d'influence. Les termes &laquo; Big data &raquo; , &laquo; science des données &raquo; et &laquo; apprentissage automatique &raquo; sont devenus des termes familiers dans l'actualité, car les méthodes statistiques sont appliquées aux énormes ensembles de données de la science et du commerce modernes. Comment en sommes-nous arrivés là ? Et où allons-nous ? Ce livre nous emmène dans un voyage exaltant à travers la révolution de l'analyse des données qui a suivi l'introduction du calcul électronique dans les années 1950. En commençant par les théories inférentielles classiques - bayésiennes, fréquentistes, fisheriennes - les différents chapitres abordent une série de sujets influents : l'analyse de survie, la régression logistique, Bayes empirique, le jackknife et le bootstrap, les forêts aléatoires, les réseaux neuronaux, la chaîne de Markov Monte Carlo, l'inférence après sélection de modèle, et des dizaines d'autres. L'approche résolument moderne intègre la méthodologie et les algorithmes à l'inférence statistique. Le livre se termine par des spéculations sur l'orientation future des statistiques et de la science des données.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Number-Sense-cover.jpg|150px|Numbersense: How to Use Big Data to Your Advantage, by Kaiser Fung]]
 
[[Image:Number-Sense-cover.jpg|150px|Numbersense: How to Use Big Data to Your Advantage, by Kaiser Fung]]
<h3 style="text-decoration:none;">Numbersense: How to Use Big Data to Your Advantage</h3>
+
<h3 style="text-decoration:none;">Le sens des nombres : comment utiliser le Big Data à votre avantage</h3>
 
<p class="author">Kaiser Fung</p>
 
<p class="author">Kaiser Fung</p>
<p>We live in a world of Big Data--and it's getting bigger every day. Virtually every choice we make hinges on how someone generates data . . . and how someone else interprets it--whether we realize it or not. The problem is, the more data we have, the more difficult it is to interpret it. From world leaders to average citizens, everyone is prone to making critical decisions based on poor data interpretations.</p>
+
<p>(En anglais - titre original : <strong>Numbersense: How to Use Big Data to Your Advantage</strong>) Nous vivons dans un monde de Big Data &#8212; et il devient de plus en plus grand chaque jour. Pratiquement tous les choix que nous faisons dépendent de la façon dont quelqu'un génère des données... et de la façon dont quelqu'un d'autre les interprète ... et de la façon dont quelqu'un d'autre les interprète &#8212; que nous en soyons conscients ou non. Le problème est que plus nous avons de données, plus il est difficile de les interpréter. Des leaders mondiaux aux citoyens moyens, tout le monde est enclin à prendre des décisions critiques basées sur de mauvaises interprétations des données. <i>Numbersense</i> vous donne un aperçu de la façon dont l'interprétation des Big Data fonctionne &#8212; et comment, trop souvent, elle ne fonctionne pas. Vous n'en ressortirez pas avec les compétences d'un statisticien professionnel, mais vous aurez une compréhension fine des pièges à données dans lesquels même les meilleurs statisticiens peuvent tomber, et vous ferez confiance à l'alarme mentale qui se déclenche dans votre tête lorsque quelque chose ne semble pas s'additionner.</p>
<p><i>Numbersense</i> gives you the insight into how Big Data interpretation works--and how it too often doesn't work. You won't come away with the skills of a professional statistician, but you will have a keen understanding of the data traps even the best statisticians can fall into, and you'll trust the mental alarm that goes off in your head when something just doesn't seem to add up.</p>
 
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Hands-on-machine-learning-with-Scikit-Learn-and-TensorFlow.jpg|150px|Hands-on machine learning with Scikit-Learn and TensorFlow]]
 
[[Image:Hands-on-machine-learning-with-Scikit-Learn-and-TensorFlow.jpg|150px|Hands-on machine learning with Scikit-Learn and TensorFlow]]
<h3 style="text-decoration:none;">Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems</h3>
+
<h3 style="text-decoration:none;">Apprentissage automatique pratique avec Scikit-Learn et TensorFlow : concepts, outils et techniques pour construire des systèmes intelligents</h3>
 
<p class="author">Aurélien Géron</p>
 
<p class="author">Aurélien Géron</p>
<p>By using concrete examples, minimal theory, and two production-ready Python frameworks—scikit-learn and TensorFlow—author Aurélien Géron helps you gain an intuitive understanding of the concepts and tools for building intelligent systems. You’ll learn a range of techniques, starting with simple linear regression and progressing to deep neural networks. With exercises in each chapter to help you apply what you’ve learned, all you need is programming experience to get started.</p>
+
<p>(En anglais - titre original : <strong>Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems</strong>) À l'aide d'exemples concrets, d'un minimum de théorie et de deux frameworks Python prêts à l'emploi &#8212; Scikit-learn et TensorFlow &#8212; l'auteur Aurélien Géron vous aide à acquérir une compréhension intuitive des concepts et des outils permettant de construire des systèmes intelligents. Vous apprendrez un éventail de techniques, en commençant par la régression linéaire simple et en progressant vers les réseaux neuronaux profonds. Avec des exercices dans chaque chapitre pour vous aider à appliquer ce que vous avez appris, tout ce dont vous avez besoin est une expérience de la programmation pour commencer.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 187: Line 487:
  
 
[[Image:Intro-to-data-science.jpg|150px|Introduction to data science]]
 
[[Image:Intro-to-data-science.jpg|150px|Introduction to data science]]
<h3 style="text-decoration:none;">Introduction to data science: data analysis and prediction algorithms with R</h3>
+
<h3 style="text-decoration:none;">Introduction à la science des données : analyse des données et algorithmes de prédiction avec R</h3>
 
<p class="author">Rafael Irizarry</p>
 
<p class="author">Rafael Irizarry</p>
<p>Introduction to Data Science: Data Analysis and Prediction Algorithms with R introduces concepts and skills that can help you tackle real-world data analysis challenges. It covers concepts from probability, statistical inference, linear regression, and machine learning. It also helps you develop skills such as R programming, data wrangling, data visualization, predictive algorithm building, file organization with UNIX/Linux shell, version control with Git and GitHub, and reproducible document preparation. This book is a textbook for a first course in data science. No previous knowledge of R is necessary, although some experience with programming may be helpful. The book is divided into six parts: R, data visualization, statistics with R, data wrangling, machine learning, and productivity tools. Each part has several chapters meant to be presented as one lecture. The author uses motivating case studies that realistically mimic a data scientist's experience.</p>
+
<p>(En anglais - titre original : <strong>Introduction to data science: data analysis and prediction algorithms with R</strong>) Introduction à la science des données : analyse des données et algorithmes de prédiction avec R présente des concepts et des compétences qui peuvent vous aider à relever des défis réels en matière d'analyse de données. Il couvre les concepts de probabilité, d'inférence statistique, de régression linéaire et d'apprentissage automatique. Il vous aide également à développer des compétences telles que la programmation R, le traitement des données, la visualisation des données, la construction d'algorithmes prédictifs, l'organisation des fichiers avec le shell UNIX/Linux, le contrôle de version avec Git et GitHub, et la préparation de documents reproductibles. Ce livre est un manuel pour un premier cours de science des données. Aucune connaissance préalable de R n'est nécessaire, bien qu'une certaine expérience de la programmation puisse être utile. Le livre est divisé en six parties : R, la visualisation des données, les statistiques avec R, le traitement des données, l'apprentissage automatique et les outils de productivité. Chaque partie comporte plusieurs chapitres destinés à être présentés comme un seul cours. L'auteur utilise des études de cas motivantes qui reproduisent de manière réaliste l'expérience d'un scientifique des données.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Intro-to-functional-data-analysis.jpg|150px|Introduction to functional data analysis]]
 
[[Image:Intro-to-functional-data-analysis.jpg|150px|Introduction to functional data analysis]]
<h3 style="text-decoration:none;">Introduction to functional data analysis</h3>
+
<h3 style="text-decoration:none;">Introduction à l'analyse fonctionnelle des données</h3>
 
<p class="author">Piotr Kokoszka et Matthew Reimherr</p>
 
<p class="author">Piotr Kokoszka et Matthew Reimherr</p>
<p>Introduction to Functional Data Analysis provides a concise textbook introduction to the field. It explains how to analyze functional data, both at exploratory and inferential levels. It also provides a systematic and accessible exposition of the methodology and the required mathematical framework. The book can be used as textbook for a semester-long course on FDA for advanced undergraduate or MS statistics majors, as well as for MS and PhD students in other disciplines, including applied mathematics, environmental science, public health, medical research, geophysical sciences and economics. It can also be used for self-study and as a reference for researchers in those fields who wish to acquire solid understanding of FDA methodology and practical guidance for its implementation.</p>
+
<p>(En anglais - titre original : <strong>Introduction to functional data analysis</strong>) Introduction à l'analyse des données fonctionnelles est un manuel concis d'introduction à ce domaine. Il explique comment analyser les données fonctionnelles, tant au niveau exploratoire qu'inférentiel. Il fournit également une exposition systématique et accessible de la méthodologie et du cadre mathématique requis. Ce livre peut être utilisé comme manuel pour un cours d'un semestre sur l'AFD destiné aux étudiants de premier cycle ou de deuxième cycle en statistiques, ainsi qu'aux étudiants de deuxième et troisième cycles d'autres disciplines, notamment les mathématiques appliquées, les sciences de l'environnement, la santé publique, la recherche médicale, les sciences géophysiques et l'économie. Il peut également être utilisé en autoformation et comme référence pour les chercheurs de ces domaines qui souhaitent acquérir une solide compréhension de la méthodologie de la FDA et des conseils pratiques pour sa mise en œuvre.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 202: Line 502:
  
 
[[Image:Doing-Bayesian-data-analysis.jpg|150px|Doing Bayesian data analysis]]
 
[[Image:Doing-Bayesian-data-analysis.jpg|150px|Doing Bayesian data analysis]]
<h3 style="text-decoration:none;">Doing Bayesian data analysis: a tutorial with R, JAGS, and Stan</h3>
+
<h3 style="text-decoration:none;">Faire de l'analyse bayésienne des données : un tutoriel avec R, JAGS et Stan</h3>
 
<p class="author">John K Kruschke</p>
 
<p class="author">John K Kruschke</p>
<p>Doing Bayesian data analysis: a tutorial with R, JAGS, and Stan. Amsterdam, Academic Press.
+
<p>(En anglais - titre original : <strong>Doing Bayesian data analysis: a tutorial with R, JAGS, and Stan</strong>) Faire de l'analyse bayésienne des données propose une approche accessible de l'analyse bayésienne des données, la matière étant expliquée clairement à l'aide d'exemples concrets. Le livre commence par les bases, notamment les concepts essentiels de probabilité et d'échantillonnage aléatoire, et progresse progressivement vers des méthodes avancées de modélisation hiérarchique pour des données réalistes.</p>
Provides an accessible approach to Bayesian data analysis, as material is explained clearly with concrete examples. The book begins with the basics, including essential concepts of probability and random sampling, and gradually progresses to advanced hierarchical modeling methods for realistic data.</p>
 
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Data-assimilation.jpg|150px|Data Assimilation]]
 
[[Image:Data-assimilation.jpg|150px|Data Assimilation]]
<h3 style="text-decoration:none;">Data Assimilation: A Mathematical Introduction (Texts in Applied Mathematics Book 62)</h3>
+
<h3 style="text-decoration:none;">Assimilation des données : Une introduction mathématique</h3>
 
<p class="author">Kody Law, Andrew Stuart et Konstantinos Zygalakis</p>
 
<p class="author">Kody Law, Andrew Stuart et Konstantinos Zygalakis</p>
<p>This book provides a systematic treatment of the mathematical underpinnings of work in data assimilation, covering both theoretical and computational approaches. Specifically the authors develop a unified mathematical framework in which a Bayesian formulation of the problem provides the bedrock for the derivation, development and analysis of algorithms; the many examples used in the text, together with the algorithms which are introduced and discussed, are all illustrated by the MATLAB software detailed in the book and made freely available online. The book is organized into nine chapters: the first contains a brief introduction to the mathematical tools around which the material is organized; the next four are concerned with discrete time dynamical systems and discrete time data; the last four are concerned with continuous time dynamical systems and continuous time data and are organized analogously to the corresponding discrete time chapters. This book is aimed at mathematical researchers interested in a systematic development of this interdisciplinary field, and at researchers from the geosciences, and a variety of other scientific fields, who use tools from data assimilation to combine data with time-dependent models. </p>
+
<p>(En anglais - titre original : <strong>Data Assimilation: A Mathematical Introduction</strong>) Ce livre offre un traitement systématique des fondements mathématiques des travaux sur l'assimilation des données, couvrant à la fois les approches théoriques et informatiques. Plus précisément, les auteurs développent un cadre mathématique unifié dans lequel une formulation bayésienne du problème sert de base à la dérivation, au développement et à l'analyse des algorithmes. Les nombreux exemples utilisés dans le texte, ainsi que les algorithmes présentés et discutés, sont tous illustrés par le logiciel MATLAB détaillé dans le livre et disponible gratuitement en ligne. Le livre est organisé en neuf chapitres : le premier contient une brève introduction aux outils mathématiques autour desquels le matériel est organisé ; les quatre suivants concernent les systèmes dynamiques à temps discret et les données à temps discret ; les quatre derniers concernent les systèmes dynamiques à temps continu et les données à temps continu et sont organisés de manière analogue aux chapitres correspondants sur le temps discret. Ce livre s'adresse aux chercheurs en mathématiques intéressés par un développement systématique de ce domaine interdisciplinaire, ainsi qu'aux chercheurs des géosciences, et d'une variété d'autres domaines scientifiques, qui utilisent les outils de l'assimilation de données pour combiner des données avec des modèles dépendant du temps.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
 +
 +
<h3 style="text-decoration:none;">[https://www.lco-cdo.org/wp-content/uploads/2021/04/LCO-Regulating-AI-Critical-Issues-and-Choices-Toronto-April-2021-1.pdf Réglementer l’intelligence artificielle – Enjeux et choix essentiels] <small>PDF</small></h3>
 +
<p class="author">Commission du droit de l’Ontario</p>
 +
<p>(En anglais - titre original : <strong>Regulating AI: Critical Issues and Choice</strong>) Ce rapport constitue une analyse innovante sur la façon de réglementer les systèmes d’intelligence artificielle (IA) et de prise de décision automatisée (PDA) utilisés par les gouvernements et autres institutions publiques. Il examine les principaux choix entourant cette question, cerne les lacunes en matière de réglementation et propose un cadre exhaustif pour faire en sorte que les gouvernements ayant recours aux systèmes d’IA et de PDA protègent les droits de la personne, assurent l’application régulière de la loi et favorisent la participation du public.</p>
 +
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
  
 
[[Image:Analyse-des-donnees-textuelles.jpg|150px|Analyse des données textuelles]]
 
[[Image:Analyse-des-donnees-textuelles.jpg|150px|Analyse des données textuelles]]
Line 221: Line 525:
 
<p>(En français) L’analyse des données textuelles (ADT) permet d’explorer et de visualiser les recueils de textes les plus divers : œuvres littéraires, transcriptions d’entretien, discours politiques, dossiers de presse, documents d’archives, enquêtes en ligne avec questions ouvertes, fichiers de réclamations, sondages de satisfaction. Le présent ouvrage procède à une présentation rigoureuse des méthodes de l’ADT, qui combinent statistique exploratoire, visualisations, procédures de validation quantitative et approche qualitative.</p>
 
<p>(En français) L’analyse des données textuelles (ADT) permet d’explorer et de visualiser les recueils de textes les plus divers : œuvres littéraires, transcriptions d’entretien, discours politiques, dossiers de presse, documents d’archives, enquêtes en ligne avec questions ouvertes, fichiers de réclamations, sondages de satisfaction. Le présent ouvrage procède à une présentation rigoureuse des méthodes de l’ADT, qui combinent statistique exploratoire, visualisations, procédures de validation quantitative et approche qualitative.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 +
<br>
 
<br>
 
<br>
 
<br>
 
<br>
  
 
[[Image:Exploratory-data-analysis-with-MATLAB.jpg|150px|]]
 
[[Image:Exploratory-data-analysis-with-MATLAB.jpg|150px|]]
<h3 style="text-decoration:none;">Exploratory data analysis with MATLAB, 3rd edition</h3>
+
<h3 style="text-decoration:none;">Analyse exploratoire des données avec MATLAB, 3e édition</h3>
<p class="author">Wendy L Martinez, Angel R Martinez, and Jeffrey Solka</p>
+
<p class="author">Wendy L Martinez, Angel R Martinez, et Jeffrey Solka</p>
<p>Exploratory Data Analysis with MATLAB, Third Edition presents EDA methods from a computational perspective and uses numerous examples and applications to show how the methods are used in practice. The authors use MATLAB code, pseudo-code, and algorithm descriptions to illustrate the concepts. The MATLAB code for examples, data sets, and the EDA Toolbox are available for download on the book's website. New to the Third Edition Random projections and estimating local intrinsic dimensionality Deep learning autoencoders and stochastic neighbor embedding Minimum spanning tree and additional cluster validity indices Kernel density estimation Plots for visualizing data distributions, such as beanplots and violin plots A chapter on visualizing categorical data;The authors put a computational emphasis on the methods used to visualise and summarise data before making model assumptions to generate hypotheses. They use MATLAB code and algorithmic descriptions to provide the user with state-of-the-art techniques for finding patterns and structure in data.</p>
+
<p>(En anglais - titre original : <strong>Exploratory data analysis with MATLAB, 3rd edition</strong>) Analyse exploratoire des données avec MATLAB, 3e édition, présente les méthodes d'AED d'un point de vue informatique et utilise de nombreux exemples et applications pour montrer comment les méthodes sont utilisées en pratique. Les auteurs utilisent du code MATLAB, du pseudo-code et des descriptions d'algorithmes pour illustrer les concepts. Le code MATLAB des exemples, les ensembles de données et l'EDA Toolbox peuvent être téléchargés sur le site Web de l'ouvrage. Nouveautés de la troisième édition Projections aléatoires et estimation de la dimensionnalité intrinsèque locale Autoencodeurs d'apprentissage profond et intégration stochastique des voisins Arbre de portée minimale et indices supplémentaires de validité des clusters Estimation de la densité du noyau Graphiques de visualisation des distributions de données, tels que les diagrammes en forme de haricot et les diagrammes en forme de violon Chapitre sur la visualisation des données catégorielles;Les auteurs mettent l'accent sur les méthodes utilisées pour visualiser et résumer les données avant de faire des hypothèses de modèle pour générer des hypothèses. Ils utilisent le code MATLAB et les descriptions algorithmiques pour fournir à l'utilisateur des techniques de pointe pour trouver des modèles et des structures dans les données.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 246: Line 551:
  
 
[[Image:Open-data-structures.jpg|150px|Open data structures]]
 
[[Image:Open-data-structures.jpg|150px|Open data structures]]
<h3 style="text-decoration:none;">[https://open.umn.edu/opentextbooks/textbooks/171 Open data structures: an introduction]</h3>
+
<h3 style="text-decoration:none;">[https://open.umn.edu/opentextbooks/textbooks/171 Structures de données ouvertes : une introduction]</h3>
 
<p class="author">Pat Morin</p>
 
<p class="author">Pat Morin</p>
<p>Offered as an introduction to the field of data structures and algorithms, Open Data Structures covers the implementation and analysis of data structures for sequences (lists), queues, priority queues, unordered dictionaries, ordered dictionaries, and graphs. Focusing on a mathematically rigorous approach that is fast, practical, and efficient, Morin clearly and briskly presents instruction along with source code. Analyzed and implemented in Java, the data structures presented in the book include stacks, queues, deques, and lists implemented as arrays and linked-lists; space-efficient implementations of lists; skip lists; hash tables and hash codes; binary search trees including treaps, scapegoat trees, and red-black trees; integer searching structures including binary tries, x-fast tries, and y-fast tries; heaps, including implicit binary heaps and randomized meldable heaps; graphs, including adjacency matrix and adjacency list representations; and B-trees. A modern treatment of an essential computer science topic, Open Data Structures is a measured balance between classical topics and state-of-the art structures that will serve the needs of all undergraduate students or self-directed learners.</p>
+
<p>(En anglais - titre original : <strong>Open data structures: an introduction</strong>) Proposé comme une introduction au domaine des structures de données et des algorithmes, Structures de données ouvertes couvre l'implémentation et l'analyse des structures de données pour les séquences (listes), les files d'attente, les files d'attente prioritaires, les dictionnaires non ordonnés, les dictionnaires ordonnés et les graphes. En se concentrant sur une approche mathématiquement rigoureuse qui est rapide, pratique et efficace, Morin présente clairement et rapidement des instructions accompagnées du code source. Analysées et implémentées en Java, les structures de données présentées dans le livre comprennent les piles, les files d'attente, les déques et les listes implémentées sous forme de tableaux et de listes chaînées ; des implémentations efficaces des listes en termes d'espace ; des listes de saut ; des tables de hachage et des codes de hachage ; les arbres de recherche binaires, y compris les arbres treaps, les arbres scapegoat et les arbres red-black ; les structures de recherche d'entiers, y compris les essais binaires, les essais x-fast et les essais y-fast ; les tas, y compris les tas binaires implicites et les tas meldable randomisés ; les graphes, y compris les représentations de la matrice d'adjacence et de la liste d'adjacence ; et les B-trees. Traitement moderne d'un sujet essentiel de l'informatique, Structures de données ouvertes est un équilibre mesuré entre les sujets classiques et les structures de pointe qui répondra aux besoins de tous les étudiants de premier cycle ou des apprenants autonomes.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Intro-to-data-technologies.jpg|150px|Introduction to data technologies]]
 
[[Image:Intro-to-data-technologies.jpg|150px|Introduction to data technologies]]
<h3 style="text-decoration:none;">[https://www.stat.auckland.ac.nz/~paul/ItDT/ Introduction to data technologies]</h3>
+
<h3 style="text-decoration:none;">[https://www.stat.auckland.ac.nz/~paul/ItDT/ Introduction aux technologies des données]</h3>
 
<p class="author">Paul Murrell</p>
 
<p class="author">Paul Murrell</p>
<p>Providing key information on how to work with research data, Introduction to Data Technologiespresents ideas and techniques for performing critical, behind-the-scenes tasks that take up so much time and effort yet typically receive little attention in formal education. With a focus on computational tools, the book shows readers how to improve their awareness of what tasks can be achieved and describes the correct approach to perform these tasks. Practical examples demonstrate the most important points. The author first discusses how to write computer code using HTML as a concrete example. He then covers a variety of data storage topics, including different file formats, XML, and the structure and design issues of relational databases. After illustrating how to extract data from a relational database using SQL, the book presents tools and techniques for searching, sorting, tabulating, and manipulating data. It also introduces some very basic programming concepts as well as the R language for statistical computing.</p>
+
<p>(En anglais - titre original : <strong>Introduction to data technologies</strong>) Fournissant des informations clés sur la façon de travailler avec des données de recherche, Introduction aux technologies des donnéess présente des idées et des techniques pour effectuer des tâches critiques, en coulisses, qui prennent beaucoup de temps et d'efforts mais qui reçoivent généralement peu d'attention dans l'éducation formelle. En mettant l'accent sur les outils informatiques, le livre montre aux lecteurs comment améliorer leur prise de conscience des tâches qui peuvent être réalisées et décrit l'approche correcte pour effectuer ces tâches. Des exemples pratiques démontrent les points les plus importants. L'auteur explique d'abord comment écrire du code informatique en utilisant le langage HTML comme exemple concret. Il aborde ensuite divers sujets relatifs au stockage des données, notamment les différents formats de fichiers, le XML, ainsi que la structure et les problèmes de conception des bases de données relationnelles. Après avoir illustré comment extraire des données d'une base de données relationnelle à l'aide de SQL, le livre présente des outils et des techniques de recherche, de tri, de tabulation et de manipulation des données. Il présente également quelques concepts de programmation de base ainsi que le langage R pour le calcul statistique.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:Quantitative-bioimaging.jpg|150px|Quantitative Bioimaging]]
 
[[Image:Quantitative-bioimaging.jpg|150px|Quantitative Bioimaging]]
<h3 style="text-decoration:none;">Quantitative Bioimaging: An Introduction to Biology, Instrumentation, Experiments, and Data Analysis for Scientists and Engineers</h3>
+
<h3 style="text-decoration:none;">Bioimagerie quantitative : Une introduction à la biologie, à l'instrumentation, aux expériences et à l'analyse des données pour les scientifiques et les ingénieurs</h3>
<p class="author">Raimund J Ober, E Sally Ward, and Jerry Chao</p>
+
<p class="author">Raimund J Ober, E Sally Ward et Jerry Chao</p>
<p>Quantitative bioimaging is a broad interdisciplinary field that exploits tools from biology, chemistry, optics, and statistical data analysis for the design and implementation of investigations of biological processes. Instead of adopting the traditional approach of focusing on just one of the component disciplines, this textbook provides a unique introduction to quantitative bioimaging that presents all of the disciplines in an integrated manner. The wide range of topics covered include basic concepts in molecular and cellular biology, relevant aspects of antibody technology, instrumentation and experimental design in fluorescence microscopy, introductory geometrical optics and diffraction theory, and parameter estimation and information theory for the analysis of stochastic data.</p>
+
<p>(En anglais - titre original : <strong>Quantitative Bioimaging: An Introduction to Biology, Instrumentation, Experiments, and Data Analysis for Scientists and Engineers</strong>) La bioimagerie quantitative est un vaste domaine interdisciplinaire qui exploite les outils de la biologie, de la chimie, de l'optique et de l'analyse statistique des données pour concevoir et mettre en œuvre des études sur les processus biologiques. Au lieu d'adopter l'approche traditionnelle consistant à se concentrer sur une seule des disciplines constitutives, ce manuel offre une introduction unique à la bioimagerie quantitative qui présente toutes les disciplines d'une manière intégrée. Le large éventail de sujets abordés comprend les concepts de base de la biologie moléculaire et cellulaire, les aspects pertinents de la technologie des anticorps, l'instrumentation et la conception expérimentale en microscopie à fluorescence, l'introduction à l'optique géométrique et à la théorie de la diffraction, ainsi que l'estimation des paramètres et la théorie de l'information pour l'analyse des données stochastiques.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
[[Image:Open-gov-data-report.jpg|150px|Open Government Data Report]]
+
[[Image:Rapport-sur-les-donnees-ouvertes-publiques.jpg|150px|Open Government Data Report]]
<h3 style="text-decoration:none;">[https://www.oecd-ilibrary.org/governance/open-government-data-report_9789264305847-en Open Government Data Report: Enhancing Policy Maturity for Sustainable Impact]</h3>
+
<h3 style="text-decoration:none;">[https://www.oecd-ilibrary.org/fr/governance/rapport-sur-les-donnees-ouvertes-publiques_12ea5027-fr Rapport sur les données ouvertes publiques : Encourager la maturité des politiques de données ouvertes pour un impact durable]</h3>
<p class="author">OECD</p>
+
<p class="author">OCDE</p>
<p>This report provides an overview of the state of open data policies across OECD member and partner countries, based on data collected through the OECD Open Government Data survey (2013, 2014, 2016/17), country reviews and comparative analysis. The report analyses open data policies using an analytical framework that is in line with the OECD OUR data Index and the International Open Data Charter. It assesses governments’ efforts to enhance the availability, accessibility and re-use of open government data. It makes the case that beyond countries’ commitment to open up good quality government data, the creation of public value requires engaging user communities from the entire ecosystem, such as journalists, civil society organisations, entrepreneurs, major tech private companies and academia. The report also underlines how open data policies are elements of broader digital transformations, and how public sector data policies require interaction with other public sector agendas such as open government, innovation, employment, integrity, public budgeting, sustainable development, urban mobility and transport. It stresses the relevance of measuring open data impacts in order to support the business case for open government data.</p>
+
<p>Ce rapport offre un aperçu détaillé de l’état des politiques de données ouvertes dans les pays membres de l’OCDE et de ses partenaires, se basant principalement sur les données récoltées par les enquêtes de l’OCDE sur les données publiques ouvertes en 2013, 2014 et 2016, sur celles des revues de pays et des analyses comparatives faîtes par l’OCDE. Le rapport analyse les politiques de données ouvertes en utilisant un cadre analytique conforme à l’indice OURdata sur les données publiques ouvertes, utiles et réutilisables et à la Charte internationale des données ouvertes (International Open Data Charter). Il évalue les efforts déployés par les gouvernements pour renforcer la disponibilité, l'accessibilité et la réutilisation des données publiques ouvertes. Le rapport soutient qu’au-delà de l'engagement des pays à ouvrir des données gouvernementales de qualité, la création de valeur publique nécessite la mobilisation des différentes communautés d'utilisateurs de l'ensemble de l'écosystème, tel que les journalistes, les organisations de la société civile, les entrepreneurs, les grandes entreprises technologiques privées et les universités. Le rapport souligne également le fait que les politiques de données ouvertes sont des éléments de transformations numériques plus larges et que les politiques de données du secteur public nécessitent une interaction avec d'autres programmes publics, tels que celles du gouvernement ouvert, de l'innovation, l'emploi, l'intégrité, la budgétisation publique, le développement durable, la mobilité urbaine et les transports. Il met aussi l’accent sur la pertinence de mesurer les impacts des données ouvertes afin de soutenir l'analyse de rentabilisation (i.e. le business case) des données publiques ouvertes.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
  
 
[[Image:Good-practice-principles-for-data-ethics-in-the-public-sector.png|150px|Good Practice Principles for Data Ethics in the Public Sector]]
 
[[Image:Good-practice-principles-for-data-ethics-in-the-public-sector.png|150px|Good Practice Principles for Data Ethics in the Public Sector]]
<h3 style="text-decoration:none;">[https://www.oecd.org/gov/digital-government/good-practice-principles-for-data-ethics-in-the-public-sector.htm Good Practice Principles for Data Ethics in the Public Sector]</h3>
+
<h3 style="text-decoration:none;">[https://www.oecd.org/gov/digital-government/good-practice-principles-for-data-ethics-in-the-public-sector.htm Principes de bonnes pratiques pour l'éthique des données dans le secteur public]</h3>
<p class="author">OECD Digital Government and Data Unit</p>
+
<p class="author">Division des données et gouvernement données numériques de l'OCDE</p>
<p>Taking values-based common actions that place human rights at the core of digital government and data policies. The Good Practice Principles for Data Ethics in the Public Sector support the ethical use of data in digital government projects, products, and services to ensure they are worthy of citizens' trust. The document introduces 10 Good Practice Principles for Data Ethics in the Public Sector, including a set of specific actions which can support their implementation.</p>
+
<p>(En anglais - titre original : <strong>Good Practice Principles for Data Ethics in the Public Sector</strong>) Prendre des mesures communes fondées sur des valeurs qui placent les droits de l'homme au cœur des politiques en matière de gouvernement numérique et de données. Les principes de bonnes pratiques pour l'éthique des données dans le secteur public soutiennent l'utilisation éthique des données dans les projets, produits et services du gouvernement numérique afin de garantir qu'ils sont dignes de la confiance des citoyens. Le document présente 10 principes de bonnes pratiques pour l'éthique des données dans le secteur public, y compris une série d'actions spécifiques qui peuvent soutenir leur mise en œuvre.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 282: Line 587:
  
 
[[Image:Intro-to-hierarchical-bayesian-modeling-for-ecological-data.jpg|150px|Introduction to hierarchical Bayesian modeling for ecological data]]
 
[[Image:Intro-to-hierarchical-bayesian-modeling-for-ecological-data.jpg|150px|Introduction to hierarchical Bayesian modeling for ecological data]]
<h3 style="text-decoration:none;">Introduction to hierarchical Bayesian modeling for ecological data</h3>
+
<h3 style="text-decoration:none;">Introduction à la modélisation bayésienne hiérarchique pour les données écologiques</h3>
 
<p class="author">Eric Parent et Etienne Rivot</p>
 
<p class="author">Eric Parent et Etienne Rivot</p>
<p>Making statistical modeling and inference more accessible to ecologists and related scientists, Introduction to Hierarchical Bayesian Modeling for Ecological Datagives readers a flexible and effective framework to learn about complex ecological processes from various sources of data. It also helps readers get started on building their own statistical models. The text begins with simple models that progressively become more complex and realistic through explanatory covariates and intermediate hidden states variables. When fitting the models to data, the authors gradually present the concepts and techniques of the Bayesian paradigm from a practical point of view using real case studies. They emphasize how hierarchical Bayesian modeling supports multidimensional models involving complex interactions between parameters and latent variables. Data sets, exercises, and R and WinBUGS codes are available on the authors' website. This book shows how Bayesian statistical modeling provides an intuitive way to organize data, test ideas, investigate competing hypotheses, and assess degrees of confidence of predictions. It also illustrates how conditional reasoning can dismantle a complex reality into more understandable pieces. As conditional reasoning is intimately linked with Bayesian thinking, considering hierarchical models within the Bayesian setting offers a unified and coherent framework for modeling, estimation, and prediction.</p>
+
<p>(En anglais - titre original : <strong>Introduction to hierarchical Bayesian modeling for ecological data</strong>) Rendant la modélisation et l'inférence statistiques plus accessibles aux écologistes et aux scientifiques connexes, Introduction à la modélisation bayésienne hiérarchique pour les données écologiques offre aux lecteurs un cadre souple et efficace pour apprendre à connaître les processus écologiques complexes à partir de diverses sources de données. Il aide également les lecteurs à commencer à construire leurs propres modèles statistiques. Le texte commence par des modèles simples qui deviennent progressivement plus complexes et réalistes grâce à des covariables explicatives et des variables intermédiaires à états cachés. Lors de l'ajustement des modèles aux données, les auteurs présentent progressivement les concepts et techniques du paradigme bayésien d'un point de vue pratique à l'aide d'études de cas réels. Ils soulignent comment la modélisation bayésienne hiérarchique prend en charge les modèles multidimensionnels impliquant des interactions complexes entre les paramètres et les variables latentes. Des ensembles de données, des exercices et des codes R et WinBUGS sont disponibles sur le site Web des auteurs. Ce livre montre comment la modélisation statistique bayésienne offre un moyen intuitif d'organiser les données, de tester des idées, d'étudier des hypothèses concurrentes et d'évaluer le degré de confiance des prédictions. Il illustre également comment le raisonnement conditionnel peut démanteler une réalité complexe en morceaux plus compréhensibles. Le raisonnement conditionnel étant intimement lié à la pensée bayésienne, la prise en compte des modèles hiérarchiques dans le cadre bayésien offre un cadre unifié et cohérent pour la modélisation, l'estimation et la prédiction.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 290: Line 595:
  
 
[[Image:Statistical-and-machine-learning-data-mining.jpg|150px|Statistical and machine-learning data mining]]
 
[[Image:Statistical-and-machine-learning-data-mining.jpg|150px|Statistical and machine-learning data mining]]
<h3 style="text-decoration:none;">Statistical and machine-learning data mining: techniques for better predictive modeling and analysis of big data</h3>
+
<h3 style="text-decoration:none;">Extraction de données statistiques et d'apprentissage automatique : techniques pour une meilleure modélisation prédictive et une meilleure analyse des données volumineuses</h3>
 
<p class="author">Bruce Ratner</p>
 
<p class="author">Bruce Ratner</p>
<p>Focusing on uniquely large-scale statistical models that effectively consider big data identifying structures (variables) with the appropriate predictive power in order to yield reliable, robust, relevant large scale analyses, this edition incorporates 13 chapters, as well as explanations of the author's own GenIQ model.</p>
+
<p>(En anglais - titre original : <strong>Statistical and machine-learning data mining: techniques for better predictive modeling and analysis of big data</strong>) Axée sur des modèles statistiques à grande échelle uniques qui prennent efficacement en compte les structures d'identification des big data (variables) avec le pouvoir prédictif approprié afin de produire des analyses à grande échelle fiables, robustes et pertinentes, cette édition comprend 13 chapitres, ainsi que des explications sur le modèle GenIQ propre à l'auteur.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 300: Line 605:
  
 
[[Image:Shifting-the-balance.jpg|150px|Shifting the Balance]]
 
[[Image:Shifting-the-balance.jpg|150px|Shifting the Balance]]
<h3 style="text-decoration:none;">Shifting the Balance: How Top Organizations Beat the Competition by Combining Intuition with Data</h3>
+
<h3 style="text-decoration:none;">Modifier l'équilibre : Comment les meilleures organisations battent la concurrence en combinant l'intuition et les données</h3>
 
<p class="author">Mark Schrutt</p>
 
<p class="author">Mark Schrutt</p>
<p>Digital transformation expert Mark Schrutt reveals how the world's top companies are using vast amounts of data to inform their decisions, disrupt industries, and get closer to their customers. Businesses that continue to rely only on intuition do so at their peril. What if you had the data you always wanted and could tell what was truly an emerging trend that would forever change your industry? Shifting the Balance analyzes the turn towards data-driven decision-making and describes how best-in-class organizations use data to shift their field of vision so it is forward-looking instead of reactive.</p>
+
<p>(En anglais - titre original : <strong>Shifting the Balance: How Top Organizations Beat the Competition by Combining Intuition with Data</strong>) Mark Schrutt, expert en transformation numérique, révèle comment les plus grandes entreprises du monde utilisent de grandes quantités de données pour éclairer leurs décisions, perturber les industries et se rapprocher de leurs clients. Les entreprises qui continuent à ne se fier qu'à leur intuition le font à leurs risques et périls. Et si vous disposiez des données dont vous avez toujours rêvé et pouviez dire quelle est la véritable tendance émergente qui va changer à jamais votre secteur ? Modifier l'équilibre analyse le virage vers la prise de décision basée sur les données et décrit comment les organisations les plus performantes utilisent les données pour modifier leur champ de vision afin qu'il soit tourné vers l'avenir plutôt que réactif.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
Line 308: Line 613:
  
 
[[Image:Data-mining-with-R.jpg|150px|Data Mining with R: Learning with Case Studies]]
 
[[Image:Data-mining-with-R.jpg|150px|Data Mining with R: Learning with Case Studies]]
<h3 style="text-decoration:none;">Data Mining with R: Learning with Case Studies, Second Edition</h3>
+
<h3 style="text-decoration:none;">Data Mining avec R : Apprendre avec des études de cas, deuxième édition</h3>
 
<p class="author">Luis Torgo</p>
 
<p class="author">Luis Torgo</p>
<p>Data Mining with R: Learning with Case Studies, Second Edition uses practical examples to illustrate the power of R and data mining. Providing an extensive update to the best-selling first edition, this new edition is divided into two parts. The first part will feature introductory material, including a new chapter that provides an introduction to data mining, to complement the already existing introduction to R. The second part includes case studies, and the new edition strongly revises the R code of the case studies making it more up-to-date with recent packages that have emerged in R. The book does not assume any prior knowledge about R. Readers who are new to R and data mining should be able to follow the case studies, and they are designed to be self-contained so the reader can start anywhere in the document. The book is accompanied by a set of freely available R source files that can be obtained at the book’s web site. These files include all the code used in the case studies, and they facilitate the "do-it-yourself" approach followed in the book. Designed for users of data analysis tools, as well as researchers and developers, the book should be useful for anyone interested in entering the "world" of R and data mining.</p>
+
<p>(En anglais - titre original : <strong>Data Mining with R: Learning with Case Studies, Second Edition</strong>) Data Mining avec R utilise des exemples pratiques pour illustrer la puissance de R et du data mining. Cette nouvelle édition, qui constitue une mise à jour complète de la première édition best-seller, est divisée en deux parties. La première partie comprend des éléments d'introduction, dont un nouveau chapitre d'introduction à l'exploration de données, qui vient compléter l'introduction à R déjà existante. La deuxième partie comprend des études de cas, et la nouvelle édition révise fortement le code R des études de cas afin de le mettre à jour avec les paquets récents qui sont apparus dans R. Le livre ne suppose aucune connaissance préalable de R. Les lecteurs qui ne connaissent pas R et l'exploration de données devraient être en mesure de suivre les études de cas, et celles-ci sont conçues pour être autonomes afin que le lecteur puisse commencer n'importe où dans le document. Le livre est accompagné d'un ensemble de fichiers sources R librement disponibles, qui peuvent être obtenus sur le site Web du livre. Ces fichiers comprennent tout le code utilisé dans les études de cas et facilitent l'approche &laquo; do-it-yourself &raquo; suivie dans le livre. Conçu pour les utilisateurs d'outils d'analyse de données, ainsi que pour les chercheurs et les développeurs, ce livre devrait être utile à toute personne souhaitant entrer dans le &laquo; monde &raquo; de R et de l'exploration de données.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:R-for-political-data-science.jpg|150px|R for Political Data Science: A Practical Guide]]
 
[[Image:R-for-political-data-science.jpg|150px|R for Political Data Science: A Practical Guide]]
<h3 style="text-decoration:none;">R for Political Data Science: A Practical Guide</h3>
+
<h3 style="text-decoration:none;">R pour la science des données politiques : Un guide pratique</h3>
 
<p class="author">Francisco Urdinez et Andrés Cruz (éditeurs)</p>
 
<p class="author">Francisco Urdinez et Andrés Cruz (éditeurs)</p>
<p>R for Political Data Science: A Practical Guide is a handbook for political scientists new to R who want to learn the most useful and common ways to interpret and analyze political data. It was written by political scientists, thinking about the many real-world problems faced in their work. The book has 16 chapters and is organized in three sections. The first, on the use of R, is for those users who are learning R or are migrating from another software. The second section, on econometric models, covers OLS, binary and survival models, panel data, and causal inference. The third section is a data science toolbox of some the most useful tools in the discipline: data imputation, fuzzy merge of large datasets, web mining, quantitative text analysis, network analysis, mapping, spatial cluster analysis, and principal component analysis. As the title suggests, this book is highly applied in nature, and is designed as a toolbox for the reader. It can be used in methods and data science courses, at both the undergraduate and graduate levels. It will be equally useful for a university student pursuing a PhD, political consultants, or a public official, all of whom need to transform their datasets into substantive and easily interpretable conclusions.</p>
+
<p>(En anglais - titre original : <strong>R for Political Data Science: A Practical Guide</strong>) R pour la science des données politiques : Un guide pratique est un manuel destiné aux politologues novices en R qui souhaitent apprendre les méthodes les plus utiles et les plus courantes pour interpréter et analyser les données politiques. Il a été écrit par des politologues, en pensant aux nombreux problèmes du monde réel rencontrés dans leur travail. Le livre comporte 16 chapitres et est organisé en trois sections. La première, sur l'utilisation de R, s'adresse aux utilisateurs qui apprennent R ou qui migrent d'un autre logiciel. La deuxième section, consacrée aux modèles économétriques, couvre les MCO, les modèles binaires et de survie, les données de panel et l'inférence causale. La troisième section est une boîte à outils de science des données contenant certains des outils les plus utiles de la discipline : imputation de données, fusion floue de grands ensembles de données, exploration du Web, analyse quantitative de texte, analyse de réseau, cartographie, analyse spatiale en grappes et analyse en composantes principales. Comme le suggère le titre, ce livre est très appliqué par nature et est conçu comme une boîte à outils pour le lecteur. Il peut être utilisé dans le cadre de cours de méthodologie et de science des données, tant au niveau du premier cycle que du deuxième cycle. Il sera également utile à un étudiant universitaire poursuivant un doctorat, à des consultants politiques ou à un fonctionnaire, qui ont tous besoin de transformer leurs ensembles de données en conclusions substantielles et facilement interprétables.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
<br>
  
 
[[Image:The-social-dynamics-of-open-data.jpg|150px|The Social Dynamics of Open Data]]
 
[[Image:The-social-dynamics-of-open-data.jpg|150px|The Social Dynamics of Open Data]]
<h3 style="text-decoration:none;">The Social Dynamics of Open Data</h3>
+
<h3 style="text-decoration:none;">La dynamique sociale des données ouvertes</h3>
 
<p class="author">François van Schalkwyk, Stefaan G Verhulst et Gustavo Magalhaes</p>
 
<p class="author">François van Schalkwyk, Stefaan G Verhulst et Gustavo Magalhaes</p>
<p>The Social Dynamics of Open Data is a collection of peer reviewed papers presented at the 2nd Open Data Research Symposium (ODRS) held in Madrid, Spain, on 5 October 2016. Research is critical to developing a more rigorous and fine-combed analysis not only of why open data is valuable, but how it is valuable and under what specific conditions. The objective of the Open Data Research Symposium and the subsequent collection of chapters published here is to build such a stronger evidence base. This base is essential to understanding what open data's impacts have been to date, and how positive impacts can be enabled and amplified. Consequently, common to the majority of chapters in this collection is the attempt by the authors to draw on existing scientific theories, and to apply them to open data to better explain the socially embedded dynamics that account for open data's successes and failures in contributing to a more equitable and just society. </p>
+
<p>(En anglais - titre original : <strong>The Social Dynamics of Open Data</strong>) La dynamique sociale des données ouvertes est un recueil d'articles évalués par les pairs présentés lors du 2e symposium de recherche sur les données ouvertes (ODRS) qui s'est tenu à Madrid, en Espagne, le 5 octobre 2016. La recherche est essentielle pour développer une analyse plus rigoureuse et plus fine non seulement des raisons pour lesquelles les données ouvertes sont précieuses, mais aussi de la manière dont elles le sont et dans quelles conditions spécifiques. L'objectif du Symposium de recherche sur les données ouvertes et du recueil de chapitres qui en découle et qui est publié ici est de construire une telle base de preuves plus solide. Cette base est essentielle pour comprendre quels ont été les impacts des données ouvertes à ce jour, et comment les impacts positifs peuvent être activés et amplifiés. Par conséquent, le point commun à la majorité des chapitres de cette collection est la tentative des auteurs de s'appuyer sur les théories scientifiques existantes et de les appliquer aux données ouvertes afin de mieux expliquer la dynamique socialement intégrée qui explique les succès et les échecs des données ouvertes dans la contribution à une société plus équitable et plus juste.</p>
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
 
 
<!-- *** ARTICLES + POSTS *** -->
 
 
 
<h2>Articles and posts</h2>
 
<h3 style="text-decoration:none;">[https://derekalton.medium.com/building-a-framework-to-grow-ecosystems-a-rough-rough-draft-7b93ad73ed08 Building a framework to grow ecosystems… a rough rough draft]</h3>
 
<p class="author">Derek Alton</p>
 
<p>Any ecosystem starts with a base foundation. These are the rivers and streams, the mountains and earth, the sun, rain and general climate. It is from this base foundation that an ecosystem grows. This foundation needs to have some level of sustainability for life to take hold. Likewise a social ecosystem requires a base infrastructure that is stable and secure to develop on. This could be physical infrastructure like roads and buildings with electricity and hydro but since we live now in a digital age, this is increasingly digital infrastructure: things like broadband connection and the world wide web (and all the protocols that underpin it). It is important to understand what infrastructure is required for your ecosystem to thrive and make sure it is sustainably available.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://medium.com/opendatacharter/spotlight-a-plea-from-the-odcs-iwg-data-standardisation-matters-4d26329a18bb A plea from the ODC’s IWG: Data standardisation matters]</h3>
 
<p class="author">Darine Benkalha</p>
 
<p>A re-cap of ODC’s Implementation Working Group meeting held last September 2021.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/en/data-science/network/data-visualizations Creating Compelling Data Visualizations]</h3>
 
<p class="author">Alden Chen, Statistique Canada</p>
 
<p>Data visualization is a key component in many data science projects. For some stakeholders, especially subject matter experts and executives who may not be technical experts, it is the primary avenue by which they see, understand and interact with data projects. Consequently, it is important that visualizations communicate insights as clearly as possible. But too often, visualizations are hindered by some common flaws that make them difficult to interpret, or worse yet, are misleading. This article will review three common visualization pitfalls that both data communicators and data consumers should understand, as well as some practical suggestions for getting around them.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/en/data-science/resources Data science resources]</h3>
 
<p class="author">from the Data Science Network for the Federal Public Service</p>
 
<p>For data science enthusiasts: Find resources, training, tools, and communities.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.statcan.gc.ca/eng/data-science/network/automated-systems Responsible use of automated decision systems in the federal government]</h3>
 
<p class="author">Benoit Deshaies, Treasury Board of Canada Secretariat, et Dawn Hall, Treasury Board of Canada Secretariat</p>
 
<p>Data scientists play an important role in assessing data quality and building models to support automated decision systems. An understanding of when the Directive on Automated Decision-Making applies and how to meet its requirements can support the ethical and responsible use of these systems. In particular, the explanation requirement and the guidance (Guidance on Service and Digital, section 4.5.3.) from the Treasury Board of Canada Secretariat (TBS) on model selection are of high relevance to data scientists.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://ec.europa.eu/isa2/eif_en The New European Interoperability Framework]</h3>
 
<p class="author">European Commission</p>
 
<p>The European Interoperability Framework (EIF) is part of the Communication (COM(2017)134) from the European Commission adopted on 23 March 2017. The framework gives specific guidance on how to set up interoperable digital public services.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://towardsdatascience.com/how-i-would-learn-data-science-if-i-had-to-start-over-f3bf0d27ca87 How I Would Learn Data Science (If I Had to Start Over)]</h3>
 
<p class="author">Ken Jee, sur Towards Data Science</p>
 
<p>Lessons learned from my data science journey.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.mccarthy.ca/fr/references/blogues/techlex/le-projet-de-loi-95-de-la-volonte-de-letat-quebecois-de-permettre-un-acces-et-une-utilisation-optimale-de-ses-donnees Le projet de loi 95 : De la volonté de l’État québécois de permettre un accès et une utilisation optimale de ses données]</h3>
 
<p class="author">Karine Joizil</p>
 
<p>(En français) Dans le monde de la recherche, cette réforme était souhaitée depuis longtemps notamment par le Scientifique en chef du Québec et les fonds de recherche pour qui l’accès à ces données sera d’une grande utilité.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.lco-cdo.org/wp-content/uploads/2021/04/LCO-Regulating-AI-Critical-Issues-and-Choices-Toronto-April-2021-1.pdf Regulating AI: Critical Issues and Choice] <small>PDF</small></h3>
 
<p class="author">Law Commission of Ontario</p>
 
<p>This paper identifies a series of important legal and policy issues that Canadian policymakers should consider when contemplating regulatory framework(s) for AI and ADM systems that aid government decision-making.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.stateofopendata.od4d.net/ State of Open Data]</h3>
 
<p class="author">Tim Davies, Stephen B Walker, et Mor Rubinstein, sur Open Data for Development</p>
 
<p>It’s been ten years since open data first broke onto the global stage. Over the past decade, thousands of programmes and projects around the world have worked to open data and use it to address a myriad of social and economic challenges. Meanwhile, issues related to data rights and privacy have moved to the centre of public and political discourse. As the open data movement enters a new phase in its evolution, shifting to target real-world problems and embed open data thinking into other existing or emerging communities of practice, big questions still remain.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://arxiv.org/abs/1811.10154 Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead]</h3>
 
<p class="author">Cynthia Rudin</p>
 
<p>Black box machine learning models are currently being used for high-stakes decision making throughout society, causing problems in healthcare, criminal justice and other domains. Some people hope that creating methods for explaining these black box models will alleviate some of the problems, but trying to explain black box models, rather than creating models that are interpretable in the first place, is likely to perpetuate bad practice and can potentially cause great harm to society. The way forward is to design models that are inherently interpretable. This Perspective clarifies the chasm between explaining black boxes and using inherently interpretable models, outlines several key reasons why explainable black boxes should be avoided in high-stakes decisions, identifies challenges to interpretable machine learning, and provides several example applications where interpretable models could potentially replace black box models in criminal justice, healthcare and computer vision.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<!-- *** WEBSITES *** -->
 
 
 
<h2>Websites</h2>
 
<h3 style="text-decoration:none;">[https://data2x.org/ Data2x]</h3>
 
<p>Important data about women and girls is incomplete or missing. Through partnerships with UN agencies, governments, civil society, academics, and the private sector, Data2X is working for change.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.reddit.com/r/dataisbeautiful/top/?t=all /r/DataIsBeautiful]</h3>
 
<p class="author">sur Reddit</p>
 
<p>DataIsBeautiful is for visualizations that effectively convey information. Aesthetics are an important part of information visualization, but pretty pictures are not the sole aim of this subreddit.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://open.canada.ca/en Government of Canada Open Government]</h3>
 
<p>Open Government is about making government more accessible to everyone. Participate in conversations, find data and digital records, and learn about open government.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://informationisbeautiful.net/ Information is beautiful]</h3>
 
<p class="author">David McCandless</p>
 
<p>Data, information, knowledge: we distil it into beautiful, useful graphics & diagrams. Information is Beautiful is dedicated to helping you make clearer, more informed decisions about the world. All our visualizations are based on facts and data: constantly updated, revised and revisioned.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://opendatacharter.net/ International Open Data Charter]</h3>
 
<p>The Open Data Charter is a collaboration between over 150 governments and organisations working to open up data based on a shared set of principles. We promote policies and practices that enable governments and CSOs to collect, share, and use well-governed data, to respond effectively and accountably to the following focus areas: anti-corruption, climate action and pay equity.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.oecd-ilibrary.org/science-and-technology/oecd-digital-economy-papers_20716826 OECD Digital Economy Papers]</h3>
 
<p>The OECD Directorate for Science, Technology and Innovation (STI) undertakes a wide range of activities to better understand how information and communication technologies (ICTs) contribute to sustainable economic growth and social well-being. The OECD Digital Economy Papers series covers a broad range of ICT-related issues and makes selected studies available to a wider readership. They include policy reports, which are officially declassified by an OECD Committee, and occasional working papers, which are meant to share early knowledge.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.oecd.org/gov/digital-government/open-government-data.htm OECD Open Government data]</h3>
 
<p>Open Government Data (OGD) is a philosophy- and increasingly a set of policies - that promotes transparency, accountability and value creation by making government data available to all. Public bodies produce and commission huge quantities of data and information. By making their datasets available, public institutions become more transparent and accountable to citizens. By encouraging the use, reuse and free distribution of datasets, governments promote business creation and innovative, citizen-centric services.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://theodi.org/ Open Data Institute]</h3>
 
<p>The ODI is a non-profit with a mission to work with companies and governments to build an open, trustworthy data ecosystem. We work with a range of organisations, governments, public bodies and civil society to create a world where data works for everyone.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.opengovpartnership.org/ Open Government Partnership]</h3>
 
<p>In 2011, government leaders and civil society advocates came together to create a unique partnership—one that combines these powerful forces to promote transparent, participatory, inclusive and accountable governance. Seventy-eight countries and seventy-six local governments — representing more than two billion people — along with thousands of civil society organizations are members of the Open Government Partnership (OGP).</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://www.data.gov/ US Government Open Data]</h3>
 
<p>Find data, tools, and resources to conduct research, develop web and mobile applications, design data visualizations, and more.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
 
<h3 style="text-decoration:none;">[https://data.worldbank.org/ World Bank Open Data]</h3>
 
<p>Free and open access to global development data.</p>
 
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<!-- *** TOOLS *** -->
 
 
<h2>Tools</h2>
 
 
[[Image:Data-interoperatiblity_guide-UN.png|150px|Data Interoperability Guide]]
 
<h3 style="text-decoration:none;">[https://unstats.un.org/wiki/display/InteropGuide/Introduction Data Interoperability Guide]</h3>
 
<p class="author">Luis Gonzalez, sur UN Statistics Wiki</p>
 
<p>Over the years, countless systems that do not talk to one another have been created within and across organizations for the purposes of collecting, processing and disseminating data for development. With the proliferation of different technology platforms, data definitions and institutional arrangements for managing, sharing and using data, it has become increasingly necessary to dedicate resources to integrate the data necessary to support policy-design and decision-making. Interoperability is the ability to join-up and merge data without losing meaning (JUDS 2016). In practice, data is said to be interoperable when it can be easily re-used and processed in different applications, allowing different information systems to work together. Interoperability is a key enabler for the development sector to become more data-driven.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
<h3 style="text-decoration:none;">[http://opendatatoolkit.worldbank.org/en/index.html Starting an Open Data Initiative]</h3>
 
<p class="author">from Worldbank</p>
 
<p>The Open Government Data Toolkit is designed to help governments, Bank staff and users understand the basic precepts of Open Data, then get “up to speed” in planning and implementing an open government data program, while avoiding common pitfalls.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
[[Image:Data-Ethics-Canvas.jpg|150px|The Data Ethics Canvas]]
 
<h3 style="text-decoration:none;">[https://theodi.org/article/the-data-ethics-canvas-2021/ The Data Ethics Canvas]</h3>
 
<p class="author">Dave Tarrant, James Maddison et Olivier Thereaux</p>
 
<p>The Data Ethics Canvas is a tool for anyone who collects, shares or uses data. It helps identify and manage ethical issues – at the start of a project that uses data, and throughout. It encourages you to ask important questions about projects that use data, and reflect on the responses. The Data Ethics Canvas provides a framework to develop ethical guidance that suits any context, whatever the project’s size or scope.</p>
 
<p class="recco">Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.</p>
 
 
<br>
 
<br>
  
<!-- *** PEOPLE *** -->
 
 
<!--<h2>People to follow</h2>
 
<h3 style="text-decoration:none;">This</h3>
 
<p>Description</p>
 
<h3 style="text-decoration:none;">That</h3>
 
<p>Description</p>-->
 
 
<!-- *** NEWSLETTERS + BLOGS *** -->
 
 
<h2>Newsletters and blogs</h2>
 
[[Image:The-AI-ethics-brief-newsletter.PNG|150px|The AI Ethics Brief]]
 
<h3 style="text-decoration:none;">[https://brief.montrealethics.ai/ The AI Ethics Brief]</h3>
 
<p class="author">Montreal AI Ethics Institute</p>
 
<p>The Montreal AI Ethics Institute is an international non-profit organization democratizing AI ethics literacy. Subscribe to get full access to the newsletter and have the latest from the field of AI ethics delivered right to your inbox every week. Never miss an update from the work being done at the Montreal AI Ethics Institute and our thoughts on research and development in the field from around the world.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
 
<!-- *** PODCASTS *** -->
 
 
<h2>Podcasts</h2>
 
[[Image:Women-in-data-science-podcast.PNG|150px|Women in Data Science podcast, Stanford University]]
 
<h3 style="text-decoration:none;">[https://www.widsconference.org/podcast.html Women in Data Science podcast]</h3>
 
<p>Leading women in data science share their work, advice, and lessons learned along the way with Professor Margot Gerritsen from Stanford University. Hear about how data science is being applied and having impact across a wide range of domains, from healthcare to finance to cosmology to human rights and more.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
 
[[Image:Data-sceptic-podcast.PNG|150px|Data Skeptic podcast]]
 
<h3 style="text-decoration:none;">[https://dataskeptic.com/ Data Skeptic podcast]</h3>
 
<p>Your trusted podcast, centered on data science, machine learning, and artificial intelligence.</p>
 
<p class="recco">Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.</p>
 
<br>
 
 
<!--FOOTER-->
 
<!--FOOTER-->
 
<br>
 
<br>

Latest revision as of 13:31, 21 February 2023

English

Conférence sur les données 2022: Valoriser les données et leur interprétation pour servir la population canadienne, 23 + 24 février 2022

Exposition virtuelle  |   Ordre du jour  |   Conférenciers  |   Objectifs de réseautage  |   Découvrez-en plus sur les données 2023  |   Annonces

Présenté par Statistique Canada et l'École de la fonction publique du Canada avec le soutien de la Communauté des données du GC.

Découvrez plus sur les données

Il nous manque quelque chose ? Envoyez-nous les détails : Communauté des données du GC

Apprentissage

Discover Data series

Série Découverte : Découvrez les données de l'Académie du numérique

Une introduction aux données au gouvernement du Canada : Découvrez comment la révolution des données façonne le gouvernement d'aujourd'hui et comment l'utilisation efficace des données crée des possibilités d'améliorer les programmes et les services pour les Canadiens.

Évaluer son niveau de littératie des données (En ligne, à rythme libre)

Un guide autodirigé pour comprendre les données (En ligne, à rythme libre)

Le rôle des données dans un gouvernement numérique (Classe virtuelle)

Recommandé par l'École de la fonction publique du Canada, un partenaire de la Communauté des données du GC.

Académie du numérique

L'École de la fonction publique du Canada (EFPC) a créé l'Académie du numérique de l'EFPC en 2018. L'objectif de ce secteur d'activité est d'apprendre aux fonctionnaires fédéraux du Canada les compétences, les approches et les mentalités numériques nécessaires pour transformer les services publics en cette ère numérique. L'Académie du numérique soutient les principes de l'initiative Au-delà de 2020 pour un milieu de travail agile, inclusif et mieux outillé, et milite pour une approche axée sur la numérique qui s'harmonise aux normes numériques du gouvernement du Canada.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

École de la fonction publique du Canada Catalogue d'apprentissage

Consultez le catalogue complet de l'École, qui propose des cours, des événements, des programmes et des outils d'apprentissage. Pour voir les produits d'apprentissage recommandés par thème ou par communauté, consultez nos parcours d'apprentissage.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Initiative de formation sur la littératie des données de Statistique Canada

La littératie des données est la capacité de tirer des renseignements utiles des données. Elle met l'accent sur les compétences nécessaires pour travailler avec les données, y compris les connaissances et les compétences requises pour les lire, les analyser, les interpréter, les visualiser et les communiquer ainsi que pour comprendre comment elles sont utilisées dans la prise de décisions.

  • Compétences en littératie des données: Les compétences en matière de littératie des données sont les compétences et les connaissances dont vous avez besoin pour travailler efficacement avec les données.
  • Cheminement des données: Le cheminement des données représente les étapes clés du processus appliqué aux données, allant de la recherche et de l'exploration des données jusqu'à la présentation de l'histoire des données.
  • Catalogue d'apprentissage: Formation sur la littératie des données disponible de Statistique Canada.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.


Articles

Arrêtez d'expliquer les modèles d'apprentissage automatique de la boîte noire pour les décisions à fort enjeu et utilisez plutôt des modèles interprétables

Cynthia Rudin

(En anglais - titre original : Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead) Des modèles d'apprentissage automatique en boîte noire sont actuellement utilisés pour des prises de décision à fort enjeu dans toute la société, causant des problèmes dans les soins de santé, la justice pénale et d'autres domaines. Certaines personnes espèrent que la création de méthodes permettant d'expliquer ces modèles boîte noire atténuera certains des problèmes, mais essayer d'expliquer les modèles boîte noire, plutôt que de créer des modèles interprétables en premier lieu, risque de perpétuer les mauvaises pratiques et peut potentiellement causer un grand tort à la société. La voie à suivre consiste à concevoir des modèles qui sont intrinsèquement interprétables. Cette perspective clarifie le gouffre entre l'explication des boîtes noires et l'utilisation de modèles intrinsèquement interprétables, souligne plusieurs raisons clés pour lesquelles les boîtes noires explicables devraient être évitées dans les décisions à fort enjeu, identifie les défis de l'apprentissage automatique interprétable et fournit plusieurs exemples d'applications où les modèles interprétables pourraient potentiellement remplacer les modèles de boîtes noires dans la justice pénale, les soins de santé et la vision par ordinateur.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Cadre d’interopérabilité européen– Stratégie de mise en oeuvre

Commission européenne

Le cadre d'interopérabilité européen (CIR) fait partie de la communication (COM(2017)134) de la Commission européenne adoptée le 23 mars 2017. Ce cadre donne des orientations spécifiques sur la manière de mettre en place des services publics numériques interopérables.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Comment j'apprendrais la science des données (si je devais recommencer)

Ken Jee, sur Towards Data Science

(En anglais - titre original : How I Would Learn Data Science (If I Had to Start Over)) Lessons learned from my data science journey.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Créer des visualisations de données convaincantes

Alden Chen, Statistique Canada

La visualisation des données est un élément clé de nombreux projets de science des données. Pour certains intervenants, notamment les spécialistes du domaine et les cadres qui ne sont pas nécessairement des experts techniques, il s'agit de la principale voie par laquelle ils voient, comprennent et interagissent avec les projets de données. Par conséquent, il est important que les visualisations communiquent des renseignements aussi clairement que possible. Trop souvent, les visualisations sont entravées par certains défauts courants qui les rendent difficiles à interpréter ou, pire encore, sont trompeuses. Cet article passe en revue trois pièges courants de la visualisation que les communicateurs de données et les consommateurs de données devraient comprendre, ainsi que quelques suggestions pratiques pour les contourner.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Construire un cadre pour faire croître les écosystèmes... une ébauche sommaire

Derek Alton

(En anglais - titre original : Building a framework to grow ecosystems… a rough rough draft) Tout écosystème commence par un socle de base. Ce sont les rivières et les ruisseaux, les montagnes et la terre, le soleil, la pluie et le climat général. C'est à partir de cette base qu'un écosystème se développe. Cette base doit présenter un certain niveau de durabilité pour que la vie s'installe. De même, un écosystème social a besoin d'une infrastructure de base stable et sûre pour se développer. Il peut s'agir d'une infrastructure physique telle que des routes et des bâtiments alimentés en électricité et en énergie hydraulique, mais comme nous vivons à l'ère du numérique, il s'agit de plus en plus d'une infrastructure numérique : des éléments tels que la connexion à large bande et le World Wide Web (et tous les protocoles qui le sous-tendent). Il est important de comprendre quelles sont les infrastructures nécessaires à la prospérité de votre écosystème et de veiller à ce qu'elles soient durablement disponibles.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Détournement et paiement du prix - Pourquoi les gangs de rançongiciels devraient être considérés comme des terroristes

Melissa Hathaway

(En anglais - titre original : Hijacked and Paying the Price - Why Ransomware Gangs Should be Designated as Terrorists) Les gangs de ransomware ont causé d'importants dégâts. Il est temps que le gouvernement les prenne plus au sérieux.

Recommandé par la Communauté des données du GC

Directive sur la prise de décisions automatisée

Le gouvernement du Canada cherche de plus en plus à utiliser l’intelligence artificielle pour prendre ou aider à prendre des décisions administratives afin d’améliorer la prestation des services. Le gouvernement s’est engagé à le faire d’une manière compatible avec les principes fondamentaux du droit administratif, comme la transparence, la responsabilisation, la légalité et l’équité procédurale. Sachant que cette technologie évolue rapidement, la présente Directive continuera d’évoluer afin de veiller à ce qu’elle soit pertinente.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Les fiducies de données peuvent-elles constituer l'épine dorsale de notre futur écosystème d'IA ?

Dr Aida Mehonic, sur The Alan Turing Institute

(En anglais - titre original : Can data trusts be the backbone of our future AI ecosystem?) Ici, à l'Alan Turing Institute, nous nous intéressons à la façon dont les fiducies de données pourraient contribuer à façonner le futur écosystème de l'intelligence artificielle (IA). À l'heure actuelle, de nombreuses initiatives bien intentionnées visant à créer des algorithmes d'apprentissage automatique échouent en raison du manque d'ensembles de données d'entraînement, et cela est vrai tant dans le secteur privé que dans le secteur public. Un trust de données pourrait permettre un partage sûr et sécurisé des données qui permettrait au Royaume-Uni de développer et de déployer des systèmes d'IA au profit de la société et de l'économie.

Recommandé par Chantal Bernier, une conférencière de la Conférence sur les données 2022

L'état des données ouvertes

Tim Davies, Stephen B Walker, et Mor Rubinstein, sur Open Data for Development

(En anglais - titre original : State of Open Data) Cela fait dix ans que les données ouvertes ont fait leur apparition sur la scène mondiale. Au cours de la dernière décennie, des milliers de programmes et de projets dans le monde entier ont travaillé à l'ouverture des données et les ont utilisées pour relever une myriade de défis sociaux et économiques. Pendant ce temps, les questions liées aux droits et à la confidentialité des données sont passées au centre du discours public et politique. Alors que le mouvement de l'ouverture des données entre dans une nouvelle phase de son évolution, se déplaçant pour cibler des problèmes du monde réel et intégrer la pensée de l'ouverture des données dans d'autres communautés de pratique existantes ou émergentes, de grandes questions demeurent.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Le projet de loi 95 : De la volonté de l’État québécois de permettre un accès et une utilisation optimale de ses données

Karine Joizil

(En français) Dans le monde de la recherche, cette réforme était souhaitée depuis longtemps notamment par le Scientifique en chef du Québec et les fonds de recherche pour qui l’accès à ces données sera d’une grande utilité.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Le rafistolage de notre avenir numérique est insoutenable et dangereux

Melissa Hathaway

(En anglais - titre original : Patching Our Digital Future Is Unsustainable and Dangerous) Ces dernières années, le monde a été témoin d'un nombre alarmant de cyberincidents très médiatisés, de pratiques préjudiciables dans le domaine des technologies de l'information et des communications (TIC) et d'actes répréhensibles à l'échelle internationale dus à une mauvaise utilisation des TIC. Au cours des 30 dernières années, une vulnérabilité unique et stratégique a été apportée à la société, en permettant à des produits commerciaux prêts à l'emploi, mal codés ou mal conçus, d'imprégner et d'alimenter chaque aspect de notre société connectée. Ces produits et services, qui présentent des faiblesses exploitables, sont devenus le ventre mou des systèmes gouvernementaux, des infrastructures et services essentiels, ainsi que des activités des entreprises et des ménages. La cyber-insécurité mondiale qui en résulte représente un risque croissant pour la santé, la sécurité et la prospérité publiques. Il est essentiel de devenir beaucoup plus stratégique dans la façon dont les nouvelles technologies numériques sont conçues et déployées, et de tenir les fabricants de ces technologies responsables de la sécurité numérique et de la sûreté de leurs produits. L'industrie technologique a rapidement mis sur le marché des produits vulnérables - maintenant, il est crucial de travailler ensemble pour réduire les risques créés et guérir notre environnement numérique aussi vite que la société le peut. Cet article a d'abord été publié dans le cadre de la récente série d'essais du CIGI, Governing Cyber Space during a Crisis in Trust.

Recommandé par la Communauté des données du GC

Ressources en science des données

Réseau de la science des données pour la fonction publique fédérale

Pour les passionnés de science des données : Trouvez des ressources, des formations, des outils et des communautés.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Un plaidoyer du Groupe de travail sur la mise en œuvre de la Charte des données ouvertes : la normalisation des données est importante

Darine Benkalha

(En anglais - titre original : A plea from the ODC’s IWG: Data standardisation matters) Un récapitulatif de la réunion du groupe de travail sur la mise en œuvre de la Charte des données ouvertes qui s'est tenue en septembre 2021.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Utilisation responsable des systèmes décisionnels automatisés du gouvernement fédéral

Benoit Deshaies, Secrétariat du Conseil du Trésor du Canada, et Dawn Hall, Secrétariat du Conseil du Trésor du Canada

Les scientifiques des données jouent un rôle important dans l'évaluation de la qualité des données et la mise au point de modèles pour appuyer les systèmes décisionnels automatisés. Une compréhension du moment où la Directive s'applique et de la manière de satisfaire à ses exigences peut appuyer l'utilisation éthique et responsable de ces systèmes. En particulier, l'exigence en matière d'explication et l'orientation (Ligne directrice sur les services et le numérique, section 4.5.3 ) du Secrétariat du Conseil du Trésor du Canada (SCT) sur la sélection des modèles sont d'une grande importance pour les scientifiques des données.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.


Sites web

Centre de la science des données

En cette ère du numérique en croissance rapide, les organismes statistiques doivent trouver des moyens innovants pour exploiter la puissance des données. Statistique Canada adopte les possibilités que la science des données lui offre pour mieux répondre aux besoins d'information des Canadiens.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Charte internationale des données ouvertes

(En anglais - titre original : International Open Data Charter) La Charte des données ouvertes est une collaboration entre plus de 150 gouvernements et organisations qui travaillent à l'ouverture des données sur la base d'un ensemble de principes communs. Nous promouvons des politiques et des pratiques qui permettent aux gouvernements et aux OSC de collecter, partager et utiliser des données bien gérées, afin de répondre de manière efficace et responsable aux domaines d'intérêt suivants : la lutte contre la corruption, l'action climatique et l'équité salariale.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

La COVID-19 : sous l'angle des données

Une série d'articles sur divers sujets qui traitent des répercussions de la COVID-19 sur le plan socio-économique. De nouveaux articles seront diffusés de façon périodique.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Data2x

(En anglais) Des données importantes sur les femmes et les filles sont incomplètes ou manquantes. Grâce à des partenariats avec des agences des Nations unies, des gouvernements, la société civile, des universitaires et le secteur privé, Data2X œuvre pour le changement.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

/r/DataIsBeautiful sur Reddit

(En anglais) DataIsBeautiful est destiné aux visualisations qui transmettent efficacement des informations. L'esthétique est une partie importante de la visualisation d'informations, mais les jolies images ne sont pas le seul objectif de ce subreddit.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

The Data Lodge

(En anglais) Les données et l'analytique sont le pivot de la transformation numérique, mais la culture est la partie la plus difficile. La maîtrise des données est le chaînon manquant, et la clé pour déchiffrer le code culturel. Nous pensons que le fondement de la formation d'une main-d'œuvre compétente en matière de données (des cadres supérieurs aux professionnels des données et de l'analyse, en passant par vos collaborateurs de première ligne) est la promotion d'un langage commun autour de l'utilisation des données, ou Information as a Second Language® (ISL). Et pour briser le code culturel, il faut commencer par rendre ce langage personnel.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Data To The People

(En anglais) Data To The People sont des experts mondiaux reconnus et des leaders de l'industrie dans le développement et l'entretien de la culture des données. Nous fournissons aux dirigeants et aux organisations les outils nécessaires pour évaluer les compétences individuelles et organisationnelles en matière de données, et nous concevons des programmes sur mesure pour améliorer les compétences de leur personnel dans ce domaine.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Documents de travail de l'OCDE sur l'économie numérique

Les technologies de l'information et de la communication sont largement diffusées et utilisées, ce qui renforce leur incidence économique et sociale. L'OCDE conduit des activités pour aider à mieux comprendre la façon dont les TIC contribuent à une croissance économique et un bien-être social durables, ainsi que leur rôle dans l'évolution vers des sociétés fondées sur la connaissance.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Données de l'OCDE sur les gouvernements ouverts

(En anglais - titre original : OECD Open Government data) Les Données gouvernementales ouvertes (DGO) est une philosophie - et de plus en plus un ensemble de politiques - qui favorise la transparence, la responsabilité et la création de valeur en mettant les données gouvernementales à la disposition de tous. Les organismes publics produisent et commandent d'énormes quantités de données et d'informations. En mettant leurs jeux de données à disposition, les institutions publiques deviennent plus transparentes et plus responsables vis-à-vis des citoyens. En encourageant l'utilisation, la réutilisation et la distribution gratuite des ensembles de données, les gouvernements favorisent la création d'entreprises et de services innovants axés sur les citoyens.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Données ouvertes du gouvernement américain

(En anglais - titre original : US Government Open Data) Trouvez des données, des outils et des ressources pour mener des recherches, développer des applications web et mobiles, concevoir des visualisations de données, etc.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Données ouvertes de la Banque mondiale

Un accès gratuit et libre à des statistiques sur le développement dans le monde.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Gouvernement ouvert du Canada

Le gouvernement ouvert vise à rendre le gouvernement plus accessible à tous. Participez à des conversations, trouvez des données et des dossiers numériques, et apprenez-en davantage sur le gouvernement ouvert.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

L'information est belle

(En anglais - titre original : Information is Beautiful) Données, informations, connaissances : nous les distillons dans des graphiques et des diagrammes beaux et utiles. Information is Beautiful a pour vocation de vous aider à prendre des décisions plus claires et mieux informées sur le monde. Toutes nos visualisations sont basées sur des faits et des données : constamment mises à jour, révisées et révisées.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Institut des données ouvertes

(En anglais - titre original : Open Data Institute) L'Institut des données ouvertes est un organisme à but non lucratif dont la mission est de travailler avec les entreprises et les gouvernements pour construire un écosystème de données ouvert et digne de confiance. Nous travaillons avec un éventail d'organisations, de gouvernements, d'organismes publics et de la société civile pour créer un monde où les données fonctionnent pour tout le monde.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Interagir avec les données

Trouvez des vidéos, des visualisations de données, des infographies et des cartes thématiques de Statistique Canada.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Partenariat pour un gouvernement ouvert

(En anglais - titre original : Open Government Partnership) En 2011, les dirigeants gouvernementaux et les défenseurs de la société civile se sont réunis pour créer un partenariat unique - un partenariat qui combine ces forces puissantes pour promouvoir une gouvernance transparente, participative, inclusive et responsable. Soixante-dix-huit pays et soixante-seize gouvernements locaux - représentant plus de deux milliards de personnes - ainsi que des milliers d'organisations de la société civile sont membres du Partenariat pour un gouvernement ouvert.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Recensement de la population

Un portrait statistique détaillé du Canada et de ses habitants selon leurs caractéristiques démographiques, sociales et économiques.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Réseau de la science des données pour la fonction publique fédérale

À la recherche d'un espace dynamique pour collaborer et en apprendre davantage sur la science des données? Joignez-vous au nouveau Réseau de la science des données pour la fonction publique fédérale (propulsé par l'intendance de StatCan). Notre vision est de créer une communauté dynamique de passionnés de la science des données et d'offrir un espace de communication permettant aux membres de collaborer et d'en apprendre davantage sur la science des données.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Trajets en bus

Trajets en bus est un produit de l’Académie du numérique de l’École de la fonction publique du Canada et constitue une ressource pour mieux comprendre tout ce qui est numérique et gouvernemental.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Statistiques

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.


Outils

Cadre pour l’utilisation des processus d’apprentissage automatique de façon responsable à Statistique Canada

Le présent document est un guide pour les utilisateurs qui désirent élaborer et mettre en œuvre des projets d’apprentissage automatique. Il fournit une orientation et des conseils pratiques sur la façon responsable d’élaborer ces processus automatisés au sein de Statistique Canada, mais qui pourrait aussi être adopté par toute autre organisation. Le guide peut s’appliquer au travail de production tout aussi bien qu’au travail de recherche menant à des publications.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Data Interoperability Guide

Guide d'interopérabilité des données

Luis Gonzalez, sur UN Statistics Wiki

(En anglais - titre original : Data Interoperability Guide) Au fil des ans, d'innombrables systèmes qui ne communiquent pas entre eux ont été créés au sein des organisations et entre elles dans le but de collecter, traiter et diffuser des données pour le développement. Avec la prolifération de différentes plateformes technologiques, définitions de données et dispositions institutionnelles pour la gestion, le partage et l'utilisation des données, il est devenu de plus en plus nécessaire de consacrer des ressources à l'intégration des données nécessaires pour soutenir l'élaboration des politiques et la prise de décision. L'interopérabilité est la capacité de joindre et de fusionner des données sans perdre de sens (JUDS 2016). En pratique, on dit que les données sont interopérables lorsqu'elles peuvent être facilement réutilisées et traitées dans différentes applications, ce qui permet à différents systèmes d'information de fonctionner ensemble. L'interopérabilité est un catalyseur essentiel pour que le secteur du développement devienne plus axé sur les données.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Guide pratique des données ouvertes

from Worldbank

Le Guide Pratique des Données Ouvertes a pour but d’aider les pouvoirs publics, le personnel de la Banque mondiale et les utilisateurs à comprendre les principes fondamentaux de l'ouverture des données publiques, et à planifier et mettre en œuvre un programme de ce type en évitant les écueils les plus courants.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

The Data Ethics Canvas

Le canevas de l'éthique des données

Dave Tarrant, James Maddison et Olivier Thereaux

(En anglais - titre original : The Data Ethics Canvas) Le Canevas d'éthique des données est un outil destiné à tous ceux qui collectent, partagent ou utilisent des données. Il permet d'identifier et de gérer les problèmes éthiques - au début d'un projet qui utilise des données, et tout au long de celui-ci. Il vous encourage à poser des questions importantes sur les projets qui utilisent des données, et à réfléchir aux réponses. Le Canevas d'éthique des données fournit un cadre pour développer des conseils éthiques adaptés à tout contexte, quelle que soit la taille ou la portée du projet.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.




L'appli StatsCAN

L'appli StatsCAN

Statistique Canada

Cette application gratuite vous donne accès à des analyses spécialisées, des faits amusants, des produits de visualisation, de brèves histoires et des observations qui rassemblent des données, des outils et des articles pour vous fournir les renseignements les plus récents sur l'économie, la société et l'environnement du Canada.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.








Mon StatCan

Statistique Canada

Mon StatCan est un portail complet et personnalisable qui vous permet de : mettre un signet à vos articles, rapports, tableaux de données, indicateurs et autres favoris pour y avoir accès rapidement; recevoir par courriel les avis portant sur les données les plus récentes que nous avons diffusées; participer à des discussions en ligne sur le blogue de StatCan, Clavarder avec un expert et la Question du mois.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Outil d’évaluation de l’incidence algorithmique

L’outil d’évaluation de l’incidence algorithmique (ÉIA) est un outil d’évaluation des risques obligatoire destiné à soutenir la Directive sur la prise de décisions automatisée (« la Directive ») du Conseil du Trésor. L’outil est un questionnaire qui détermine le niveau d’incidence d’un système de décision automatisé. Il est composé de 48 questions sur les risques et de 33 questions sur l’atténuation. Les notes d’évaluation sont fondées sur de nombreux facteurs, y compris la conception des systèmes, l’algorithme, le type de décision, l’incidence et les données.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

L’Explorateur géospatial des statistiques canadiennes

Statistique Canada

L’Explorateur géospatial des statistiques canadiennes permet aux utilisateurs de découvrir les données géospatiales de Statistique Canada jusqu'au plus petit niveau de détail disponible, l'aire de diffusion. Les utilisateurs peuvent rechercher, explorer puis exporter des données dans divers formats pour les utiliser dans leurs flux de travail. Les utilisateurs peuvent également personnaliser la carte et modifier les fonds de carte (imagerie satellite, topographie, etc.) pour afficher les données dans un contexte different.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

Où dois-je aller pour en savoir plus, de « The Data Lodge » (PDF)

Valerie Logan

(En anglais) Ressources et webinaires clés sur la maîtrise des données.

Recommandé par la Communauté des données du GC.


Bulletins, blogs et flux

Communauté des données du GC

Bulletin mensuel de la Communauté des données du GC

Inscrivez-vous pour vous tenir au courant des événements, des communiqués, des emplois et plus encore liés aux données au sein du gouvernement du Canada.

Recommandé par la Communauté des données du GC.




Bulletin d'information du Réseau de la science des données pour la fonction publique fédérale

Tenez-vous au courant des dernières nouvelles dans le monde de la science des données en vous abonnant au bulletin d'information du Réseau : Méli-mélo de la science des données—votre source d'information pour tout ce qui concerne la science des données au sein du gouvernement du Canada et ailleurs.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

The AI Ethics Brief

L'éthique de l'IA en bref

Institut d'éthique de l'IA de Montréal

(En anglais - titre original : The AI Ethics Brief) L'Institut d'éthique de l'IA de Montréal est une organisation internationale à but non lucratif qui démocratise la connaissance de l'éthique de l'IA. Abonnez-vous pour avoir un accès complet à la newsletter et recevoir chaque semaine dans votre boîte de réception les dernières nouvelles du domaine de l'éthique de l'IA. Ne manquez jamais une mise à jour du travail effectué à l'Institut d'éthique de l'IA de Montréal et nos réflexions sur la recherche et le développement dans ce domaine à travers le monde.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Le Quotidien

Statistics Canada

En manchette : les communiqués quotidiens.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.

StatsCAN Plus

Statistics Canada

Restez au courant de l'actualité statistique du pays tout au long de la journée !

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.


Balados

Women in Data Science podcast, Stanford University

Balado sur les femmes dans les sciences des données

(En anglais - titre original : Women in Data Science podcast) Des femmes de premier plan dans le domaine de la science des données partagent leur travail, leurs conseils et les leçons apprises en cours de route avec le professeur Margot Gerritsen de l'université de Stanford. Découvrez comment la science des données est appliquée et a un impact dans un large éventail de domaines, des soins de santé à la finance en passant par la cosmologie et les droits de l'homme, etc.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Data Skeptic podcast

Balado du sceptique des données

(En anglais - titre original : Data Skeptic podcast) Votre balado de confiance, centré sur la science des données, l'apprentissage automatique et l'intelligence artificielle.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Hé-coutez bien!

Balado Hé-coutez bien!

Soyez à l'écoute du balado Hé-coutez bien! pour faire la connaissance des personnes derrière les données et découvrir les histoires qu'elles révèlent. Soyez des nôtres alors que nous rencontrons des experts de Statistique Canada ainsi que de partout au pays pour leur poser les questions qui comptent pour les Canadiens et entendre leur réponses.

Recommandé par Statistique Canada, un partenaire de la Communauté des données du GC.


Livres et rapports

Introduction to Online Ecological and Environmental Data

Introduction aux données écologiques et environnementales en ligne

Virginia A Baldwin

(En anglais - titre original : Introduction to Online Ecological and Environmental Data) L'avènement de l'Internet et la prolifération des documents qu'il contient ont entraîné des changements importants et rapides dans la communication savante. L'affichage des données de recherche en vue de leur partage avec d'autres chercheurs dans le domaine a peut-être été plus progressif. Ce volume décrit plusieurs projets qui ont rendu les données des chercheurs en environnement et en écologie librement accessibles en ligne. Des bibliothécaires de la National Aeronautics and Space Administration (NASA), du United States Geological Survey (USGS), d'une agence régionale basée en Oregon, d'une université et d'une société de recherche décrivent les aspects des projets de données en ligne développés par leurs institutions respectives. Un sixième article, rédigé par un bibliothécaire de l'université de l'État de New York à Buffalo, suit le développement de données de recherche en ligne dans un domaine spécifique, la recherche sur les pluies acides, à partir de divers types de programmes de recherche. Un thème commun à ces articles est l'implication interdisciplinaire des chercheurs qui produisent et utilisent des données dans les domaines des études environnementales et écologiques.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Federal data science

La science des données fédérales : transformer le gouvernement et la politique agricole grâce à l'intelligence artificielle

Feras A Batarseh et Ruixin Yang

(En anglais - titre original : Federal data science: Transforming government and agricultural policy using artificial intelligence) La science des données fédérales sert de guide aux ingénieurs logiciels fédéraux, aux analystes gouvernementaux, aux économistes, aux chercheurs, aux scientifiques des données et aux responsables de l'ingénierie pour déployer des méthodes d'analyse des données dans les processus gouvernementaux. Poussées par les initiatives de gouvernement ouvert (2009) et de big data (2012), les agences fédérales ont un sérieux besoin de mettre en œuvre des méthodes de gestion intelligente des données, de partager leurs données et de déployer des analyses avancées dans leurs processus. L'utilisation des données fédérales pour une prise de décision réactive n'est plus suffisante, les systèmes de données intelligents permettent des activités proactives qui conduisent à des avantages tels que : l'amélioration des services aux citoyens, une plus grande responsabilité, la réduction des inefficacités de livraison, la réduction des coûts, l'amélioration des connaissances nationales et une meilleure prise de décision. Aucun autre ouvrage consacré au gouvernement n'a été trouvé dans la littérature qui traite de ce vaste sujet. Ce livre présente de nombreux cas d'utilisation, décrit les avantages de la science des données au niveau fédéral et comble les lacunes dans ce domaine critique et opportun.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


L’intelligence artificielle et les mondes du travail

L’intelligence artificielle et les mondes du travail: Perspectives sociojuridiques et enjeux éthiques

Jean Bernier (éditeur)

(En français) Le développement de l'économie numérique et de l'intelligence artificielle (IA) a modifié de façon importante les modes de production des produits et des services, à telle enseigne qu'il oblige les entreprises à revoir leurs pratiques de fonctionnement sur tous les plans. Qui plus est, l'accélération vers le numérique envahit peu à peu le quotidien de chacun et chacune qui voit se transformer parfois en profondeur son activité de travail jusqu'à entraîner une certaine forme de déqualification professionnelle, voire la perte de certains emplois et la création de certains autres, nécessitant un niveau de formation différent et plus élevé. Conçu selon une approche interdisciplinaire et grâce à la contribution d'autrices et d'auteurs québécois, français et belge, le présent ouvrage examine les principaux effets que provoquent ces transformations vers le numérique sur les mondes du travail ainsi que la place de plus en plus importante qu'y occupe l'intelligence artificielle (IA). Il propose un éclairage sur certains des enjeux que suscitent ces transformations tant sur le plan éthique que sur celui du dialogue social et de la gestion des ressources humaines ou encore sur le plan juridique. À ces enjeux s'ajoutent les défis que représentent la dilution de la frontière entre la vie de travail et la vie privée de même que la métamorphose du rapport entre l'entreprise et les personnes salariées qui découle du développement des plateformes numériques. L'ouvrage vise aussi à susciter la réflexion sur la nécessité de revoir les modes de régulation du travail pour lesquels il présente des avenues à explorer.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

La feuille de route du Collectif canadien de normalisation

La feuille de route du Collectif canadien de normalisation (juin 2021)

Collectif canadien de normalisation en matière de gouvernance des données

La feuille de route du Collectif canadien de normalisation en matière de gouvernance des données aborde les grandes questions au carrefour des normes et de la gouvernance des données. Elle décrit le paysage normatif du Canada, actuel et souhaité, formule 35 recommandations pour combler les lacunes, et signale des domaines qui bénéficieraient de cadres normatifs ou de mécanismes d’évaluation de la conformité. En 2019, le CCN a formé le Collectif canadien de normalisation en matière de gouvernance des données en vue de dynamiser l’élaboration de normes de gouvernance des données dans tous les secteurs. Le Collectif, qui a passé les deux dernières années à élaborer une feuille de route de normalisation, réunit 220 acteurs canadiens issus d’administrations publiques, du secteur privé, de la société civile, d’organisations autochtones, du milieu universitaire et d’organismes d’élaboration de normes.

Recommandé par le Conseil canadien des normes, ami de la Communauté des données du GC

La modélisation par équations structurelles avec Mplus

La modélisation par équations structurelles avec Mplus

Pier-Olivier Caron

(En français) La modelisation par equations structurelles s'impose de plus en plus en sciences humaines, que ce soit en psychologie, en sociologie ou en sexologie. L'objectif du present ouvrage est d'offrir aux chercheurs et aux etudiants une introduction a la syntaxe Mplus sous forme d'un guide pratique leur permettant de realiser des analyses de base. Le logiciel Mplus se demarque par la diversite des analyses qu'il offre, sa polyvalence quant a la gestion des donnees (continues, ordinales, binaires, non normales, etc), son traitement des donnees manquantes et sa simplicite d'utilisation.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.




Invisible Women: Data Bias in a World Designed for Men, by Caroline Criado Pérez

Femmes invisibles : La partialité des données dans un monde conçu pour les hommes

Caroline Criado Pérez

(En anglais - titre original : Invisible Women: Data Bias in a World Designed for Men) Les données sont fondamentales dans le monde moderne. Du développement économique aux soins de santé, en passant par l'éducation et les politiques publiques, nous nous appuyons sur des chiffres pour allouer des ressources et prendre des décisions cruciales. Mais comme de nombreuses données ne tiennent pas compte du sexe, parce qu'elles considèrent les hommes comme la norme et les femmes comme atypiques, les préjugés et la discrimination sont intégrés dans nos systèmes. Et les femmes paient un prix énorme pour ces préjugés, en temps, en argent, et souvent de leur vie. La célèbre féministe Caroline Criado Perez enquête sur les causes profondes et choquantes de l'inégalité des sexes et de la recherche dans Les femmes invisibles, en plongeant dans la vie des femmes à la maison, au travail, sur la place publique, chez le médecin, etc. Fondé sur des centaines d'études menées aux États-Unis, au Royaume-Uni et dans le monde entier, et écrit avec énergie, esprit et intelligence, ce livre est un exposé révolutionnaire et inoubliable qui changera votre façon de voir le monde.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.


Introduction to data analysis with R for forensic scientists

Introduction à l'analyse des données avec R pour les scientifiques de la police scientifique (Vol. 21)

James Michael Curran

(En anglais - titre original : Introduction to data analysis with R for forensic scientists (Vol. 21)) Les méthodes statistiques fournissent un cadre logique et cohérent dans lequel les données issues de la science expérimentale peuvent être analysées. Cependant, de nombreux chercheurs ne disposent pas des compétences ou des ressources statistiques qui leur permettraient d'explorer leurs données à leur plein potentiel. Introduction à l'analyse des données avec R pour les scientifiques de la police scientifique minimise la théorie et les mathématiques et se concentre sur l'application et la pratique des statistiques afin de fournir aux chercheurs la dextérité nécessaire pour analyser systématiquement les données découvertes à partir des fruits de leurs recherches. En utilisant des techniques traditionnelles et en s'appuyant sur des exemples et des tutoriels avec des données réelles recueillies lors d'expériences, ce livre présente les informations essentielles suivantes nécessaires aux chercheurs : Une remise à niveau sur les statistiques de base et une introduction à R. Des considérations et des techniques pour l'affichage visuel des données par le biais de graphiques ; Une vue d'ensemble des tests d'hypothèses statistiques et le raisonnement qui les sous-tend ; Un guide complet de l'utilisation du modèle linéaire, le fondement de la plupart des statistiques rencontrées ; Une introduction aux extensions du modèle linéaire pour les scénarios couramment rencontrés.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Systems immunology: an introduction to modeling methods for scientists

Immunologie des systèmes : une introduction aux méthodes de modélisation pour les scientifiques

Jayajit Das et Ciriyam Jayaprakash

(En anglais - titre original : Systems immunology: an introduction to modeling methods for scientists) Ce livre offre une vue d'ensemble complète de l'immunologie computationnelle, depuis les concepts de base jusqu'à la modélisation mathématique au niveau de la molécule unique, de la cellule, de l'organisme et de la population. Il présente les modèles mécanistes modernes et leur utilisation pour faire des prédictions, concevoir des expériences et élucider les processus biochimiques sous-jacents. Il commence par une introduction à l'analyse des données, aux approximations et aux hypothèses utilisées dans la construction des modèles. Les chapitres principaux traitent des modèles et des méthodes d'étude des réponses immunitaires, les concepts fondamentaux étant clairement définis. Les lecteurs issus de l'immunologie, de la biologie quantitative et de la physique appliquée bénéficieront des éléments suivants : Les principes fondamentaux de l'immunologie computationnelle et les méthodes quantitatives modernes pour étudier la réponse immunitaire au niveau de la molécule unique, de la cellule, de l'organisme et de la population. Un aperçu des concepts de base de la modélisation et de l'analyse des données. Couverture de sujets pour lesquels la modélisation mécaniste a contribué de manière substantielle à la compréhension actuelle. Discussion sur la diversité génétique du système immunitaire, la signalisation cellulaire dans le système immunitaire, la réponse immunitaire à l'échelle de la population cellulaire et l'écologie des interactions hôte-pathogène.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Les données administratives publiques dans l'espace numérique

Les données administratives publiques dans l'espace numérique

Pierre Desrochers

(En français) Cet ouvrage a pour objectif d'explorer les enjeux liés à la collecte et à l'utilisation des données administratives. Ces données, accumulées par les ministères et les organismes gouvernementaux lors de leurs activités quotidiennes, deviennent de plus en plus intéressantes à mesure que les outils statistiques et technologiques se développent et permettent leur exploitation. Les données administratives sont celles qui sont recueillies systématiquement lors de l'inscription de personnes ou la réalisation de transactions, ou encore créées lors des activités de tenue de documents liées à la prestation d'un service. Les incidences des mégadonnées, ou Big Data, l'arrivée de l'apprentissage automatique et de l'intelligence artificielle sont importantes pour les organisations et la gouvernance de leur information. Elles soulèvent de nombreux enjeux de qualité, de précision, de protection des renseignements personnels ou encore d'interprétation.

Recommandé par la Communauté des données du GC.


Data Feminism

Le féminisme des données : Une nouvelle façon de penser la science des données et l'éthique des données qui est informée par les idées du féminisme intersectionne

Catherine D'Ignazio and Lauren F Klein

(En anglais - titre original : Data Feminism: A new way of thinking about data science and data ethics that is informed by the ideas of intersectional feminism) Aujourd'hui, la science des données est une forme de pouvoir. Elle a été utilisée pour dénoncer l'injustice, améliorer les résultats en matière de santé et renverser des gouvernements. Mais elle a également été utilisée pour discriminer, policer et surveiller. Ce potentiel de bien, d'une part, et de mal, d'autre part, fait qu'il est essentiel de s'interroger : La science des données par qui ? La science des données pour qui ? La science des données dans l'intérêt de qui ? Les récits autour du big data et de la science des données sont très majoritairement blancs, masculins et techno-héroïques. Dans Data Feminism, Catherine D'Ignazio et Lauren Klein présentent une nouvelle façon de penser la science des données et l'éthique des données - une qui est informée par la pensée féministe intersectionnelle. Data Feminism offre des stratégies pour les scientifiques des données qui cherchent à apprendre comment le féminisme peut les aider à œuvrer pour la justice, et pour les féministes qui veulent concentrer leurs efforts sur le domaine croissant de la science des données. Mais le féminisme des données va bien au-delà du genre. Il s'agit du pouvoir, de qui en a et de qui n'en a pas, et de la manière dont ces différences de pouvoir peuvent être remises en question et modifiées.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.


Qu’est-ce que le text et data mining ?

Qu’est-ce que le text et data mining ?

Direction de l’Information Scientifique et Technique, CNRS

(En français) Le data mining est un concept jeune qui apparaît en 1989 sous un premier nom de KDD (Knowledge Discovery in Databases, en français ECD pour Extraction de Connaissances à partir des Données). Le terme de « text and data mining » est apparu pour la première fois dans le domaine du marketing au début des années 1990. Ce concept, tel qu’appliqué aux services marketing, est étroitement lié au concept du « one-to-one relationship » (Michael Berry et Gordon Linoff, créateurs du data mining dans le m).

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.




Computer age statistical inference: Algorithms, evidence, and data science

Inférence statistique à l'ère de l'informatique : Algorithmes, preuves et science des données

Bradley Efron et Trevor Hastie

(En anglais - titre original : Computer age statistical inference: Algorithms, evidence, and data science) Le vingt-et-unième siècle a vu une expansion époustouflante de la méthodologie statistique, tant en termes de portée que d'influence. Les termes « Big data » , « science des données » et « apprentissage automatique » sont devenus des termes familiers dans l'actualité, car les méthodes statistiques sont appliquées aux énormes ensembles de données de la science et du commerce modernes. Comment en sommes-nous arrivés là ? Et où allons-nous ? Ce livre nous emmène dans un voyage exaltant à travers la révolution de l'analyse des données qui a suivi l'introduction du calcul électronique dans les années 1950. En commençant par les théories inférentielles classiques - bayésiennes, fréquentistes, fisheriennes - les différents chapitres abordent une série de sujets influents : l'analyse de survie, la régression logistique, Bayes empirique, le jackknife et le bootstrap, les forêts aléatoires, les réseaux neuronaux, la chaîne de Markov Monte Carlo, l'inférence après sélection de modèle, et des dizaines d'autres. L'approche résolument moderne intègre la méthodologie et les algorithmes à l'inférence statistique. Le livre se termine par des spéculations sur l'orientation future des statistiques et de la science des données.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Numbersense: How to Use Big Data to Your Advantage, by Kaiser Fung

Le sens des nombres : comment utiliser le Big Data à votre avantage

Kaiser Fung

(En anglais - titre original : Numbersense: How to Use Big Data to Your Advantage) Nous vivons dans un monde de Big Data — et il devient de plus en plus grand chaque jour. Pratiquement tous les choix que nous faisons dépendent de la façon dont quelqu'un génère des données... et de la façon dont quelqu'un d'autre les interprète ... et de la façon dont quelqu'un d'autre les interprète — que nous en soyons conscients ou non. Le problème est que plus nous avons de données, plus il est difficile de les interpréter. Des leaders mondiaux aux citoyens moyens, tout le monde est enclin à prendre des décisions critiques basées sur de mauvaises interprétations des données. Numbersense vous donne un aperçu de la façon dont l'interprétation des Big Data fonctionne — et comment, trop souvent, elle ne fonctionne pas. Vous n'en ressortirez pas avec les compétences d'un statisticien professionnel, mais vous aurez une compréhension fine des pièges à données dans lesquels même les meilleurs statisticiens peuvent tomber, et vous ferez confiance à l'alarme mentale qui se déclenche dans votre tête lorsque quelque chose ne semble pas s'additionner.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.


Hands-on machine learning with Scikit-Learn and TensorFlow

Apprentissage automatique pratique avec Scikit-Learn et TensorFlow : concepts, outils et techniques pour construire des systèmes intelligents

Aurélien Géron

(En anglais - titre original : Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems) À l'aide d'exemples concrets, d'un minimum de théorie et de deux frameworks Python prêts à l'emploi — Scikit-learn et TensorFlow — l'auteur Aurélien Géron vous aide à acquérir une compréhension intuitive des concepts et des outils permettant de construire des systèmes intelligents. Vous apprendrez un éventail de techniques, en commençant par la régression linéaire simple et en progressant vers les réseaux neuronaux profonds. Avec des exercices dans chaque chapitre pour vous aider à appliquer ce que vous avez appris, tout ce dont vous avez besoin est une expérience de la programmation pour commencer.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Opinions des Canadiens sur l'intelligence artificielle : Rapport final

Innovation, Sciences et Développement économique Canada

Cette étude avait pour but de recueillir l'opinion actuelle du public concernant la perception de l'IA au Canada. La recherche servira à appuyer le mandat du Conseil consultatif en matière d'IA, qui consiste à formuler des recommandations au gouvernement du Canada quant aux « manières de consolider les forces du pays en matière d'IA. De plus, il cernera les possibilités de croissance économique qui procureront des retombées pour tous les Canadiens, et il veillera à ce que les avancées dans le secteur reflètent les valeurs canadiennes ». Le but est d'établir une norme fondée sur des données probantes concernant la perception publique actuelle de l'IA et de son développement, ce qui permettra de mieux étayer le discours canadien grâce à une compréhension mesurée de la technologie, de ses utilisations potentielles et des risques qui y sont associés.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.

Introduction to data science

Introduction à la science des données : analyse des données et algorithmes de prédiction avec R

Rafael Irizarry

(En anglais - titre original : Introduction to data science: data analysis and prediction algorithms with R) Introduction à la science des données : analyse des données et algorithmes de prédiction avec R présente des concepts et des compétences qui peuvent vous aider à relever des défis réels en matière d'analyse de données. Il couvre les concepts de probabilité, d'inférence statistique, de régression linéaire et d'apprentissage automatique. Il vous aide également à développer des compétences telles que la programmation R, le traitement des données, la visualisation des données, la construction d'algorithmes prédictifs, l'organisation des fichiers avec le shell UNIX/Linux, le contrôle de version avec Git et GitHub, et la préparation de documents reproductibles. Ce livre est un manuel pour un premier cours de science des données. Aucune connaissance préalable de R n'est nécessaire, bien qu'une certaine expérience de la programmation puisse être utile. Le livre est divisé en six parties : R, la visualisation des données, les statistiques avec R, le traitement des données, l'apprentissage automatique et les outils de productivité. Chaque partie comporte plusieurs chapitres destinés à être présentés comme un seul cours. L'auteur utilise des études de cas motivantes qui reproduisent de manière réaliste l'expérience d'un scientifique des données.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Introduction to functional data analysis

Introduction à l'analyse fonctionnelle des données

Piotr Kokoszka et Matthew Reimherr

(En anglais - titre original : Introduction to functional data analysis) Introduction à l'analyse des données fonctionnelles est un manuel concis d'introduction à ce domaine. Il explique comment analyser les données fonctionnelles, tant au niveau exploratoire qu'inférentiel. Il fournit également une exposition systématique et accessible de la méthodologie et du cadre mathématique requis. Ce livre peut être utilisé comme manuel pour un cours d'un semestre sur l'AFD destiné aux étudiants de premier cycle ou de deuxième cycle en statistiques, ainsi qu'aux étudiants de deuxième et troisième cycles d'autres disciplines, notamment les mathématiques appliquées, les sciences de l'environnement, la santé publique, la recherche médicale, les sciences géophysiques et l'économie. Il peut également être utilisé en autoformation et comme référence pour les chercheurs de ces domaines qui souhaitent acquérir une solide compréhension de la méthodologie de la FDA et des conseils pratiques pour sa mise en œuvre.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Doing Bayesian data analysis

Faire de l'analyse bayésienne des données : un tutoriel avec R, JAGS et Stan

John K Kruschke

(En anglais - titre original : Doing Bayesian data analysis: a tutorial with R, JAGS, and Stan) Faire de l'analyse bayésienne des données propose une approche accessible de l'analyse bayésienne des données, la matière étant expliquée clairement à l'aide d'exemples concrets. Le livre commence par les bases, notamment les concepts essentiels de probabilité et d'échantillonnage aléatoire, et progresse progressivement vers des méthodes avancées de modélisation hiérarchique pour des données réalistes.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Data Assimilation

Assimilation des données : Une introduction mathématique

Kody Law, Andrew Stuart et Konstantinos Zygalakis

(En anglais - titre original : Data Assimilation: A Mathematical Introduction) Ce livre offre un traitement systématique des fondements mathématiques des travaux sur l'assimilation des données, couvrant à la fois les approches théoriques et informatiques. Plus précisément, les auteurs développent un cadre mathématique unifié dans lequel une formulation bayésienne du problème sert de base à la dérivation, au développement et à l'analyse des algorithmes. Les nombreux exemples utilisés dans le texte, ainsi que les algorithmes présentés et discutés, sont tous illustrés par le logiciel MATLAB détaillé dans le livre et disponible gratuitement en ligne. Le livre est organisé en neuf chapitres : le premier contient une brève introduction aux outils mathématiques autour desquels le matériel est organisé ; les quatre suivants concernent les systèmes dynamiques à temps discret et les données à temps discret ; les quatre derniers concernent les systèmes dynamiques à temps continu et les données à temps continu et sont organisés de manière analogue aux chapitres correspondants sur le temps discret. Ce livre s'adresse aux chercheurs en mathématiques intéressés par un développement systématique de ce domaine interdisciplinaire, ainsi qu'aux chercheurs des géosciences, et d'une variété d'autres domaines scientifiques, qui utilisent les outils de l'assimilation de données pour combiner des données avec des modèles dépendant du temps.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Réglementer l’intelligence artificielle – Enjeux et choix essentiels PDF

Commission du droit de l’Ontario

(En anglais - titre original : Regulating AI: Critical Issues and Choice) Ce rapport constitue une analyse innovante sur la façon de réglementer les systèmes d’intelligence artificielle (IA) et de prise de décision automatisée (PDA) utilisés par les gouvernements et autres institutions publiques. Il examine les principaux choix entourant cette question, cerne les lacunes en matière de réglementation et propose un cadre exhaustif pour faire en sorte que les gouvernements ayant recours aux systèmes d’IA et de PDA protègent les droits de la personne, assurent l’application régulière de la loi et favorisent la participation du public.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Analyse des données textuelles

Analyse des données textuelles

Ludovic Lebart, Bénédicte Pincemin et Céline Poudat

(En français) L’analyse des données textuelles (ADT) permet d’explorer et de visualiser les recueils de textes les plus divers : œuvres littéraires, transcriptions d’entretien, discours politiques, dossiers de presse, documents d’archives, enquêtes en ligne avec questions ouvertes, fichiers de réclamations, sondages de satisfaction. Le présent ouvrage procède à une présentation rigoureuse des méthodes de l’ADT, qui combinent statistique exploratoire, visualisations, procédures de validation quantitative et approche qualitative.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.




Exploratory-data-analysis-with-MATLAB.jpg

Analyse exploratoire des données avec MATLAB, 3e édition

Wendy L Martinez, Angel R Martinez, et Jeffrey Solka

(En anglais - titre original : Exploratory data analysis with MATLAB, 3rd edition) Analyse exploratoire des données avec MATLAB, 3e édition, présente les méthodes d'AED d'un point de vue informatique et utilise de nombreux exemples et applications pour montrer comment les méthodes sont utilisées en pratique. Les auteurs utilisent du code MATLAB, du pseudo-code et des descriptions d'algorithmes pour illustrer les concepts. Le code MATLAB des exemples, les ensembles de données et l'EDA Toolbox peuvent être téléchargés sur le site Web de l'ouvrage. Nouveautés de la troisième édition Projections aléatoires et estimation de la dimensionnalité intrinsèque locale Autoencodeurs d'apprentissage profond et intégration stochastique des voisins Arbre de portée minimale et indices supplémentaires de validité des clusters Estimation de la densité du noyau Graphiques de visualisation des distributions de données, tels que les diagrammes en forme de haricot et les diagrammes en forme de violon Chapitre sur la visualisation des données catégorielles;Les auteurs mettent l'accent sur les méthodes utilisées pour visualiser et résumer les données avant de faire des hypothèses de modèle pour générer des hypothèses. Ils utilisent le code MATLAB et les descriptions algorithmiques pour fournir à l'utilisateur des techniques de pointe pour trouver des modèles et des structures dans les données.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Big data et traçabilité numérique

Big data et traçabilité numérique

Pierre-Michel Menger et Simon Paye (éditeurs)

(En français) Les traces numériques de l’activité des individus, des entreprises, des administrations, des réseaux sociaux sont devenues un gisement considérable. Comment ces données sont-elles prélevées, stockées, valorisées, et vendues ? Et que penser des algorithmes qui convertissent en outil de contrôle et de persuasion l’information sur les comportements, les actes de travail et les échanges ? Les big data sont-elles à notre service ou font-elles de nous les rouages consentants du capitalisme informationnel et relationnel ? Les sciences sociales enquêtent sur les enjeux sociaux, éthiques, politiques et économiques de ces transformations. Mais elles sont elles aussi de plus en plus consommatrices de données numériques de masse. Cet ouvrage collectif explore l’expansion de la traçabilité numérique dans ces deux dimensions, marchande et scientifique. L’ouvrage est dirigé par Pierre-Michel Menger, professeur au Collège de France et titulaire de la chaire « Sociologie du travail créateur », et par Simon Paye, maître de conférences à l’université de Lorraine, sociologue du travail et des groupes professionnels.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Big Data et société

Big Data et société: Industrialisation des médiations symboliques

André Mondoux et Marc Ménard (éditeurs)

(En français) Le Big Data (ou mégadonnées) suscite des discours porteurs de visions économiques prometteuses : efficience du microciblage, meilleurs rendements par gestion prédictive, algorithmes et intelligence artificielle, villes intelligentes . bref, toute une économie des données qui trouverait son achèvement véritable dans une créativité enfin libérée de tout joug disciplinaire, idéologique et politique. L'éclatement des individualités émancipées sonde le social tel qu'il est porté par ces discours de promotion. En effet, force est de constater que le social est relativement absent, pour l'instant, des réflexions que l'on présente comme névralgiques pour un avenir meilleur. Ce phénomène soulève d'importantes et préoccupantes questions, que ce soit concernant l'intégrité de la vie privée face à la marchandisation des données personnelles, les dynamiques - économiquement productives - de la surveillance corporative, les rapports de pouvoir induits par les GAFAM (Google, Apple, Facebook, Amazon et Microsoft), les pièges du temps réel ou encore la dynamique algorithmique et sa tendance à suppléer les lois (le politique) par les faits (le réel enfin rendu indéniable grâce aux données quantifiables). Ce premier ouvrage collectif du Groupe de recherche sur l'information et la surveillance au quotidien (GRISQ) envisage le Big Data comme producteur d'effets en même temps que produit de dynamiques sociales. Il intéressera les étudiants et les chercheurs du domaine de la communication qui s'interrogent sur le vaste univers des mégadonnées.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Open data structures

Structures de données ouvertes : une introduction

Pat Morin

(En anglais - titre original : Open data structures: an introduction) Proposé comme une introduction au domaine des structures de données et des algorithmes, Structures de données ouvertes couvre l'implémentation et l'analyse des structures de données pour les séquences (listes), les files d'attente, les files d'attente prioritaires, les dictionnaires non ordonnés, les dictionnaires ordonnés et les graphes. En se concentrant sur une approche mathématiquement rigoureuse qui est rapide, pratique et efficace, Morin présente clairement et rapidement des instructions accompagnées du code source. Analysées et implémentées en Java, les structures de données présentées dans le livre comprennent les piles, les files d'attente, les déques et les listes implémentées sous forme de tableaux et de listes chaînées ; des implémentations efficaces des listes en termes d'espace ; des listes de saut ; des tables de hachage et des codes de hachage ; les arbres de recherche binaires, y compris les arbres treaps, les arbres scapegoat et les arbres red-black ; les structures de recherche d'entiers, y compris les essais binaires, les essais x-fast et les essais y-fast ; les tas, y compris les tas binaires implicites et les tas meldable randomisés ; les graphes, y compris les représentations de la matrice d'adjacence et de la liste d'adjacence ; et les B-trees. Traitement moderne d'un sujet essentiel de l'informatique, Structures de données ouvertes est un équilibre mesuré entre les sujets classiques et les structures de pointe qui répondra aux besoins de tous les étudiants de premier cycle ou des apprenants autonomes.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Introduction to data technologies

Introduction aux technologies des données

Paul Murrell

(En anglais - titre original : Introduction to data technologies) Fournissant des informations clés sur la façon de travailler avec des données de recherche, Introduction aux technologies des donnéess présente des idées et des techniques pour effectuer des tâches critiques, en coulisses, qui prennent beaucoup de temps et d'efforts mais qui reçoivent généralement peu d'attention dans l'éducation formelle. En mettant l'accent sur les outils informatiques, le livre montre aux lecteurs comment améliorer leur prise de conscience des tâches qui peuvent être réalisées et décrit l'approche correcte pour effectuer ces tâches. Des exemples pratiques démontrent les points les plus importants. L'auteur explique d'abord comment écrire du code informatique en utilisant le langage HTML comme exemple concret. Il aborde ensuite divers sujets relatifs au stockage des données, notamment les différents formats de fichiers, le XML, ainsi que la structure et les problèmes de conception des bases de données relationnelles. Après avoir illustré comment extraire des données d'une base de données relationnelle à l'aide de SQL, le livre présente des outils et des techniques de recherche, de tri, de tabulation et de manipulation des données. Il présente également quelques concepts de programmation de base ainsi que le langage R pour le calcul statistique.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Quantitative Bioimaging

Bioimagerie quantitative : Une introduction à la biologie, à l'instrumentation, aux expériences et à l'analyse des données pour les scientifiques et les ingénieurs

Raimund J Ober, E Sally Ward et Jerry Chao

(En anglais - titre original : Quantitative Bioimaging: An Introduction to Biology, Instrumentation, Experiments, and Data Analysis for Scientists and Engineers) La bioimagerie quantitative est un vaste domaine interdisciplinaire qui exploite les outils de la biologie, de la chimie, de l'optique et de l'analyse statistique des données pour concevoir et mettre en œuvre des études sur les processus biologiques. Au lieu d'adopter l'approche traditionnelle consistant à se concentrer sur une seule des disciplines constitutives, ce manuel offre une introduction unique à la bioimagerie quantitative qui présente toutes les disciplines d'une manière intégrée. Le large éventail de sujets abordés comprend les concepts de base de la biologie moléculaire et cellulaire, les aspects pertinents de la technologie des anticorps, l'instrumentation et la conception expérimentale en microscopie à fluorescence, l'introduction à l'optique géométrique et à la théorie de la diffraction, ainsi que l'estimation des paramètres et la théorie de l'information pour l'analyse des données stochastiques.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


Open Government Data Report

Rapport sur les données ouvertes publiques : Encourager la maturité des politiques de données ouvertes pour un impact durable

OCDE

Ce rapport offre un aperçu détaillé de l’état des politiques de données ouvertes dans les pays membres de l’OCDE et de ses partenaires, se basant principalement sur les données récoltées par les enquêtes de l’OCDE sur les données publiques ouvertes en 2013, 2014 et 2016, sur celles des revues de pays et des analyses comparatives faîtes par l’OCDE. Le rapport analyse les politiques de données ouvertes en utilisant un cadre analytique conforme à l’indice OURdata sur les données publiques ouvertes, utiles et réutilisables et à la Charte internationale des données ouvertes (International Open Data Charter). Il évalue les efforts déployés par les gouvernements pour renforcer la disponibilité, l'accessibilité et la réutilisation des données publiques ouvertes. Le rapport soutient qu’au-delà de l'engagement des pays à ouvrir des données gouvernementales de qualité, la création de valeur publique nécessite la mobilisation des différentes communautés d'utilisateurs de l'ensemble de l'écosystème, tel que les journalistes, les organisations de la société civile, les entrepreneurs, les grandes entreprises technologiques privées et les universités. Le rapport souligne également le fait que les politiques de données ouvertes sont des éléments de transformations numériques plus larges et que les politiques de données du secteur public nécessitent une interaction avec d'autres programmes publics, tels que celles du gouvernement ouvert, de l'innovation, l'emploi, l'intégrité, la budgétisation publique, le développement durable, la mobilité urbaine et les transports. Il met aussi l’accent sur la pertinence de mesurer les impacts des données ouvertes afin de soutenir l'analyse de rentabilisation (i.e. le business case) des données publiques ouvertes.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.

Good Practice Principles for Data Ethics in the Public Sector

Principes de bonnes pratiques pour l'éthique des données dans le secteur public

Division des données et gouvernement données numériques de l'OCDE

(En anglais - titre original : Good Practice Principles for Data Ethics in the Public Sector) Prendre des mesures communes fondées sur des valeurs qui placent les droits de l'homme au cœur des politiques en matière de gouvernement numérique et de données. Les principes de bonnes pratiques pour l'éthique des données dans le secteur public soutiennent l'utilisation éthique des données dans les projets, produits et services du gouvernement numérique afin de garantir qu'ils sont dignes de la confiance des citoyens. Le document présente 10 principes de bonnes pratiques pour l'éthique des données dans le secteur public, y compris une série d'actions spécifiques qui peuvent soutenir leur mise en œuvre.

Recommandé par le Bureau du DPI du Canada, Secrétariat du Conseil du Trésor du Canada, un partenaire de la Communauté des données du GC.




Introduction to hierarchical Bayesian modeling for ecological data

Introduction à la modélisation bayésienne hiérarchique pour les données écologiques

Eric Parent et Etienne Rivot

(En anglais - titre original : Introduction to hierarchical Bayesian modeling for ecological data) Rendant la modélisation et l'inférence statistiques plus accessibles aux écologistes et aux scientifiques connexes, Introduction à la modélisation bayésienne hiérarchique pour les données écologiques offre aux lecteurs un cadre souple et efficace pour apprendre à connaître les processus écologiques complexes à partir de diverses sources de données. Il aide également les lecteurs à commencer à construire leurs propres modèles statistiques. Le texte commence par des modèles simples qui deviennent progressivement plus complexes et réalistes grâce à des covariables explicatives et des variables intermédiaires à états cachés. Lors de l'ajustement des modèles aux données, les auteurs présentent progressivement les concepts et techniques du paradigme bayésien d'un point de vue pratique à l'aide d'études de cas réels. Ils soulignent comment la modélisation bayésienne hiérarchique prend en charge les modèles multidimensionnels impliquant des interactions complexes entre les paramètres et les variables latentes. Des ensembles de données, des exercices et des codes R et WinBUGS sont disponibles sur le site Web des auteurs. Ce livre montre comment la modélisation statistique bayésienne offre un moyen intuitif d'organiser les données, de tester des idées, d'étudier des hypothèses concurrentes et d'évaluer le degré de confiance des prédictions. Il illustre également comment le raisonnement conditionnel peut démanteler une réalité complexe en morceaux plus compréhensibles. Le raisonnement conditionnel étant intimement lié à la pensée bayésienne, la prise en compte des modèles hiérarchiques dans le cadre bayésien offre un cadre unifié et cohérent pour la modélisation, l'estimation et la prédiction.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Statistical and machine-learning data mining

Extraction de données statistiques et d'apprentissage automatique : techniques pour une meilleure modélisation prédictive et une meilleure analyse des données volumineuses

Bruce Ratner

(En anglais - titre original : Statistical and machine-learning data mining: techniques for better predictive modeling and analysis of big data) Axée sur des modèles statistiques à grande échelle uniques qui prennent efficacement en compte les structures d'identification des big data (variables) avec le pouvoir prédictif approprié afin de produire des analyses à grande échelle fiables, robustes et pertinentes, cette édition comprend 13 chapitres, ainsi que des explications sur le modèle GenIQ propre à l'auteur.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.





Shifting the Balance

Modifier l'équilibre : Comment les meilleures organisations battent la concurrence en combinant l'intuition et les données

Mark Schrutt

(En anglais - titre original : Shifting the Balance: How Top Organizations Beat the Competition by Combining Intuition with Data) Mark Schrutt, expert en transformation numérique, révèle comment les plus grandes entreprises du monde utilisent de grandes quantités de données pour éclairer leurs décisions, perturber les industries et se rapprocher de leurs clients. Les entreprises qui continuent à ne se fier qu'à leur intuition le font à leurs risques et périls. Et si vous disposiez des données dont vous avez toujours rêvé et pouviez dire quelle est la véritable tendance émergente qui va changer à jamais votre secteur ? Modifier l'équilibre analyse le virage vers la prise de décision basée sur les données et décrit comment les organisations les plus performantes utilisent les données pour modifier leur champ de vision afin qu'il soit tourné vers l'avenir plutôt que réactif.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Data Mining with R: Learning with Case Studies

Data Mining avec R : Apprendre avec des études de cas, deuxième édition

Luis Torgo

(En anglais - titre original : Data Mining with R: Learning with Case Studies, Second Edition) Data Mining avec R utilise des exemples pratiques pour illustrer la puissance de R et du data mining. Cette nouvelle édition, qui constitue une mise à jour complète de la première édition best-seller, est divisée en deux parties. La première partie comprend des éléments d'introduction, dont un nouveau chapitre d'introduction à l'exploration de données, qui vient compléter l'introduction à R déjà existante. La deuxième partie comprend des études de cas, et la nouvelle édition révise fortement le code R des études de cas afin de le mettre à jour avec les paquets récents qui sont apparus dans R. Le livre ne suppose aucune connaissance préalable de R. Les lecteurs qui ne connaissent pas R et l'exploration de données devraient être en mesure de suivre les études de cas, et celles-ci sont conçues pour être autonomes afin que le lecteur puisse commencer n'importe où dans le document. Le livre est accompagné d'un ensemble de fichiers sources R librement disponibles, qui peuvent être obtenus sur le site Web du livre. Ces fichiers comprennent tout le code utilisé dans les études de cas et facilitent l'approche « do-it-yourself » suivie dans le livre. Conçu pour les utilisateurs d'outils d'analyse de données, ainsi que pour les chercheurs et les développeurs, ce livre devrait être utile à toute personne souhaitant entrer dans le « monde » de R et de l'exploration de données.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


R for Political Data Science: A Practical Guide

R pour la science des données politiques : Un guide pratique

Francisco Urdinez et Andrés Cruz (éditeurs)

(En anglais - titre original : R for Political Data Science: A Practical Guide) R pour la science des données politiques : Un guide pratique est un manuel destiné aux politologues novices en R qui souhaitent apprendre les méthodes les plus utiles et les plus courantes pour interpréter et analyser les données politiques. Il a été écrit par des politologues, en pensant aux nombreux problèmes du monde réel rencontrés dans leur travail. Le livre comporte 16 chapitres et est organisé en trois sections. La première, sur l'utilisation de R, s'adresse aux utilisateurs qui apprennent R ou qui migrent d'un autre logiciel. La deuxième section, consacrée aux modèles économétriques, couvre les MCO, les modèles binaires et de survie, les données de panel et l'inférence causale. La troisième section est une boîte à outils de science des données contenant certains des outils les plus utiles de la discipline : imputation de données, fusion floue de grands ensembles de données, exploration du Web, analyse quantitative de texte, analyse de réseau, cartographie, analyse spatiale en grappes et analyse en composantes principales. Comme le suggère le titre, ce livre est très appliqué par nature et est conçu comme une boîte à outils pour le lecteur. Il peut être utilisé dans le cadre de cours de méthodologie et de science des données, tant au niveau du premier cycle que du deuxième cycle. Il sera également utile à un étudiant universitaire poursuivant un doctorat, à des consultants politiques ou à un fonctionnaire, qui ont tous besoin de transformer leurs ensembles de données en conclusions substantielles et facilement interprétables.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.


The Social Dynamics of Open Data

La dynamique sociale des données ouvertes

François van Schalkwyk, Stefaan G Verhulst et Gustavo Magalhaes

(En anglais - titre original : The Social Dynamics of Open Data) La dynamique sociale des données ouvertes est un recueil d'articles évalués par les pairs présentés lors du 2e symposium de recherche sur les données ouvertes (ODRS) qui s'est tenu à Madrid, en Espagne, le 5 octobre 2016. La recherche est essentielle pour développer une analyse plus rigoureuse et plus fine non seulement des raisons pour lesquelles les données ouvertes sont précieuses, mais aussi de la manière dont elles le sont et dans quelles conditions spécifiques. L'objectif du Symposium de recherche sur les données ouvertes et du recueil de chapitres qui en découle et qui est publié ici est de construire une telle base de preuves plus solide. Cette base est essentielle pour comprendre quels ont été les impacts des données ouvertes à ce jour, et comment les impacts positifs peuvent être activés et amplifiés. Par conséquent, le point commun à la majorité des chapitres de cette collection est la tentative des auteurs de s'appuyer sur les théories scientifiques existantes et de les appliquer aux données ouvertes afin de mieux expliquer la dynamique socialement intégrée qui explique les succès et les échecs des données ouvertes dans la contribution à une société plus équitable et plus juste.

Recommandé par Agriculture et Agroalimentaire Canada, un partenaire de la Communauté des données du GC.



Il nous manque quelque chose ? Envoyez-nous les détails : Communauté des données du GC


Communauté des données du GC | Contactez-nous | Inscrivez-vous | Joignez-vous à nous sur GCcollab | Partenaires