Open Data et protection de la vie privée
Exploration des données publiques et des enjeux du RGPD concernant les données personnelles.
Besoin d’un plan de cours en SNT : Culture et Citoyenneté Numérique ?
Questions clés
- Comment concilier l'ouverture des données publiques et la nécessité de protéger la vie privée des individus ?
- Dans quelle mesure l'Open Data favorise-t-il la transparence démocratique et l'innovation citoyenne ?
- Quels risques la publication de données ouvertes peut-elle engendrer pour les personnes concernées ?
Programmes Officiels
À propos de ce thème
L'Open Data et la protection de la vie privée forment un couple indissociable dans le programme de SNT. L'Éducation nationale demande aux élèves de Seconde de comprendre à la fois la valeur des données ouvertes pour la démocratie et les risques que leur publication peut engendrer pour les individus. Le RGPD (Règlement Général sur la Protection des Données), en vigueur dans l'UE depuis 2018, est le cadre juridique central de cette réflexion.
Les élèves explorent des portails de données ouvertes (data.gouv.fr, data.europa.eu) et analysent comment les données publiques sont anonymisées avant publication. Ils découvrent que l'anonymisation parfaite est un défi technique majeur : des données apparemment inoffensives peuvent permettre la ré-identification par croisement. Ce sujet mêle technique, droit et éthique, ce qui en fait un terrain idéal pour le débat argumenté et l'étude de cas. Les approches actives permettent aux élèves de se confronter directement aux dilemmes plutôt que de recevoir des réponses toutes faites.
Objectifs d'apprentissage
- Analyser la structure et le format des jeux de données ouverts disponibles sur data.gouv.fr.
- Évaluer les risques potentiels de ré-identification des individus à partir de jeux de données anonymisés.
- Expliquer le rôle et les principes fondamentaux du RGPD dans la protection des données personnelles.
- Comparer les approches d'anonymisation utilisées par différentes administrations publiques.
- Critiquer les limites de l'anonymisation des données dans le contexte de l'Open Data.
Avant de commencer
Pourquoi : Les élèves doivent avoir une compréhension de base de ce qu'est une donnée avant d'aborder la notion de donnée ouverte ou personnelle.
Pourquoi : La navigation sur les portails d'Open Data nécessite des compétences de recherche et de filtrage d'informations.
Vocabulaire clé
| Open Data | Données publiques rendues librement accessibles et réutilisables par tous, dans n'importe quel but. |
| RGPD | Règlement Général sur la Protection des Données, une loi européenne qui encadre le traitement des données personnelles. |
| Anonymisation | Processus visant à rendre impossible l'identification d'une personne à partir de données, même par recoupement. |
| Donnée personnelle | Toute information se rapportant à une personne physique identifiée ou identifiable. |
| Ré-identification | Processus consistant à retrouver l'identité d'une personne à partir de données qui étaient censées être anonymisées. |
Idées d'apprentissage actif
Voir toutes les activitésInvestigation collaborative : Peut-on ré-identifier des données anonymes ?
Les groupes reçoivent un jeu de données anonymisé (âge, code postal, profession) et tentent de retrouver des individus en croisant avec des sources publiques. Ils mesurent le risque de ré-identification et proposent des mesures de protection supplémentaires.
Débat structuré : Transparence publique vs vie privée
Deux équipes s'opposent sur un cas concret : faut-il publier les salaires des fonctionnaires en open data ? Chaque équipe prépare ses arguments en s'appuyant sur le RGPD et des exemples internationaux. Un jury d'élèves évalue la solidité des positions.
Atelier pratique : Explorer data.gouv.fr
Les élèves naviguent sur data.gouv.fr, choisissent un jeu de données et analysent les métadonnées : qui l'a publié, sous quelle licence, quelles colonnes contient-il, des données personnelles sont-elles présentes ? Ils rédigent une fiche d'évaluation critique.
Penser-Partager-Présenter: Mes données, mes droits
Chaque élève identifie trois services en ligne qu'il utilise et recherche leur politique de confidentialité. En binôme, ils vérifient si les droits RGPD (accès, rectification, effacement) sont effectivement accessibles. La mise en commun révèle les disparités entre services.
Liens avec le monde réel
Les journalistes d'investigation utilisent les données ouvertes de la Cour des comptes pour analyser les dépenses publiques et dénoncer les gaspillages, contribuant ainsi à la transparence démocratique.
Les développeurs d'applications citoyennes s'appuient sur les données ouvertes de transport (horaires de bus, plans de métro) pour créer des outils d'aide à la mobilité pour les habitants de grandes villes comme Lyon ou Marseille.
Les chercheurs en santé publique analysent des données anonymisées sur les maladies pour identifier des tendances et améliorer les campagnes de prévention, tout en respectant la vie privée des patients.
Attention à ces idées reçues
Idée reçue couranteLes données anonymisées ne permettent jamais d'identifier une personne.
Ce qu'il faut enseigner à la place
Le croisement de quelques variables apparemment anodines (âge, code postal, profession) peut suffire à ré-identifier un individu. Des études ont montré que 87 % des Américains sont identifiables avec ces trois seules données. L'exercice de ré-identification en groupe rend ce risque concret.
Idée reçue couranteLe RGPD interdit toute collecte de données personnelles.
Ce qu'il faut enseigner à la place
Le RGPD encadre la collecte, pas l'interdit. Il exige un fondement légal (consentement, intérêt légitime, obligation légale), une finalité précise et une durée de conservation limitée. L'analyse des politiques de confidentialité en atelier permet de vérifier ces principes dans la pratique.
Idée reçue couranteL'Open Data ne concerne que les informaticiens et les chercheurs.
Ce qu'il faut enseigner à la place
Les données ouvertes sont utilisées par les journalistes, les associations, les citoyens et les élus pour éclairer le débat public. Des applications courantes (itinéraires de transport, qualité de l'air) reposent sur l'Open Data. L'exploration de data.gouv.fr montre la diversité des usages accessibles à tous.
Idées d'évaluation
Distribuez une fiche avec deux questions : 1. Citez une donnée personnelle qui pourrait se trouver dans un jeu de données ouvert. 2. Expliquez en une phrase pourquoi l'anonymisation est cruciale pour cette donnée.
Proposez ce scénario : 'Une mairie publie la liste des noms et adresses des propriétaires de chiens.' Demandez aux élèves : Est-ce une donnée personnelle ? L'ouverture de cette donnée pose-t-elle un risque pour la vie privée ? Pourquoi ?
Pendant la présentation d'un portail d'Open Data, demandez aux élèves de lever la main s'ils identifient un jeu de données qui pourrait contenir des informations personnelles. Interrogez ensuite un élève pour qu'il justifie son choix.
Méthodologies suggérées
Prêt à enseigner ce sujet ?
Générez une mission d'apprentissage actif complète et prête pour la classe en quelques secondes.
Générer une mission personnaliséeQuestions fréquentes
Qu'est-ce que l'Open Data et à quoi ça sert ?
Qu'est-ce que le RGPD et quels sont mes droits ?
Comment l'apprentissage actif aide-t-il à comprendre les enjeux de l'Open Data ?
Comment vérifier si un site respecte le RGPD ?
Modèles de planification pour SNT : Culture et Citoyenneté Numérique
Plus dans Les Données Structurées et leur Traitement
Introduction aux données et à l'information
Les élèves distinguent les données brutes de l'information et explorent leur cycle de vie.
2 methodologies
Formats de données et métadonnées
Identification des formats ouverts (CSV, JSON) et analyse des informations invisibles cachées dans les fichiers.
2 methodologies
Représentation des nombres et du texte
Les élèves explorent comment les nombres et les caractères sont codés en binaire dans un ordinateur.
2 methodologies
Traitement de données avec Python
Utilisation de bibliothèques logicielles pour filtrer et trier des jeux de données massifs.
2 methodologies
Manipulation de listes et dictionnaires en Python
Les élèves apprennent à utiliser les structures de données fondamentales de Python pour organiser l'information.
2 methodologies