Skip to content
Numérique et sciences informatiques · Première

Idées d’apprentissage actif

Représentation des textes

La représentation des textes est une thématique qui lie l'informatique à la culture universelle et aux enjeux de communication mondiale. De l'ASCII historique, limité aux caractères anglo-saxons, à l'Unicode (UTF-8) capable de coder tous les alphabets et emojis, les élèves découvrent comment la technique s'adapte à la diversité humaine. Ce sujet est crucial pour comprendre pourquoi certains fichiers affichent des caractères étranges ou pourquoi la taille des fichiers texte varie.

Programmes OfficielsBOEN spécialité NSI 1re - Représentation d'un texte en machineBOEN spécialité NSI 1re - Normes ASCII, ISO-8859-1, Unicode
20–40 minBinômes → Classe entière3 activités

Activité 01

Galerie marchande40 min · Classe entière

Galerie marchande: L'évolution des encodages

Des affiches présentent différents encodages (ASCII, ISO-8859-1, UTF-8). Les élèves circulent pour identifier quels caractères sont supportés et notent les différences de stockage pour un même mot.

Qu'est-ce que le code ASCII ?
ComprendreAppliquerAnalyserCréerCompétences relationnellesConscience sociale
Générer une leçon complète

Activité 02

Cercle de recherche30 min · Binômes

Cercle de recherche: Le mystère des accents disparus

Les élèves reçoivent un fichier texte corrompu. Ils doivent tester différents encodages dans leur éditeur pour retrouver le texte original et expliquer la cause du problème.

Comment représenter les caractères internationaux avec Unicode ?
AnalyserÉvaluerCréerAutogestionConscience de soi
Générer une leçon complète

Activité 03

Penser-Partager-Présenter20 min · Binômes

Penser-Partager-Présenter: Créer son propre emoji

Les élèves cherchent le code Unicode d'un emoji et calculent sa représentation en octets UTF-8, puis comparent leurs résultats avec un camarade.

Pourquoi observe-t-on parfois des erreurs d'affichage de caractères ?
ComprendreAppliquerAnalyserConscience de soiCompétences relationnelles
Générer une leçon complète

Quelques notes pour enseigner cette unité


Attention à ces idées reçues

  • Confondre le caractère et son glyphe (son apparence visuelle).

    Un caractère est un concept abstrait lié à un code numérique, alors que la police d'écriture est une image. Utiliser différents éditeurs pour ouvrir le même fichier aide à faire cette distinction.

  • Penser qu'un caractère occupe toujours un seul octet.

    C'était vrai pour l'ASCII, mais l'UTF-8 utilise entre 1 et 4 octets. Faire compter la taille en octets d'une chaîne contenant des accents montre que la longueur en caractères n'est pas égale à la taille mémoire.


Méthodes utilisées dans ce dossier