La textométrie pour évaluer les productions des élèves#

Informations

  • Atelier Numérique

  • Auteurs : Fanny Rinck, LIDILEM & Philippe Dessus, Inspé & LaRAC, Univ. Grenoble Alpes.

  • Date de création : Janvier 2020.

Informations supplémentaires
  • Date de modification : 03 avril 2024.

  • Durée de lecture : 4 minutes.

  • Statut du document : Terminé.

  • Résumé : Cet atelier permet de se sensibiliser à l’utilisation de la lexicométrie pour analyser les productions écrites des élèves.

  • Citation : Pour citer ce document : Auteur·s (Date_de_création_ou_de_révision). Titre_du_document. Grenoble : Univ. Grenoble Alpes, Inspé, base de cours en sciences de l’éducation, accédé le date_d_accès, URL_du_document.

  • Licence : Document placé sous licence Creative Commons : BY-NC-SA.

Analyse d’usages : la lexicométrie#

La lexicométrie est l’analyse statistique de l’usage des mots dans un ou des textes afin de les interpréter, cela indépendamment du contexte d’énonciation (qui parle, dans quel contexte). Dans cet atelier, nous allons explorer des textes par la fréquence de leurs mots et leur concordance, deux activités qui sont utiles à l’enseignant pour mieux comprendre l’utilisation des mots par ses élèves.

Explorer les fréquences#

Les listes de mots#

Le moyen le plus simple d’avoir une idée du contenu d’un texte est d’en établir une liste alphabétique, avec la fréquence d’occurrence de chaque mot. Il existe de nombreux utilitaires sur internet qui calculent de telles fréquences. Par exemple RapidTable>WordFrequency.

Exercice 1 : Copiez un texte de votre choix (de préférence une production d’élève) et collez-le dans la fenêtre du site ci-dessus et consultez les résultats. Vous noterez qu’il y a peu de mots qui ont des fréquences élevées et beaucoup de mots qui ont des fréquences faibles. Cela illustre la loi de Zipf.

Bien évidemment, comparer la fréquence d’apparition d’un même mot dans des textes différents est impossible si ces textes sont de longueur différente. On peut aisément calculer la fréquence relative des mots en divisant leur fréquence par le nombre de mots du texte analysé. Cette comparaison a toutefois un sens lorsque le nombre d’occurrences est élevé (voir Poudat & Landragin, 2017).

Les nuages de mots#

Une manière plus visuelle de représenter ces fréquences de mots est de recourir au nuage de mots, qui représente l’ensemble des mots d’un texte avec une taille proportionnelle à sa fréquence. Il y a aussi de très nombreux utilitaires sur internet qui réalisent des nuages de mots, comme nuagesdemots.fr.

Exercice 2 : Reprenez le même texte que dans l’exercice 1 et collez-le dans le site ci-dessus. Vous pouvez jouer sur certains paramètres (couleur des mots et du fond, taille et police de caratères).

Inconvénients de l’approche par fréquence#

Analyser des documents par la fréquence de leurs mots a certains inconvénients. Tout d’abord, elle ne donne aucune organisation thématique (pas de classement en sous-thèmes), et deux mots proches dans le nuage peuvent très bien n’avoir aucun rapport entre eux.

Autre problème, les formes des mots analysés peuvent ne pas être normées, c’est-à-dire corrigées orthographiquement, ce qui biaise le comptage. Enfin, il peut être intéressant, avant cette analyse, de réaliser une lemmatisation, c’est-à-dire ramener chaque mot à son lemme, sa forme canonique ou non fléchie, notamment indiquée en entrée de dictionnaire (p. ex., le lemme de “grandes” est “grand”, le lemme de “avait” est “avoir”). Le site Outils de lemmatisation de J. Pasquelin réalise cette opération.

Exercice 3 : Reprenez le même texte que pour les exercices ci-dessus et collez-le dans le site ci-dessus. Le nombre d’entrées est moins important.

Explorer les concordances#

Précédemment, on examinait les mots un par un, ce qui est plutôt pauvre et nous dit rien sur les éventuelles relations entre mots. Par exemple, dans un texte sur les chiens, on pourrait vouloir analyser quel est le contexte autour du mot “chien” dans les productions des élèves. Un concordancier est un programme qui réalise cette présentation : elle met au centre le mot (ou le groupe de mots) cible(s) (le pivot) et de part et d’autre son contexte (ses prédécesseurs et successeurs). Il existe de nombreux logiciels concordanciers, et le site AnaText 2.3 d’O. Kraif peut être utilisé.

Exercice 4 : Reprenez le même texte que pour les exercices ci-dessus et collez-le dans le champ du site AnaText ; cliquez sur le bouton “Analyser le texte”. Puis, dans le volet gauche de la fenêtre qui s’affiche, cliquez sur “Concordance”. Entrez le pivot voulu et cliquez sur le bouton “Rechercher”. Les différents contextes d’occurrence du pivot apparaissent, permettant l’analyse.

Utilisation pédagogique de la textométrie#

Exercice 4 : Visionner la vidéo ci-dessous et essayez de transposer les idées pédagogiques qui y sont contenues dans un enseignement de Cycle 3 de votre choix.

Les utilisations pédagogiques de ces outils sont nombreuses, en voici quelques-unes :

  • représenter synthétiquement les idées d’un texte, en vue d’un débat, d’une œuvre plastique ;

  • comparer plusieurs textes (p. ex. d’élèves, présentant des vues différentes, ou les représentations des élèves à 2 moments différents, p. ex. avant-après des cours sur le sujet) ;

  • exprimer collaborativement des attentes et les visualiser ;

  • via le concordancier, analyser finement les représentations des élèves, ou leur usage de tel ou tel mot.

Conception#

Imaginer deux à trois activités mettant en œuvre ces outils, éventuellement en faisant des recherches sur internet.

Questions de réflexion#

  • Quels sont les avantages et inconvénients d’une analyse textométrique des productions des élèves ?

  • Peut-elle être utilisée pour évaluer ces productions ? À quelles conditions ?

  • Par quelles autres analyses vous les compléteriez ?

  • Cette approche peut-elle aussi être utilisée pour mieux caractériser les textes présentés aux élèves ?

Rendre compte#

L’objectif de cette partie est de présenter aux autres ce que vous avez appris lors de cet atelier. Le mode de restitution sera précisé par votre formateur.

  • Les réponses aux questions de l’analyse réflexive.

  • Les choix que vous avez été amenés à faire pour votre scénario.

  • Les éléments qu’il vous manquent et le chemin qu’il vous reste à parcourir pour l’utiliser dans votre classe.

Références#

  • Marchand, P. & Ratinaud, P. (s.d.). Faut-il faire des nuages de mots ? Blog d’Iramuteq.

  • Poudat, C., & Landragin, F. (2017). Explorer un corpus textuel. Bruxelles: De Boeck.