Lemmatisation et annotations des formes verbales du français médiéval
Langue Français
Langue Français
Auteur(s) : Bringer Clara
Directeur : Bernhard, Delphine, Glikman, Julie
Date de création : 30-06-2019
Description : Ce travail consiste à déterminer la forme infinitive (c’est-à-dire le lemme), le mode, le temps, la personne et le nombre de chaque forme verbale du texte La Queste del saint Graal. Nous expliquons les difficultés liées au français médiéval, ainsi que les enjeux liés à ces annotations. Pour réaliser ces annotations, nous travaillons sur l’édition de ce texte présente sur le site TXM, mise à disposition par la Base de Français Médiévale (BFM), annotée automatiquement, et dont les annotations ont été vérifiées manuellement par l’équipe de la BFM. Cette édition a également été annotée et lemmatisée par l’outil LGeRM (Lemmes, Graphies et Règles Morphologiques) pour le site de l’ATILF (Analyse et Traitement Informatique de la Langue Française), ce dont nous nous servons également. Nous étudions pour cela le fonctionnement de LGeRM, et nous utilisons le site du TCAF (Tableau de Conjugaison de l’Ancien Français), qui recense les tableaux de conjugaison de 266 verbes différents.
Discipline : Technologies des langues
Mots-clés libres : Français (langue) Avant 1300 (ancien français), Lemmatisation Lemmatiseur Annotation Médiéval Formes verbales Variations Variations graphiques Graphies Etiquettes morphologiques Corpus Précision, 447
Couverture : FR
Directeur : Bernhard, Delphine, Glikman, Julie
Date de création : 30-06-2019
Description : Ce travail consiste à déterminer la forme infinitive (c’est-à-dire le lemme), le mode, le temps, la personne et le nombre de chaque forme verbale du texte La Queste del saint Graal. Nous expliquons les difficultés liées au français médiéval, ainsi que les enjeux liés à ces annotations. Pour réaliser ces annotations, nous travaillons sur l’édition de ce texte présente sur le site TXM, mise à disposition par la Base de Français Médiévale (BFM), annotée automatiquement, et dont les annotations ont été vérifiées manuellement par l’équipe de la BFM. Cette édition a également été annotée et lemmatisée par l’outil LGeRM (Lemmes, Graphies et Règles Morphologiques) pour le site de l’ATILF (Analyse et Traitement Informatique de la Langue Française), ce dont nous nous servons également. Nous étudions pour cela le fonctionnement de LGeRM, et nous utilisons le site du TCAF (Tableau de Conjugaison de l’Ancien Français), qui recense les tableaux de conjugaison de 266 verbes différents.
Discipline : Technologies des langues
Mots-clés libres : Français (langue) Avant 1300 (ancien français), Lemmatisation Lemmatiseur Annotation Médiéval Formes verbales Variations Variations graphiques Graphies Etiquettes morphologiques Corpus Précision, 447
Couverture : FR
Type : Mémoire de master, Memoire Unistra
Format : Document PDF
Source(s) :
Format : Document PDF
Source(s) :
- http://www.sudoc.fr/262988933
Entrepôt d'origine :
Identifiant : ecrin-ori-330115
Type de ressource : Ressource documentaire
Identifiant : ecrin-ori-330115
Type de ressource : Ressource documentaire