Neutralisation automatique du genre à travers l’utilisation de noms collectifs en français
Langue Français
Langue Français
Auteur(s) : Doyen, Enzo
Directeur(s) : Todiraşcu-Courtier, Amalia
Composante : Faculté des langues
Établissement : Université de Strasbourg
Date de création : 30-06-2024
Résumé(s) : Une grande part des données textuelles utilisées dans le domaine du traitement automatique des langues (TAL) comporte des biais relatifs au genre, notamment en raison de l’utilisation de noms au masculin générique (des noms de genre masculin censés regrouper hommes et femmes), qui peuvent perpétuer et renforcer les stéréotypes. La réécriture du genre, une tâche du domaine du TAL qui vise à détecter et remplacer automatiquement des formes genrées par des formes neutres ou opposées (en passant par exemple du masculin au féminin) peut être utilisée pour réduire ce type de biais. Bien que des travaux dans ce champ aient été réalisés pour l’anglais, l’arabe, le portugais et l’allemand, il n’existe aucun travail similaire pour le français. Nous avons pour objectif de créer un système de réécriture neutre pour le français en utilisant les noms collectifs, qui ont un genre fixe en français. Ce mémoire présente GeNRe, le tout premier système de réécriture neutre pour le français. Nous présentons un système à base de règles conçu spécifiquement pour le français, ainsi que deux modèles de langue affinés pour cette tâche. En outre, nous visons à évaluer l’efficacité des modèles d’instructions pour améliorer les performances de nos autres systèmes. À travers cette contribution, notre objectif est de promouvoir le développement des techniques de réduction des biais de genre dans le domaine du TAL en français.
Discipline : Technologie des langues
Directeur(s) : Todiraşcu-Courtier, Amalia
Composante : Faculté des langues
Établissement : Université de Strasbourg
Date de création : 30-06-2024
Résumé(s) : Une grande part des données textuelles utilisées dans le domaine du traitement automatique des langues (TAL) comporte des biais relatifs au genre, notamment en raison de l’utilisation de noms au masculin générique (des noms de genre masculin censés regrouper hommes et femmes), qui peuvent perpétuer et renforcer les stéréotypes. La réécriture du genre, une tâche du domaine du TAL qui vise à détecter et remplacer automatiquement des formes genrées par des formes neutres ou opposées (en passant par exemple du masculin au féminin) peut être utilisée pour réduire ce type de biais. Bien que des travaux dans ce champ aient été réalisés pour l’anglais, l’arabe, le portugais et l’allemand, il n’existe aucun travail similaire pour le français. Nous avons pour objectif de créer un système de réécriture neutre pour le français en utilisant les noms collectifs, qui ont un genre fixe en français. Ce mémoire présente GeNRe, le tout premier système de réécriture neutre pour le français. Nous présentons un système à base de règles conçu spécifiquement pour le français, ainsi que deux modèles de langue affinés pour cette tâche. En outre, nous visons à évaluer l’efficacité des modèles d’instructions pour améliorer les performances de nos autres systèmes. À travers cette contribution, notre objectif est de promouvoir le développement des techniques de réduction des biais de genre dans le domaine du TAL en français.
Discipline : Technologie des langues
Mots-clés libres :
Couverture : FR
- Sociolinguistique
- France
- Traitement automatique du langage naturel
- 408
Type : Mémoire de master, Memoire Unistra
Format : PDF
Source(s) :
Format : PDF
Source(s) :
- http://www.sudoc.fr/283166207
Entrepôt d'origine :
Identifiant : ecrin-ori-380025
Type de ressource : Ressource documentaire

Identifiant : ecrin-ori-380025
Type de ressource : Ressource documentaire