<?xml version="1.0" encoding="UTF-8"?>
<oaidc:dc xmlns:oaidc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:source xsi:type="dcterms:URI">http://www.sudoc.fr/280853491</dc:source>
<dc:language xsi:type="dcterms:ISO639-2">fre</dc:language>
<dc:coverage xsi:type="unistra:Coverage">FR</dc:coverage>
<dc:title xml:lang="fre" xsi:type="unistra:Titre">Traduction automatique des dialectes alsaciens vers l’allemand standard :</dc:title>
<dc:type xsi:type="unistra:Mention">Mémoire de master</dc:type>
<dc:description xml:langue="fr" xsi:type="unistra:Discipline">Technologie des langues</dc:description>
<dc:description xml:langue="" xsi:type="unistra:Resume">La traduction automatique (TA) basée sur les réseaux neuronaux fait aujourd'hui l'objet de recherches intensives. Les modèles multilingues, avec la génération de texte comme objectif, sont bien développés et pré-entraînés pour les langues bien dotées. Les langues peu dotées sont toutefois plus difficiles à gérer. La faible quantité de données disponibles rend la TA difficile. Un autre facteur de plus grande complication est le manque de normalisation à l’écrit de ces langues. Ce projet de recherche vise à développer la traduction automatique pour les dialectes alsaciens par un rapprochement vers deux langues germaniques. Des modèles de traduction multilingues (M2M-100, Opus-MT, SMALL-100, NLLB-200) ont été utilisés, ainsi qu'un grand modèle de langues (ChatGPT 3.5) (LLM). Pour ce rapprochement vers deux langues germaniques (l’allemand et le luxembourgeois), plusieurs transformations de corpus ont été développées. Afin d’estimer l’intérêt de notre approche, chaque transformation suivie par la traduction par les modèles évoqués a été évaluée selon les métriques d’évaluation courantes. Un gold standard avant toute transformation a également été créé. Après plusieurs transformations et évaluations, nous avons pu confirmer que quel que soit le corpus, la transformation ou la langue, le grand modèle de langues est clairement et sans aucun doute supérieur aux modèles multilingues pour toutes les métriques appliquées. Nous concluons en évoquant quelques pistes d’amélioration et perspectives pour ce travail.</dc:description>
<dc:date xsi:type="unistra:Date">2024-06-30</dc:date>
<dc:subject xml:lang="fre">Traduction automatique</dc:subject>
<dc:subject xml:lang="fre">Alsaciens</dc:subject>
<dc:subject xsi:type="unistra:Classification">437.944</dc:subject>
<dc:creator xsi:type="unistra:Auteur">Wurps, Franka Emilie</dc:creator>
<dc:contributor xsi:type="unistra:Directeur">Bernhard, Delphine</dc:contributor>
<dc:publisher xsi:type="unistra:Etablissement">Université de Strasbourg</dc:publisher>
<dc:publisher xsi:type="unistra:Composante">Faculté des langues</dc:publisher>
<dc:format xsi:type="dcterms:IMT">application/pdf</dc:format>
<dc:rights xsi:type="unistra:Droits" xml:lang="fre">Accès libre</dc:rights>
<dc:identifier xsi:type="dcterms:URI">https://publication-theses.unistra.fr/public/memoires/2024/FLCE/2024_WURPS_Franka-Emilie.pdf</dc:identifier>
<dc:type xsi:type="unistra:Memoire">Memoire Unistra</dc:type>
</oaidc:dc>
