Enseignement 2023-2024 : Apprendre les langues aux machines
Séminaire du 08 décembre 2023 : Quelques exemples d’application du TAL aux humanités numériques

Intervenant : Jean-Baptiste Camps, maître de conférences en philologie computationnelle à l’École nationale des chartes, PSL

Traitement automatique des langues et sciences humaines computationnelles : l’intelligence artificielle au service du passé

Cette intervention présentera des cas d’usage de méthodes relevant du traitement automatique des langues en sciences humaines, et particulièrement dans les sciences des textes et la philologie des textes anciens et médiévaux en français et en hébreu. Nous commencerons par l’utilisation de techniques d’alignement texte/image qui facilitent la création supervisée de données de vérité de terrain pour la transcription automatique d’écritures manuscrites, aident à la résolution des abréviations et la reconstitution des copies d’un même texte. Nous continuerons avec les défis posés par la normalisation ou la lemmatisation d’états anciens de langue, présentant une variation graphique importante, tout en montrant comment cela peut servir ensuite pour la détection de l’intertextualité ou bien encore, à l’utilisation de méthodes de stylométrie pour l’identification des auteurs de textes anonymes ou disputés. Enfin, nous montrerons comment le traitement automatique des langues et l’intelligence artificielle peuvent être mis au service de la constitution et l’analyse de vastes corpus en diachronie longue, et comment ceux-ci peuvent être ensuite analysés en ayant recours à des méthodes telles que les plongements de mots et documents (embeddings) ou les grands modèles de langue pour ensuivre dans le temps les grandes évolutions thématiques.

Retrouvez les enregistrements audios et vidéos du cycle :
https://www.college-de-france.fr/fr/agenda/seminaire/apprendre-les-langues-aux-machines

Chaire Informatique et sciences numériques
Professeur : Benoît Sagot

Retrouvez tous ses enseignements :
https://www.college-de-france.fr/fr/chaire/benoit-sagot-informatique-et-sciences-numeriques-chaire-annuelle

Le Collège de France est une institution de recherche fondamentale dans tous les domaines de la connaissance et un lieu de diffusion du « savoir en train de se faire » ouvert à tous.
Les cours, séminaires, colloques sont enregistrés puis mis à disposition du public sur le site internet du Collège de France.

Découvrez toutes les ressources du Collège de France :
https://www.college-de-france.fr

Suivez-nous sur :
Facebook : https://www.facebook.com/College.de.France
Instagram : https://www.instagram.com/collegedefrance
X (ex-Twitter) : https://twitter.com/cdf1530
LinkedIn : https://fr.linkedin.com/company/collègedefrance

Leave A Reply