Organisation

  1. Bruno Bon (Dictionnaire du latin médiéval, Institut de Recherche et d’Histoire des Textes, CNRS)
  2. Krzysztof Nowak (Dictionnaire du latin médiéval, Institut de la Langue Polonaise, PAN)

Motivation

Après une première expérience en 2016, nous souhaitons proposer deux sessions pour l’édition IMC 2018, sur la construction et l’utilisation des corpus textuels électroniques dans les études médiévales, en associant des utilisateurs et créateurs confirmés d’outils numériques à ceux qui font leurs premiers pas dans la recherche sur les corpus. L’IMC offre une belle occasion à ce genre de discussion, car l'événement rassemble des spécialistes de nombreuses disciplines, aptes à signaler les outils qui leur sont nécessaires, et à préciser les questions qu’ils posent à leurs corpus.

La première session traitera des questions générales sur la création de corpus textuels, pendant que la seconde, suivant le thème annuel de l’IMC, étudiera des cas d’utilisation pratique des corpus textuels dans la recherche en latin médiéval.

Session 1: Quel corpus textuel pour les études médiévales ?

Le tout récent projet ANR VELUM (Visualisation, Exploration et Liaison de ressources innovantes pour le latin médiéval) cherche à construire un corpus de latin médiéval le plus utile possible à la communauté scientifique, représentatif de la richesse de l’écriture médiolatine, en l’accompagnant d’outils d’analyse approfondie. Souvent conçu de manière assez lâche, le « corpus textuel » est ici compris de façon rigoureuse, son architecture devant correspondre au moins généralement aux proportions des genres dans la production écrite contemporaine. Facile dictu...

Suggestions : 1) Représentativité : Qu’est-ce qu’un corpus textuel historiquement représentatif ? Comment représenter la richesse de la production écrite dans un corpus restreint ? De quel(s) latin(s) s’agit-il (période, région, genre, etc.) ? Comment évaluer l’importance relative des textes médiévaux (tradition manuscrite, etc.) ? 2) Textes : Quelles sources utiliser, dans quelles éditions, avec quels droits ? Un même et unique corpus peut-il répondre à tous les besoins ? 3) Quels outils d’interrogation pour la recherche historique ? Quel affichage des données textuelles ? Quelle visualisation des textes, pour quel usage ? Quel lien avec les autres outils (linked data) ?

Session 2: Vocabulaire de la mémoire

Les études du vocabulaire ont largement bénéficié du tournant numérique. Les grands corpus permettent une analyse empirique de milliers d’occurrences, largement libérée de la subjectivité et des biais dont les études lexicales ont longtemps souffert. Les métadonnées rendent possibles l’interrogation simultanée d’un corpus et de ses parties, et les études comparatives de genre, d’auteur ou de périodes. Avec les méthodes automatiques (distant reading), on assiste à un changement radical du champ exploratoire des médiévistes. La session cherchera à montrer comment ces corpus peuvent aider le latiniste, l’historien ou le philosophe à mieux comprendre l’usage des mots et la verbalisation des concepts en latin médiéval. En accord avec le thème de l’IMC 2018, il s’agira ici du vocabulaire de la mémoire.

Suggestions : 1) Memoria & co. : Quels mots pour la mémoire et les concepts voisins ? Comment le champ lexical de la mémoire a-t-il évolué à travers les âges ? 2) Fonctions : Comment et pourquoi le vocabulaire lié à la mémoire varie-t-il selon le genre du texte, sa fonction ou son public ? 3) Métaphorisation : Par quelles métaphores le concept de mémoire est-il saisi ? 4) Comment retrouver automatiquement les mots liés à la mémoire ? Comment identifier les principaux modèles d’usage (analyse des cooccurrences, etc.) ? Comment repérer les textes liés à la mémoire (mots-clefs, topic modelling, etc.) ?

Qui ?

Les sessions sont ouvertes à tous, linguistes, historiens, humanistes numériques, etc, scientifiques expérimentés ou jeunes chercheurs.

Commment ?

La communication peut se faire dans toutes les langues du congrès (allemand, anglais, français, espagnol, italien). La proposition, qui doit être envoyée au plus tard le 22 Septembre 2017 conjointement à bruno.bon@irht.cnrs.fr et krzysztof.nowak@ijp.pan.pl, contiendra :

Les organisateurs ne peuvent malheureusement pas contribuer aux frais des participants.

Pour toute question, n’hésitez pas à nous contacter.

  1. Bruno Bon est sous-directeur de l’Institut de Recherche et d’Histoire des Textes (CNRS, Paris), et rédacteur du Novum Glossarium Mediae Latinitatis (UAI). Il a coordonné le projet ANR Omnia (http://glossaria.eu), qui a abouti à la rétrodigitalisation de dictionnaires (Glossarium de Du Cange et  NGML) et au développement de paramètres de lemmatisation du latin médiéval pour Treetagger. Porteur du nouveau projet ANR Velum, il s’occupe actuellement de sémantique historique et de statistique textuelle : https://www.irht.cnrs.fr/annuaire/bon-bruno.
  2. Krzysztof Nowak est un linguiste et lexicographe du latin médiéval. Membre de l’équipe de rédaction du Lexicon Medii et Infimae Latinitatis Polonorum (IJP-PAN), il est responsable de la conception, de la coordination et de la programmation du dictionnaire électronique (http://scriptores.pl/elexicon/en) et du corpus électronique (http://scriptores.pl/en/efontes/) du latin médiéval polonais. Ses recherches récentes concernent la linguistique de corpus latine et la sémantique distributionnelle : https://ijp-pan.krakow.pl/nasi-pracownicy/doktorzy/krzysztof-nowak.