Digital Humanities Laboratory (DHLab)

Un centre d’expertise en Data Science au service des humanités numériques

La transdisciplinarité étant au cœur des actions du projet IDEX UCAJEDI, suite à la création du Medical Data Laboratory, la Maison de la Modélisation, de la Simulation et des Interactions (MSI) a impulsé la création d’un deuxième centre d’expertise thématique : le Digital Humanities Laboratory (DHLab).  

Son rôle : favoriser le dialogue entre les chercheurs en Data Science et ceux travaillant dans le domaine des Sciences Humaines et Sociales (SHS) au sein d’Université Côte d’Azur.

Objectifs

Le DHLab mène actuellement deux projets  (« Analyse automatisée d'images de bois archéologique » et « Alignement de l'expertise régionale et performance des entreprises ») ayant comme dénominateur commun le traitement de données textuelles (text mining). La phase pilote du DHLab inscrite dans le programme structurant Data Science du projet IDEX UCAJEDI s'est terminée en 2021 avec l'obtention définitive de l'IDEX. Le DHLab soutient désormais le développement et la recherche sur les problématiques de modélisation et traitement de données en SHS, au sein d’Université Côte d’Azur. Il offrira un véritable support pour la modélisation, la classification et la visualisation de données hétérogènes.

Les modalités d'aide du DHLab sur des projets de recherche seront affichées prochainement.

Formation

Le DHLab contribue au déploiement d’un cycle de formations courtes, sous la forme de séminaires et workshops sur la science des données, l’intelligence artificielle et l’intégration des données appliquées à plusieurs domaines, ayant lieu à Nice ou à Sophia Antipolis.
 

Découvrez l’offre de formations courtes de la MSI et inscrivez-vous à sa newsletter !

Équipe

Les décisions concernant l’activité et les missions du DHLab sont prises, en lien avec la gouvernance d’Université Côte d'Azur, par un comité stratégique constitué de représentants des membres de l'université, présidé par le Pr Arnaud Zucker (professeur de langue et littérature grecques chez Université Côte d’Azur).

Le personnel du DHLab travaille sous l’autorité hiérarchique du directeur de la MSI, le Pr Stéphane Descombes. Actuellement, font partie du DHLab :

  • Le Dr Marco Corneli, responsable opérationnel, qui assure le bon fonctionnement du laboratoire et qui travaille sur le projet "Analyse automatisée d'images de bois archéologique" au sein du laboratoire CEPAM d’Université Cote d’Azur ;
  • Jean-Noël Mattei, ingénieur data scientist, qui travaille sur le projet "Alignement de l'expertise régionale et performance des entreprises" au sein de Skema Business School, sur le campus de Sophia Antipolis.
Le DHLab s’appuie aussi sur un vaste bassin de ressources, représenté par des ingénieurs très actifs dans le domaine de la science des données et des chercheurs UCA de très haut niveau en statistique et intelligence artificielle.
Axes de recherche

Les axes de recherche du DHLab sont les suivants :

  • Algorithmes de prétraitement et nettoyage de données non structurées ;
  • Classification, traitement et modélisation de données hétérogènes telles que textes, images et données d’interaction (graphes) ;
  • Apprentissage statistique, automatique et par réseaux profonds (deep learning), convolutionnels ou récurrents.

Les bases de données adoptées dans ces projets proviennent de plusieurs sites 

  1. Les laboratoires d’Université Côte d'Azur ;
  2. INSEE ;
  3. European Patent Office ;
  4. Microsoft Academic.
De plus, une base de données d'images anthracologiques, sur base nationale, est en train d'être constituée par la CEPAM et sera utilisée dans le cadre du projet "Analyse automatisée d'images de bois archéologique".
Publications

Preprints

L. Vanni, M. Corneli, D. Mayaffre, F. Precioso : From text saliency to linguistic objects: learning linguistic interpretable markers with a multichannel convolutional architecture (2021). hal-03142170

Articles dans reviews

M. Corneli, C. Bouveyron, P. Latouche : Co-Clustering of Ordinal Data via Latent Continuous Random Variables and Not Missing at Random Entries, “Journal of Computational and Graphical Statistics”, Mars 2020.

Chapitres d'ouvrage

L. Vanni, M. Corneli, D. Longrée, D. Mayaffre, F. Precioso. Key Passages : From statistics to Deep Learning. D. Fioredistella Iezzi; D. Mayaffre; Michelangelo Misuraca. Text Analytics. Advances and Challenges, Springer, pp.41-54, 2020, 978-3-030-52679-5. 10.1007/978-3-030-52680-1_4. hal-03099658⟩.

Conférences

L. Vanni, M. Corneli, D. Longrée, D. Mayaffre, F. Precioso. Hyperdeep : deep learning descriptif pour l'analyse de données textuelles. JADT 2020 - 15èmes Journées Internationales d'Analyse statistique des Données Textuelles, Juin 2020, Toulouse, France. hal-02926880

Contacts

Dr Marco Corneli : marco.corneli@univ-cotedazur.fr

Projets en cours

Charbon de bois. Originel à gauche, heatmap superposée à droite, à souligner les régions utilisées par le CNN pour la classification.
Charbon de bois. Originel à gauche, heatmap superposée à droite, à souligner les régions utilisées par le CNN pour la classification.

Anciens projets

Passages clefs dans le discours de Macron attribués aux classes “Trump” et “Obama”
Passages clefs dans le discours de Macron attribués aux classes “Trump” et “Obama”