Digital Humanities Laboratory (DHLab)
Un centre d’expertise en Data Science au service des humanités numériques
La transdisciplinarité étant au cœur des actions du projet IDEX UCAJEDI, suite à la création du Medical Data Laboratory, la Maison de la Modélisation, de la Simulation et des Interactions (MSI) a impulsé la création d’un deuxième centre d’expertise thématique : le Digital Humanities Laboratory (DHLab).
Son rôle : favoriser le dialogue entre les chercheurs en Data Science et ceux travaillant dans le domaine des Sciences Humaines et Sociales (SHS) au sein d’Université Côte d’Azur.
- Objectifs
-
Le DHLab mène actuellement deux projets (« Analyse automatisée d'images de bois archéologique » et « Alignement de l'expertise régionale et performance des entreprises ») ayant comme dénominateur commun le traitement de données textuelles (text mining). La phase pilote du DHLab inscrite dans le programme structurant Data Science du projet IDEX UCAJEDI s'est terminée en 2021 avec l'obtention définitive de l'IDEX. Le DHLab soutient désormais le développement et la recherche sur les problématiques de modélisation et traitement de données en SHS, au sein d’Université Côte d’Azur. Il offrira un véritable support pour la modélisation, la classification et la visualisation de données hétérogènes.
Les modalités d'aide du DHLab sur des projets de recherche seront affichées prochainement. - Formation
-
Le DHLab contribue au déploiement d’un cycle de formations courtes, sous la forme de séminaires et workshops sur la science des données, l’intelligence artificielle et l’intégration des données appliquées à plusieurs domaines, ayant lieu à Nice ou à Sophia Antipolis.
Découvrez l’offre de formations courtes de la MSI et inscrivez-vous à sa newsletter !
- Équipe
-
Les décisions concernant l’activité et les missions du DHLab sont prises, en lien avec la gouvernance d’Université Côte d'Azur, par un comité stratégique constitué de représentants des membres de l'université, présidé par le Pr Arnaud Zucker (professeur de langue et littérature grecques chez Université Côte d’Azur).
Le personnel du DHLab travaille sous l’autorité hiérarchique du directeur de la MSI, le Pr Stéphane Descombes. Actuellement, font partie du DHLab :
- Le Dr Marco Corneli, responsable opérationnel, qui assure le bon fonctionnement du laboratoire et qui travaille sur le projet "Analyse automatisée d'images de bois archéologique" au sein du laboratoire CEPAM d’Université Cote d’Azur ;
- Jean-Noël Mattei, ingénieur data scientist, qui travaille sur le projet "Alignement de l'expertise régionale et performance des entreprises" au sein de Skema Business School, sur le campus de Sophia Antipolis.
- Axes de recherche
-
Les axes de recherche du DHLab sont les suivants :
- Algorithmes de prétraitement et nettoyage de données non structurées ;
- Classification, traitement et modélisation de données hétérogènes telles que textes, images et données d’interaction (graphes) ;
- Apprentissage statistique, automatique et par réseaux profonds (deep learning), convolutionnels ou récurrents.
Les bases de données adoptées dans ces projets proviennent de plusieurs sites
- Les laboratoires d’Université Côte d'Azur ;
- INSEE ;
- European Patent Office ;
- Microsoft Academic.
- Publications
-
Preprints
L. Vanni, M. Corneli, D. Mayaffre, F. Precioso : From text saliency to linguistic objects: learning linguistic interpretable markers with a multichannel convolutional architecture (2021). ⟨hal-03142170⟩
Articles dans reviews
M. Corneli, C. Bouveyron, P. Latouche : Co-Clustering of Ordinal Data via Latent Continuous Random Variables and Not Missing at Random Entries, “Journal of Computational and Graphical Statistics”, Mars 2020.
Chapitres d'ouvrage
L. Vanni, M. Corneli, D. Longrée, D. Mayaffre, F. Precioso. Key Passages : From statistics to Deep Learning. D. Fioredistella Iezzi; D. Mayaffre; Michelangelo Misuraca. Text Analytics. Advances and Challenges, Springer, pp.41-54, 2020, 978-3-030-52679-5. ⟨10.1007/978-3-030-52680-1_4⟩. ⟨hal-03099658⟩.
Conférences
L. Vanni, M. Corneli, D. Longrée, D. Mayaffre, F. Precioso. Hyperdeep : deep learning descriptif pour l'analyse de données textuelles. JADT 2020 - 15èmes Journées Internationales d'Analyse statistique des Données Textuelles, Juin 2020, Toulouse, France. ⟨hal-02926880⟩
- Contacts
-
Dr Marco Corneli : marco.corneli@univ-cotedazur.fr