Abstract: Count data is used in many scientific fields in the form of frequency counts for instance as the occurrences of distinct words in a bag-of-words model for text analysis, or as read counts in genomics. This presentation addresses the problem of count data clustering, with the help of a mixture model. Based on the latent Dirichlet allocation, also known as the multinomial PCA, it allows the integration of clustering and dimension reduction to deal with high-dimensional datasets. We present a new variational EM algorithm for this model, combined with a greedy heuristic. We illustrate the qualitative interest of the proposed methodology in a real-world application, for the clustering of anatomopathological medical reports, in partnership with expert practitioners from the Institut Curie hospital.
Due to the current pandemic, this seminar will be held remotely via Microsoft Teams.
Lors de la consultation par profil (menu « Je suis ») du portail d’Université Côte d’Azur et des portails des composantes d’Université Côte d’Azur des informations sont susceptibles d'être enregistrées dans un fichier "Cookie" installé par Université Côte d’Azur dans votre ordinateur, tablette ou téléphone mobile. Ce fichier Cookie contient certaines informations, comme un identifiant unique, le nom du portail, ainsi que le profil choisi. Ce fichier Cookie est lu par son émetteur. Il permet, pendant sa durée de validité de 12 mois, de reconnaitre votre terminal et de conserver le profil choisi comme votre page d’accueil par défaut.
Vous avez donné votre consentement pour le dépôt de cookies sauvegardant votre profil dans votre navigateur.
Vous vous êtes opposé au dépôt de cookies de mémorisation de votre profil dans votre navigateur.
Le paramètre "Do Not Track" est actif sur votre navigateur. Le profil ne sera pas mémorisé dans un cookie
Cookies de mesure d 'audiences
Ce site utilise Google Analytics. En appuyant sur le bouton "j'accepte" ou en continuant à naviguer sur le site, vous nous autorisez à déposer des cookies à des fins de mesure d'audience.
Vous avez donné votre consentement pour le dépôt de cookies de mesures d'audience dans votre navigateur.
Vous vous êtes opposé au dépôt de cookies de mesures d'audience dans votre navigateur.
Le paramètre "Do Not Track" est actif sur votre navigateur. Aucune statistique de navigation ne sera collectée.