Description

Le groupe de travail Miners a pour vocation de réunir des chercheurs autour du domaine de l’apprentissage artificiel à travers des réunions, des échanges (brainstorming) et des séminaires. La recherche au sein du groupe Miners s'articule autour de trois grands axes: Apprentissage automatique, Analyse des données et leurs applications au monde réel.

Vous souhaitez retrouver nos actualités avant octobre 2021 ? Voici le lien vers notre ancien site internet :

https://limos.fr/workgroup/miners/
1 / 18
2 / 18
3 / 18
4 / 18
5 / 18
6 / 18
7 / 18
8 / 18
9 / 18
10 / 18
11 / 18
12 / 18
13 / 18
14 / 18
15 / 18
16 / 18
17 / 18
18 / 18

Date des conférences

Actualités récentes

autres LIMOS seminar

Tags :
Date de publication : 2022-06-15

Dr. Norbert Tsopze is an invited collegue from the university of Yaounde 1, in Cameroon. He is visiting LIMOS for a month. His research area is around deep neural networks. Title: Explicability of deep neural model for text classification. Abstract: Text is one of the most widely used means of communication between people and information storage. Many corpora have been saved on different platforms. Exploiting these corpora could help managers in strategy planning and decision making. An important task in text exploitation is classification, which consists in automatically labelling the text. Deep models have shown promising results in the text classification task but they remain black box for the user. We have developed a deep model (CNN+FCN) for text classification and propose to explain the different model output labels. In the explanation part, we adopt the well-known LRP algorithm and adapt it to the convolution part of the model. We conduct the experiments in many types of text classification, including resume classification, sentiment analysis and question answering. These experiments show the different n-grams responsible for classification. In particular for resume classification, the qualitative analysis allows us to see that many cases of misclassification are due to mislabeling by the user. In order to simplify and reduce the set of selected features, we also propose the sufficient features set and the necessary features set. The main objective of these two sets is to present a concise set of features responsible for classification. Experiments show that these sets are, in most cases, responsible for the output of the model and can help to simplify explanations for the final user.

Accepted

seminaires Miners's seminar

Tags :
Date de publication : 2022-10-13

Invited speaker: Pablo Báez Title: Linguistic characterization of the Chilean clinical text: towards an automatic extraction of information. Abstract: Free text is an effective and efficient method for documenting the complex reasoning involved in patient care, which explains its frequent use in the clinical setting. Using these records in research offers unprecedented possibilities but presents significant difficulties, especially in languages other than English, where linguistic resources and models are scarce. Knowledge of linguistic properties in the clinical text is essential because it forms the basis for developing and optimizing Natural Language Processing (NLP) and text mining tools. Despite its importance, there is a significant knowledge gap in Chilean clinical text's linguistic features and sublanguage. Since NLP tools tend to be more robust in specific domains, it is essential to define and understand well the sublanguages of the domain to be analyzed. Considering the current needs, we aim to characterize the linguistic richness and sublanguage of six Chilean clinical corpora to advance in developing NLP tools suitable for the contemporary Chilean clinical text.

Accepted

Projets récents

These NeuroDeRisk

Participants : Quentin RUIN, Issam FALIH, David BALAYSSAC, Engelbert MEPHU NGUIFO
Mots Clés : Dimensionality reduction - Manifold learning - Machine learning - Biomarkers - Neurotoxicity
Début du projet : 2021-02-01 Fin du projet : 2024-01-01

Le projet NeuroDeRisk est coordonné par l'Université de Vienne en Autriche et par les laboratoires SANOFI. Il regroupe 18 institutions de 12 pays européens différents dont 7 industriels parmi lesquels Astrazeneca, Novartis Pharma, Pfizer ou encore MSD. Il est financé par le programme IMI2 "Innovative Medecines Initiative" qui est un partenariat public-privé de l'UE qui finance des projets de recherche dans le domaine des Sciences de la Vie devant répondre aux besoins des industriels des produits de santé.

Le but de NeuroDeRisk est de fournir de nouveaux outils intégrés pour améliorer la prédictibilité préclinique des effets indésirables sur le système nerveux (effets pro-convulsivants, troubles psychiatriques/psychologiques et neuropathies périphériques) des produits pharmaceutiques et ainsi aider à réduire le risque de découverte de nouveaux médicaments à risques.

Accepted

Projet Pfeiffer

Participants : Gertrude Raïssa MBIADOU SALEU, Engelbert MEPHU NGUIFO, Farouk TOUMANI, Michael Franklin MBOUOPDA, Vasilis CAKO, Anne-Marthe Sophie NGO BIBINBE, Marie DEVITA, Julien BOUNOUAR
Mots Clés : Analyse temps réel - Analyse des données - Stockage et traitement des données
Début du projet : 2021-02-01 Fin du projet : 2023-10-01

Pfeiffer Vacuum France est la filiale du groupe international, l’un des leaders sur les marchés du vide : pompes à vide, détecteurs de fuite, pompes turbo moléculaires, systèmes de contrôle de l’étanchéité. Implantée à ANNECY (74000), Pfeiffer Vacuum compte aujourd’hui environ 1000 collaborateurs qui travaillent à la conception, à la fabrication et à la commercialisation de pompes à vide, détecteurs de fuite, pompes turbo moléculaires, systèmes de contrôle de l’étanchéité…

Pfeiffer Vacuum est partenaire du projet IT2 et est chargée de développer la technologie PTR-ToF-MS pour l'identification et la surveillance de la contamination aéroportée, liée aux procédés en salle blanche et dans les environnements FOUP. L’objectif est de développer un nouveau logiciel d'analyse de traitement des données pour permettre une identification facile des composés détectés inconnus (aujourd'hui, l'identification ne peut être effectuée que si l'étalonnage des molécules a été effectué auparavant) qui peuvent être présents dans l'environnement FOUP ou dans la salle blanche. Cette identification s’appuiera sur des études expérimentales dans ces environnements. A noter que l’analyseur, génère de grosses quantités de données: spectres (autour de 3Go/jour en continu), aujourd’hui, toutes les informations ne sont pas traitées et tous les composés ne sont pas identifiés.

C’est dans ce contexte que s’inscrit la collaboration de Pfeiffer Vacuum avec le CNRS-LIMOS. Le CNRS-LIMOS sert de soutien à Pfeiffer sur le stockage et l’analyse de données pour l’identification et la surveillance de la contamination aéroportée, liée aux procédés en salle blanche.

Un des travaux effectués au sein de l'équipe est l'étude et l'état de l’art sur la gestion et le stockage de flux de données (Data Stream) pour l’entreprise Pfeiffer. Le système de stockage existant (MariaDB) est comparé avec le nouveau système de séries temporelles (InfluxDB) pour quantifier le gain en termes de performances et espace de stockage.

Accepted

Nos partenaires