Jour 1 (PM) - Conférence > 14h15 | Le panorama des méthodologies de fouille de textes et interdisciplinarité

Le panorama des méthodologies de fouille de textes et l'interdisciplinarité
 
Adrian Chifu (contact)
Laboratoire d'informatique et systèmes (LIS)
Aix-Marseille Université (AMU), Université de Toulon, Centre national de la recherche scientifique (CNRS)

Adrian Chifu, enseignant-chercheur (maître de conférences) en informatique à Aix-Marseille Université, est membre de l’équipe Recherche d’Information et Interactions (R2I) du Laboratoire d’Informatique et Systèmes (LIS). Ses travaux de recherche sont principalement axés sur la recherche d’information textuelle, avec une attention particulière portée aux aspects de difficulté textuelle liés aux requêtes et aux phrases. Son intérêt s'étend également aux méthodes de traitement automatique du langage et d’apprentissage automatique appliquées à la recherche d’information.

Présentation

La fouille de données, qu'elle soit générale ou textuelle, est une discipline qui réunit trois domaines clés : l'informatique, les mathématiques et l'aspect métier.

Le processus de fouille de textes comprend plusieurs étapes telles que la collecte de données, le prétraitement des données, l'extraction de caractéristiques, la modélisation pour résoudre la tâche en question, l'évaluation, l'interprétation et éventuellement la visualisation des résultats. Chacune de ces étapes nécessite l'utilisation d'outils logiciels et de ressources qui peuvent être plus ou moins intuitifs à utiliser, et ils présentent tous leurs avantages, leurs limites et leurs risques respectifs. De plus, l'avancée de l'informatique générative offre des opportunités intéressantes pour la fouille de textes. L'interdisciplinarité est également représentée par le domaine d'application, chaque domaine comme la médecine, la biologie, le droit, la bibliométrie, etc., présentant ses particularités et ses défis propres.

Ce sont ces différents aspects liés aux outils et à l'interdisciplinarité de la chaîne de traitement de la fouille de textes qui seront présentés et qui permettront d'introduire les ateliers pratiques.

Programme

Introduction à la fouille de textes

  • L'interdisciplinarité de la fouille de données
  • Les particularités de la fouille de données textuelles
  • Le processus (pipeline) d'un modèle de fouille de textes

Panorama des méthodes, outils et ressources pour la fouille de textes

  • Les outils pour les étapes du processus de fouille (construction de corpus, représentation de textes, modèles d'apprentissage, etc.)
  • Les spécificités des outils selon le domaine d'application
  • L'intelligence artificielle générative : avancées et opportunités
  • Les avantages, les limites et les risques concernant les outils présentés
  • Les bibliothèques logicielles R et Python pour la fouille de textes

Vidéothèque

Conférence Patrice Bellot - ANF TDM 2021 (1h30)

Personnes connectées : 2 Vie privée
Chargement...