Deux étudiants-chercheurs de la majeure Data & IA d’ESILV, promo 2026, ont présenté leur méthode UC-FIRe à CORIA-TALN 2025, un rendez-vous francophone majeur en traitement automatique des langues et en recherche d’information.
Leur contribution illustre les avancées concrètes issues du cycle ingénieur à l’ESILV, en matière d’intelligence artificielle appliquée.
CORIA-TALN : une conférence de référence en traitement automatique des langues
CORIA-TALN 2025 s’est tenue à Marseille sous l’égide des associations ARIA et ATALA, réunissant plusieurs événements scientifiques majeurs autour de la recherche d’information et du traitement automatique des langues naturelles.
L’édition a rassemblé jeunes chercheurs, doctorants et ingénieurs pour présenter des travaux novateurs sur les systèmes de recherche, les modèles linguistiques et les applications industrielles.
UC-FIRe : une approche simple et performante
Dans ce contexte, Quentin et Maxime, étudiants de la majeure Data & IA, ont présenté UC-FIRe : une méthode non supervisée qui améliore le modèle BM25 grâce à une réduction de l’écart lexical.
UC-FIRe s’appuie sur l’entraînement de vecteurs de mots FastText et sur la création de clusters de mots à partir de matrices de similarité et de coexistence.
Ces regroupements permettent de reformuler documents et requêtes, afin d’augmenter la pertinence des résultats obtenus.
UC-FIRe, une méthode légère, rapide et efficace
Entièrement exécutée sur CPU, la méthode UC-FIRe affiche un faible coût computationnel.
Elle conserve une vitesse d’inférence comparable à BM25 tout en atteignant de meilleures performances sur plusieurs jeux de données du benchmark BEIR.
Ces résultats démontrent la pertinence de cette alternative aux modèles denses ou hybrides, souvent plus gourmands en ressources.
Quentin et Maxime, étudiants de la majeure Data & IA
Des résultats prometteurs pour la recherche appliquée
L’efficacité de la méthode UC-FIRe et sa simplicité d’implémentation ouvrent des perspectives concrètes pour les applications industrielles ou les moteurs de recherche à grande échelle.
Le code est mis à disposition en open source, facilitant son adoption et sa réplicabilité dans divers contextes.
Cette intervention à CORIA-TALN illustre le rôle actif des élèves-ingénieurs dans la recherche appliquée en IA. À travers des projets comme UC-FIRe, le master Data & IA permet aux étudiants d’allier rigueur scientifique et exploration de cas d’usage à fort potentiel.
Pour en savoir plus sur la majeuere Data et intelligence artificielle
This post was last modified on 25 juillet 2025 7:45 pm