Skip to content

Activités de recherche

Cette section décrit mes activités de recherche dans le domaine de la modélisation des connaissances, des systèmes à bases de connaissances et des systèmes centrés utilisateur.

Je m'intéresse à la modélisation, au stockage, à l'extraction, à l'exploitation, au traitement et au partage de connaissances par approche symbolique et numérique, à l'apprentissage artificiel et à l'apprentissage profond.

Thématiques

Je m’intéresse tout particulièrement à la modélisation et la représentation des connaissances, ainsi que l’étude des systèmes capables de les exploiter. Il s’agit pour ces systèmes dans mes activités de recherche d’inférer de nouvelles connaissances à l’aide de mécanismes de raisonnements valides ou non monotones, d’inférer sur des connaissances 2D, 3D et spatio-temporelles, de rechercher et recommander de l’information et notamment des données textuelles à l’aide de traitements automatiques du langage.

Depuis plus de cinquante ans, le domaine de l’intelligence artificielle développe des outils de modélisation permettant de formaliser la connaissance à l’aide de langages ontologiques. A partir de cet héritage, le mouvement du Web sémantique a développé des dialectes ontologiques permettant une meilleure interopérabilité des données. La communauté a aussi développé des méthodes et outils pour produire des connaissances. Aujourd’hui, ces outils de modélisation et de traitement des ontologies s’insérant dans la dynamique des graphes de connaissances possèdent de nombreux avantages marqués toutefois d’un certain nombre de limites tels que la gestion valide de l’évolution des connaissances, l’inférence quantitative et qualitative sur des relations spatiales 3D, la gestion de l’imprécision et l’incertitude dans les systèmes à base de connaissances, l’indexation de grands volumes de données à l’aide de connaissances expertes.

Plus récemment, je m’intéresse aux modèles d’intelligence artificielle et à l’apprentissage profond. En regard des approches symboliques, ces approches connectivistes ou subsymboliques apporte des réponses au traitement automatique de grands volumes de données et notamment des données textuelles. Par exemple, les grands modèles de langage permettent de produire des résumés automatiques par approche extractive (extraction des phrases clés) ou abstractive (écriture synthétique du résumé). Cette thématique concerne la thèse de Abdelghani Laïfa en collaboration avec les linguistes du Laboratoire TIL de l’Université de Bourgogne où notre méthode d’augmentation des données a permis de produire des résumés de meilleure qualité idiomatique. Les travaux avec l’entreprise Actualis visent l’indexation automatique de corps textuels à l’aide d’une taxonomie métier (Multilabel classification) et l’analyse de la dynamique de la modélisation des thèmes (Dynamic Topic Modeling) et de leur trajectoire à l’aide de modèle à base de Transformer pour veille économique et stratégique.

Concernant le projet DL4Graphs avec l’entreprise DAVI dans le cadre d’un financement France Relance, nous étudions les IA hybride neurosymbolique pour répondre aux problématiques d’hallucination, de non-exhaustivité, de séquence des modèles de langage pour la génération automatique de textes. Nous visons à produire des modèles hybrides capables d’extraire des connaissances à partir de textes sous la forme de graphes de connaissances et de produire du texte à partir de ces mêmes graphes. De plus, je travaille avec le laboratoire TIL sur les cadres sémantiques avec pour objectifs la formalisation de l’idiomaticité sous la forme de patterns lexico-grammaticaux pour renforcer l’extraction et la restitution des connaissances métiers depuis et vers le texte. Pour venir soutenir l’effort de calcul, j’ai déposé un projet Projet européen OCRE Google Cloud pour un montant de 250k€ de Cloud Google (2022) et le développement d'IA hybride (symbolique et subsymbolique) (Vertex AI, Neo4J, Kubernetes, etc.).

Aujourd'hui, mes travaux s'orientent sur plusieurs axes complémentaires, notamment le RAG (Retrieval Augmented Generative) et les IA agentiques. Le RAG est un modèle de langage récent qui combine les capacités de génération de texte avec des mécanismes de récupération d'informations. Contrairement à certains modèles de langage précédents qui génèrent du texte à partir de zéro, le RAG peut accéder à une base de connaissances externe pour informer et guider sa génération de texte. Cela lui permet d'être plus précis et informatif dans ses réponses en s'appuyant sur des informations disponibles dans la base de connaissances.

Mon approche s'oriente sur l'usage des graphes de connaissances qui peuvent être utilisés pour enrichir la base de connaissances accessible par le RAG. En structurant les informations sous forme de graphe, il devient plus facile pour le modèle de naviguer et d'extraire des informations pertinentes. De plus, les graphes de connaissances peuvent être utilisés pour valider et enrichir automatiquement la base de connaissances, en identifiant des relations implicites entre les entités et en proposant de nouvelles informations à ajouter.

En parallèle, je travaille sur les IA agentiques dans le cadre du projet ANR Labcom LAMAe en collaboration avec l'entreprise DAVI the Humanizer. Ce projet vise à développer des agents conversationnels capables d'interactions plus naturelles et contextualisées, en s'appuyant notamment sur les graphes de connaissances pour améliorer leur compréhension du contexte et leur capacité à générer des réponses pertinentes.

Ces différents axes de recherche sont explorés dans la thèse d'Oualid Bougzime sur la gestion des connaissances dans le domaine des matériaux intelligents et l'impression 4D. L'intégration des approches RAG et agentiques, couplée aux graphes de connaissances, permet d'améliorer significativement la qualité et la pertinence des interactions homme-machine dans ces différents contextes applicatifs.

Encadrement doctoral

Thèses en cours

Doctorants Titre de la thèse - lien vers le résumé Co-encadrant(s)
Oualid Bougzime Développement d'un système de prédiction/recommandation pour l'impression 4D de structures intelligentes utilisant des graphes de connaissances et un modèle de langage, PIA Artemis Frédéric Demoly, Christophe Cruz
Nicolas Zante Développement d’une aide à la décision pour l’élaboration des appels d’offres de l’environnement de travail (workplace, FM, services généraux) 102/103 Christophe Cruz, Sebti Foufou
Christian Wolf Interdependencies of care for the elderly in rural areas – a holistic perspective, thèse en collaboration avec l'institut i3mainz, Mayence Markus Schaffer, Christophe Cruz, Hocine Cherifi

Thèses passées

Docteurs Titre de la thèse - lien vers le résumé Co-encadrant(s) Date de soutenance PDF
Sarah Théroine Vers une nouvelle évaluation de la comparabilité et de l'idiomaticité des corpus multilingues Laurent Gautier, Christophe Cruz 20/12/2024 intranet uB
Flann Chambers nowledge-graph driven agent-based modelling of semantic environmental trajectories of complex urban systems. Enabling a descriptive, predictive and prescriptive analysis, towards developing digital twins for policy-making Giovanna Di Marzo Serugendo, Christophe Cruz 19/12/2024 intranet uB
Abdelghani Laïfa Rédaction automatique de résumés à partir de textes en utilisant des schémas lexico-grammaticaux et l'apprentissage profond Laurent Gautier, Christophe Cruz 13/12/2022 intranet uB
Saoussen Dimassi Spatiotemporal semantics and logical knowledge description of mecHanical objEcts in the era of 4D pRinting and programmable Matter for nExt-generation of CAD systemS Frédéric Demoly, Christophe Cruz, Samuel Gomes 04/03/2022 intranet uB
Claire Prudhomme Système d'information géographique sémantique: traitement de données géospatiales hétérogènes, basé sur la connaissance Christophe Cruz, Ana Roxin, Frank Boochs 17/12/2020 intranet uB
Muhammad Arslan Architecture sémantique de capteurs intelligents adaptatifs en environnement bâti Christophe Cruz, Dominique Ginhac 12/02/2020 intranet uB
Thomas Hassan Approche big data et semantic web pour la fouille et la classification de données web automatique Christophe Cruz, Aurélie Bertaux 22/10/2017 intranet uB
Rafael Peixoto A maintainable hierarchical multi-label classification process for Big Data based on web reasoning Christophe Cruz, Nuno Silva 09/12/2016 intranet uB
Benjamin Harbelot Continuum : un modèle spatio-temporel et sémantique pour la découverte de phénomènes dynamiques au sein d'environnements géospatiaux Christophe Cruz 17/12/2015 intranet uB
David Werner Indexation et recommandation d'informations : vers une qualification précise des items par une approche ontologique, fondée sur une modélisation métier du domaine : application à la recommandation d'articles économiques Christophe Cruz, Aurélie Bertaux 08/07/2015 intranet uB
Perrine Pittet OntoVersionGraph : a change management methodology dedicated to formal ontologies and their user views in a collaborative context : application to SHOIN(D) ontologies Christophe Nicolle, Christophe Cruz 11/07/2014 intranet uB
Helmi Ben Hmida From quantitative spatial operators to qualitative spatial relationships : a new approach applied to the detection and the semantic qualification of 3D objects Christophe Nicolle, Christophe Cruz, Frank Boochs 12/12/2012 intranet uB
Romain Picot-Clémente Une architecture générique de Systèmes de recommandation de combinaison d'items : application au domaine du tourisme Christophe Nicolle, Christophe Cruz 07/12/2011 intranet uB
Ashish Karmacharya Intégration d'une couche spatiale dans l'architecture du Web sémantique : une proposition via la plateforme ArchaeoKM Franck Marzani, Frank Boochs, Christophe Cruz 30/06/2011 intranet uB

Jury de thèses

Année Doctorant Titre Etablissement
2024 Examinateur Maryam Maslek Elayam La modélisation des réseaux de mobilité maritime via une approche par graphe hiérarchique Université de Bretagne Occidentale
2024 Examinateur Emmanuel Esposito Online Learning, Uniform Convergence, and a Theory of Interpretability University of Milan
2024 Examinateur Alessia Galdeman A Framework for Network Evolution University of Milan
2024 Examinateur Francesco Periti Modeling Semantic Change Through Large Language Models University of Milan
2024 Examinateur Md Moklesur RAHMAN AI-Driven Atrial Arrhythmia Detection: Development, Cross-Comparison and Uncertainty Quantification of Algorithms for Clinical Continuous ECGs University of Milan
2024 Examinateur Priscilla Raucci Quantum and Translucent Paradigms in Automata Theory: A Study on Computational Capabilities University of Milan
2023 Rapporteur Matthieu Bellucci Approches symboliques pour une intelligence artificielle explicable Institut National des Sciences Appliquées (Rouen Normandie)
2021 Examinateur Jordane Dorne Représentation sémantique de données géospatiales au service de l'analyse de changements Institut de Recherche en Informatique de Toulouse UMR 5505
2019 Examinateur Camille Bernard Immersing evolving geographic divisions in the semantic Web. Towards spatiotemporal knowledge graphs to reflect territorial dynamics over time Laboratoire d'Informatique de Grenoble UMR 5217
2017 Rapporteur Antoine Hombiat OF4OSM - un méta-modèle pour structurer la folksonomie OpenStreetMap en une nouvelle ontologie Laboratoire d'Informatique de Grenoble UMR 5217
2015 Rapporteur Nuno Miguel Gomes Bettencourt Cross-Domain Resource Sharing, Resource Access Recommendation and Traceability Information Universidade de Tras-os-Montes e Alto Douro

Coopérations internationales

Années Description
2005-* Coopération avec l’Institut i3mainz de Mayence (Allemagne), 3 thèses soutenues cours, 2 projets ANR et plus de 40 publications communes (projets ArchaeoKM, WiDOP, SemGIS, ANR HiGeoMes, ANR TexTelSem)
2014-17 Coopération avec l’Université d’Oran (Algérie), chercheur invité, 1 publication commune indexée ISI WoS
2014 Coopération avec l’institut IPN Mexico (Mexique), chercheuse invitée, 1 publication commune
2012-16 Coopération avec l’Institut ISEP de Porto (Portugal), plus de 10 publications (projet S-HMC Maintenance)
2013 Coopération avec l’Université de Hainan (Chine) avec Dr. Yucong Duan et 2 publications communes

Communauté scientifique

  • Advisory Board & Web Chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2025, May 21-23, 2025, Bordeaux, France
  • Membre du bureau Association EGC, prix de thèse 2024'25
  • Sponsor Chairs, The 13th International Conference on Complex Network and their Applications Complex Networks, 10-12 Décembre, 2024, Istanbul, Turquie
  • Advisory Board & Web Chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2023, May 29-31, 2024, Montpellier, France
  • Co-président de programme EGC, Extraction et Gestion des Connaissances, EGC 2024, Dijon
  • Comité d'organisation EGC, Extraction et Gestion des Connaissances, EGC 2024, Dijon
  • Journal reviews: SCP, Journal Automation, Journal IARIA'14, Journal IPL, Mechatronics, Data & Knowledge Engineering'17'20'24, Computers in Industry'17, Software & Systems Modeling'17'24, Journal IEEE Access'19, IJGIS'21, ZUSC'21, MDPI'21'24, Semantic Web Journal'24, Data & Knowledge Engineering'24, EDAS'24, IEEE Journal of Biomedical and Health Informatics'24, Frontiers of Information Technology & Electronic Engineering'21
  • Publication Chairs FRCSS, French Regional Conference on Complex Systems, FRCCS 2023, May 31 - June 02, 2023, Le Havre, France
  • Sponsor Chairs, The 12th International Conference on Complex Network and their Applications Complex Networks, 28-30 Novembre, 2023, Menton Riviera, France
  • Publicity Chairs, The 11th International Conference on Complex Network and their Applications Complex Networks, 08-10 Novembre, 2022, Palermo, Italy
  • Local chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2021, ONLINE, May 26 - 28, 2021, Dijon
  • Expertise ANRT-CIFRE 2021
  • Editorial Board MDPI - Mathematics
  • Comité de suivi de thèse de Maryam Maslek Elayam, Analyse de motifs et comportements de trajectoires maritimes, 2020/2021
  • Guest Editors: IEEE Access, Innovation and Application of Intelligent Processing of Data, Information and Knowledge as Resources in Edge Computing, 29 February 2020
  • Program Committee: IEEE International Workshop on Knowledge Graph as a Service'20, i-society'14, SITIS'14, CASE’15, BigCVEn’15’16, KEOD’15’16'17'18'19'20'21, ESWC’17, WEBIST'18'19'20'21'22'23'24'25, MARAMI'20
  • Local committee chair MARAMI'19
  • PC member of IEEE SERVICES 2019 Workshop on Knowledge Graph as a Service (KGAAS), 2019
  • Open journal, Sven Groppe, Christophe Cruz, The First International Workshop on Web Data Processing & Reasoning (WDPAR 2018) in Open Journal of Web Technologies (OJWT), 2018, Vol.5, (1), p.1-5, Special Issue: Proceedings of the International Workshop on Web Data Processing & Reasoning (WDPAR 2018) in conjunction with the 41st German Conference on Artificial Intelligence (KI) in Berlin, Germany.
  • Expertise pour l’Université PSL Paris Sciences et Lettres (2016)
  • Membre de l’action prospective du GdR MAGIS – Dynamiques spatiales et Interactions (2015-)
  • Organisation du 1er Colloque du projet HiGeoMes ANR-DFG – IUT Dijon (2012)

Awarded Papers

  • Best Paper Award Text2KG'24 lien
  • Best Student Paper Award WebIst'17 lien
  • Best Paper Semapro’10 lien

Conférencier invité - communications

Cinq publications de référence

  • Muhammad Arslan, Christophe Cruz, Business text classification with imbalanced data and moderately large label spaces for digital transformation. Applied Network Science, 2024 doi|
  • Muhammad Arslan, Saba Munawar, Christophe Cruz, Political-RAG: using generative AI to extract political information from media content. Journal of Information Technology and Politics, 2024, doi
  • Flann Chambers, Giovanna Di Marzo Serugendo, Christophe Cruz, A DPSIR-Driven Agent-Based Model for Residential Choices and Mobility in an Urban Setting. 16 (18), pp.8181, 2024, doi|
  • Saoussen Dimassi, Frédéric Demoly, Hadrien Belkebir, Christophe Cruz, Kyoung-Yun Kim, Samuel Gomes, H Jerry Qi, Jean-Claude André, A knowledge recommendation approach in design for multi-material 4D printing based on semantic similarity vector space model and case-based reasoning, Computers in Industry, Elsevier, 2023 doi
  • Saoussen Dimassi, Frédéric Demoly, Christophe Cruz, H. Jerry Qi, Kyoung-Yun Kim, Jean-Claude André, Samuel Gomes, An ontology-based framework to formalize and represent 4D printing knowledge in design, Computers in Industry 126, 2021 doi