Activités de recherche

Cette section décrit mes activités de recherche dans le domaine de la modélisation des connaissances, des systèmes à bases de connaissances et des systèmes centrés utilisateur.

Je m'intéresse à la modélisation, au stockage, à l'extraction, à l'exploitation, au traitement et au partage de connaissances par approche symbolique et numérique, à l'apprentissage artificiel et à l'apprentissage profond.

Thématiques

Je m’intéresse tout particulièrement à la modélisation et la représentation des connaissances, ainsi que l’étude des systèmes capables de les exploiter. Il s’agit pour ces systèmes dans mes activités de recherche d’inférer de nouvelles connaissances à l’aide de mécanismes de raisonnements valides ou non monotones, d’inférer sur des connaissances 2D, 3D et spatio-temporelles, de rechercher et recommander de l’information et notamment des données textuelles à l’aide de traitements automatiques du langage.

Depuis plus de cinquante ans, le domaine de l’intelligence artificielle développe des outils de modélisation permettant de formaliser la connaissance à l’aide de langages ontologiques. A partir de cet héritage, le mouvement du Web sémantique a développé des dialectes ontologiques permettant une meilleure interopérabilité des données. La communauté a aussi développé des méthodes et outils pour produire des connaissances. Aujourd’hui, ces outils de modélisation et de traitement des ontologies s’insérant dans la dynamique des graphes de connaissances possèdent de nombreux avantages marqués toutefois d’un certain nombre de limites tels que la gestion valide de l’évolution des connaissances, l’inférence quantitative et qualitative sur des relations spatiales 3D, la gestion de l’imprécision et l’incertitude dans les systèmes à base de connaissances, l’indexation de grands volumes de données à l’aide de connaissances expertes.

Plus récemment, je m’intéresse aux modèles d’intelligence artificielle et à l’apprentissage profond. En regard des approches symboliques, ces approches connectivistes ou subsymboliques apporte des réponses au traitement automatique de grands volumes de données et notamment des données textuelles. Par exemple, les grands modèles de langage permettent de produire des résumés automatiques par approche extractive (extraction des phrases clés) ou abstractive (écriture synthétique du résumé). Cette thématique concerne la thèse de Abdelghani Laïfa en collaboration avec les linguistes du Laboratoire TIL de l’Université de Bourgogne où notre méthode d’augmentation des données a permis de produire des résumés de meilleure qualité idiomatique. Les travaux avec l’entreprise Actualis visent l’indexation automatique de corps textuels à l’aide d’une taxonomie métier (Multilabel classification) et l’analyse de la dynamique de la modélisation des thèmes (Dynamic Topic Modeling) et de leur trajectoire à l’aide de modèle à base de Transformer pour veille économique et stratégique.

Concernant le projet DL4Graphs avec l’entreprise DAVI dans le cadre d’un financement France Relance, nous étudions les IA hybride neurosymbolique pour répondre aux problématiques d’hallucination, de non-exhaustivité, de séquence des modèles de langage pour la génération automatique de textes. Nous visons à produire des modèles hybrides capables d’extraire des connaissances à partir de textes sous la forme de graphes de connaissances et de produire du texte à partir de ces mêmes graphes. De plus, je travaille avec le laboratoire TIL sur les cadres sémantiques avec pour objectifs la formalisation de l’idiomaticité sous la forme de patterns lexico-grammaticaux pour renforcer l’extraction et la restitution des connaissances métiers depuis et vers le texte. Pour venir soutenir l’effort de calcul, j’ai déposé un projet Projet européen OCRE Google Cloud pour un montant de 250k€ de Cloud Google (2022) et le développement d'IA hybride (symbolique et subsymbolique) (Vertex AI, Neo4J, Kubernetes, etc.).

Aujourd'hui, mes travaux s'orientent sur plusieurs axes complémentaires, notamment le RAG (Retrieval Augmented Generative) et les IA agentiques. Le RAG est un modèle de langage récent qui combine les capacités de génération de texte avec des mécanismes de récupération d'informations. Contrairement à certains modèles de langage précédents qui génèrent du texte à partir de zéro, le RAG peut accéder à une base de connaissances externe pour informer et guider sa génération de texte. Cela lui permet d'être plus précis et informatif dans ses réponses en s'appuyant sur des informations disponibles dans la base de connaissances.

Mon approche s'oriente sur l'usage des graphes de connaissances qui peuvent être utilisés pour enrichir la base de connaissances accessible par le RAG. En structurant les informations sous forme de graphe, il devient plus facile pour le modèle de naviguer et d'extraire des informations pertinentes. De plus, les graphes de connaissances peuvent être utilisés pour valider et enrichir automatiquement la base de connaissances, en identifiant des relations implicites entre les entités et en proposant de nouvelles informations à ajouter.

En parallèle, je travaille sur les IA agentiques dans le cadre du projet ANR Labcom LAMAe en collaboration avec l'entreprise DAVI the Humanizer. Ce projet vise à développer des agents conversationnels capables d'interactions plus naturelles et contextualisées, en s'appuyant notamment sur les graphes de connaissances pour améliorer leur compréhension du contexte et leur capacité à générer des réponses pertinentes.

Ces différents axes de recherche sont explorés dans la thèse d'Oualid Bougzime sur la gestion des connaissances dans le domaine des matériaux intelligents et l'impression 4D. L'intégration des approches RAG et agentiques, couplée aux graphes de connaissances, permet d'améliorer significativement la qualité et la pertinence des interactions homme-machine dans ces différents contextes applicatifs.

Encadrement doctoral

Thèses en cours

Doctorants	Titre de la thèse - lien vers le résumé	Co-encadrant(s)
Oualid Bougzime	Développement d'un système de prédiction/recommandation pour l'impression 4D de structures intelligentes utilisant des graphes de connaissances et un modèle de langage, PIA Artemis	Frédéric Demoly, Christophe Cruz
Nicolas Zante	Développement d’une aide à la décision pour l’élaboration des appels d’offres de l’environnement de travail (workplace, FM, services généraux) 102/103	Christophe Cruz, Sebti Foufou
Christian Wolf	Interdependencies of care for the elderly in rural areas – a holistic perspective, thèse en collaboration avec l'institut i3mainz, Mayence	Markus Schaffer, Christophe Cruz, Hocine Cherifi

Thèses passées

Docteurs	Titre de la thèse - lien vers le résumé	Co-encadrant(s)	Date de soutenance
Sarah Théroine	Vers une nouvelle évaluation de la comparabilité et de l'idiomaticité des corpus multilingues	Laurent Gautier, Christophe Cruz	20/12/2024
Flann Chambers	nowledge-graph driven agent-based modelling of semantic environmental trajectories of complex urban systems. Enabling a descriptive, predictive and prescriptive analysis, towards developing digital twins for policy-making	Giovanna Di Marzo Serugendo, Christophe Cruz	19/12/2024
Abdelghani Laïfa	Rédaction automatique de résumés à partir de textes en utilisant des schémas lexico-grammaticaux et l'apprentissage profond	Laurent Gautier, Christophe Cruz	13/12/2022
Saoussen Dimassi	Spatiotemporal semantics and logical knowledge description of mecHanical objEcts in the era of 4D pRinting and programmable Matter for nExt-generation of CAD systemS	Frédéric Demoly, Christophe Cruz, Samuel Gomes	04/03/2022
Claire Prudhomme	Système d'information géographique sémantique: traitement de données géospatiales hétérogènes, basé sur la connaissance	Christophe Cruz, Ana Roxin, Frank Boochs	17/12/2020
Muhammad Arslan	Architecture sémantique de capteurs intelligents adaptatifs en environnement bâti	Christophe Cruz, Dominique Ginhac	12/02/2020
Thomas Hassan	Approche big data et semantic web pour la fouille et la classification de données web automatique	Christophe Cruz, Aurélie Bertaux	22/10/2017
Rafael Peixoto	A maintainable hierarchical multi-label classification process for Big Data based on web reasoning	Christophe Cruz, Nuno Silva	09/12/2016
Benjamin Harbelot	Continuum : un modèle spatio-temporel et sémantique pour la découverte de phénomènes dynamiques au sein d'environnements géospatiaux	Christophe Cruz	17/12/2015
David Werner	Indexation et recommandation d'informations : vers une qualification précise des items par une approche ontologique, fondée sur une modélisation métier du domaine : application à la recommandation d'articles économiques	Christophe Cruz, Aurélie Bertaux	08/07/2015
Perrine Pittet	OntoVersionGraph : a change management methodology dedicated to formal ontologies and their user views in a collaborative context : application to SHOIN(D) ontologies	Christophe Nicolle, Christophe Cruz	11/07/2014
Helmi Ben Hmida	From quantitative spatial operators to qualitative spatial relationships : a new approach applied to the detection and the semantic qualification of 3D objects	Christophe Nicolle, Christophe Cruz, Frank Boochs	12/12/2012
Romain Picot-Clémente	Une architecture générique de Systèmes de recommandation de combinaison d'items : application au domaine du tourisme	Christophe Nicolle, Christophe Cruz	07/12/2011
Ashish Karmacharya	Intégration d'une couche spatiale dans l'architecture du Web sémantique : une proposition via la plateforme ArchaeoKM	Franck Marzani, Frank Boochs, Christophe Cruz	30/06/2011

Jury de thèses

Année	Doctorant	Titre	Etablissement
2024 Examinateur	Maryam Maslek Elayam	La modélisation des réseaux de mobilité maritime via une approche par graphe hiérarchique	Université de Bretagne Occidentale
2024 Examinateur	Emmanuel Esposito	Online Learning, Uniform Convergence, and a Theory of Interpretability	University of Milan
2024 Examinateur	Alessia Galdeman	A Framework for Network Evolution	University of Milan
2024 Examinateur	Francesco Periti	Modeling Semantic Change Through Large Language Models	University of Milan
2024 Examinateur	Md Moklesur RAHMAN	AI-Driven Atrial Arrhythmia Detection: Development, Cross-Comparison and Uncertainty Quantification of Algorithms for Clinical Continuous ECGs	University of Milan
2024 Examinateur	Priscilla Raucci	Quantum and Translucent Paradigms in Automata Theory: A Study on Computational Capabilities	University of Milan
2023 Rapporteur	Matthieu Bellucci	Approches symboliques pour une intelligence artificielle explicable	Institut National des Sciences Appliquées (Rouen Normandie)
2021 Examinateur	Jordane Dorne	Représentation sémantique de données géospatiales au service de l'analyse de changements	Institut de Recherche en Informatique de Toulouse UMR 5505
2019 Examinateur	Camille Bernard	Immersing evolving geographic divisions in the semantic Web. Towards spatiotemporal knowledge graphs to reflect territorial dynamics over time	Laboratoire d'Informatique de Grenoble UMR 5217
2017 Rapporteur	Antoine Hombiat	OF4OSM - un méta-modèle pour structurer la folksonomie OpenStreetMap en une nouvelle ontologie	Laboratoire d'Informatique de Grenoble UMR 5217
2015 Rapporteur	Nuno Miguel Gomes Bettencourt	Cross-Domain Resource Sharing, Resource Access Recommendation and Traceability Information	Universidade de Tras-os-Montes e Alto Douro

Coopérations internationales

Années	Description
2005-*	Coopération avec l’Institut i3mainz de Mayence (Allemagne), 3 thèses soutenues cours, 2 projets ANR et plus de 40 publications communes (projets ArchaeoKM, WiDOP, SemGIS, ANR HiGeoMes, ANR TexTelSem)
2014-17	Coopération avec l’Université d’Oran (Algérie), chercheur invité, 1 publication commune indexée ISI WoS
2014	Coopération avec l’institut IPN Mexico (Mexique), chercheuse invitée, 1 publication commune
2012-16	Coopération avec l’Institut ISEP de Porto (Portugal), plus de 10 publications (projet S-HMC Maintenance)
2013	Coopération avec l’Université de Hainan (Chine) avec Dr. Yucong Duan et 2 publications communes

Communauté scientifique

Advisory Board & Web Chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2025, May 21-23, 2025, Bordeaux, France
Membre du bureau Association EGC, prix de thèse 2024'25
Sponsor Chairs, The 13th International Conference on Complex Network and their Applications Complex Networks, 10-12 Décembre, 2024, Istanbul, Turquie
Advisory Board & Web Chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2023, May 29-31, 2024, Montpellier, France
Co-président de programme EGC, Extraction et Gestion des Connaissances, EGC 2024, Dijon
Comité d'organisation EGC, Extraction et Gestion des Connaissances, EGC 2024, Dijon
Journal reviews: SCP, Journal Automation, Journal IARIA'14, Journal IPL, Mechatronics, Data & Knowledge Engineering'17'20'24, Computers in Industry'17, Software & Systems Modeling'17'24, Journal IEEE Access'19, IJGIS'21, ZUSC'21, MDPI'21'24, Semantic Web Journal'24, Data & Knowledge Engineering'24, EDAS'24, IEEE Journal of Biomedical and Health Informatics'24, Frontiers of Information Technology & Electronic Engineering'21
Publication Chairs FRCSS, French Regional Conference on Complex Systems, FRCCS 2023, May 31 - June 02, 2023, Le Havre, France
Sponsor Chairs, The 12th International Conference on Complex Network and their Applications Complex Networks, 28-30 Novembre, 2023, Menton Riviera, France
Publicity Chairs, The 11th International Conference on Complex Network and their Applications Complex Networks, 08-10 Novembre, 2022, Palermo, Italy
Local chair FRCSS, French Regional Conference on Complex Systems, FRCCS 2021, ONLINE, May 26 - 28, 2021, Dijon
Expertise ANRT-CIFRE 2021
Editorial Board MDPI - Mathematics
Comité de suivi de thèse de Maryam Maslek Elayam, Analyse de motifs et comportements de trajectoires maritimes, 2020/2021
Guest Editors: IEEE Access, Innovation and Application of Intelligent Processing of Data, Information and Knowledge as Resources in Edge Computing, 29 February 2020
Program Committee: IEEE International Workshop on Knowledge Graph as a Service'20, i-society'14, SITIS'14, CASE’15, BigCVEn’15’16, KEOD’15’16'17'18'19'20'21, ESWC’17, WEBIST'18'19'20'21'22'23'24'25, MARAMI'20
Local committee chair MARAMI'19
PC member of IEEE SERVICES 2019 Workshop on Knowledge Graph as a Service (KGAAS), 2019
Open journal, Sven Groppe, Christophe Cruz, The First International Workshop on Web Data Processing & Reasoning (WDPAR 2018) in Open Journal of Web Technologies (OJWT), 2018, Vol.5, (1), p.1-5, Special Issue: Proceedings of the International Workshop on Web Data Processing & Reasoning (WDPAR 2018) in conjunction with the 41st German Conference on Artificial Intelligence (KI) in Berlin, Germany.
Expertise pour l’Université PSL Paris Sciences et Lettres (2016)
Membre de l’action prospective du GdR MAGIS – Dynamiques spatiales et Interactions (2015-)
Organisation du 1er Colloque du projet HiGeoMes ANR-DFG – IUT Dijon (2012)

Awarded Papers

Best Paper Award Text2KG'24 lien
Best Student Paper Award WebIst'17 lien
Best Paper Semapro’10 lien

Conférencier invité - communications

TALN, IA générative et linguistique : nouveau paradigme ?, MSH Lyon - Saint-Étienne le lundi 24 juin 2024
An overview on large language models LLM and knowledge graphs, Sibiu Innovation Days, 5 et 6 Octobre 2023
Addressing the Challenges of Understanding the Behaviours of Moving and Changing Objects in Dynamic Environments, Séminaire à l'Université de Lisbonne, 2018
Approche sémantique pour la recommandation de documents textuels dans un contexte Big Data appliquée à la veille économique, à l’Institut des Sciences de l’Homme de Lyon accueille La 4ème édition des journées « Big Data Mining and Visualization », Jeudi 18 et vendredi 19 juin 2015, Institut des Sciences de l’Homme, 14 avenue Berthelot, Lyon 7ème, http://eric.univ-lyon2.fr/~gt-fdc/journees/, http://25images.ish-lyon.cnrs.fr/bigdatamining-juin2015/video/christophe-cruz/fr
From Text to Knowledge and Knowledge to Text. Towards a formal modelling of philological Knowledge from Old Babylonian and Middle Assyrian Texts, The Potential of Itineraries and journeys for Historical Geography, 19 November, LMU München, 2015

Cinq publications de référence

Muhammad Arslan, Christophe Cruz, Business text classification with imbalanced data and moderately large label spaces for digital transformation. Applied Network Science, 2024 doi|
Muhammad Arslan, Saba Munawar, Christophe Cruz, Political-RAG: using generative AI to extract political information from media content. Journal of Information Technology and Politics, 2024, doi
Flann Chambers, Giovanna Di Marzo Serugendo, Christophe Cruz, A DPSIR-Driven Agent-Based Model for Residential Choices and Mobility in an Urban Setting. 16 (18), pp.8181, 2024, doi|
Saoussen Dimassi, Frédéric Demoly, Hadrien Belkebir, Christophe Cruz, Kyoung-Yun Kim, Samuel Gomes, H Jerry Qi, Jean-Claude André, A knowledge recommendation approach in design for multi-material 4D printing based on semantic similarity vector space model and case-based reasoning, Computers in Industry, Elsevier, 2023 doi
Saoussen Dimassi, Frédéric Demoly, Christophe Cruz, H. Jerry Qi, Kyoung-Yun Kim, Jean-Claude André, Samuel Gomes, An ontology-based framework to formalize and represent 4D printing knowledge in design, Computers in Industry 126, 2021 doi