Datahub
Le système d’information (SI) actuel repose sur de multiples applications métiers et bases de données, chacune gérant ses propres informations. Cette organisation a conduit à une forte hétérogénéité des données et à une dépendance accrue des applications vis-à-vis des systèmes sources. Ainsi, la moindre modification dans la structure ou les modalités d’accès à une donnée source peut avoir un impact en chaîne sur plusieurs applications.
Dans un contexte d’urbanisation du SI, il est apparu nécessaire de créer un point central de collecte, de stockage et de diffusion des données : le Datahub. Cette approche permet de réduire la complexité des interconnexions, de limiter les coûts d’adaptation aux évolutions et d’assurer une meilleure gouvernance des données. Il est la première étape vers un futur méta-datahub capable de centraliser les données de plusieurs établissements.
Mots-clés
Datahub, urbanisation, interopérabilité, open-source, Python, Django, base de données, annuaires
Utilisation du Datahub (avec collecte des données via Hermes) et mise à disposition des données aux applications métiers
Rôle pivot du Datahub
Sans Datahub, les applications métiers doivent récolter les données dans différentes sources. De plus, une source change, cela peut impacter différentes applications.

Publics cibles
Les établissements de l'enseignement supérieur et plus précisément les différents INSA.
Objectifs
Centraliser et harmoniser les données provenant de différentes sources
Améliorer la gouvernance et la qualité des données
Garantir la stabilité des structures de données
Fournir un point unique et stable d’accès aux données pour les applications métiers
Réduire les impacts des changements des systèmes sources sur les applications métiers
Alimenter un annuaire (style LDAP par exemple)
Standardiser l'alimentation des LDAP
Acteurs
Sébastien BONNEGENT (Directeur Technique de la DSI de l'INSA Rouen Normandie)
Corentin HAREL (Alternant développeur de la DSI de l'INSA Rouen Normandie)
Julien HOUCHARD (Développeur DemoES INSA 2025 de l'INSA Rouen Normandie)
Marcelin LE CHOSSEC (Alternant développeur de la DSI de l'INSA Rouen Normandie)
Christine LEGEMBLE ( Responsable de l'intégration et développeur de l'INSA Rouen Normandie)
Laurent VASSEUR (DSI de l'INSA Rouen Normandie)
Eric Louvel (DSI INSA Strasbourg)
Elric Richter (Ingénieur informatique INSA Strasbourg)
Les DSI du Groupe INSA
Résumé
Le projet Datahub a consisté en la mise en place d'une base de données centralisée pour la gestion des données (compatible supann2021), en facilitant l’accès et l’analyse de la donnée.
De quoi s'agit-il ?
Mettre en place un outil facilitant la convergence des systèmes d'Information des établissements du Groupe INSA, avec pour objectif principal de faciliter l'authentification et l'identification des usagers de nos établissements.
Permettre la remontée des informations supplémentaires de nos SI, non plus pour identifier des personnes, mais des populations de façon uniforme pour le Groupe.
Ce que cela apporte/permet/transforme ?
Faciliter la mise en place de nouveaux services avec un ensemble de briques d'authentifications communes.
Permettre d'identifier plus facilement des populations au niveau Groupe (doctorants, enseignants) mais aussi des organisations d'établissement.
Identifier certains attributs d'une seule manière.
Générer également un levier pour travailler sur le projet ECIU.
Questions autour de la gestion de projet
Les freins.
Les projets qui touchent directement les SI des établissements ou plus particulièrement leur urbanisation.
L'entraînement intrinsèque des initiatives d'établissement pour avancer sur le sujet avec des choix non concertés.
Le besoin de convergence à trouver pour faire adhérer au projet.
La charge de travail des DSI.
Les recrutements, notamment en informatique, et donc la prise en charge des missions par les RH en place, ce qui ajoute à la surcharge.
L'absence de pilotage par le Groupe sur le ou les systèmes d'information.
Calendrier de déploiement
Modélisation de la base de données : conception de l'architecture pour une gestion efficace des données.
Choix des outils : sélection de technologies internes et externes adaptées aux besoins du projet (dont Hermes développé par INSA Strasbourg).
Développement : création de la base, d'une interface de gestion, suivi des tests et optimisation.
Mise en production : déploiement de la solution, avec intégration progressive.
Résultat : amélioration de l'accessibilité et de la gestion des données, via une base de données centralisée et maîtrisée.
Contacts
Julien Houchard (Développeur DemoES INSA 2025)
Laurent Vasseur (DSI, INSA Rouen Normandie)

