“Le Modern Data quoi ?” Voilà la petite phrase ravageuse que nous entendons au quotidien chez Arkhn entre deux cafés, à des entretiens, à des tables rondes, ou lorsque nous accueillons de nouvelles personnes.Elle est souvent accompagnée d’une perplexité qui nous rappelle à quel point l’écosystème data a encore besoin d’être démystifié, surtout dans la santé… La notion de Modern Data Management est pourtant beaucoup plus simple qu’il n’y paraît. Cet article a pour but d'éclaircir ces sujets, et vous proposer quelques clés pour vous en sortir la prochaine fois que vous entendrez des acronymes barbares comme MDS, FAIR, ETL ou ELT 🙃
Retour aux sources (de données)
À l’hôpital aujourd’hui, donnée rime effectivement avec cloisonnement. L’accès aux données est une impasse : il est long, difficile et coûteux. Les données sont collectées et stockées exclusivement pour le soin et ne sont pas suffisamment accessibles ou structurées (et encore moins standardisées*). Il n’aura échappé à personne qu’un travail de mise en qualité est nécessaire, primordial même, pour que la donnée puisse être utilisée pour n’importe quelle autre finalité. Les extractions sont manuelles, prennent un temps fou avec un risque d’erreur important, sans parler de la collaboration multicentrique qui devient proprement épineuse dans ces conditions.
À l’hôpital, l’accès aux données est une impasse.
Aujourd’hui, l’hôpital peut et doit accueillir la modernité pour la gestion de ses données. La mise à jour des systèmes utilisés n’est pas un luxe dans le contexte de crise hospitalière que nous connaissons aujourd’hui, mais bien un investissement précieux sur le long-terme, qui contribue à une homogénéisation structurelle et nécessaire du système de santé.
Le Modern Data Management : un concept phare qui tarde à trouver son chemin à l'hôpital
Le Modern Data Management est le roi des concepts de gestion de données dans la plupart des secteurs industriels, en particulier ceux mobilisant de grandes quantités de données (numérique, logistique, hôtellerie, etc). Pourtant, il tarde encore à trouver son chemin jusqu’aux établissements de santé, qui pourraient en tirer parti pour un très grand nombre d’usages (si on devait encore vous en convaincre).🔦 Si la voie est longue, elle est pourtant bien tracée. Chez Arkhn, le Modern Data Management est un peu le phare qui nous éclaire dans la nuit : il est au cœur de notre produit, de notre expertise et de notre mission : accompagner les établissements de santé dans la gestion et valorisation de leurs données au bénéfice de tout l’écosystème.
Les architectures de données modernes au coeur du Modern Data Management
Si nous devions vous expliquer le Modern Data Management en une minute, nous vous parlerions tout de go d’un ensemble de pratiques qui, pour faire simple :
- s’appuient sur des architectures de données modernes*
- permettent de mobiliser les mêmes données pour différents usages
- sont à la fois transparentes et évolutives, favorisant la collaboration
- permettent de fluidifier la gestion des données
- optimisent les performances de l’établissement à l’échelle.
Une architecture de données est une sorte de grande bibliothèque qui regroupe et gère les données d’une organisation. L’outil qui permettrait de ramasser des livres dispersés (à la manière de données à travers tout l’hôpital), de les ranger, de les traduire intelligiblement, pour qu’ils soient utilisés à bon escient.
Une architecture de données peut être comparée à une grande bibliothèque qui regroupe et gère les données d’une organisation.
Dans un établissement de santé, on fait face à une multitude de logiciels - souvent propres à un service - qui utilisent des formats de données différents, des terminologies différentes, et ne “communiquent” que par des flux de données complexes et coûteux. Une architecture de données permettrait dans ce contexte d’homogénéiser l’organisation de la donnée dans la structure, afin de pouvoir accéder à ces données de manière croisée pour des projets de recherche, pour un meilleur pilotage, ou encore pour ouvrir les portes de l’hôpital à l’innovation.
Une architectures de données moderne, ou Modern Data Architecture, c’est tout simplement le nom que l’on donne à une architecture de données qui respecte les principes du Modern Data Management. C’est aussi une architecture de données évolutive, qui offre la possibilité de s’adapter aux avancées technologiques et aux pratiques médicales.
Comme l’illustre le schéma que nous venons de parcourir, une Modern Data Architecture est un ensemble de blocs technologiques ayant chacun une tâche spécifique, souvent réalisée par un acteur spécialisé (illustrés par les acronymes ELT/ETL sur lesquels nous reviendrons dans un instant).
Pour se doter d’une architecture data moderne, on peut donc soit :
- Acheter séparément chacun de ces blocs génériques (ils ne dépendent pas du secteur d’activité), les assembler et les adapter à son organisation,
- Passer par un acteur qui agrège ces expertises et réalise ce travail d’assemblage justement pour un secteur d’activité particulier. C’est ce que nous faisons chez Arkhn pour les établissements de santé.
Ce schéma a été emprunté à Dawn, merci à eux de l’avoir diffusé car il a énormément aidé à clarifier les discussions sur le sujet. Nous l’avons mis à jour avec de nouvelles technologies et le changement de paradigme d’ETL à ELT survenu ces dernières années (expliqué ci-après).
Par définition, une Modern Data Architecture garantit une donnée harmonisée, de confiance et toujours accessible, car elle suit des principes précis : ceux du FAIR data management. Par ailleurs, elle est structurée de telle manière à ce que ses utilisateurs puissent être en totale autonomie sur la donnée qu’ils manipulent et les usages qu’ils en font.
Pour résumer, le Modern Data Management est l’anti-boîte noire des architectures de données. Transparence, fluidité, accessibilité, optimisation… C’est l’outil de valorisation de ses données par excellence.
Une Modern Data Architecture est holistique par définition
À elle toute seule, une architecture de données moderne permet de :
- Gérer la donnée de manière FAIR*, ce qui est primordial en santé car les échanges d’information sont cruciaux pour le soin et la recherche
- Collecter de la donnée (c’est ce qu’on appelle un “Extract”)
- Charger cette donnée de base en base (le “Load”)
- Harmoniser, mettre en qualité, standardiser la donnée (le “Transform”)
- Stocker la donnée de façon efficace (l’information recherchée est immédiatement disponible) au sein de data lakes ou de data warehouses (entrepôts de données)
- Exporter la donnée et générer des datasets et datamarts, qui sont donc une copie de la donnée dédiée à un usage précis, intégrant des modalités de pseudonymisation, sur un périmètre de patient·e·s délimité
- Intégrer “by design” des normes hautes de sécurité et de gouvernance.
Une architecture de données moderne holistique permet de collecter, charger, harmoniser la donnée (Extract - Load - Transform ou ELT), en plus de la stocker, l'exporter et la réutiliser.
En santé, une architecture de données moderne offre donc la possibilité d’une multitude d’usages de la donnée à des fins de recherche, de pilotage et d’innovation. Elle matérialise la capacité d’un établissement à regagner sa souveraineté sur sa donnée.
La standardisation
La standardisation fait référence à un alignement syntaxique et sémantique des données, autrement dit une unification du format des données utilisé. Il n’y a pas d’interopérabilité en santé sans standardisation des données.
Les principes FAIR
Findable, Accessible, Interoperable, Reusable : les grands principes de gestion de données qui se sont imposés comme le modèle à suivre dans l’écosystème de la donnée en France et dans le monde, véritable fil conducteur du data management. Nous vous préparons un article de blog aux petits oignons à ce sujet.