Recherche clinique

Les enjeux du cohorting en recherche clinique et comment y répondre en 2023 par l’analyse de données de santé

Florian Sebal

Qu’est ce que la recherche clinique ?

1.  État des lieux

Les études cliniques sont un enjeu majeur de santé publique. Elles apportent de nouvelles solutions thérapeutiques et améliorent la prise en charge des patients. Ce sont également un marché très important avec des coûts de développement particulièrement élevés.  En 2021, selon le Ministère de la santé et de la prévention 2 206 études cliniques ont eu lieu en France.

2. Les types de recherche clinique

La recherche clinique regroupe deux principales catégories d’études : 

Schéma des différents types de recherche clinique

Catégories d'études cliniques

3. Les acteurs de la création de cohortes de patients

Les cohortes sont les groupes de patients sélectionnés selon des critères précis participant à un essai clinique.La création des cohortes nécessaires à la réalisation des études cliniques implique des acteurs variés mais indispensables qui rencontrent des difficultés chacun à leur niveau.

Médecin et internes

La constitution d’une cohorte commence par la définition d’une question de recherche et de la population cible de la cohorte. Le challenge majeur pour l’investigateur est de savoir combien de patients sont susceptibles de participer à l’étude. Les données sont dispersées dans diverses sources qui sont rarement conciliables et harmonisées. Cet accès complexe à la donnée clinique rend le processus de recrutement des patients très long, cela peut-être décourageant pour les équipes investigatrices. A l’heure actuelle, le processus de sélection des patients est majoritairement manuel et s'effectue à la fois dans le dossier papier et numérique des patients. Les aller-retours entre les différents supports d’informations est très chronophage.  

Attaché de recherche clinique (ARC)

Le principal objectif de l’attaché de recherche clinique est de suivre les données des patients au sein de l’essai. Il doit s’assurer de la fiabilité, de la consistance, de la reproductibilité et de l’authenticité des données cliniques recueillies. L’une des missions principales de l’ARC est de screener et d’assister le médecin dans l'inclusion des patients. La plus grande difficulté est la diversification des sources de données. Chaque type d’examens médicaux est associé à un logiciel différent. Cela engendre des pertes de temps et une fragmentation des données préjudiciable pour leur niveau de qualité. Enfin, dans la plupart des études cliniques, les ARC accompagnent de façon hebdomadaire les patients et évaluent leur qualité de vie pendant leur traitement. Ces évaluations se font via des questionnaires papiers. Les scores de qualité de vie sont ensuite reportés à la main dans les cahiers d’observations électroniques.  

DSI

Les DSI doivent extraire des informations patients de plusieurs sources de données qui ne communiquent pas entre elles, ces sources de données sont affiliées à des logiciels qui ne sont pas interopérables. Ce manque d’interopérabilité génère beaucoup d'hétérogénéité dans les données de sorties. Les formats et les origines diverses des données les rendent difficilement exploitables sans aucun traitement préalable. Ces difficultés d’accès et d’exploitation de la donnée de santé engendrent à minima un retard de recrutement de patients pour un essai ou pire empêchent un CHU d’obtenir une étude clinique à cause d’une estimation trop tardive ou incorrecte d’une population de patients potentielle.

Ces difficultés rencontrées par les équipes hospitalières se révèlent quotidiennes et ont un réel impact sur la faisabilité et le succès des études cliniques, et ce particulièrement en raison de la complexité du recrutement des patients.

L’accès aux données des patients : un véritable frein à la recherche clinique

Les raisons d’échecs des études cliniques peuvent être multifactorielles et variées. Cependant, les causes les plus reconnues sont les suivantes :

1. Recrutement insuffisant des patients

Dans le monde, d’après Harrier et al Artificial Intelligence for Clinical Trial Design, CellPress 2019, seulement 15 % des études ne rencontrent aucun abandon de patients durant l’essai clinique. De plus, 86 % des études ne complètent pas leur objectif de recrutement de  patients. 

Cet échec de recrutement est la conséquence de critères d’inclusion et d’exclusion des patients très sélectifs qui :  

Au-delà de la difficulté de cette recherche, appelée screening, des délais de recrutement très longs en découlent. Des retards importants apparaissent alors pour la mise sur le marché d’un produit pharmaceutique ou la restitution des données d’un essai observationnel. 

L’autre versant de ce problème est souvent l’estimation trop généreuse des investigateurs du nombre de patients potentiellement incluables au sein de leur établissements comme le rapporte D.B Fogel dans l’article Factors associated with clinical trials that fail and opportunities for improving the likelihood of success: A Review.

2. Suivi des données durant les études cliniques

Le suivi des données durant un essai clinique se fait au fur et à mesure dans le cadre des études prospectives. Dans la plupart des études, beaucoup de données sont manquantes. Ce problème touche particulièrement les études observationnelles qui n’imposent pas de changement au patient dans la prise en charge thérapeutique de  sa pathologie. Cette latitude laissée au patient peut générer un suivi fragmenté des données du patient.

3. Inadéquation des protocoles avec la pratique hospitalière

Dans certaines études cliniques, particulièrement pour les études observationnelles et/ou rétrospectives, les variables demandées par les protocoles ne sont pas générées en pratique de routine dans les centres hospitaliers. Les variables trop spécifiques ne sont pas systématiquement reportées dans les cahiers d’observations ce qui engendre également des données manquantes. 

C’est également valable pour certaines études interventionnelles. Certaines prises de mesures biologiques décidées dans le protocole peuvent se révéler inadéquates avec le tableau clinique des patients. Par exemple, un patient ayant des veines fragilisées par une chimiothérapie ne pourra pas nécessairement subir un trop grand nombre d’analyses sanguines.

Dans ces cas-là, il est fréquent de devoir chercher des alternatives en allant puiser dans les données de prise en charge disponibles dans le SIH.

4. Fiabilité des données 

Durant les études cliniques, beaucoup de problèmes de cohérence des données sont causés par des erreurs de saisie. La majorité de ces erreurs peuvent se trouver dans les bilans biologiques. Ces examens produisent des valeurs qui requièrent une précision de saisie à la virgule.

De ces différentes problématiques freinant la recherche émerge un réel besoin pour les établissements de santé de déployer des solutions permettant une meilleure gestion des données pour favoriser la mise en place d’études cliniques.

La gestion des données : un enjeu clé dans la réussite des essais cliniques 

Les données médicales sont extrêmement dispersées dans plusieurs sources de données différentes. L’enjeu majeur du traitement de la donnée de santé à l’heure actuelle est la réconciliation des bases de données. Il faut aussi que les investigateurs s’appuient sur des données de haute qualité afin que leurs analyses soient les plus robustes possibles. Les données de santé doivent donc être mises en qualité et extraites de façon pertinente en fonction de l’objectif clinique recherché. Cette montée en qualité permet à l’investigateur d’avoir une plus grande confiance dans les données produites par les logiciels de soin.

Pour ce faire, nous pouvons imaginer un logiciel capable d'explorer plusieurs bases de données simultanément. L'idéal serait que les médecins et les attachés de recherche clinique puissent rechercher et filtrer des patients selon des critères sélectifs définis en amont, et ce en autonomie et sans besoins de compétences techniques en systèmes d’informations. 

1. Constitution d’une cohorte vraiment représentative

Pour répondre à ce besoin qui émerge du terrain, Arkhn propose une solution innovante : l’application Explore qui permet aux investigateurs de faciliter l’étape de pré-screening et de constituer une cohorte représentative de la population de patients traitée dans leur établissement selon des critères démographiques et diagnostiques précis. Arkhn Explore s'adosse à une architecture de données existante pour garantir la provenance des données et leur fraîcheur. Il peut s'agir de l'Architecture de Données d'Arkhn ou d'une autre solution déjà mise en place au sein de l'établissement.

2. Accélération du screening

Ces différents facteurs engendrent un gain de temps potentiellement substantiel  Habituellement, un délai de 3 mois est nécessaire à un CHU pour obtenir une cohorte de patient dans un cadre clinique précis. La solution Explore permet de réduire ce délai à quelques minutes.

Une fois les critères de sélection saisis dans Arkhn Explore, une cohorte de milliers patients peut être générée en quelques secondes. 

Ce gain de temps permet aux établissements de santé d’accepter plus d’études cliniques grâce à des réponses plus rapides aux sponsors de l’industrie pharmaceutique ou des institutions publiques. La conséquence directe est une offre thérapeutique plus étoffée pour les patients. 

3. Mise en  qualité de la donnée

Cette liaison permanente avec les données hospitalières mises en qualité et standardisées par les data engineer et les solutions logicielles d'Arkhn, garantit une sélection de patient la plus pertinente et à jour possible

Un des points bloquants dans les études observationnelles et la constitution de cohorte est l’exploitation de données de vie réelle. Les données de vie réelle sont de qualité variable. Les données remontées par Arkhn Explore sont directement exploitables et utilisables par les investigateurs du fait de leur mise en qualité préalable dans l'architecture de données de santé.

4. Recherche textuelle par analyse du langage naturel grâce à l'intelligence artificielle

Une autre grande difficulté est le suivi des données patients dans le cadre d’une étude observationnelle prospective Ces études n'interfèrent pas avec la prise en charge courante du patient, les visites de celui-ci à l’hôpital ne sont pas systématiques et par conséquent ses données peuvent être plus éparses et moins nombreuses. Afin de rendre la recherche de données pour ce type de patient plus aisé, Arkhn Explore comporte un algorithme d'intelligence artificielle de recherche textuelle par analyse du langage naturel ou Natural Language Processing (NLP). Concrètement, cela permet à l’investigateur de rechercher des termes médicaux spécifiques auxquels vont être associés une liste de patients inclus dans la cohorte. Cette extraction de données grâce à l’intelligence artificielle permet un remplissage plus rapide des formulaires de registre électronique. La rapidité de complétion de ces formulaires permet une restitution rapide des résultats de l’étude. Cela permet aux établissements de santé de proposer de nouvelles options thérapeutiques aux patients. 

Pour conclure

Enfin, la clef de la réussite dans les études cliniques est la synergie entre les différents acteurs de la recherche clinique. A savoir, les médecins, l’industrie pharmaceutique, les institutions, les patients et les attachés de recherche clinique. Afin de relever les défis mentionnés dans cet article, il est important de donner aux établissements de l’autonomie dans la gestion de leur données afin de mettre celles-ci au service du soin.

Glossaire médical

Pour aller plus loin 

Lire un autre article

Icône de professionnel de santé

Ce que les modèles de langes comprennent du monde

Icône de professionnel de santé

La recherche clinique : un enjeu de santé et d'avenir

Icône de professionnel de santé

Faire réfléchir les modèles avec Chain of Thought