publicité
Facebook Facebook Facebook Partager

Infertilité

Publié le 16 oct 2022Lecture 17 min

Prédiction du nombre d’ovocytes par un logiciel d’intelligence artificielle lors d’une hyperstimulation ovarienne contrôlée en FIV/ICSI

René WYTTYNCK(1) et coll.*

Aujourd’hui, il n’existe aucune recommandation pour assister les cliniciens dans le choix des protocoles de fécondation in vitro (FIV). La littérature actuelle ne permet pas d’imposer tel ou tel protocole face à des situations cliniques précises. De fait, ces pratiques sont le plus souvent issues d’un empirisme intra-centre ou d’un effet de mode pour un protocole. Les doses de gonadotrophines sont ainsi adaptées par les praticiens en fonction de l’âge, du poids et de la réserve ovarienne de la patiente sans aide à la décision thérapeutique. Certains profils de patientes sont par ailleurs connus pour avoir une probabilité très faible d’obtenir une grossesse après les 4 cycles de FIV remboursés par la Sécurité sociale. Il faut développer des méthodes pour guider le clinicien dans le choix du protocole et de la dose de gonadotrophine.

L'un des critères sur lequel on peut se baser pour aider les praticiens est le nombre optimal d’ovocytes ponctionnés après stimulation ovarienne chez une patiente, sans lui faire courir de risque d’hyperstimulation ovarienne (HSO). Parmi les différentes approches possibles, les méthodes d’apprentissage automatique à partir des données biomédicales apparaissent très prometteuses. En effet, le volume et la richesse des données disponibles permettent d’utiliser les méthodes de classification automatique parfaitement adaptées pour identifier des groupes de patients similaires selon leurs traits phénotypiques. Notre objectif est de créer un algorithme d’intelligence artificielle pour aider le praticien dans sa prise en charge de fécondation in vitro (FIV ou FIV ISCI). Ce modèle sera capable de prédire le nombre d’ovocytes que l’on peut ponctionner en fonction de la dose de gonadotrophine et du protocole de stimulation choisi par le praticien.   Matériel et méthodes Nous développons un modèle de machine learning s’appuyant sur des algorithmes d’apprentissage automatique alimentés par les données d’une base issue de 12 centres d’AMP français, regroupant les données cliniques et biologiques de 40 000 patientes. Cela représente plus de 113 256 cycles de FIV, FIV-ICSI, dons d’ovocyte (DO) et préservation de la fertilité (encadré 1). Quatre protocoles sont utilisés majoritairement : antagoniste, antagoniste court, agoniste quotidien, agoniste retard. Le résultat utilisé pour l’apprentissage de l’algorithme est le nombre d’ovocytes mis en fécondation pour la FIV " classique " et le nombre d’ovocytes micro-injectés pour la FIV ICSI. Base de données La base regroupe les données 113 256 cycles de FIV, FIV ICSI et TEC (tableaux 1 et 2). Nous avons supprimé 31 834 cycles de TEC, 2 499 cycles de FIV " naturels " et 10 165 cycles dont les issues de la stimulation n’étaient pas renseignées. Puis nous avons retiré de la base 324 cycles présentant des données manquantes ou aberrantes, comme les cycles où le nombre d’ovocytes utilisables était supérieur au nombre d’ovocytes ponctionnés ou des AMH > 120 ; 2 919 cycles ont été supprimés car les ovocytes utilisables n’étaient pas renseignés. Après nettoyage de la base, il est resté 65 510 cycles. Chaque colonne représente la population d’un des centres ayant participé à la base de données. La population est décrite en fonction des données les plus importantes. La dernière colonne représente la description de la population moyenne. Nous avons réalisé un partitionnement du jeu de données de façon aléatoire par bloc stratifié : 70 % des données ont été utilisées pour l’apprentissage du modèle ; 15 % ont servi à la validation de l’apprentissage. Les 15 % restantes, à tester l’algorithme et à obtenir les résultats sous la forme d’un coefficient de corrélation. Modèles d'intelligence artificielle Nous avons créé un modèle dit " naïf " servant de baseline pour évaluer l’apprentissage des différents algorithmes modélisés. C’est une classification basée sur le théorème de Bayes, qui part du principe que chaque variable est indépendante, dite " naïve ". En d’autres termes, cela suppose qu’il n’existe aucun lien entre 2 variables ; par exemple, l’AMH est indépendante du CFA. Le modèle va créer une règle dite " simpliste " pour laquelle chaque donnée est susceptible de prédire un nombre moyen d’ovocytes. Cela permet de différencier les résultats issus de l’apprentissage des résultats issus du hasard. Nous avons modélisé plusieurs algorithmes pour trouver celui permettant d’offrir le meilleur résultat. Celui qui offre les meilleurs résultats combine des modèles interprétables de statistique " classique " : cas (K) le plus proche voisin associé à un random forest boosting. Le cas le plus proche voisin consiste à identifier, dans le bloc des données servant à l’apprentissage, un ou plusieurs cycle(s) de stimulation d’une ou de plusieurs patientes présentant les mêmes caractéristiques cliniques et paracliniques que la patiente du bloc " test " dont on cherche à prédire le nombre d’ovocytes afin d’extrapoler le même nombre d’ovocyte matures. La ou les patiente(s) du bloc d’apprentissage sont donc des " cas voisins " de la patiente du bloc test. Un modèle d’arbre de décision ou forêt aléatoire (random forest) lui a été combiné pour prédire les différents résultats possibles en fonction des trois protocoles et des différentes posologies de gonadotrophine possibles. Une relation entre les forêts aléatoires et les cas les plus proches voisins a été soulignée par Lin et Jeon en 2002(5). A ces deux modèles, nous avons ajouté un modèle de machine learning : le Gradient XGBoosting, qui est une technique ensembliste consistant à agréger des modèles élaborés séquentiellement sur un échantillon d’apprentissage, dont les poids des individus sont corrigés au fur et à mesure. Les modèles sont pondérés selon leurs performances. C’est une technique qui permet d’approcher la solution d’un problème par optimisation. Il détermine les paramètres (des modèles) qui permettent d'optimiser (en les minimisant ou en les diminuant) afin d’obtenir les meilleures performances de l’algorithme.   Résultats Les résultats des modèles ont été évalués avec un coefficient de corrélation et une erreur quadratique moyenne. Nous avons modélisé plusieurs algorithmes pour trouver celui permettant d’offrir le meilleur résultat. Nous avons écarté les réseaux de neurones profonds qui ne permettaient pas d’obtenir des résultats supérieurs aux prédictions réalisées par hasard. Nous avons retenu un algorithme modélisé en utilisant la technique du cas le plus proche voisin et le random forest auquel nous avons ajouté un XGboosting. Nous avons testé les résultats de chaque étape du modèle sur la partition de test, qui représentent 13 266 cycles de stimulation ovarienne. Les performances ont été estimées par le coefficient de corrélation entre le nombre d’ovocytes ponctionnés prédit et celui observé, ainsi que la différence moyenne observée entre ses deux valeurs. L’impact du protocole utilisé et de la dose de gonadotrophine initiale a été évalué en faisant varier ces valeurs à l’échelle individuelle (poidsw(xi,x’)) afin d’évaluer leur effet sur le nombre d'ovocytes prédit. Les performances ont été estimées par le coefficient de corrélation (annexe) entre le nombre d’ovocytes ponctionnés prédit et celui observé ainsi que la différence moyenne observée entre ses deux valeurs. Ce nombre est fortement corrélé avec le modèle de type Gradient Boosting Trees à 0,6 et celui obtenu après la ponction, avec une erreur de ± 4 ovocytes. Les modèles naïf seul et cas (K) plus proche voisin seul obtenaient une erreur respectivement de ± 5,5 et 4,8. L’impact du protocole et de la dose de gonadotrophine peut être évalué par l’utilisation de graphique permettant d’observer l’effet de leur variation.   Analyse et interprétation des données réalisées par le modèle Le modèle a identifié la dose initiale de gonadotrophine comme variable la plus importante pour optimiser le nombre d’ovocytes ponctionnés. La réserve ovarienne représentée par le CFA et AMH a été identifiée par le modèle comme une des variables, importante pour la prédiction du nombre des ovocytes ponctionnables après stimulation ovarienne (figures 1,2). Figure 1. Pondération des variables selon leur impact sur le nombre d’ovocytes ponctionnables après stimulation ovarienne. L’âge est une variable identifiée comme ayant un faible impact sur le nombre d’ovocytes matures ponctionnés après une stimulation ovarienne. On remarque que plus le CFA augmente, plus le nombre d’ovocytes " utilisables " prédit par le modèle augmente jusqu’à une décroissance pour les CFA > 50 (figure 2). Figure 2. Impact du CFA sur la prédiction du nombre d’ovocytes ponctionnables après stimulation ovarienne On remarque aussi que plus l'IMC augmente, moins le nombre d’ovocytes ponctionnables sera élevé pour notre algorithme (figure 3). Figure 3. Impact de l’IMC sur la prédiction du nombre d’ovocytes ponctionnables après stimulation ovarienne.   Le modèle montre qu'au-delà de 300 UI de gonadotrophine, il existe un effet "seuil" ; l’augmentation de la dose de gonadotrophine n’augmentera pas le nombre d’ovocytes ponctionnables (figure 4). Figure 4. Impact de la dose initiale de gonadotrophine sur la prédiction du nombre d’ovocytes ponctionnables après stimulation ovarienne.   Discussion Nous avons obtenu un algorithme capable de prédire le nombre d’ovocytes utilisables en FIV ± ICSI à un coefficient de corrélation de 0,6 et une erreur quadratique moyenne de ± 4 ovocytes. Ces résultats sont encourageants, car ils montrent que les prédictions de l’algorithme sont issues d’un apprentissage et non du hasard. Cet apprentissage doit être parfait afin d’améliorer les résultats et de permettre une utilisation de cet algorithme en pratique clinique. La faiblesse de nos résultats actuels résulte essentiellement du grand nombre de données manquantes dans la base. Afin d’améliorer l’apprentissage du modèle, il est important de poursuivre son apprentissage sur une base de données comportant moins de cas mais dépourvu de données manquantes ni aberrantes. Il est important que cette base soit représentative de l’ensemble des profils cliniques que l’algorithme sera susceptible de rencontrer en pratique. La faiblesse de nos résultats est également due à la très grande hétérogénéité des pratiques entre les différents centres de PMA constituant notre base de données. Même si cela a pu abaisser le résultat du coefficient de corrélation, cela constitue également un avantage pour l’apprentissage du modèle car il a pu apprendre différentes prises en charge face à des profils de patiente identiques. Ces caractéristiques peuvent expliquer la meilleure capacité de  prédiction obtenue par l’algorithme de l’équipe de N. Correa et coll.(1) qui ont obtenu un coefficient de corrélation de 0,829 avec une prédiction de 10 ± 1 et 7,2 ± 5,3 à partir de 6 952 cycles. Toutefois, son écart de prédiction est de ± 14 ovocytes, ce qui explique un coefficient de corrélation excellent puisque les chances que les prédictions de l’algorithme ne soient pas dans cette fourchette de ± 14 ovocytes sont faibles. La base de donn.es du N. Correa(1) comportait moins de cycles, et probablement moins de données manquantes ou aberrantes. Cette base restreinte, monocentrique, représente les pratiques d’un seul centre, ce qui rend difficilement généralisable les résultats obtenus à d’autres centres ayant des pratiques différentes. La fiabilité de prédiction des complexe cumulo-ovocytaires (COC) était 10 ± 7,1 et de 7,2 ± 5,3 pour les ovocyte en métaphase II (MII). Nous n’avons pas différencié la prédiction entre les prises en charge en FIV et en ICSI, préférant que le logiciel applique un correctif négatif sur la prédiction d’ICSI, car certains centres font parfois des FIV en réalisant la moitié des fécondations en FIV "classique" et l’autre moitié en ICSI en cas de doute sur un problème de fécondation. En FIV classique, il y a toujours davantage d’ovocytes mis en fécondation qu’en ICSI, car les ovocytes n’ont pas été décoronisés ; les ovocytes immatures sont mis en fécondation alors qu’ils ne peuvent être fécondés. Cela augmente artificiellement les résultats. Notre prédiction du nombre d’ovocytes en métaphase II (ou utilisables) possède une erreur quadratique moyenne de ± 4 ovocytes, ce qui reste plus performant que l’erreur quadratique obtenue par l’équipe de N. Correa qui est ± 7,1 pour les COC et ± -5,3 pour les MII. L’algorithme a identifié l’AMH et le CFA comme deux variables importantes pour évaluer la réponse à la stimulation ovarienne, comme l’a montré l’équipe de S.L. Broer(2). Ces derniers concluent que l’AMH et le CFA sont les meilleures données pour prédire le risque de réponse excessive à la stimulation ovarienne. Notre modèle a identifié l’AMH comme une variable plus importante que le CFA dans l’évaluation de la réserve ovarienne. Certaines études comme celle de V.T. Lan et coll.(3) insistent sur la plus grande fiabilité d’utilisation de l’AMH par rapport au CFA pour ajuster la dose initiale de gonadotrophine. En effet, il y a eu davantage de réponses ovariennes excessives chez les patientes ayant eu une dose adaptée avec le CFA comparativement à celles ayant eu une dose adaptée avec l’AMH. Le laboratoire Ferring possède un algorithme pour adapter la dose de sa nouvelle gonadotrophine Rekovelle® en fonction du poids et de l’AMH, sans prise en compte du CFA. L’AMH est une variable identifiée comme plus importante que le CFA par notre modèle, ce  qui peut s’expliquer par le fait que le CFA est une variable obtenue en échographie qui est un examen opérateur-dépendant avec une plus grande hétérogénéité des résultats alors que l’AMH est une donnée obtenue par des dosages automatisés avec des kits reproductibles, tel le kit Roche. L’âge est une variable identifiée comme ayant un impact plus faible que les marqueurs de la réserve ovarienne pour la prédiction du nombre d’ovocytes ponctionnables après stimulation ovarienne. En effet, l’âge est un facteur prédictif des chances de grossesse : plus l’âge avance, plus les chances de grossesse diminuent comme l’ont montré N. Gleicher et coll.(4). Néanmoins l’âge semble peu influencer la réponse ovarienne à la stimulation par gonadotrophine. On peut émettre l’hypothèse qu’une patiente de 25 ans avec un CFA à 13 et une AMH à 2,5 aura plus de chance de grossesse qu’une patiente de 40 ans avec un CFA à 13 et une AMH à 2,5 ; mais apparemment le nombre d’ovocytes "ponctionnables" serait proche avec le même protocole de stimulation et la même dose de gonadotrophine. C’est pour cela que le laboratoire Ferring utilise le poids et l’AMH pour adapter la dose de sa gonadotrophine (follitropine delata) Rekovelle®, car leur objectif de prédiction est un nombre d’ovocytes ponctionnables entre 8 et 14, et non les chances de grossesse, ce qui explique que l’âge n’est pas pris en compte. S.M. Nelson et coll.(5) ont montré que, parmi les femmes âgées de 18 à 40 ans ayant un taux d’AMH < 15 pmol/L, 93 % recevraient la même dose de follitropine delta et atteindraient un nombre identique d’ovocytes dans 97 % des cas. Pour les femmes de 18 à 40 ans ayant un taux d’AMH ≥ 15 pmol/L, 80 % recevraient une dose individualisée à ± 1,5 μg et 90 % atteindraient le même nombre d’ovocytes à ± 1 ovocyte près. La réponse ovarienne semble donc influencée davantage par la réserve ovarienne que par l’âge. Notre modèle a identifié le poids comme un facteur diminuant les chances d’obtenir une bonne réponse à la stimulation ovarienne. Or, nous savons qu’un IMC > 25 diminue les chances de grossesse en AMP (RR = 0,90, p < 0,0001)(6). Notre modèle a identifié la dose de 300 UI de gonadotrophine comme dose maximale pour augmenter le nombre d’ovocytes à la ponction. H. Lashen et coll.(7) ont montré qu’il n’y a pas de bénéfice à administrer des doses journalières en gonadotrophine supérieures à 300 UI/j ainsi que R.F. Harrison et coll.(8) qui ne retrouvent pas plus d’ovocytes en métaphase II ponctionnés chez les patientes ayant reçu 400 UI/j comparativement à celles ayant reçu 400 UI/J. Nous avons cherché à prédire le nombre d’ovocytes matures utilisables en FIV ± ICSI après une stimulation ovarienne et non les chances de naissance vivante, car nous pensons que le parcours d’AMP doit être réparti en différentes étapes qui, mises bout à bout, visent à l’obtention d’une naissance vivante. L’étape clinique (stimulation ovarienne et ponction) s’efforce d’obtenir le plus d’ovocytes possible pour la patiente sans risques de complications. Ces ovocytes rejoindront ensuite dans l’étape biologique de la prise en charge avec l’obtention d’embryons. Certains modèles historiques tels celui de A. Templeton et coll.(9) ou de Nelson(10) (FIV predict) ont cherché à prédire les chances de naissances vivantes en fonction des caractéristiques cliniques et paracliniques des patientes mais ils n’ont pas obtenu de validité externe, en partie car ils n’ont pas différencié les étapes cliniques et biologiques. L’équipe d’I. Sfontouris(11) a travaillé à partir de 463 699 cycles obtenus à partir du registre britannique "Human Fertilization and Embryology Authority". Ils ont créé un modèle de prédiction des naissances vivantes et réussi à prédire le taux d’absence de naissances vivantes avec une sensibilité de 94,8 % mais avec une sensibilité pour le taux de naissance vivantes de 11,09 %. Le taux d’arrêt d’un cycle de FIV en cours de stimulation ovarienne peut atteindre 22 % pour certains centres avec une moyenne de 13 %. Aujourd’hui le coût d’une FIV est d’environ 4 100 €, comprenant en moyenne 1 300 € pour le traitement de stimulation ovarienne, à savoir l’achat des médicaments et l’intervention des infirmières à domicile, et environ 500 € pour la surveillance hormonale et échographique. Les taux d’annulation de cycles de stimulations ovariennes issues des 14 centres français ayant fourni la seconde base de données sont indiqués dans la figure 11. Figure 11. Taux d’annulation des centres d’AMP. Ce modèle, en proposant un protocole de stimulation adapté aux caractéristiques cliniques des patientes et une dose de gonadotrophine optimale, permettrait de diminuer les arrêts de stimulation en cours de traitement pour réponse ovarienne inadaptée, et pourrait ainsi engendrer des économies pour la Sécurité sociale. La médecine est de plus en plus soumise à des certifications et à des démarches qualité dans le but d’améliorer et d’uniformiser les prises en charge des patients. Aujourd’hui, en AMP, il y a peu de reproductibilité et d’homogénéité dans les pratiques, malgré la bonne volonté des praticiens. Il n’existe pas de recommandation pour pratique clinique des collèges nationaux sur le choix des protocoles, le type de gonadotrophines, ou la dose à utiliser dans cette situation ; la littérature ne répond pas à ces questions car de nombreuses publications ont des résultats contradictoires et aucune ne peut servir de référence. Notre modèle permettrait une reproductibilité des prises en charge de stimulation ovarienne en FIV, car il proposerait le même protocole et la même dose de gonadotrophines pour la même patiente à Rennes comme à Grenoble. Conclusion Notre modèle permet de prédire le nombre d’ovocytes matures avec une erreur quadratique moyenne de ± 4 ovocytes selon le protocole de stimulation ovarienne choisi par le praticien et la dose de gonadotrophine initiale. Il est nécessaire de diminuer cette erreur moyenne en continuant l’apprentissage du modèle avec une base de données sans données manquantes ou aberrantes. Pour permettre une utilisation quotidienne de cet outil par les praticiens, une évaluation de sa validité externe doit être réalisée par une étude prospective de concordance entre les " choix du modèle " et les " choix du praticien ", suivie d’une seconde étude randomisée multicentrique en double aveugle comparant le nombre d’ovocytes "utilisables" ponctionnés chez les patientes ayant reçu une prise en charge proposée par l’algorithme versus chez des patientes ayant reçu une prise en charge classique par un praticien. L’objectif secondaire serait la comparaison de la morbidité observée dans les deux groupes.   CAS CLINIQUE 1 TRAITÉ PAR L'ALGORITHME Marqueurs de réserve ovarienne : CFA 40, AMH 12,5 Choix du praticien d’un protocole antagoniste Administration quotidienne de 125 UI de gonadotrophine 9 ovocytes ponctionnés On remarque que le modèle (figure 5) prédit la possibilité de ponctionner 12 ovocytes au lieu de 9 avec une dose initiale de gonadotrophine à 175 UI au lieu de 125 UI et une durée d’administration prolongée d’une journée. Sur la figure 6, on observe que la dose initiale de gonadotrophine à 125 UI a diminué le nombre d’ovocytes ponctionnables de 1. Sa bonne réserve ovarienne avec une AMH à 12 et un CFA à 40 a permis d’augmenter de 3 le nombre d’ovocytes ponctionnés. L’ICSI joue un rôle défavorable sur le nombre d’ovocytes "utilisables" après stimulation ovarienne de 1 ovocyte en moyenne, car le modèle compare le nombre d’ovocytes en FIV "classique" et en FIV ICSI. En ICSI, on n’utilise que les ovocytes matures obtenus après décoronisation (procédé non réalisé en FIV "classique"). Ce procédé permet d’identifier les ovocytes matures comparativement aux ovocytes immatures et évite la mise en fécondation inutile de ces derniers ; il y donc moins d’ovocytes ponctionnés "utilisables" en FIV ICSI qu’en FIV "classique". On observe chez cette patiente qu’un allongement de la durée du traitement aurait pu augmenter la cohorte de 1 ovocyte lors de la ponction.     Figure 5. Prédiction du modèle.   Figure 6. Pondération des variables ayant influé sur la prédiction du modèle chez la patiente.   CAS CLINIQUE 2 TRAITÉ PAR L'ALGORITHME Patiente normo-ovulante Marqueurs de réserve ovarienne : CFA 13, AMH 2,5 Choix par le praticien d’un protocole antagoniste Dose initiale choisie de 175 UI de gonadotrophine 7 ovocytes ponctionnés On remarque que le modèle prédit la possibilité de ponctionner  8 ovocytes au lieu de 7 ovocytes avec une dose initiale de gonadotrophine. 175 UI au lieu de 150 UI (figure 7). La durée d’administration prolongée d’une journée aurait pu majorer le nombre d’ovocytes "utilisables" ponctionnés. On observe (figure 8) chez cette patiente que son IMC à 19 est un facteur favorable pour augmenter le nombre d’ovocytes ponctionnables. La FIV ICSI est un facteur diminuant le nombre d’ovocytes ponctionnables de 0,6. La dose initiale de gonadotrophine jugée comme insuffisante par le modèle diminue le nombre d’ovocytes ponctionnables de 0,6. Figure 7. Prédiction du modèle. Figure 8. Pondération des variables ayant influé sur la prédiction du modèle chez la patiente.   CAS CLINIQUE 3 TRAITÉ PAR L'ALGORITHME Patiente présentant une insuffisance ovarienne débutante (IOD) Marqueurs de réserve ovarienne : CFA 7, AMH 0,6 Choix par le praticien d’un protocole court agoniste Dose initiale de 300 UI de gonadotrophine 3 ovocytes ponctionnés On remarque que le modèle (figure 9) prédit la possibilité de ponctionner 3 ovocytes avec une dose de gonadotrophine de 250 à 400 UI. La patiente a bénéficié d’une dose de 300 UI, ce qui a permis de ponctionner 3 ovocytes. La prolongation de la durée d’administration n’aurait pas majoré le nombre d’ovocytes "utilisables" ponctionnés. On observe (figure 10) que l’âge de la patiente, 38 ans, joue un petit rôle en diminuant le nombre d’ovocytes ponctionnables. Sa réserve ovarienne basse avec une AMH 0,6 et un CFA à 7 joue un rôle important dans le faible nombre d’ovocytes ponctionnables. La dose initiale de gonadotrophine est la dose juste. Figure 9. Prédiction du modèle. Figure 10. Pondération des variables ayant influé sur la prédiction du modèle chez la patiente.    

Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.

pour voir la suite, inscrivez-vous gratuitement.

Si vous êtes déjà inscrit,
connectez vous :

Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :

Version PDF

Articles sur le même thème

Vidéo sur le même thème