ModGraProDep: intel·ligència artificial i modelització probabilística aplicada a l’oncologia clínica

Millorar la predicció d’indicadors de supervivència en malalts de càncer de mama mitjançant eines d’intel·ligència artificial i modelització probabilística és el propòsit principal del sistema ModGraProDep

11/06/2020

ModGraProDep és un sistema innovador presentat en un estudi que ha dirigit Ramon Clèries, professor del Departament de Ciències Clíniques de la Facultat de Medicina i Ciències de la Salut de la Universitat de Barcelona (UB) i membre del Pla director d’oncologia (ICO-IDIBELL). El treball ha estat publicat a la revista Artificial Intelligence in Medicine.

La nova tecnologia ha estat desenvolupada per un ampli equip d’experts en epidemiologia, oncologia i gestió de dades del Pla director d’oncologia (IDIBELL), la Universitat de Barcelona, la Universitat Politècnica de Catalunya · BarcelonaTech (UPC), l’Institut Català d’Oncologia (ICO), l’Institut d’Investigació Biomèdica de Girona (IDIBGI), la Universitat de Girona, la Universitat d'Alacant, el CIBER d’Epidemiologia i Salut Pública (CIBERESP), l’Institut de Salut Carlos III, l’Hospital Universitari Sant Joan de Reus, el Servei d’Oncologia Mèdica de l’ICO Girona, els Registres de Càncer de Girona i Tarragona i l’entitat MC Mutual.

Juntament amb altres experts en epidemiologia, oncologia i estadística, des de la UPC s’ha analitzat, comparat i validat diferents propostes metodològiques per millorar la predicció d'indicadors de supervivència en pacients amb càncer de mama. S’ha proposat la metodologia innovadora ModGraProDep (Modeling Graphical Probabilistic Dependencies), d'utilitat per a situacions de predicció de dades no disponibles i tamany mostral reduït, com és el camp de la investigació en càncer. La perspectiva ModGraProDep ha sigut comparada amb els algoritmes de classificació, oversampling i  aprenentatge automàtic més utilitzats. Segons l’investigador de la UPC José Miguel Martínez, del Departament d’Estadística i Investigació Operativa, “els resultats obtinguts mostren que ModGraProDep permet fer prediccions de dades no disponibles de forma simultània i simular bases de dades de gran tamany, per tant, és una alternativa d’utilitat a altres metodologies.  

 

Modelització matemàtica: noves fronteres en la lluita contra el càncer

Una de les aplicacions de la modelització numèrica d’indicadors clínics en oncologia és el desenvolupament de models predictius que ajudin els oncòlegs i els clínics a classificar i valorar futurs escenaris d’evolució dels pacients de càncer. En aquest context, la predicció de la supervivència dels malalts —amb variables concretes i edats específiques— és un element decisiu per valorar tractaments i identificar subgrups entre els pacients. No obstant això,  sovint aquesta informació s’ha d’estimar mitjançant la modelització numèrica, atès que no existeix una població mostral suficient per calcular aquests indicadors de manera específica.

L’aplicació de la nova metodologia ModGraProDep (Modeling Graphical Probabilistic Dependencies) ha donat lloc a dos estudis que han estat coordinats per la professora Mireia Vilardell, de la Secció d’Estadística del Departament de Genètica, Microbiologia i Estadística de la Facultat de Biologia UB, i per la investigadora Maria Buxó, de l’IDIBGI.

En el primer cas, ModGraProDep permet identificar l’estructura de la base de dades i generar una «població sintètica» (simulada) de pacients amb les característiques demogràfiques de la cohort original. Amb aquesta aproximació, es poden identificar possibles nous patrons de pacients i calcular indicadors (per exemple, la supervivència d’un pacient en funció dels valors de les seves variables).

En el segon estudi, ModGraProDep es revela com una tecnologia capaç d’assignar valors de manera probabilística en variables de les quals no s’havia pogut recollir informació.

L’equip científic també ha dissenyat una aplicació web de gran interès clínic en l’àmbit de l’oncologia que permet obtenir una predicció d’indicadors de supervivència i risc de mortalitat per càncer —i per altres causes— de cada pacient fins a un termini màxim de vint anys.

 

Article de referència:

Vilardell, M.; Buxó, M.; Clèries, R.; Martínez, J. M.; Garcia, G.; Ameijide, A.; Font, R.; Civit, S. «Missing data imputation and synthetic data simulation through modeling graphical probabilistic dependencies between variables (ModGraProDep): An application to breast cancer survival». Artificial Intelligence in Medicine, maig de 2020. Doi: 10.1016/j.artmed.2020.101875