Un análisis exhaustivo sobre combinaciones de modelos de machine learning con sobremuestreo para la hipertensión pulmonar asociada a displasia broncopulmonar en bebés extremadamente prematuros


Resumen

Contexto

La hipertensión pulmonar asociada a la displasia broncopulmonar (BPD-PH) continúa siendo una complicación clínica devastadora que impacta significativamente en el resultado terapéutico de los recién nacidos prematuros. Por consiguiente, la detección temprana y el diagnóstico oportuno antes de los cambios patológicos son elementos clave para reducir la morbilidad y mejorar el pronóstico. Nuestro objetivo principal es emplear técnicas de machine learning para desarrollar modelos predictivos que puedan identificar con precisión a los bebés con BPD-PH en riesgo de desarrollar HP.

Metodología

Los datos utilizados en este estudio fueron recopilados de los servicios de neonatología de cuatro hospitales de nivel terciario en China. Para abordar el problema de desequilibrio de los datos, se implementó la técnica de sobremuestreo de minorías sintéticas (SMOTE) de algoritmos de sobremuestreo para mejorar el modelo.

Resultados

El estudio recopiló setecientos sesenta y un expedientes clínicos. Después de la preparación de los datos y la selección de características, se utilizaron 5 de las 46 características para construir modelos, incluyendo la duración de la asistencia respiratoria invasiva (días), la severidad de la BPD, neumonía asociada al ventilador, hemorragia pulmonar y HP de inicio temprano. Cuatro modelos de machine learning se aplicaron para el aprendizaje predictivo y, tras una revisión exhaustiva, se seleccionó un modelo. El modelo logró una sensibilidad del 93,8%, una precisión del 85,0% y un AUC de 0,933. Una puntuación de la fórmula de regresión logística mayor a 0 fue identificada como una señal de advertencia para BPD-PH.

Conclusiones

Se compararon de manera exhaustiva distintos modelos de machine learning y se seleccionó finalmente un modelo con buenas perspectivas que resultó ser útil para ayudar a los pediatras a realizar diagnósticos tempranos y elaborar planes de tratamiento más efectivos para pacientes pediátricos con BPD-PH.

Introducción

Con el continuo avance en la tecnología perinatal, ha habido un notable incremento en la tasa de éxito en el tratamiento de bebés muy prematuros y extremadamente prematuros diagnosticados con displasia broncopulmonar (DBP). Sin embargo, algunos de estos bebés con DBP pueden desarrollar hipertensión pulmonar (HP), lo que impacta significativamente su tasa de mortalidad. Investigaciones han indicado que la incidencia de HP en bebés prematuros con DBP es elevada, llegando al 26,8% en otros países, con tasas de mortalidad que oscilan entre el 14% y el 38% e incluso alcanzando el 50% en algunas naciones. Los sobrevivientes aún enfrentan complicaciones adversas a corto y largo plazo. La patogénesis de la BPD-PH aún no se comprende completamente y actualmente no existe un tratamiento seguro y efectivo para la enfermedad. Por tanto, la detección temprana y el diagnóstico oportuno antes de los cambios patológicos son cruciales para disminuir la morbilidad y mejorar el pronóstico. Identificar a los bebés en riesgo de desarrollar BPD-PH se ha convertido en un punto crítico de la investigación pediátrica.

Hasta la fecha, se han realizado pocos estudios que informen sobre la creación de modelos predictivos de BPD-PH. Los estudios individuales que han examinado la creación de modelos predictivos de BPD-PH utilizaron coeficientes de regresión para indicar la correlación entre los factores de riesgo y las enfermedades, emplearon algoritmos relativamente sencillos y no lograron proporcionar valores de probabilidad específicos con precisión. Con el desarrollo de la infraestructura de big data en medicina y salud, la forma y cantidad de datos médicos continúa mejorando, lo cual nos brinda la oportunidad de abordar las deficiencias técnicas mencionadas anteriormente con un alcance de capacitación más amplio y una validación más rigurosa. Además, para abordar el problema comúnmente observado de desequilibrio en los conjuntos de datos del mundo real, se podrían evaluar algunas técnicas de machine learning, como el sobremuestreo. La técnica de sobremuestreo de minorías sintéticas (SMOTE) es un método de sobremuestreo basado en redes neuronales que simula el proceso de aprendizaje de las redes neuronales para detectar valores faltantes y atípicos. En este estudio retrospectivo, nos propusimos responder a las siguientes preguntas de investigación utilizando los registros médicos de pacientes hospitalizados en cuatro importantes centros médicos de nivel terciario en China:

  • RS1: ¿Pueden los métodos de machine learning respaldar la predicción del riesgo de BPD-PH en un entorno clínico más práctico en diferentes organizaciones?

  • RS2: ¿Pueden las técnicas de sobremuestreo como SMOTE contribuir a mejorar los resultados de predicción?

Recopilación de datos

Pacientes

Este estudio fue aprobado por el comité de ética de investigación del Séptimo Centro Médico del Hospital General del PLA (No. 2022-02) y se adhirió a la Declaración de Helsinki. Se dispensó el consentimiento informado. La población de estudio incluyó bebés extremadamente prematuros (VPI) con BPD que nacieron o ingresaron al Séptimo Centro Médico del Hospital General del PLA (Pekín, China), al Hospital de Mujeres y Niños de Qingdao (Qingdao, China), al Hospital Central de Ginecología y Obstetricia de Tianjin (Tianjin, China) y al Hospital de Mujeres y Niños de Guangdong (Guangzhou, China) entre el 1 de agosto de 2015 y el 28 de febrero de 2022. Se recopilaron un total de 801 VPI con DBP menores de 32 semanas de edad gestacional. De estos, 626 nacieron en el Séptimo Centro Médico del Hospital General del PLA, 69 en el Hospital de Mujeres y Niños de Qingdao, 59 en el Hospital Central de Ginecología y Obstetricia de Tianjin y 47 en el Hospital de Mujeres y Niños de Guangdong. Se aplicaron los siguientes criterios para constituir el conjunto inicial de datos:

Los criterios de inclusión abarcaban VPI con edad gestacional inferior a 32 semanas y diagnóstico de BPD. Los criterios de diagnóstico y gravedad de la BPD se basaron en la definición propuesta en la conferencia del Instituto Nacional de Salud Infantil y Desarrollo Humano en junio de 2000, corrigiendo la edad gestacional a 36 semanas.

Los criterios de exclusión abarcaban VPI: 1) con edad de ingreso > 3 días o que no permanecieron hospitalizados hasta las 36 semanas de gestación corregida (debido a alta o fallecimiento); 2) con enfermedades pulmonares congénitas, otras anomalías anatómicas (como hernia diafragmática o malformaciones torácicas), enfermedad cardíaca congénita salvo conducto arterioso persistente (CAP), foramen oval persistente (FOP), defectos pequeños del tabique auricular (CIA) o del tabique interventricular (CIV) (diámetro del defecto < 5 mm/m2 de superficie corporal) que resulten en HP.

Se consideraron sujetos válidos los VPI con edad de ingreso > 3 días o que permanecieron hospitalizados hasta las 36 semanas de gestación corregida, reconociendo que una edad de ingreso > 3 días podría resultar en datos clínicos maternos y neonatales faltantes, mientras que la hospitalización por < 36 semanas de gestación corregida podría afectar el diagnóstico de la gravedad de la BPD y la HP. En consecuencia, se excluyeron un total de 40 casos de bebés con TLP y finalmente se reclutaron 761 casos de bebés con TLP.

Según los resultados de la ecocardiografía Doppler a al menos 36 semanas de gestación corregida, los pacientes se dividieron en los grupos de BPD-PH y BPD.

Características clínicas

Se recopilaron un total de 46 características clínicas que coinciden con las variables mediante la revisión de archivos médicos durante la hospitalización, incluyendo factores relacionados con el embarazo materno, datos clínicos del neonato, detalles del tratamiento e información de ecocardiografía.

Los factores del embarazo materno abarcaban cesárea, hipertensión durante el embarazo, diabetes gestacional, sufrimiento fetal, preeclampsia, partos múltiples, concepción natural, anomalías placentarias, desprendimiento de placenta, ruptura prematura de membranas (PROM), PROM superior a 18 horas y oligohidramnios.

Los datos clínicos del neonato incluían edad gestacional (semanas), peso al nacer (gramos), gravedad de la BPD, HP de inicio temprano, puntuación de Apgar a los 1 minutos, puntuación de Apgar a los 5 minutos, síndrome de aspiración de meconio (MAS), contaminación del líquido amniótico, lactancia materna exclusiva, síndrome de dificultad respiratoria neonatal (NRDS) de grado II o superior, neumonía asociada al ventilador, septicemia, enterocolitis necrotizante quirúrgicamente requerida, hemorragia pulmonar, PCA hemodinámicamente significativa, retinopatía del prematuro de grado II o superior, pequeño para la edad gestacional, sexo, edad al inicio de la alimentación y tiempo para lograr la alimentación enteral completa.

Los detalles del tratamiento incluían la duración del soporte respiratorio invasivo, duración de oxigenación con cánula nasal, duración del soporte respiratorio no invasivo, uso de corticosteroides para el tratamiento de la BPD, administración de surfactante pulmonar en dosis única o múltiple, uso de agentes vasoactivos, administración de cafeína y ligadura del CAP.

La información de la ecocardiografía comprendía FOP, diámetro máximo de CAP, VSD, ASD, velocidad máxima del flujo regurgitante tricuspídeo, velocidad y dirección del flujo sanguíneo en el CAP, derivación a nivel de FOP, derivación a nivel de VSD y posición del tabique ventricular.

Estas características clínicas cubren la mayoría de los factores que pueden influir en la enfermedad, permitiendo que los modelos posteriores puedan predecir de manera más precisa si los pacientes tienen riesgo de desarrollar la enfermedad. Los criterios diagnósticos están relacionados y todos los períodos de diagnóstico y tratamiento son antes o en el momento de corregir la edad gestacional a 36 semanas, excepto para BPD-PH. La HP de inicio temprano se definió como HP que ocurre entre las 72 horas y los 14 días después del nacimiento. La BPD-PH se definió como HP que surge después de las 36 semanas de gestación corregida. Los criterios ecocardiográficos de HP incluyen presión sistólica del ventrículo derecho (PSVD) > 35 mmHg, relación PSVD/PAS > 0,5, presencia de CIV o PCA, o la cumplimentación de otros criterios sin insuficiencia o cortocircuito de la válvula tricúspide. Cabe mencionar que había un desequilibrio en la cantidad de datos entre BPD-PH y sin PH.

Métodos

Preprocesamiento de datos

El…

Truncado en 10000 caracteresTraducido automáticamente
Publicación Original

¿Quieres recibir semanalmente y gratuitamente todos los contenidos de Fisio One?

Artículos relacionados

Heterogeneidad en la expresión de PD-L1 entre ganglios linfáticos primarios y metastásicos: un predictor de la respuesta a la terapia EGFR-TKI en el cáncer de pulmón de células no pequeñas

Heterogeneidad en la expresión de PD-L1 entre ganglios linfáticos primarios y metastásicos: un predictor de la respuesta a la terapia EGFR-TKI en el cáncer de pulmón de células no pequeñas

ResumenAntecedentesNo hay evidencia concluyente que sugiera que la expresión del ligando 1 de muerte celular programada (PD-L1) sea un posible predictor de la respuesta a la terapia con EGFR-TKI en el cáncer de pulmón de células no pequeñas (CPCNP) avanzado con...