Desarrollo y aplicación de un modelo de diagnóstico temprano integral basado en aprendizaje profundo para la enfermedad pulmonar obstructiva crónica

Resumen

Antecedentes

La enfermedad pulmonar obstructiva crónica (EPOC) es una afección frecuentemente diagnosticada pero tratable, siempre que se identifique tempranamente y se trate de manera efectiva. Este estudio tiene como objetivo desarrollar un modelo de diagnóstico avanzado de EPOC mediante la integración de funciones radiómicas y de aprendizaje profundo.

Métodos

Utilizamos un conjunto de datos que comprende imágenes de tomografía computarizada de 2983 participantes, de los cuales 2317 participantes también proporcionaron datos epidemiológicos a través de cuestionarios. Las características de aprendizaje profundo se extrajeron utilizando un codificador automático variacional y las características radiómicas se obtuvieron utilizando el paquete PyRadiomics. Se utilizaron perceptrones multicapa para construir modelos basados ​​en características radiómicas y de aprendizaje profundo de forma independiente, así como un modelo de fusión que integra ambos. Posteriormente, se incorporaron datos del cuestionario epidemiológico para establecer un modelo más completo. El rendimiento diagnóstico de los modelos independientes, el modelo de fusión y el modelo integral se evaluó y comparó utilizando métricas que incluyen exactitud, precisión, recuperación, puntuación F1, puntuación de Brier, curvas características operativas del receptor y área bajo la curva (AUC).

Resultados

El modelo de fusión mostró un rendimiento sobresaliente con un AUC de 0,952, superando a los modelos independientes basados ​​únicamente en características de aprendizaje profundo (AUC = 0,844) o características radiómicas (AUC = 0,944). En particular, el modelo integral, que incorpora características de aprendizaje profundo, características radiómicas y variables de cuestionario, demostró el rendimiento diagnóstico más alto entre todos los modelos, arrojando un AUC de 0,971.

Conclusión

Desarrollamos e implementamos una estrategia de fusión de datos para construir un modelo de diagnóstico de EPOC de última generación que integra características de aprendizaje profundo, características radiómicas y variables de cuestionario. Nuestra estrategia de fusión de datos resultó eficaz y el modelo se puede implementar fácilmente en entornos clínicos.

Registro de prueba

No aplica. Este estudio NO es un ensayo clínico, no informa los resultados de una intervención de atención médica en participantes humanos.

Introducción

La enfermedad pulmonar obstructiva crónica (EPOC), una enfermedad pulmonar crónica prevalente y prevenible, es un factor de riesgo bien establecido para el cáncer de pulmón (1,2,3). En 2019, la EPOC provocó aproximadamente 3,23 millones de muertes en todo el mundo (4), con una prevalencia reportada del 13,7% en personas de 40 años o más en China (5). El inicio insidioso, los síntomas atípicos y la conciencia pública limitada contribuyen a una baja tasa de éxito en el diagnóstico temprano y una alta tasa de letalidad (6, 7). Por lo tanto, se necesitan con urgencia estrategias para mejorar el diagnóstico temprano de la EPOC (8, 9).

Los métodos de diagnóstico convencionales, que se basan principalmente en pruebas de función pulmonar, presentan limitaciones en cuanto a precisión, demostrando una sensibilidad del 79,9% (74,2–84,7%) y una especificidad del 84,4% (68,9–93,0%) (10) debido a los síntomas clínicos sutiles y los cambios modestos de la función pulmonar en la EPOC en etapa temprana (10, 11). Por el contrario, la tomografía computarizada (TC) emerge como una herramienta más objetiva, precisa y eficiente para el diagnóstico y evaluación precoz de la EPOC (12, 13), y mejora la sensibilidad al 83,95% (73,0-89,0%) y la especificidad al 87,95% (70,0-95,6%) (14). Sin embargo, la heterogeneidad de la enfermedad plantea desafíos prácticos para los métodos convencionales de lectura manual, incluida la variabilidad de interpretación subjetiva entre el personal médico y procesos que requieren mucho tiempo.12,13,14,15).

Para abordar estos desafíos, se han aplicado técnicas de inteligencia artificial (IA), en particular el aprendizaje automático, en el análisis de características radiómicas basadas en TC y han demostrado un rendimiento favorable (dieciséis). En los últimos años, el aprendizaje profundo, un subconjunto del aprendizaje automático conocido por su capacidad para manejar problemas complejos, ha ampliado aún más la aplicación de la IA en varios campos, incluida la medicina.17, 18). En el contexto de la EPOC, los algoritmos de aprendizaje profundo, como las redes neuronales convolucionales (CNN), han mejorado significativamente el rendimiento del diagnóstico.19,20,21,22,23,24,25). En particular, se logró un AUC de 0,82 para la detección de EPOC utilizando DenseNet (26), una sólida red de aprendizaje profundo. Además, el aprovechamiento de las características radiómicas extraídas de los modelos de aprendizaje profundo para predecir la supervivencia de los pacientes con EPOC dio como resultado un índice de concordancia de 0,73 (IC del 95 %, 0,70–0,73) (27). Además, algunos estudios recientes han utilizado enfoques de aprendizaje profundo para modelar el sonido respiratorio para el diagnóstico de EPOC, logrando una precisión de 0,953 (28), un AUC de 0,966 (29) y una precisión de 0,958 (30), respectivamente. Estos modelos de aprendizaje profundo pudieron extraer de forma autónoma características complejas de imágenes de TC, proporcionar una precisión excepcional en el análisis de imágenes y aliviar la carga de trabajo de los profesionales clínicos (18,19,20, 26).

Recientemente se introdujeron estrategias de fusión en las que se extrajeron simultáneamente características radiómicas y características abstractas de aprendizaje profundo de imágenes de TC y algoritmos computacionales como el perceptrón multicapa (MLP) (31) luego se emplearon para integrar perfectamente estas características intermodales, lo que llevó a la construcción de modelos de fusión (32). Aprovechando la naturaleza complementaria de la radiómica y las funciones de aprendizaje profundo, este enfoque de fusión promete mejorar la precisión y la confiabilidad en el diagnóstico y la predicción de riesgos (32). Además, a medida que continúan los esfuerzos por construir grandes cohortes de población, los datos de los cuestionarios están cada vez más disponibles. Las investigaciones existentes han demostrado que agregar características radiómicas a la información epidemiológica puede mejorar las capacidades predictivas de los modelos de aprendizaje automático para la progresión y la mortalidad de la EPOC (33, 34).Sin embargo, aún no está claro si estos datos del cuestionario pueden mejorar el rendimiento diagnóstico de los modelos de EPOC basados ​​en el aprendizaje profundo.

En este estudio, combinamos el aprendizaje profundo con perfiles radiómicos de imágenes de TC utilizando MLP para construir un modelo de fusión de diagnóstico de EPOC. Luego se incorporaron los datos del cuestionario epidemiológico para desarrollar un modelo integral. Se realizó un análisis comparativo para evaluar el rendimiento de modelos independientes, de fusión e integrales.

Materiales y métodos

Diseño del estudio y determinación de la EPOC.

Obtuvimos un conjunto de datos de TC del Lanxi People's Hospital, que comprende 23.552 tomografías computarizadas de tórax de 12.328 adultos, y cada adulto contribuyó con un número variable de tomografías. Un equipo de especialistas respiratorios del hospital revisó los informes de diagnóstico por TC y los síntomas relacionados, y confirmó la presencia de hallazgos radiológicos pulmonares normales o manifestaciones por imágenes indicativas de EPOC en 2983 adultos. Específicamente, los hallazgos radiológicos pulmonares normales se definieron como la ausencia de lesiones patológicas obvias en ambos pulmones, como se indica en los informes de imágenes. Las manifestaciones imagenológicas de la EPOC se caracterizaron por la presencia de bronquitis crónica combinada con enfisema o ampollas, o un diagnóstico definitivo de EPOC. Estas manifestaciones también podrían ir acompañadas de nódulos pulmonares, lesiones calcificadas, cambios fibróticos, inflamación menor (todas de menos de 1 cm) o derrame pleural menor (de menos de 3 cm), así como dilatación bronquial localizada. Se excluyeron del estudio los informes de imágenes por TC que mostraban otras anomalías patológicas, así como los pacientes con asma. Además, 2.317 de estas 2.983 personas habían respondido a un cuestionario epidemiológico completo como parte de la Cohorte de un millón de personas de Zhejiang saludable, una cohorte prospectiva recientemente establecida en la provincia de Zhejiang, China. No se excluyó a ningún paciente por motivos de género o etnia. Aunque las pruebas de función pulmonar (PFT) se recomiendan comúnmente para el diagnóstico de la EPOC, presentan ciertas limitaciones en la detección temprana de la EPOC, y algunos pacientes con síntomas graves pueden no poder tolerarlas o completarlas por completo. estas pruebas, lo que resulta en resultados de PFT incompletos en nuestra práctica diaria. El uso de diagnósticos reales de los médicos como criterio se alinea con nuestro objetivo de crear una herramienta de diagnóstico práctica, no invasiva y confiable.

Adquisición de datos del cuestionario.

El cuestionario epidemiológico recopiló datos sobre variables demográficas, estilos de vida y estado de salud de los participantes. Todas las preguntas fueron formuladas y respondidas en chino.

Las variables demográficas incluyeron edad, género, residencia (urbana o rural), estado civil (casado, divorciado/separado, viudo, soltero u otros), años de educación (0, ≥ 1 y ≤ 6, ≥7 y ≤ 12, o ≥ 13 años), ingresos anuales redondeados en miles (< 50, 50–100, 101–200, 201–300, o > 300 mil yuanes chinos) y número de convivientes en el hogar (< 2, 2, 3 , 4, > 4).

El índice de masa corporal (IMC) se calculó dividiendo el peso (en kilogramos) por el cuadrado de la altura (en metros). Posteriormente, los individuos fueron categorizados en diferentes grupos de IMC, incluido el bajo peso (< 18,5 kg/m2), peso saludable (18,5 ≤ IMC < 24 kg/m2), sobrepeso (24 ≤ IMC < 28 kg/m2) y obesidad (≥ 28 kg/m2) categorías.

El tabaquismo se clasificó según el historial de tabaquismo informado por los participantes en el cuestionario. Específicamente, los participantes que informaron haber fumado menos de 100 cigarrillos en su vida fueron clasificados como «nunca fumadores». Aquellos que informaron haber fumado más de 100 cigarrillos en su vida y habían dejado de fumar en el momento de la encuesta se clasificaron como «ex fumadores». Por último, los participantes que informaron haber fumado más de 100 cigarrillos en su vida y todavía fumaban en el momento de la encuesta se clasificaron como «fumadores actuales». La adicción al tabaquismo se clasificó como ninguna, moderadamente adicta o altamente adicta según la prueba de Fagerstrom para la dependencia de la nicotina (FTND). Los participantes también proporcionaron información sobre la frecuencia semanal de exposición al humo de segunda mano, categorizada como nunca, a veces, 1 a 2 días por semana, 3 a 5 días por semana o casi a diario. El estado de consumo de alcohol se categorizó como nunca, ex bebedor o menos de una vez por semana, más de una vez por semana durante menos de 12 años o más…

Truncado en 10000 caracteresTraducido automáticamente
Publicación Original

¿Quieres recibir semanalmente y gratuitamente todos los contenidos de Fisio One?

Artículos relacionados