Predicción derivada del aprendizaje automático de la mortalidad hospitalaria en pacientes con infección respiratoria aguda grave: análisis de datos de reclamaciones de la red de hospitales Helios en toda Alemania

Resumen

Fondo

Las infecciones respiratorias agudas graves (IRAG) son las causas infecciosas más comunes de muerte. Es escaso el trabajo previo sobre modelos de predicción de mortalidad por SARI que utilizan algoritmos de aprendizaje automático (ML) que pueden ser útiles tanto para la estratificación del riesgo individual como para la evaluación de la calidad de la atención. Nuestro objetivo fue desarrollar modelos fiables para la predicción de la mortalidad en pacientes con IRAG utilizando algoritmos de ML y comparar su rendimiento con un enfoque de análisis de regresión clásico.

Métodos

Se analizaron retrospectivamente los datos administrativos (conjunto de datos dividido aleatoriamente 75 %/25 % para el entrenamiento/prueba del modelo) de los años 2016 a 2019 de 86 hospitales Helios alemanes. Los casos de IRAG de pacientes hospitalizados se definieron mediante los códigos ICD J09-J22. Se evaluaron tres algoritmos de ML y se comparó su rendimiento con los modelos lineales generalizados (GLM) mediante el cálculo del área característica operativa del receptor bajo la curva (AUC) y el área bajo la curva de recuperación de precisión (AUPRC).

Resultados

El conjunto de datos contenía 241.988 casos de IRAG de pacientes hospitalizados (75 años o más: 49%; hombres 56,2%). La mortalidad hospitalaria fue del 11,6%. AUC y AUPRC en el conjunto de datos de prueba fueron 0,83 y 0,372 para GLM, 0,831 y 0,384 para bosque aleatorio (RF), 0,834 y 0,382 para red neuronal de una sola capa (NNET) y 0,834 y 0,389 para aumento de gradiente extremo (XGBoost). La comparación estadística de las AUC de ROC reveló un mejor rendimiento de NNET y XGBoost en comparación con GLM.

Conclusión

Los algoritmos de aprendizaje automático para predecir la mortalidad hospitalaria se entrenaron y probaron en un gran conjunto de datos administrativos del mundo real de pacientes con IRAG y mostraron un buen rendimiento discriminatorio. La amplia aplicación de nuestros modelos en la práctica clínica habitual puede contribuir a la evaluación del riesgo y la gestión de la calidad de los pacientes.

Introducción

La infección respiratoria aguda grave (IRAG) fue definida por la Organización Mundial de la Salud (OMS) en 2011 y se describe según los siguientes criterios: enfermedad respiratoria aguda, antecedentes de fiebre (o fiebre medida de ≥ 38 grados centígrados), tos, disnea (o taquipnea), inicio en los últimos 10 días, requirió hospitalización [1, 2]. Se informaron varios brotes de IRAG en los últimos años, en su mayoría debido a los virus de la influenza. [3, 4]. Según el Global Burden of Diseases Study 2015, las infecciones del tracto respiratorio inferior son las causas infecciosas más comunes de muerte. [5]. No solo desde el inicio de la pandemia mundial de SARS-CoV2 en 2019 se reconoció la importancia de la investigación epidemiológica sobre los ingresos hospitalarios relacionados con IRAG. En la última década se establecieron estudios prospectivos a gran escala y sistemas de vigilancia basados ​​en hospitales como respuesta a epidemias pasadas. [1, 6, 7] incluido el ICOSARI-sentinel alemán, un sistema de vigilancia de SARI en curso realizado por la agencia del gobierno federal alemán Robert-Koch-Institute (RKI) en colaboración con Helios Kliniken GmbH [8].

La capacidad de los algoritmos de aprendizaje automático (ML) para predecir los resultados de los pacientes se ha estudiado entre diferentes entidades de enfermedades. [9]. Por ejemplo, la predicción de resultados en pacientes con COVID-19 utilizando métodos de aprendizaje profundo se evaluó recientemente con resultados prometedores. [10,11,12]. Con respecto a los pacientes con IRAG no COVID, también se informaron varios enfoques para la predicción de la mortalidad en pacientes con neumonía en general y específicamente con neumonía causada por influenza. La metodología de esos estudios incluía diferentes conceptos de ML [13,14,15,16] así como regresión logística (LR) [14, 17, 18]. Los autores se centraron principalmente en desarrollar modelos de predicción de mortalidad y estratificación del riesgo individual para evaluar el riesgo individual del paciente en el momento de la admisión en el hospital. Apuntando en la misma dirección, existen varias herramientas de evaluación bien establecidas para la neumonía para evaluar el riesgo de mortalidad individual y ayudar a guiar las decisiones de los médicos. Las partituras ampliamente utilizadas son las CRB-65/CURB-65 [19, 20] y el índice de gravedad de la neumonía (PSI) [21, 22]. Sin embargo, es necesario predecir los resultados también a nivel de población en lugar de a nivel individual en el contexto de los intereses e investigaciones de salud pública, así como en la evaluación comparativa de hospitales. Faltan herramientas de predicción con este propósito.

En cuanto a las enfermedades cardiovasculares, se han realizado varios estudios con foco en la estratificación de riesgo [23, 24] también mediante la aplicación de enfoques ML [25]. Nuestro grupo de trabajo presentó recientemente un análisis sobre la mortalidad hospitalaria en pacientes con insuficiencia cardíaca (IC) con la implementación de algoritmos de ML [26]. Este trabajo preliminar de predicción del riesgo basado en la población nos ha proporcionado un concepto metodológico establecido que constituye la base de este estudio en el ámbito de la IRAG. En un enfoque más basado en el paciente, nuestro objetivo fue evaluar modelos de predicción de mortalidad para pacientes con IRAG y, en este contexto, comparar diferentes algoritmos de ML con LR (modelos lineales generalizados, GLM).

Métodos

Definición de caso

Existen diferentes definiciones de casos para identificar a los pacientes con IRAG a partir de datos administrativos en un entorno hospitalario, considerando que no todas las condiciones definitorias de IRAG pueden ser evaluadas por esta fuente de datos. En el centinela ICOSARI mencionado anteriormente, un enfoque utilizó diagnósticos principales y secundarios específicos de SARI de los códigos ICD-10 (Clasificación estadística internacional de enfermedades y problemas de salud relacionados, versión 10) J09-J22 para la definición de casos y demostró ser sensible [8]. Este método fue adaptado en nuestro estudio. Los códigos ICD-10 J09-J22 comprenden influenza y neumonía (J09-J18), bronquitis aguda (J20.-), bronquiolitis aguda (J21.-) e infección aguda no especificada del tracto respiratorio inferior (J22) [27].

Fuente de datos

Nuestro conjunto de datos incluía datos administrativos de 86 hospitales dentro de la red alemana Helios. Los criterios de inclusión fueron (1) tratamiento hospitalario y (2) SARI como diagnóstico principal o secundario según lo definido por los códigos ICD-10 (ver arriba). Analizamos retrospectivamente los ingresos de pacientes urgentes o regulares desde el 1 de eneroS t 2016 al 31 de diciembreS t 2019. La muerte hospitalaria como medida de resultado primaria de interés se identificó a través del tipo de alta. Se utilizaron los códigos CIE-10-GM (Modificación alemana de la CIE-10) como diagnóstico principal y secundario al alta hospitalaria para identificar las comorbilidades relevantes de acuerdo con la puntuación de comorbilidad de Elixhauser sin distinguir entre comorbilidades preexistentes y condiciones recién diagnosticadas [28, 29]. Una descripción detallada de los códigos ICD-10-GM y la puntuación de comorbilidad de Elixhauser [29] se proporciona en el (Archivo adicional 1: Tabla S1). El análisis se llevó a cabo de acuerdo con los principios descritos en la Declaración de Helsinki. Los datos relacionados con el paciente se almacenaron de forma anónima. El comité de ética local (voto: AZ490/20-ek) y la autoridad de protección de datos de Helios Kliniken GmbH aprobaron el uso de datos para este estudio.

análisis estadístico

El enfoque metodológico presentado aquí se aplicó con éxito a un conjunto de datos de pacientes con IC antes y se usó de manera similar para este análisis. [26]. El conjunto de datos inicial se dividió aleatoriamente en un 75 % para el desarrollo de modelos (entrenamiento de modelos) y un 25 % para pruebas de modelos. Las divisiones del conjunto de datos se realizaron para que todos los casos de un paciente determinado estuvieran en el mismo subconjunto (entrenamiento/pruebas o entrenamiento/validación para el enfoque de validación cruzada). La probabilidad de resultado fue idéntica en cada subconjunto. Cada conjunto de variables contenía las siguientes variables de referencia: edad, sexo, año de ingreso, tratamiento en la UCI (sí/no), IRAG adquirida en el hospital (sí/no) y tipo de IRAG. Para este último, subdividimos los códigos ICD para SARI (J09-J22) para definir diferentes tipos de SARI: influenza J09, J10; neumonía viral distinta de la influenza J12; neumonía bacteriana J13-J16; otra neumonía J17, J18; otras infecciones del tracto respiratorio inferior J20-J22.

En un primer paso, evaluamos y validamos de forma cruzada dos conjuntos de variables diferentes basados ​​en el conjunto de datos de entrenamiento: uno contenía las comorbilidades de Elixhauser como variables separadas y otro contenía las puntuaciones ponderadas de comorbilidad de Elixhauser. [29].

Variables que eran muy escasas y desequilibradas (variables de varianza cercana a cero[

Truncado en 8000 caracteresTraducido automáticamente
Publicación Original

¿Quieres recibir semanalmente y gratuitamente todos los contenidos de Fisio One?

Artículos relacionados

Síntomas respiratorios y desenlaces en fumadores de cigarros: descubrimientos de las etapas 2 a 5 del estudio Evaluación de la Población del Tabaco y Salud (PATH) (2014-2019)

Síntomas respiratorios y desenlaces en fumadores de cigarros: descubrimientos de las etapas 2 a 5 del estudio Evaluación de la Población del Tabaco y Salud (PATH) (2014-2019)

ResumenContextoLos mecanismos que llevan al aumento del riesgo de padecer enfermedades respiratorias por fumar cigarros han sido investigados. A pesar de ello, se conoce menos sobre los riesgos de síntomas respiratorios y desenlaces vinculados al tabaquismo en...