Resumen
Antecedentes
La clasificación de las etiologías del derrame pleural es un desafío crítico en la práctica clínica. Los métodos de diagnóstico tradicionales dependen de un método de corte simple basado en las pruebas de laboratorio. Sin embargo, el aprendizaje automático (ML) ofrece un enfoque novedoso basado en la inteligencia artificial para mejorar la precisión del diagnóstico y capturar las relaciones no lineales.
Método
Se realizó un estudio retrospectivo utilizando datos de pacientes diagnosticados con derrame pleural. El conjunto de datos se dividió en capacitación y prueba con una relación de 7: 3 con 6 algoritmos de aprendizaje automático implementados para diagnosticar el derrame pleural. Las actuaciones del modelo se evaluaron mediante precisión, precisión, recuperación, puntajes F1 y área bajo la curva característica operativa del receptor (AUC). Se analizó la importancia y la predicción promedio de la edad, la adenosina (ADA) y la lactato deshidrogenasa (LDH). Se visualizó el árbol de decisión.
Resultados
Se incluyeron un total de 742 pacientes (cohorte de entrenamiento: 522, cohorte de prueba: 220), 397 (53.3%) diagnosticados con derrame pleural maligno (MPE) y 253 (34.1%) con derrame pleural tuberculoso (TPE) en la cohorte. Todos los 6 modelos se desempeñaron bien en el diagnóstico de MPE, TPE y transudados. El aumento de gradiente extremo y el bosque aleatorio obtuvieron mejor en el diagnóstico del MPE, con puntajes F1 por encima de 0.890, mientras que los vecinos K-nears y el transformador tabular funcionan mejor en el diagnóstico del TPE, con puntajes F1 por encima de 0.870. ADA se identificó como la característica más importante. El modelo ROC del modelo de aprendizaje automático superó a los de los umbrales de diagnóstico convencionales.
Conclusiones
Este estudio demuestra que los modelos de ML utilizando edad, ADA y LDH pueden clasificar de manera efectiva las etiologías del derrame pleural, lo que sugiere que los enfoques basados en ML pueden mejorar la toma de decisiones de diagnóstico.
Introducción
El derrame pleural es la acumulación del fluido en la cavidad pleural y a menudo ocurre en la práctica clínica. El manejo efectivo requiere la identificación de su etiología subyacente (1). Las etiologías más comunes incluyen insuficiencia cardíaca congestiva, neumonía y cáncer (2). Sin embargo, los métodos de diagnóstico existentes tienen limitaciones. La toracentesis con análisis de fluido se usa ampliamente para diagnosticar el derrame pleural (3), pero la precisión diagnóstica para el derrame pleural maligno (MPE) varía ampliamente (4). En regiones con una alta carga de tuberculosis, el derrame pleural de tuberculosis (TPE) constituye una mayor proporción (5). Los criterios de la luz, aunque comúnmente empleados, clasifican erróneamente aproximadamente el 25% de los transudios como exudados (6). Además, el diagnóstico de efusión parapneumónica (PPE) es un desafío, particularmente al excluir otras causas, ya que no existen criterios definitivos para diagnosticar el derrame parapneumónico sin complicaciones (7). Por lo tanto, se necesitan nuevas herramientas para facilitar el diagnóstico.
Aunque algunos procedimientos invasivos, como la biopsia de aguja pleural y la toracoscopia, pueden proporcionar diagnósticos patológicos definitivos, pero conllevan un riesgo de complicaciones, requieren tiempo para el análisis patológico y dependen de la experiencia de los patólogos ((8). Estos desafíos destacan la necesidad de métodos de diagnóstico integrados basados en pruebas de laboratorio objetivas, que pueden respaldar la toma de decisiones clínicas y ofrecer información de diagnóstico crucial para el derrame pleural de una manera más eficiente y menos invasiva. La adenosina desaminasa (ADA) en el derrame pleural es un biomarcador para TPE, con una sensibilidad resumida y una especificidad de 0.92 y 0.90 respectivamente (9). La lactato deshidrogenasa (LDH) mejora la especificidad en la detección de exudados malignos e inflamatorios y es una prueba de laboratorio clave en los criterios de la luz (10). Además, la precisión del diagnóstico de la ADA de líquido pleural se vio afectada por la edad (11, 12). Estos biomarcadores basados en el laboratorio y las características demográficas se consideraron como las características potenciales en el desarrollo de modelos de diagnóstico más eficientes para el derrame pleural.
Como el desarrollo de los algoritmos y técnicas, el aprendizaje automático se ha utilizado en el diagnóstico de diversas enfermedades (13), incluido el derrame pleural. Los enfoques de aprendizaje automático, a diferencia de los métodos tradicionales basados en valores de corte predefinidos, sobresalen en la captura de relaciones complejas y no lineales entre las variables (14). Varios estudios han aplicado modelos de aprendizaje automático con diversas características, como características demográficas, síntomas clínicos, análisis de líquidos en sangre y pleural, portaobjetos citopatológicos, características radiómicas e incluso datos basados en imágenes (9, 15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33). La mayoría de estos modelos han incorporado más de diez características. Aunque los resultados de estos estudios muestran valores prometedores de AUC, la inclusión de esas características conduce a un número creciente de pruebas, aumentando así los gastos de prueba de laboratorio para los pacientes. Por lo tanto, utilizamos un modelo de aprendizaje automático con menos características, pero clínicamente significativas, para el diagnóstico del derrame pleural.
En este estudio, seleccionamos la edad, la ADA de líquido pleural y la LDH de líquido pleural como características y modelos de diagnóstico construidos para el derrame pleural. Aplicamos seis técnicas de aprendizaje automático: regresión lineal multinomial (LR), máquina de vectores de soporte (SVM), impulso de gradiente extremo (XGBOost), bosque aleatorio (RF), vecinos K-nears (KNN) y transformador tabular (TabTransformer), con el objetivo de construir modelos eficientes para mejorar la aceleración de diagnóstico.
Método
Participantes
Este estudio retrospectivo incluyó pacientes internados del Hospital Beijing Chao-Yang entre enero de 2014 y mayo de 2024. Se incluyeron pacientes con derrame pleural y se sometieron a toracentesis de diagnóstico en este estudio. Se excluyeron aquellos con etiologías poco claras o múltiples. Este estudio aprobado por el Hospital Beijing Chao-Yang afiliado a Capital Medical University (2018-Ke-321, 2024-Ke-502). Dado el diseño retrospectivo de este estudio, el consentimiento informado no fue necesario para este estudio.
Características y criterios de diagnóstico
Los criterios de exclusión fueron los siguientes: 1) etiologías indeterminadas del derrame pleural, empiema, quilotórax. 2) pacientes con datos clínicos incompletos. Se recolectaron 3 características (edad, ADA fluido, LDH fluido) del sistema de registros médicos de los pacientes. Si se dispone de múltiples resultados para ADA y LDH en las pruebas de líquido pleural, se seleccionará el primer resultado después de la toracentesis. Se clasificaron cinco etiologías principales de derrame pleural: derrame pleural maligno (MPE), derrame pleural tuberculoso (TPE), derrame pleural paraapneumónico (PPE), derrame pleural transudativo, otras causas.
El derrame pleural maligno se definió como los hallazgos patológicos de malignidad en el derrame pleural o la pleura. El derrame pleural tuberculoso se definió como los siguientes criterios: 1) El frotis o el cultivo de bacilos ácidos fueron positivos para Mycobacterium tuberculosis en esputo, líquido pleural y líquido de lavado broncoalveolar; 2) Mycobacterium tuberculosis positiva en muestras de cepillo broncoalveolar, pulmón o biopsia pleural; 3) granuloma caseoso en pleura o pulmón; o 4) la relación de linfocitos a neutrófilos en el derrame pleural excedió 0,75, y la ADA fluida fue superior a 40 UI/L, con un tratamiento efectivo de antituberculosis y otras causas de derrame pleural excluido. Otras etiologías de derrame pleural se clasificaron como otras causas, como etiologías relacionadas con el inmune. El derrame pleural paraapneumónico se diagnosticó ya que el derrame se definió como exudativo y asociado con la neumonía, con otras etiologías excluidas.
Diseño de estudio
El tamaño de la muestra se calculó utilizando la siguiente fórmula: ( mathbf {n} = frac {{ mathbf {z}}^{2} times mathbf {p} times izquierda (1- mathbf {p} right)} {{ mathbf {d}}^{2}} ).
N = tamaño de muestra requerido, z = valor Z, establecido en 1.96 para un intervalo de confianza del 95%, p = precisión del modelo esperado, d = margen de error.
$$ Mathbf {n} = frac {{1.96}^{2} Times 0.85 Times Left (1-0.85 Right)} {{0.05}^{2}} = 196 $$Para lograr la precisión total esperada de 0.85 con un margen de error de 0.05 a un nivel de confianza del 95%, se requirió un mínimo de 196 muestras en el conjunto de tren.
Los conjuntos de datos de pacientes del Hospital Beijing Chao-Yang se dividieron en entrenamiento y conjuntos de pruebas con aleatorización tanto en una relación 7: 3, lo que resultó en 522 casos en el conjunto de entrenamiento. Como los pacientes con datos faltantes para la edad, el fluido pleural ADA y el líquido pleural LDH se excluyeron del conjunto de datos, no se aplicaron imputaciones. Los conjuntos de datos se centraron en una media de 0 y se escalaron a una desviación estándar de 1 para cada característica. Se utilizaron seis métodos de aprendizaje automático para construir modelos de diagnóstico: LR, SVM, XGBOost, RF, KNN y Tab Transformer. Se empleó la optimización bayesiana para ajustar los hiperparámetros de los modelos. Se enumeraron los detalles de los hiperparámetros en cada modelo (Tabla complementaria 1).
Como comparación con los modelos de aprendizaje automático, se aplicaron métodos de diagnóstico tradicionales basados en los valores de corte para evaluar el rendimiento. Para MPE, se empleó la relación de cáncer, definida como la relación de LDH en sangre con ADA de líquido pleural, con un valor umbral establecido en más de 20 (34). De manera similar, para TPE, se usó un nivel de ADA de fluido pleural mayor de 40 U/L como criterio de diagnóstico (35).
Resultado primario y métricas de rendimiento
El resultado principal de este estudio es la clasificación de los tipos etiológicos de derrame pleural, que incluyen MPE, TPE, PPE, derrame transudativo y otras causas. El punto final principal del estudio fue el rendimiento de diagnóstico de los modelos de aprendizaje automático en la clasificación de la etiología del derrame pleural. El rendimiento de los modelos se evaluó en función de la precisión, precisión, recuperación, puntaje F1 y área bajo la curva característica operativa del receptor (AUC). Se obtuvieron verdaderos positivos (TP), verdaderos negativos (TN), falsos positivos (FP) y falsos negativos (FN) de la matriz de confusión. Los parámetros se calcularon mediante la siguiente fórmula: Accuracy = ( frac {tp+tn} {tp+tn+fp+fn} ), precision = ( frac {tp} {tp+fp} ), recuerda …
(Tagstotranslate) Efección pleural (T) Modelo de diagnóstico de aprendizaje automático (T) Sistema de neumología de adenosina desaminasa (T) Sistema de neumología/respiratorio