Resumen
Antecedentes: En los últimos años, la integración de modelos de Inteligencia Artificial (IA) ha revolucionado el diagnóstico del dolor lumbar (lumbalgia) y las patologías discales asociadas. Entre ellos, SpineNetV2 se destaca como un modelo de acceso abierto de última generación para detectar y clasificar diversas patologías del disco intervertebral. Sin embargo, es primordial garantizar la confiabilidad y aplicabilidad de modelos de IA como SpineNetV2. Una validación rigurosa es esencial para garantizar su solidez y generalización en diversas cohortes de pacientes y protocolos de imágenes.
Métodos: Realizamos un análisis retrospectivo de imágenes de resonancia magnética de 1747 discos intervertebrales lumbosacros (DIV) de 353 pacientes (edad media, 54 ± 15,4 años, 44,5% mujeres) con diversos trastornos de la columna, recopiladas entre septiembre de 2021 y febrero de 2023 en X-Ray Service srl. El sistema SpineNetV2 se utilizó para clasificar 11 discos lumbosacros distintos patologías, que incluyen clasificación de Pfirrmann, estrechamiento del disco, estenosis del canal central, espondilolistesis, defectos de la placa terminal (superior e inferior), cambios de la médula (superior e inferior), estenosis del foraminal (derecho e izquierdo) y hernia de disco, utilizando imágenes de resonancia magnética sagital ponderadas en T2. . Las métricas de rendimiento incluyeron exactitud, exactitud equilibrada, precisión, puntuación F1, coeficiente de correlación de Matthew, pérdida de puntuación de Brier, coeficientes de correlación de concordancia de Lin y coeficientes kappa de Cohen. Dos radiólogos expertos realizan anotaciones para estos discos. La evaluación de la clasificación de SpineNetV2 se compara con las evaluaciones de radiólogos expertos.
Resultados: SpineNetV2 demostró un sólido rendimiento en varias métricas, con altas puntuaciones de concordancia (Kappa de Cohen, Concordancia de Lin y Coeficiente de correlación de Matthew superiores a 0,7) para la mayoría de las patologías. Sin embargo, se encontró una menor concordancia para la estenosis foraminal y la hernia discal, lo que subraya las limitaciones de las imágenes de resonancia magnética sagital para evaluar estas condiciones.
Conclusiones: Este estudio destaca la importancia de la validación externa, enfatizando la necesidad de evaluaciones integrales de los modelos de aprendizaje profundo. SpineNetV2 muestra resultados prometedores en la predicción de patologías discales, y los hallazgos guían futuras mejoras. La versión de código abierto de SpineNetV2 permite a los investigadores validar y ampliar de forma independiente las capacidades del modelo. Este enfoque colaborativo promueve la innovación y acelera el desarrollo de herramientas de aprendizaje profundo más confiables e integrales para la evaluación de la patología de la columna.
Palabras clave: IA para la Medicina; Degeneración del disco; hernia; Lumbalgia; resonancia magnética de columna; SpineNetV2.