Evaluación de la capacidad de la inteligencia artificial (ChatGPT-5.2) para clasificar fracturas del maléolo posterior e indicar su fijación: estudio multicéntrico de validación externa

  • Héctor Agustín Rivadeneira Jurado Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
  • Elías A. Rivadeneira Jurado Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0009-0006-5784-5700
  • Daniel Espinoza Freire Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0009-0000-9882-6027
  • Andrés F. Samaniego Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0000-0002-6616-6471
  • Ezequiel Lulkin Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0000-0002-4119-0483
  • Sebastián Pereira Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
  • Fernando Bidolegui Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
  • Tomás Macagno Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
Palabras clave: Inteligencia artificial, maléolo posterior, estudio multicéntrico

Resumen

Introducción: Las fracturas del maléolo posterior del tobillo tienen un gran impacto en la congruencia articular del tobillo. La indicación de fijación ya no depende exclusivamente del tamaño del fragmento, sino también de su morfología. La inteligencia artificial surge como una herramienta para apoyar la toma de decisiones clínicas. El objetivo de este estudio fue evaluar la capacidad de la inteligencia artificial para clasificar fracturas del maléolo posterior e indicar su fijación, comparada con la de un estándar de referencia basado en el consenso de expertos. Materiales y Métodos: Se realizó un estudio retrospectivo de exactitud diagnóstica con validación externa, siguiendo las guías STARD-AI y GAMER. Se diseñó un protocolo basado en la clasificación de Bartoníček y Rammelt, utilizando 24 casos para calibración. Se evaluaron 9 casos mediante radiografías y tomografía computarizada, analizados por 12 expertos y por el modelo ChatGPT-5.2. Se determinó la concordancia en la clasificación y la sensibilidad para la indicación de fijación, utilizando el coeficiente kappa de Cohen. Resultados: El ChatGPT-5.2 alcanzó una concordancia del 78% en la clasificación de fracturas, con un coeficiente kappa de 0,56, que indica una concordancia moderada. La sensibilidad para la indicación de fijación del maléolo posterior fue del 100%. Conclusiones: La inteligencia artificial tuvo un desempeño comparable al de los expertos en la clasificación de fracturas del maléolo posterior y una alta sensibilidad en la indicación de fijación. Resultó útil como herramienta de apoyo en contextos de formación médica. Se requieren estudios con muestras más grandes para validar estos hallazgos.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Héctor Agustín Rivadeneira Jurado, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Elías A. Rivadeneira Jurado, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Daniel Espinoza Freire, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Andrés F. Samaniego, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Ezequiel Lulkin, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Sebastián Pereira, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Fernando Bidolegui, Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
Tomás Macagno, Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina

Citas

Terstegen J, Weel H, Frosch KH, Rolvien T, Schlickewei C, Mueller E. Classifications of posterior malleolar

fractures: a systematic literature review. Arch Orthop Trauma Surg 2023;143(7):4181-220. https://doi.org/10.1007/s00402-022-04643-7

Mohamed A, Fuad U, Elasad A, Shrestha S, Hagroo A, Pengas IP. Posterior malleolar fractures: From the „Forgotten Fragment“ to modern concepts in management. Cureus 2025;17(10):e94681. https://doi.org/10.7759/cureus.94681

Bartoníček J, Rammelt S, Tuček M, Naňka O. Posterior malleolar fractures of the ankle. Eur J Trauma Emerg Surg 2015;41(6):587-600. https://doi.org/10.1007/s00068-015-0560-6

Verhage SM, Hoogendoorn JM, Krijnen P. When and how to operate the posterior malleolus fragment in trimalleolar fractures. Arch Orthop Trauma Surg 2018;138(9):1213-22. https://doi.org/10.1007/s00402-018-2949-2

Gale W, Oakden-Rayner L, Carneiro G, Bradley AP, Palmer LJ. Detecting hip fractures with radiologist-level performance using deep neural networks. Preprint. Digit Med 2017. https://doi.org/10.48550/arXiv.1711.06504

Lindsey R, Daluiski A, Chopra S, Lachapelle A, Mozer M, Sicular S, et al. Deep neural network improves fracture detection by clinicians. Proc Natl Acad Sci USA 2018;115(45):11591-6. https://doi.org/10.1073/pnas.1806905115

Rivadeneira Jurado HA, Rivadeneira Jurado EA, Espinoza Freire D, Samaniego AF, Lulkin E, Bidolegui F, et al. Evaluación de la clasificación de las fracturas de platillo tibial según Schatzker-Kfuri utilizando radiografías y tomografía. Comparación entre el observador experto y el modelo ChatGPT-4o. Rev Asoc Argent Ortop Traumatol 2025;90(6):556-60. https://doi.org/10.15417/issn.1852-7434.2025.90.6.2224

Husarek J, Hess S, Razaeian S, Ruder TD, Sehmisch S, Müller M, et al. Artificial intelligence in commercial fracture detection products: a systematic review and meta-analysis of diagnostic test accuracy. Sci Rep 2024;14(1):23053. https://doi.org/10.1038/s41598-024-73058-8

Mohammadi S, Parviz S, Parvaz P, Pirmoradi MM, Afzalimoghaddam M, Mirfazaelian H. Diagnostic performance of ChatGPT in tibial plateau fracture in knee X-ray. Emerg Radiol 2025;32(1):59-64. https://doi.org/10.1007/s10140-024-02298-y.

Publicado
2026-06-30
Cómo citar
Rivadeneira Jurado, H. A., Rivadeneira Jurado, E. A., Espinoza Freire, D., Samaniego, A. F., Lulkin, E., Pereira, S., Bidolegui, F., & Macagno, T. (2026). Evaluación de la capacidad de la inteligencia artificial (ChatGPT-5.2) para clasificar fracturas del maléolo posterior e indicar su fijación: estudio multicéntrico de validación externa. Revista De La Asociación Argentina De Ortopedia Y Traumatología, 91(3), 246-249. https://doi.org/10.15417/issn.1852-7434.2026.91.3.2348
Sección
Investigación Básica