Evaluación de la capacidad de la inteligencia artificial (ChatGPT-5.2) para clasificar fracturas del maléolo posterior e indicar su fijación: estudio multicéntrico de validación externa

Héctor Agustín Rivadeneira Jurado; Elías A. Rivadeneira Jurado; Daniel Espinoza Freire; Andrés F.  Samaniego; Ezequiel Lulkin; Sebastián Pereira; Fernando Bidolegui; Tomás  Macagno

doi:10.15417/issn.1852-7434.2026.91.3.2348

Héctor Agustín Rivadeneira Jurado Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Elías A. Rivadeneira Jurado Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0009-0006-5784-5700
Daniel Espinoza Freire Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0009-0000-9882-6027
Andrés F. Samaniego Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0000-0002-6616-6471
Ezequiel Lulkin Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina https://orcid.org/0000-0002-4119-0483
Sebastián Pereira Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina
Fernando Bidolegui Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina
Tomás Macagno Servicio de Ortopedia y Traumatología, Sanatorio Otamendi y Miroli, Ciudad Autónoma de Buenos Aires, Argentina

DOI: https://doi.org/10.15417/issn.1852-7434.2026.91.3.2348

Palabras clave: Inteligencia artificial, maléolo posterior, estudio multicéntrico

Resumen

Introducción: Las fracturas del maléolo posterior del tobillo tienen un gran impacto en la congruencia articular del tobillo. La indicación de fijación ya no depende exclusivamente del tamaño del fragmento, sino también de su morfología. La inteligencia artificial surge como una herramienta para apoyar la toma de decisiones clínicas. El objetivo de este estudio fue evaluar la capacidad de la inteligencia artificial para clasificar fracturas del maléolo posterior e indicar su fijación, comparada con la de un estándar de referencia basado en el consenso de expertos. Materiales y Métodos: Se realizó un estudio retrospectivo de exactitud diagnóstica con validación externa, siguiendo las guías STARD-AI y GAMER. Se diseñó un protocolo basado en la clasificación de Bartoníček y Rammelt, utilizando 24 casos para calibración. Se evaluaron 9 casos mediante radiografías y tomografía computarizada, analizados por 12 expertos y por el modelo ChatGPT-5.2. Se determinó la concordancia en la clasificación y la sensibilidad para la indicación de fijación, utilizando el coeficiente kappa de Cohen. Resultados: El ChatGPT-5.2 alcanzó una concordancia del 78% en la clasificación de fracturas, con un coeficiente kappa de 0,56, que indica una concordancia moderada. La sensibilidad para la indicación de fijación del maléolo posterior fue del 100%. Conclusiones: La inteligencia artificial tuvo un desempeño comparable al de los expertos en la clasificación de fracturas del maléolo posterior y una alta sensibilidad en la indicación de fijación. Resultó útil como herramienta de apoyo en contextos de formación médica. Se requieren estudios con muestras más grandes para validar estos hallazgos.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Héctor Agustín Rivadeneira Jurado, Servicio de Ortopedia y Traumatología, Hospital Sirio-Libanés, Ciudad Autónoma de Buenos Aires, Argentina