Negocios

Datos sintéticos: la nueva frontera de la IA médica en Colombia

Los datos sintéticos ganan terreno en salud al permitir entrenar IA médica sin exponer datos reales de pacientes ni frenar la innovación.
Lunes, Junio 22, 2026

Los pilotos realizados en Colombia con datos sintéticos en salud muestran que la inteligencia artificial puede reducir hasta 45% las hospitalizaciones innecesarias y recortar en 60% los tiempos de diagnóstico, según el análisis compartido por Softtek. La cifra instala una discusión clave para el sistema sanitario: cómo acelerar la innovación médica sin exponer la privacidad de los pacientes.

La inteligencia artificial ya está siendo probada en diagnóstico, modelos predictivos, terapias digitales y soporte clínico. Sin embargo, su avance depende de un insumo difícil de obtener: datos clínicos en cantidad, calidad y con suficiente diversidad. En países con sistemas fragmentados, repositorios incompletos o barreras regulatorias fuertes, ese acceso puede convertirse en el principal cuello de botella.

Ahí entran los datos sintéticos: conjuntos de información generados por algoritmos que replican propiedades estadísticas de datos reales, pero sin incluir identidades, historias clínicas individuales ni información personal sensible. No son datos anonimizados ni bases maquilladas; son datos nuevos, creados para reproducir patrones clínicos verosímiles.

Una vía para entrenar IA sin exponer pacientes

La principal promesa de los datos sintéticos está en permitir que hospitales, universidades, startups y compañías tecnológicas entrenen o validen modelos de inteligencia artificial sin depender exclusivamente de bases clínicas reales.

Esto puede ser especialmente relevante para enfermedades raras, condiciones de baja frecuencia o combinaciones médicas poco comunes, donde conseguir muestras suficientemente grandes suele ser difícil. También permite simular escenarios clínicos complejos, probar algoritmos de soporte diagnóstico y acelerar investigación sin comprometer la confidencialidad de los pacientes.

“Esta tecnología abre un nuevo horizonte para la investigación en salud: acelera los ensayos clínicos, el desarrollo de nuevos medicamentos y permite que los hospitales construyan redes de datos confiables, con muestras representativas a escala regional o incluso global”, explicó Diego Pereyra, director médico global de Healthcare en Softtek.

La lectura para Colombia es directa. Si el país quiere avanzar en salud digital, interoperabilidad e inteligencia artificial aplicada a medicina, necesitará mecanismos que permitan usar información de manera segura, representativa y útil para investigación.

Colombia prueba una ruta para innovar con privacidad

En América Latina, los datos sintéticos pueden tener un valor diferencial por la fragmentación de los sistemas de salud y la falta de repositorios clínicos robustos. En Colombia, la tecnología empieza a ganar espacio en ámbitos académicos, iniciativas públicas y proyectos asociados a digitalización sanitaria.

Durante el último año, impulsado por la estrategia Colombia PotencIA Digital del Ministerio TIC y las metas del Ministerio de Salud, la conversación se ha concentrado en investigación médica segura e interoperabilidad. Universidades y hospitales locales ya exploran simulaciones para enfermedades de baja frecuencia, según Softtek.

El punto crítico es que la región no puede depender únicamente de repositorios internacionales para desarrollar modelos de IA médica. Las poblaciones latinoamericanas tienen particularidades epidemiológicas, demográficas y sociales que deben reflejarse en los sistemas que luego tomarán decisiones o apoyarán procesos clínicos.

“Existen compañías especializadas en la generación de datos sintéticos que permiten preservar la privacidad sin sacrificar la calidad ni el valor clínico de la información. Estas soluciones cumplen con los marcos regulatorios más exigentes, como GDPR en Europa (Europrivacy) y HIPAA a nivel internacional”, destacó Diego Pereyra, director médico global de Healthcare en Softtek.

Hospitales, startups y universidades ante una oportunidad común

Para hospitales, los datos sintéticos pueden ayudar a construir modelos clínicos más robustos, equilibrar bases de entrenamiento, reducir sesgos y mejorar la precisión diagnóstica. Para universidades, abren una vía de investigación sin depender de largos procesos de acceso a datos sensibles. Para startups, pueden reducir una de las principales barreras para desarrollar soluciones de salud basadas en IA.

También facilitan la colaboración entre actores que normalmente tendrían restricciones para compartir información: instituciones prestadoras, centros de investigación, aseguradoras, empresas tecnológicas y entidades públicas. En vez de intercambiar historias clínicas reales, pueden trabajar con bases sintéticas que conservan patrones relevantes sin revelar información personal.

“Los datos sintéticos pueden democratizar la innovación médica, permitiendo que hospitales y startups investiguen y desarrollen soluciones de IA sin depender de repositorios internacionales ni vulnerar la confidencialidad de los pacientes”, agregó Diego Pereyra, director médico global de Healthcare en Softtek.

Esa democratización será importante si Colombia quiere evitar que la IA en salud quede concentrada en pocas instituciones con capacidad técnica, financiera y jurídica para acceder a grandes volúmenes de información clínica.

El dato sintético no reemplaza al dato real

El avance de esta tecnología no elimina la necesidad de datos clínicos reales. Los datos sintéticos funcionan como complemento, no como sustituto. Su valor depende de la calidad de los datos originales usados para entrenar los modelos, de la supervisión médica y de la validación científica posterior.

Por eso, el debate no debe quedarse en la promesa tecnológica. También debe incluir gobernanza, auditoría, estándares de calidad, evaluación de sesgos y responsabilidad frente al uso de modelos de IA en decisiones clínicas. En salud, una predicción equivocada no es solo un error técnico: puede afectar diagnósticos, tratamientos y confianza en el sistema.

“Son un puente que acelera la investigación y hace más segura la innovación médica, especialmente en países donde el acceso a grandes volúmenes de datos es limitado”, concluyó Diego Pereyra, director médico global de Healthcare en Softtek.

Para Colombia, los datos sintéticos pueden convertirse en una pieza estratégica de la salud digital: permiten investigar más rápido, proteger mejor la privacidad y entrenar IA con mayor pertinencia local. Pero su impacto real dependerá de que hospitales, reguladores, academia y empresas los adopten con criterio clínico, no solo como una solución tecnológica de moda.