
Una metodología basada en ‘machine learning’ mejora la explotación de datos médicos
Esta herramienta permite generar diferentes distribuciones de probabilidad a partir de un conjunto de datos (dataset) original, identificando qué algoritmos basados en machine learningse adaptan mejor a la naturaleza estadística de los datos.
El resultado final es una mejor extracción, selección y tratamiento de los datos biomédicos y sanitarios, con capacidades superiores a métodos clásicos como la regresión logística.
Esta nueva metodología se apoya en modelos de lenguaje, como ChatGPT y Google Gemini, que ayudan a codificar conocimiento médico con una cantidad mínima de datos, permitiendo así identificar automáticamente los algoritmos más eficaces para cada caso de búsqueda y procesamiento de la información para la extracción de conocimiento.
Explotación inteligente de datos
Los autores explican que se trata de “un importante avance para mejorar la explotación inteligente de datos médicos, con gran potencial para la investigación en salud”.
A partir de un dataset con una serie de características médicas como pueden ser analíticas, comorbilidades o medicamentos de un conjunto de pacientes, la metodología devuelve cuáles de esas características tienen relación con la outcome (enfermedad) del dataset, desde el punto de vista del conocimiento médico.
Esto puede ser de mucha utilidad para los médicos al manejar un conjunto reducido de características para diagnosticar rápidamente la outcome médica considerada.