La diabetes se puede juzgar escuchando 10 segundos de voz, ¡este modelo de IA es demasiado duro!

Fuente original: AIGC Open Community

Fuente de la imagen: Generado por Unbounded AI

Investigadores de Klick en Canadá han publicado un gran modelo de IA en la revista de salud Mayo Clinic Papers: Digital Health, que puede diagnosticar la diabetes mellitus tipo 2 (DM2) escuchando un mensaje de voz de 6 a 10 segundos.

Actualmente, la principal prueba para la diabetes se basa en la medición de la glucosa en sangre, pero este método requiere una muestra de sangre, lo cual es traumático para el paciente y requiere equipo especializado, lo cual es muy costoso. Para resolver este problema de detección, los investigadores de Klick, una conocida empresa canadiense de tecnología sanitaria, propusieron un método de detección de modelos de IA.

Los investigadores recolectaron muestras de voz de 267 voluntarios, que luego se probaron en detalle utilizando un modelo de IA, y los resultados mostraron que la IA identificó con precisión la diabetes tipo 2, con una precisión del 89 % para las mujeres y del 86 % para los hombres**. También se encontró que el "tono" y la "desviación estándar del tono" se encontraban entre las principales características en el diagnóstico de la diabetes tipo 2.

Este estudio es similar al proceso de imagen de reconstrucción del cerebro humano mediante MEG (magnetoencefalografía) propuesto por Meta hace algún tiempo, y todo se basa en las características de los organismos humanos para observar los cambios en sus datos de jitter para determinar los resultados.

Dirección:

Creación de un conjunto de datos

Los investigadores reclutaron a un total de 267 voluntarios, de los cuales 79 mujeres y 113 hombres no eran diabéticos, y 18 mujeres y 57 hombres fueron diagnosticados con diabetes tipo 2.

El diagnóstico de diabetes del participante se basa en los criterios diagnósticos de la Asociación Americana de Diabetes, confirmados por el médico. No hay antecedentes de deterioro neurológico o del lenguaje al mismo tiempo, y no hay antecedentes de tabaquismo.

Los participantes utilizaron una aplicación de teléfono inteligente para grabar una frase fija "Hola, ¿cómo estás?" ¿Cuál es mi nivel de azúcar en sangre ahora?", grabado durante 2 semanas, hasta 6 veces al día, con un total de 18.465 muestras de voz recogidas.

Segmentación de datos, extracción de características

Dado que factores como la edad y el índice de masa corporal pueden tener un impacto en los datos del habla, los investigadores segmentaron los datos en conjuntos de datos coincidentes con la edad y el IMC basados en las identificaciones de los participantes para el entrenamiento del modelo y el análisis estadístico, lo que ayudó al modelo de IA a aprender los cambios reales en el habla diabética.

El conjunto de entrenamiento representó el 50% de todos los hombres y el 61% de las mujeres con diabetes tipo 2. Los datos restantes se utilizan como un conjunto de pruebas para probar el modelo de IA entrenado.

A continuación, los investigadores extrajeron 14 características acústicas de cada muestra de voz, como el tono, la intensidad, la relación armónico-ruido, el sonido y la vibración del sonido. La extracción de características se realiza utilizando Parselmouth, la interfaz Python del software de análisis de voz Praat.

Las características numéricas que pueden reflejar los cambios de voz se pueden extraer de la señal de voz original para proporcionar información para el entrenamiento y la predicción posteriores del modelo.

Seleccionar modelo

Teniendo en cuenta los modelos utilizados en el trabajo relacionado, los investigadores eligieron modelos como la regresión logística, el Bayes ingenuo y las máquinas de vectores de soporte. El rendimiento de estos modelos se evaluó en el conjunto de entrenamiento con una validación cruzada de 5 veces para encontrar el mejor modelo.

En el caso de las mujeres, el modelo de regresión logística con tres características funcionó mejor; Para los hombres, el modelo bayesiano ingenuo con 2 características funciona mejor.

Los modelos de regresión logística pueden estimar la contribución de diferentes características a los resultados; El modelo bayesiano ingenuo funciona mejor en escenarios de muestra pequeños. A continuación, con el mejor modelo, entrene previamente en el conjunto de entrenamiento compilado.

Datos de prueba del modelo

Se utilizó el modelo de IA entrenado para predecir los datos del conjunto de prueba para obtener la probabilidad de que cada muestra perteneciera a la diabetes tipo 2. Sobre la base de un umbral de probabilidad predeterminado, se predice que la muestra es diabética tipo 2 o no diabética.

Al mismo tiempo, los datos del conjunto de prueba se utilizan para calcular la precisión, la sensibilidad, la especificidad y otros indicadores de evaluación del modelo, y la curva ROC se puede trazar para evaluar de manera integral el rendimiento de predicción del modelo.

Además, los investigadores también fusionan información como la edad y el índice de masa corporal en los resultados de la predicción, lo que puede mejorar la precisión del modelo.

Por ejemplo, la prevalencia de la predicción media del habla y el índice de masa corporal en las mujeres y la prevalencia de la edad y el índice de masa corporal en los hombres se asociaron con los resultados medios de la voz en los hombres. Al combinar múltiples fuentes de información, este módulo integrado puede compensar las deficiencias de un solo modelo y mejorar la capacidad predictiva del modelo.

Los resultados de la prueba mostraron que, en el caso de las mujeres, los resultados de la voz combinados con la prevalencia de diabetes tipo 2 en el índice de masa corporal lograron una precisión de 0,89, una especificidad de 0,91 y una sensibilidad de 0,71 en el conjunto de pruebas.

Para los varones, los resultados verbales, combinados con la prevalencia de diabetes tipo 2 por edad e índice de masa corporal, lograron una precisión de 0,86, una especificidad de 0,89 y una sensibilidad de 0,75 en el conjunto de pruebas.

Jaycee Kaufman, el jefe del estudio, dijo que identificamos los cambios en la voz de los pacientes con diabetes tipo 2 durante el estudio, que tiene un valor de aplicación muy alto para los modelos grandes de IA para detectar y evaluar la diabetes tipo 2.

El método de evaluación de la voz puede ayudar en la intervención temprana y el tratamiento de la diabetes mellitus tipo 2, al tiempo que reduce la carga de la enfermedad y mejora los resultados médicos.

Acerca de Klick Health

Fundada en 1997 y con sede en Toronto, Canadá, Klick es una empresa líder mundial en marketing de salud. Klick Health utiliza un enfoque basado en datos para desarrollar e implementar una variedad de estrategias de marketing relacionadas con la salud y la medicina.

Klick ofrece una gama de servicios, que incluyen estrategia digital, estrategia de marca, innovación y diseño, información sobre datos, desarrollo de contenido y soluciones tecnológicas.

Acerca de la diabetes tipo 2

La diabetes tipo 2 es una enfermedad crónica caracterizada por resistencia a la insulina y disfunción de la secreción de insulina. El cuerpo no puede usar la insulina de manera efectiva, y esta condición se conoce como resistencia a la insulina. La insulina es una hormona que ayuda a nuestro cuerpo a convertir el azúcar en sangre en energía.

Cuando se produce resistencia a la insulina, los niveles de azúcar en la sangre comienzan a aumentar, lo que puede provocar una variedad de problemas de salud, como enfermedades cardíacas, enfermedades renales, pérdida de la visión y daño a los nervios.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)