Red heart made out of binary digits illustrating the launch of Nova-3 Medical by Deepgram, an AI speech-to-text (STT) model tailored for transcription in the demanding environment of the healthcare sector.

El modelo de voz de IA reduce los errores de transcripción de atención médica

Engaño ha presentado Nova-3 Medical, un modelo de voz a texto de IA (STT) adaptado para la transcripción en el entorno exigente de la atención médica.

Diseñado para integrarse a la perfección con los flujos de trabajo clínicos existentes, Nova-3 Medical tiene como objetivo abordar la creciente necesidad de una transcripción precisa y eficiente en el NHS público del Reino Unido y el panorama privado de atención médica.

A medida que los registros de salud electrónicos (EHR), la telemedicina y las plataformas de salud digital se vuelven cada vez más frecuentes, la demanda de una transcripción confiable con AI nunca ha sido mayor. Sin embargo, los modelos tradicionales de voz a texto a menudo luchan con el vocabulario complejo y especializado utilizado en entornos clínicos, lo que lleva a errores y «alucinaciones» que pueden comprometer la atención al paciente.

❯ También te interesa:📷 AI Explicabilidad y su impacto inmediato en la tecnologia legalAI Explicabilidad y su impacto inmediato en la tecnología legal: información de la discusión de expertos

Deepgram’s Nova-3 Medical está diseñado para superar estos desafíos. El modelo aprovecha el aprendizaje automático avanzado y la capacitación especializada en vocabulario médico para capturar con precisión términos médicos, acrónimos y jerga clínica, incluso en condiciones de audio desafiantes. Esto es particularmente crucial en entornos donde los profesionales de la salud pueden alejarse de los dispositivos de grabación.

«Nova – 3 Medical representa un salto significativo en nuestro compromiso de transformar la documentación clínica a través de IA», dijo Scott Stephenson, CEO de Deepgram. «Al abordar los matices del lenguaje clínico y ofrecer personalización sin precedentes, estamos capacitando a los desarrolladores para construir productos que mejoren la atención del paciente y la eficiencia operativa».

Una de las características clave del modelo es su capacidad para administrar transcripciones estructuradas que se integran perfectamente con los flujos de trabajo clínicos y los sistemas EHR, asegurando que los datos vitales de los pacientes se organicen con precisión y sean fácilmente accesibles. El modelo también ofrece personalización flexible y de autoservicio, incluida la solicitud de KeyterT para hasta 100 términos clave, lo que permite a los desarrolladores adaptar la solución a las necesidades únicas de varias especialidades médicas.

❯ También te interesa:Person holding popcorn as Alibaba unveils Qwen QwQ-32B — a 32 billion parameter AI model that demonstrates performance rivalling the much larger DeepSeek-R1. This breakthrough highlights the potential of scaling Reinforcement Learning (RL) on robust foundation models.Alibaba Qwen QWQ-32B: escaparate de aprendizaje de refuerzo escalado

Opciones de implementación versátiles, incluidas las configuraciones locales y virtuales de la nube privada (VPC), garantizan la seguridad de grado empresarial y el cumplimiento de HIPAA, lo cual es crucial para cumplir con las regulaciones de protección de datos del Reino Unido.

«El habla a texto para los casos de uso empresarial no es trivial, y existe una diferencia fundamental entre las plataformas de IA de voz diseñadas para casos de uso empresarial frente a casos de uso de entretenimiento», dijo Kevin Fredrick, socio gerente de Onereach.ai. «El modelo Nova-3 de Deepgram y el modelo médico Nova-3, son las principales ofertas de IA de voz, incluidas las TTS, en términos de precisión, latencia, eficiencia y escalabilidad requeridas para los casos de uso empresarial».

Benchmarking Nova-3 Medical: precisión, velocidad y eficiencia

Deepgram ha llevado a cabo la evaluación comparativa para demostrar el rendimiento de Nova-3 Medical. El modelo afirma ofrecer una precisión de la transcripción líder en la industria, optimizando tanto el reconocimiento general de palabras como la precisión crítica del término médico.

❯ También te interesa:A smiley face wearing a graduation cap illustrating Carl by the Autoscience Institute, the first AI system crafting academic research papers to pass a rigorous double-blind peer-review process and raising questions about ethics including the role of artificial intelligence in academic settings.El primer científico de IA que escribe documentos revisados ​​por pares
  • Tasa de error de palabras (WER): Con una mediana del 3,45%, Nova-3 Medical supera a los competidores, logrando una reducción del 63.6% en los errores en comparación con el próximo mejor competidor. Esta precisión mejorada minimiza las correcciones manuales y los flujos de trabajo de línea de línea.
  • Tasa de error de palabras clave (KER): Crucialmente, Nova-3 Medical logra un KER de 6.79%, marcando una reducción del 40.35% en los errores en comparación con el siguiente mejor competidor. Esto asegura que los términos médicos críticos, como los nombres y afecciones de los medicamentos, se transcriban con precisión, reduciendo el riesgo de problemas de falta de comunicación y seguridad del paciente.

Además de la precisión, Nova-3 Medical sobresale en aplicaciones en tiempo real. El modelo transcribe el discurso 5-40x más rápido que muchos proveedores alternativos de reconocimiento de voz, lo que lo hace ideal para las plataformas de telemedicina y salud digital. Su arquitectura escalable garantiza un alto rendimiento incluso a medida que aumentan los volúmenes de transcripción.

Además, Nova-3 Medical está diseñado para ser rentable. A partir de $ 0.0077 por minuto de transmisión de audio, que Deepgram afirma es más del doble de asequible que los proveedores líderes de la nube, permite a las empresas de tecnología de salud reinvertir en innovación y acelerar el desarrollo de productos.

Deepgram’s Nova-3 Medical tiene como objetivo Empoderar a los desarrolladores Para construir aplicaciones transformadoras de transcripción médica, impulsando resultados excepcionales a través de la atención médica.

❯ También te interesa:Example images generated by the Midjourney V7 image generation model that has been released in alpha for testing by the AI community.MidJourney V7: Generación de imágenes Rapid AI

(Foto por Alexander Sinn)

Ver también: AutoScience Carl: el primer científico de IA que escribe documentos revisados ​​por pares

❯ También te interesa:Photo of the DeepSeek AI app as the Chinese artificial intelligence startup aiming to achieve AGI announces plans to open-source its repositories and research amid privacy concerns.Deepseek a la investigación AGI de código abierto en medio de preocupaciones de privacidad

¿Quiere obtener más información sobre AI y Big Data de los líderes de la industria? Verificar AI y Big Data Expo que tiene lugar en Amsterdam, California y Londres. El evento integral está ubicado en otros eventos líderes, incluidos Conferencia de automatización inteligente, Bloqueo, Semana de transformación digitaly Cyber ​​Security & Cloud Expo.

Explore otros próximos eventos y seminarios web tecnológicos empresariales con TechForge aquí.

Fuente: El modelo de voz de IA reduce los errores de transcripción de atención médica

❯ También te interesa:"Basel - Roche Building 1" by corno.fulgur75 is licensed under CC BY 2.0.EDESCOVERY dado un impulso de AI para la industria farmacéutica

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Scroll al inicio