Identificación de hablantes

Cuando revisas la transcripción de una reunión en Copera, cada segmento hablado se etiqueta con la persona que lo dijo. Esto se logra combinando el seguimiento del hablante activo en tiempo real durante la reunión y la diarización basada en IA durante el procesamiento posterior.

Cómo funciona

La identificación de hablantes ocurre en dos etapas:

1. Seguimiento en tiempo real durante la reunión

Mientras la reunión está en curso y la transcripción está activa, el frontend hace un seguimiento de qué participante habla en cada momento usando la detección de hablante activo de Copera. Estos datos —una línea de tiempo de quién hablaba y cuándo— se envían al backend y se almacenan junto con la grabación de audio.

2. Procesamiento posterior con diarización por IA

Después de que la grabación de transcripción se detiene, el audio se envía al servicio de voz a texto, que realiza su propia diarización de hablantes: divide el audio en segmentos y etiqueta cada uno con una etiqueta genérica de hablante (Hablante A, Hablante B, etc.).

Luego, el sistema ejecuta un algoritmo de coincidencia que compara los datos del hablante activo en tiempo real del paso 1 con el resultado de la diarización del paso 2. Al encontrar coincidencias temporales, asigna automáticamente las etiquetas genéricas a los nombres reales de los participantes.

Ver los hablantes en la transcripción

Cuando abres una transcripción en el visor de sesiones, el panel de Hablantes de la izquierda muestra a todas las personas identificadas. Cada hablante se representa con su avatar (si coincide con un miembro del espacio de trabajo) y se le asigna un color único. Las intervenciones de la transcripción se codifican con el mismo color, lo que facilita recorrer una transcripción larga y ver de un vistazo quién dijo qué.

Puedes hacer clic en un hablante del panel de Hablantes para filtrar la transcripción y mostrar solo sus intervenciones. Haz clic de nuevo para quitar el filtro y volver a mostrar todas las intervenciones.

Corregir la asignación de hablantes

A veces la coincidencia automática puede no ser del todo precisa, sobre todo en reuniones con muchos participantes que hablan en rápida sucesión. Puedes reasignar manualmente cualquier etiqueta de hablante:

En el panel de Hablantes, haz clic en el avatar junto a una etiqueta de hablante.
Aparece un menú desplegable con todos los participantes de la reunión.
Selecciona al participante correcto y todas las intervenciones de ese hablante se actualizan de inmediato.
También puedes agregar un hablante personalizado (por nombre y correo electrónico) para participantes externos que no eran miembros del espacio de trabajo.

Cuando abres el menú desplegable de selección de hablante, la transcripción se filtra automáticamente a ese hablante y reproduce su primera intervención, para que puedas escuchar su voz y confirmar la asignación correcta.

Consejos para mayor precisión

Evita hablar al mismo tiempo: cuando varias personas hablan a la vez, al sistema le resulta más difícil distinguir a los hablantes.
Usa micrófonos individuales: si los participantes comparten un solo micrófono (por ejemplo, en una sala de conferencias), el sistema puede agruparlos como un único hablante.
Las grabaciones más largas ayudan: cuanto más audio tiene el sistema, con mayor precisión puede identificar los distintos patrones de voz.

Cómo funciona​

1. Seguimiento en tiempo real durante la reunión​

2. Procesamiento posterior con diarización por IA​

Ver los hablantes en la transcripción​

Corregir la asignación de hablantes​

Consejos para mayor precisión​