Pular para o conteúdo principal

Identificacao de Falantes

Quando voce revisa uma transcricao de reuniao no Copera, cada segmento falado e rotulado com o falante que o disse. Isso e possivel gracas a uma combinacao de rastreamento de falante ativo em tempo real durante a reuniao e diarizacao baseada em IA durante o pos-processamento.

Como funciona

A identificacao de falantes acontece em duas etapas:

1. Rastreamento em tempo real durante a reuniao

Enquanto a reuniao esta em andamento e a transcricao esta ativa, o frontend rastreia qual participante esta falando a cada momento usando a deteccao de falante ativo do LiveKit. Esses dados -- uma linha do tempo de quem estava falando quando -- sao enviados ao backend e armazenados junto com a gravacao de audio.

2. Pos-processamento com diarizacao por IA

Apos a gravacao da transcricao parar, o audio e enviado ao servico de conversao de fala em texto, que realiza sua propria diarizacao de falantes -- dividindo o audio em segmentos e rotulando cada segmento com um rotulo generico de falante (Falante A, Falante B, etc.).

O sistema entao executa um algoritmo de correspondencia que compara os dados do falante ativo em tempo real da etapa 1 com a saida da diarizacao da etapa 2. Ao encontrar sobreposicoes de tempo, ele mapeia automaticamente os rotulos genericos para os nomes reais dos participantes.

Visualizando falantes na transcricao

Quando voce abre uma transcricao no visualizador de sessao, o painel de Falantes a esquerda mostra todos os falantes identificados. Cada falante e representado por seu avatar (se correspondido a um membro do workspace) e recebe uma cor unica. As falas na transcricao sao codificadas por cores correspondentes, facilitando a leitura de uma transcricao longa e a identificacao de quem disse o que.

Voce pode clicar em um falante no painel de Falantes para filtrar a transcricao e mostrar apenas as falas daquela pessoa. Clique novamente para limpar o filtro e mostrar todas as falas.

Corrigindo atribuicoes de falantes

As vezes a correspondencia automatica pode nao ser perfeitamente precisa -- especialmente em reunioes com muitos participantes que falam em rapida sucessao. Voce pode reatribuir manualmente qualquer rotulo de falante:

  1. No painel de Falantes, clique no avatar ao lado de um rotulo de falante.
  2. Um dropdown aparece mostrando todos os participantes da reuniao.
  3. Selecione o participante correto, e todas as falas daquele falante sao atualizadas imediatamente.
  4. Voce tambem pode adicionar um falante personalizado (por nome e email) para participantes externos que nao eram membros do workspace.

Quando voce abre um dropdown de selecao de falante, a transcricao filtra automaticamente para aquele falante e reproduz sua primeira fala para que voce possa ouvir a voz e confirmar a atribuicao correta.

Dicas para melhor precisao

  • Evite falar simultaneamente -- quando varias pessoas falam ao mesmo tempo, o sistema tem mais dificuldade para distinguir os falantes.
  • Use microfones individuais -- se os participantes compartilham um unico microfone (por exemplo, em uma sala de conferencia), o sistema pode agrupa-los como um unico falante.
  • Gravacoes mais longas ajudam -- quanto mais audio o sistema tem, mais precisamente ele pode identificar padroes de voz distintos.