Vision Mode
Vision é o modo do Bankai que pode ver sua tela. Segure o atalho do Vision, pergunte sobre o que estiver na sua frente — um gráfico, uma mensagem de erro, uma planilha, um parágrafo em outro app — e o Bankai tira um screenshot, olha e responde. A resposta cai bem no seu cursor, ou é lida em voz alta se você pedir.
É a diferença entre descrever o que você está vendo e simplesmente perguntar sobre isso. Em vez de "tem um número na terceira coluna de uma tabela sobre a receita do Q3, qual é a taxa de crescimento", você apenas diz "qual é a taxa de crescimento aqui?" enquanto olha para a tabela. O Bankai vê o que você vê.
O Vision Mode roda no aplicativo desktop da Copera (Windows e macOS), porque precisa capturar sua tela — algo que um navegador web não consegue fazer. No macOS ele também precisa da permissão de Gravação de Tela (veja abaixo).
Ativando o Vision Mode
O Vision fica desativado até você habilitá-lo:
- Abra a seção AI e vá para Configurações de Voz.
- Na seção Modes, ative Enable Vision Mode.
Uma vez ativado, o Vision entra no seu ciclo de modos (sua cor é magenta e seu ícone é um olho) e seu atalho fica ativo.
macOS: Permissão de Gravação de Tela
No macOS, capturar a tela requer a permissão de Gravação de Tela do sistema. Na primeira vez que você ativa o Vision, o Bankai te guia para concedê-la:
- O Bankai abre uma etapa de permissão e pede para você permitir a Gravação de Tela nas Configurações do Sistema.
- Depois de conceder, o macOS exige que a Copera reinicie para a mudança ter efeito — o Bankai mostra um botão Reiniciar Copera para fazer isso em um clique.
- Assim que a Copera reinicia, o Vision está pronto para usar.
O Vision precisa dessa permissão apenas no macOS. No Windows, o Vision funciona assim que você ativa o modo — não há permissão de sistema extra para conceder.
Perguntando Sobre Sua Tela
Usar o Vision é o mesmo ritmo de segurar-falar-soltar do resto do Bankai:
- Segure o atalho do Vision. O Bankai começa a ouvir imediatamente e captura um screenshot da sua tela atual ao mesmo tempo.
- Faça sua pergunta sobre o que está na tela — "resuma isso", "o que significa este erro", "qual é o total nesta coluna?"
- Solte a tecla. O Bankai lê o screenshot junto com sua pergunta e responde.
Como o screenshot é capturado no instante em que você começa a falar, o Vision parece tão rápido quanto os outros modos — não há uma etapa separada de "tirar um screenshot primeiro".
Onde a Resposta Aparece
Por padrão, a resposta do Vision é colada no seu cursor, assim como no modo Ask — pronta para cair em um documento, mensagem de chat ou onde quer que você esteja trabalhando.
Se você preferir ouvir a resposta, basta pedir em voz alta — diga algo como "me diga em voz alta" ou "leia para mim" como parte da sua pergunta, e o Bankai fala a resposta pelos seus alto-falantes em vez de colá-la.
Exemplos
| O que você pergunta (enquanto olha para…) | O que o Vision faz |
|---|---|
| Um gráfico de receita — "qual é a tendência aqui?" | Lê o gráfico e descreve a tendência |
| Uma mensagem de erro — "o que isso significa e como corrijo?" | Explica o erro e sugere uma correção |
| Uma planilha — "qual é o total desta coluna?" | Lê os números na tela e responde |
| Um artigo longo — "resuma isso em três marcadores" | Resume o que está visível na tela |
| Um formulário em outro idioma — "traduza isso para o português" | Lê e traduz o texto na tela |
Vision no Modo Omni
Você não precisa sempre mudar para o Vision deliberadamente. Se você usa o modo Omni (onde o Bankai descobre sua intenção automaticamente) e o Vision está ativado, o Omni vai buscar sua tela por conta própria quando sua pergunta soar como uma pergunta sobre a tela — por exemplo, "o que tem na minha tela agora?" ou "olhe esta planilha e me diga o total".
Quando isso acontece, o Omni captura um screenshot, responde usando-o, e o resultado é salvo como uma sessão Vision no seu histórico. Se sua pergunta Omni não é sobre a tela, nenhum screenshot é tirado — então o uso cotidiano do Omni continua rápido.
Mantenha o Vision ativado e fique no modo Omni para a experiência mais natural: apenas fale, e o Bankai puxa sua tela apenas quando a pergunta realmente exigir.
Seus Screenshots Ficam no Seu Computador
Os screenshots do Vision são armazenados localmente no seu dispositivo, não enviados para a Copera. Eles seguem as mesmas regras de retenção que você define para o áudio do Bankai, então você controla por quanto tempo são mantidos (veja Configurações de Voz).
No seu Histórico do Bankai, as sessões Vision mostram o screenshot que foi capturado junto com sua pergunta e a resposta. Clique em um screenshot para abri-lo em tamanho completo em um visualizador.
Tentando uma Resposta Vision Novamente
Se uma resposta Vision não foi exatamente o que você precisava, você pode tentar novamente a partir do seu Histórico do Bankai — o Bankai reexecuta a requisição usando o screenshot que já capturou, então você não precisa recriar o momento.
Configurações
| Configuração | O que controla | Padrão |
|---|---|---|
| Enable Vision Mode | Ativa ou desativa o Vision (na seção Modes das Configurações de Voz). | Desativado |
| Permissão de Gravação de Tela (apenas macOS) | Permissão do sistema que o Vision precisa para capturar sua tela. Concedida por uma etapa guiada no macOS. | Não concedida |
| Retenção de screenshots | Por quanto tempo os screenshots capturados são mantidos no seu dispositivo — segue sua configuração de retenção de áudio. | — |
Dicas e Boas Práticas
Coloque a coisa sobre a qual você quer perguntar claramente na tela antes de segurar o atalho. O Vision captura o que estiver visível no momento em que você começa a falar.
Para textos pequenos — letras miúdas, tabelas densas, código — o Vision captura em alto detalhe para conseguir ler os detalhes, mas uma visualização maior ou ampliada ainda dá a resposta mais precisa.
Use "me diga em voz alta" quando suas mãos estiverem ocupadas ou seus olhos estiverem em outra coisa — o Vision vai falar a resposta em vez de colá-la.
Perguntas Frequentes
Por que eu não vejo o Vision Mode?
O Vision está desativado por padrão — ative Enable Vision Mode na seção Modes das Configurações de Voz. Ele também requer o aplicativo desktop da Copera; não está disponível em um navegador web.
Por que o Vision não funciona no meu Mac depois que eu o ativei?
O macOS precisa da permissão de Gravação de Tela, e uma Gravação de Tela recém-concedida só tem efeito depois que a Copera reinicia. Siga a etapa de permissão guiada e clique em Reiniciar Copera quando solicitado.
Meus screenshots são enviados para a Copera ou armazenados na nuvem?
Seus screenshots do Vision são armazenados localmente no seu próprio dispositivo e seguem suas configurações de retenção do Bankai. Eles não são mantidos nas suas notas nem enviados para o armazenamento da Copera.
O Bankai pode ler minha tela automaticamente?
Apenas quando você pede. O Vision captura um screenshot quando você segura o atalho do Vision, ou quando você está no modo Omni e sua pergunta claramente pergunta sobre a tela. Ele nunca observa sua tela em segundo plano.
Para onde vai a resposta?
Por padrão, ela é colada no seu cursor. Peça "em voz alta" e o Bankai fala a resposta em vez disso.
Funcionalidades Relacionadas
- Modos de Voz — Todos os modos do Bankai e quando usar cada um.
- Atalhos de Teclado — O atalho do Vision para sua plataforma.
- Configurações de Voz — Ative o Vision, defina a retenção e ajuste o balão de resposta.
- Histórico e Analytics — Revise suas sessões Vision e seus screenshots.