Saltar al contenido principal

Vision Mode

Vision es el modo de Bankai que puede ver tu pantalla: mantén pulsado el atajo de Vision, pregunta sobre lo que sea que tengas delante (un gráfico, un mensaje de error, una hoja de cálculo, un párrafo en otra app) y Bankai captura una imagen de pantalla en el instante en que empiezas a hablar, la lee y responde. La respuesta cae justo en tu cursor, o se lee en voz alta si la pides.

Es la diferencia entre describir lo que estás mirando y simplemente preguntar por ello. En lugar de "hay un número en la tercera columna de una tabla sobre los ingresos del Q3, ¿cuál es la tasa de crecimiento?", solo dices "¿cuál es la tasa de crecimiento aquí?" mientras miras la tabla. Bankai ve lo que tú ves.

nota

Vision Mode funciona en la app de escritorio de Copera (Windows y macOS), porque necesita capturar tu pantalla, algo que un navegador web no puede hacer. En macOS también necesita el permiso de Grabación de pantalla (mira más abajo).

Activar Vision Mode

Vision está desactivado hasta que lo habilitas:

  1. Abre la sección IA y ve a Ajustes de voz.
  2. En la sección Modos, activa Habilitar Vision Mode.

Una vez habilitado, Vision se suma a tu rotación de modos (su color es magenta y su icono es un ojo) y su atajo se activa.

macOS: permiso de Grabación de pantalla

En macOS, capturar la pantalla requiere el permiso del sistema de Grabación de pantalla. La primera vez que habilitas Vision, Bankai te guía para concederlo:

  1. Bankai abre un paso de permiso y te pide que permitas la Grabación de pantalla en Ajustes del Sistema.
  2. Después de concederlo, macOS requiere que Copera se reinicie para que el cambio surta efecto; Bankai muestra un botón Reiniciar Copera para hacerlo en un solo clic.
  3. Una vez que Copera se reinicia, Vision está listo para usar.
nota

Vision necesita este permiso solo en macOS. En Windows, Vision funciona en cuanto activas el modo: no hay ningún permiso de sistema adicional que conceder.

Preguntar sobre tu pantalla

Usar Vision es el mismo ritmo de mantener pulsado, hablar y soltar que el resto de Bankai:

  1. Mantén pulsado el atajo de Vision. Bankai empieza a escuchar de inmediato y, a la vez, toma una captura de tu pantalla actual.
  2. Haz tu pregunta sobre lo que hay en pantalla: "resume esto", "¿qué significa este error?", "¿cuál es el total de esta columna?".
  3. Suelta la tecla. Bankai lee la captura junto con tu pregunta y responde.

Como la captura se toma en el instante en que empiezas a hablar, Vision se siente igual de rápido que los demás modos: no hay un paso aparte de "primero toma una captura".

Dónde aparece la respuesta

Por defecto, la respuesta de Vision se pega en tu cursor, igual que en el modo Ask, lista para caer en un documento, un mensaje de chat o donde estés trabajando.

Si prefieres escuchar la respuesta, solo pídela en voz alta —di algo como "dímelo en voz alta" o "léemelo" como parte de tu pregunta— y Bankai dice la respuesta por tus altavoces en lugar de pegarla.

Casos de uso de ejemplo

Lo que preguntas (mientras miras…)Lo que hace Vision
Un gráfico de ingresos: "¿cuál es la tendencia aquí?"Lee el gráfico y describe la tendencia
Un mensaje de error: "¿qué significa esto y cómo lo soluciono?"Explica el error y sugiere una solución
Una hoja de cálculo: "¿cuál es el total de esta columna?"Lee los números en pantalla y responde
Un artículo largo: "resume esto en tres viñetas"Resume lo que se ve en pantalla
Un formulario en otro idioma: "traduce esto al español"Lee y traduce el texto en pantalla

Vision en el modo Omni

No siempre tienes que cambiar a Vision a propósito. Si usas el modo Omni (donde Bankai descubre tu intención automáticamente) y Vision está activado, Omni recurrirá a tu pantalla por su cuenta cuando tu pregunta suene a una pregunta sobre la pantalla, por ejemplo, "¿qué hay en mi pantalla ahora mismo?" o "mira esta hoja de cálculo y dime el total".

Cuando eso ocurre, Omni captura una imagen de pantalla, responde a partir de ella y el resultado se guarda como una sesión de Vision en tu historial. Si tu pregunta en Omni no es sobre la pantalla, no se toma ninguna captura, así que el uso cotidiano de Omni se mantiene rápido.

consejo

Mantén Vision activado y quédate en el modo Omni para la experiencia más natural: solo habla, y Bankai recurre a tu pantalla únicamente cuando la pregunta realmente lo exige.

Tus capturas se quedan en tu computadora

Las capturas de Vision se almacenan localmente en tu dispositivo, no se suben a Copera. Siguen las mismas reglas de retención que defines para tu audio de Bankai, así que tú controlas cuánto tiempo se conservan (mira Ajustes de voz).

En tu Historial de Bankai, las sesiones de Vision muestran la captura que se tomó junto con tu pregunta y la respuesta. Haz clic en una captura para abrirla a tamaño completo en un visor.

Reintentar una respuesta de Vision

Si una respuesta de Vision no fue del todo lo que necesitabas, puedes reintentarla desde tu Historial de Bankai: Bankai vuelve a ejecutar la petición usando la captura que ya tomó, así que no tienes que recrear el momento.

Ajustes y configuración

AjusteQué controlaPredeterminado
Habilitar Vision ModeActiva o desactiva Vision (en la sección Modos de Ajustes de voz).Desactivado
Permiso de Grabación de pantalla (solo macOS)Permiso del sistema que Vision necesita para capturar tu pantalla. Se concede mediante un paso guiado en macOS.No concedido
Retención de capturasCuánto tiempo se conservan en tu dispositivo las capturas tomadas: sigue tu ajuste de retención de audio.

Consejos y buenas prácticas

consejo

Pon claramente en pantalla aquello sobre lo que quieres preguntar antes de mantener pulsado el atajo. Vision captura lo que esté visible en el momento en que empiezas a hablar.

consejo

Para texto pequeño —letra menuda, tablas densas, código— Vision captura con alto detalle para poder leer los detalles, pero una vista más grande o ampliada sigue dando la respuesta más precisa.

consejo

Usa "dímelo en voz alta" cuando tengas las manos ocupadas o los ojos puestos en otra cosa: Vision dirá la respuesta en lugar de pegarla.

Preguntas frecuentes

¿Por qué no veo Vision Mode?

Vision está desactivado por defecto: activa Habilitar Vision Mode en la sección Modos de Ajustes de voz. También requiere la app de escritorio de Copera; no está disponible en un navegador web.

¿Por qué Vision no funciona en mi Mac después de activarlo?

macOS necesita el permiso de Grabación de pantalla, y un permiso de Grabación de pantalla recién concedido solo surte efecto después de reiniciar Copera. Sigue el paso de permiso guiado y haz clic en Reiniciar Copera cuando se te indique.

¿Mis capturas se envían a Copera o se almacenan en la nube?

Tus capturas de Vision se almacenan localmente en tu propio dispositivo y siguen tus ajustes de retención de Bankai. No se guardan en tus notas ni se suben al almacenamiento de Copera.

¿Puede Bankai leer mi pantalla automáticamente?

Solo cuando lo pides. Vision captura una imagen de pantalla cuando mantienes pulsado el atajo de Vision, o cuando estás en el modo Omni y tu pregunta claramente es sobre la pantalla. Nunca observa tu pantalla en segundo plano.

¿Adónde va la respuesta?

Por defecto se pega en tu cursor. Pídela "en voz alta" y Bankai dirá la respuesta en su lugar.

Funciones relacionadas