Cómo pasar audio a texto con la inteligencia artificial de Google

Pinpoint también revisa los documentos

Guardar
Pinpoint Google. (Google)
Pinpoint Google. (Google)

Journalist Studio” agrupa una serie de herramientas virtuales, como es el caso de Pinpoint, para que cualquier persona usando inteligencia artificial revise documentos y transcriba audio a texto.

También, es capaz de interpretar imágenes, reconocer letra escrita a mano, transcribir audios a texto (su función más popular), identificar nombres de personas, actuar como buscador en documentos personales, entre otras características.

Pinpoint (Infobae)
Pinpoint (Infobae)

Para acceder a Pinpoint los usuarios deben iniciar sesión desde su cuenta de Google y luego ingresar a la página web “journaliststudio.google.com/pinpoint”, donde podrán ver la página de inicio y el espacio de trabajo vacío.

Se tiene que hacer clic sobre el botón “Nueva colección privada” para solicitar a Google el permiso para utilizar el servicio.

La solicitud no es otra cosa que llenar un formulario en el que se preguntarán algunos datos personales como el nombre, la organización en la que se trabaja, país, correo electrónico (no es necesario que sea institucional) etc. Inmediatamente después de completarlo, Google permitirá el acceso completo a la plataforma y se indicará al usuario que cree su primera “Colección”.

Pinpoint (Infobae)
Pinpoint (Infobae)

Las colecciones en Pinpoint son como carpetas donde se puede subir una gran cantidad de archivos con un tema en común. Puede ser porque presentan diferentes versiones de una historia, contienen información relacionada a un caso en particular, etc. No hay un límite de colecciones que se pueden crear y tampoco un límite de documentos establecido que se puedan subir o generar.

El programa puede almacenar y procesar archivos en diferentes formatos como PDF, Word, Excel, PowerPoint, páginas web, texto sin formato, archivos de imagen, archivos de audio, entre otros. Aquellos que no puedan ser soportados no serán procesados a la hora de subirlos a una colección.

Subir y procesar archivos en Pinpoint

Para subir un archivo, los usuarios deberán hacer clic sobre el botón “Drive” u “Ordenador” y usar el explorador para encontrar el documento a procesar. Una vez seleccionado, este empezará a subirse a la nube y en la parte inferior derecha de la pantalla se podrá ver el proceso. Todo audio o video que se suba será transcrito, aunque esto podría tomar entre unos segundos a varios minutos e incluso horas dependiendo de la cantidad de audio, su extensión e incluso la calidad de la conexión a internet.

Pinpoint (Infobae)
Pinpoint (Infobae)

La calidad de la transcripción puede variar dependiendo de la configuración del idioma. Si una transcripción está en español y la siguiente está en inglés, antes de procesar el archivo se deberá cambiar el idioma usando el icono de configuración ubicado en la parte superior derecha del espacio de trabajo al lado de la foto de perfil del usuario.

Para una mejor organización de una colección, cada una puede tener diferentes etiquetas de colores para identificarlas por sub temas, información en común o importancia. Para eso solo se debe ir al icono “Añadir etiqueta” en el extremo derecho del archivo procesado.

Todas las etiquetas aparecerán en el espacio derecho de la pantalla junto a la lista de nombres de personas y de entidades, aunque estas últimas solo se muestran cuando haya suficientes documentos como para empezar a tener esas relaciones entre archivos.

Pinpoint (Infobae)
Pinpoint (Infobae)

Para visualizar la información que se ha transcrito con ayuda de Pinpoint solo hará falta hacer clic sobre el nombre del archivo y en la parte inferior de la pantalla el programa permitirá volver a reproducir el audio original para que se pueda corroborar que la transcripción fue correcta.

El mayor inconveniente con Pinpoint es que al no diferenciar a un locutor de otro, es probable que se generen grandes párrafos de texto en los que se mezclen todas las voces. Sin embargo, esto se puede solucionar escuchando la grabación y asegurándose de ver en qué momento hablan los locutores.

Guardar