Nodo 80: septiembre 2023

martes, 12 de septiembre de 2023

Esto se acabó

Un susurro de la IA vino acelerar las redacciones en todo el mundo.

Sí, un susurro.

"Whisper", el modelo de audio a texto de OpeanAI. Hay varios, pero, cuando necesito, regularmente suelo usar este. A este joven le metieron 680 mil horas de entrenamiento en múltiples idiomas.

Es potente, intuitivo y con una efectividad impresionante, salvo, como era de esperarse, en nombres propios o palabras que suenan extraño en el origen del audio, o en boca de un entrevistado, cosa que no es muy rara.

Lo recomiendo altamente a periodistas amigos con los que suelo trabajar, así que quien quiera usarlo puede ir a: https://replicate.com/openai/whisper

La lA susurradora acabó con los fastidiosos minutos para "desgrabar" una entrevista o transcribir cualquier audio que se tenga a mano.

Siempre es mejor tenerlo en .mp3

El modelo no solo modificó la forma de gestionar los audios en redacciones de impresos o medios digitales, radiales, televisivos o las propias redes, sino que aceleró la escritura de los periodistas y creadores de contenido, que no son la misma cosa.

Y es que cuando se tiene un asistente al que se le ingesta un audio de 5, 10 o más minutos y te devuelve un texto casi perfecto en menos de 2 minutos, dependiendo de la extensión del archivo, transcrito, incluso con pausas y, si la entonación de la pregunta es clara, hasta con los signos de interrogación, esto es aceleración pura y dura.

Esto aporta valor directo al periodismo como herramienta de construcción de textos e historias, les da velocidad, ayuda a llegar más rápido, que, después de todo, también es una de las ambiciones del oficio, llegar rápido y llegar bien.

Todo quiere ir más rápido en este mundo.

¿Necesitas datos de contexto para una historia y hay audios en YouTube? Pues fácil, descárgate el audio, hay plugins para capturar audios de ventana, y pásale el audio a Whisper.

¿Tienes una entrevista de 30 minutos con un entrevistado que habla lento?, pásale el audio a Whisper

¿Estás en un evento científico y debes reseñarlo con total exactitud en frases y tecnicismos?, dale el audio a Whisper

Mientras estás redactando otros tramos de tu trabajo, tu asistente susurradora irá masticando los audios para entregártelos.

La ventana de Whisper se ve así:

Captura de ventana de Wahisper en Replicate.

Puedes cargar el audio haciendo clic o drag a drop. No suelo tocar más opciones de las necesarias. Recomiendo que pongas sí el lenguaje del audio que va a ingestar, sea Español, Inglés, Italiano, Francés.....

En la ventana derecha, output, podrás ver el avance de la transcripción y su resultado final.

Si quieres entender más acerca de la arquitectura y el funcionamiento de Whisper entra aquí.

Carlos Moreno

martes, 12 de septiembre de 2023

Esto se acabó

La lA susurradora acabó con los fastidiosos minutos para "desgrabar" una entrevista o transcribir cualquier audio que se tenga a mano.

Entradas populares