martes, 12 de septiembre de 2023

Esto se acabó


Un susurro de la IA vino acelerar las redacciones en todo el mundo.

Sí, un susurro.

"Whisper", el modelo de audio a texto de OpeanAI. Hay varios, pero, cuando necesito, regularmente suelo usar este. A este joven le metieron 680 mil horas de entrenamiento en múltiples idiomas.

Es potente, intuitivo y con una efectividad impresionante, salvo, como era de esperarse, en nombres propios o palabras que suenan extraño en el origen del audio, o en boca de un entrevistado, cosa que no es muy rara.

Lo recomiendo altamente a periodistas amigos con los que suelo trabajar, así que quien quiera usarlo puede ir a: https://replicate.com/openai/whisper

La lA susurradora acabó con los fastidiosos minutos para "desgrabar" una entrevista o transcribir cualquier audio que se tenga a mano.

Siempre es mejor tenerlo en .mp3

El modelo no solo modificó la forma de gestionar los audios en redacciones de impresos o medios digitales, radiales, televisivos o las propias redes, sino que aceleró la escritura de los periodistas y creadores de contenido, que no son la misma cosa.

Y es que cuando se tiene un asistente al que se le ingesta un audio de 5, 10 o más minutos y te devuelve un texto casi perfecto en menos de 2 minutos, dependiendo de la extensión del archivo, transcrito, incluso con pausas y, si la entonación de la pregunta es clara, hasta con los signos de interrogación, esto es aceleración pura y dura.

Esto aporta valor directo al periodismo como herramienta de construcción de textos e historias, les da velocidad, ayuda a llegar más rápido, que, después de todo, también es una de las ambiciones del oficio, llegar rápido y llegar bien.

Todo quiere ir más rápido en este mundo.

¿Necesitas datos de contexto para una historia y hay audios en YouTube? Pues fácil, descárgate el audio, hay plugins para capturar audios de ventana, y pásale el audio a Whisper.

¿Tienes una entrevista de 30 minutos con un entrevistado que habla lento?, pásale el audio a Whisper

¿Estás en un evento científico y debes reseñarlo con total exactitud en frases y tecnicismos?, dale el audio a Whisper

Mientras estás redactando otros tramos de tu trabajo, tu asistente susurradora irá masticando los audios para entregártelos.

La ventana de Whisper se ve así:


Captura de ventana de Wahisper en Replicate.


Puedes cargar el audio haciendo clic o drag a drop. No suelo tocar más opciones de las necesarias. Recomiendo que pongas sí el lenguaje del audio que va a ingestar, sea Español, Inglés, Italiano, Francés.....

En la ventana derecha, output, podrás ver el avance de la transcripción y su resultado final.

Si quieres entender más acerca de la arquitectura y el funcionamiento de Whisper entra aquí.

Carlos Moreno