Un susurro de la IA vino acelerar las redacciones en todo el mundo.
Sí, un susurro.
"Whisper", el modelo de audio a texto de OpeanAI. Hay varios, pero, cuando necesito, regularmente suelo usar este. A este joven le metieron 680 mil horas de entrenamiento en múltiples idiomas.
Es potente, intuitivo y con una efectividad impresionante, salvo, como era de esperarse, en nombres propios o palabras que suenan extraño en el origen del audio, o en boca de un entrevistado, cosa que no es muy rara.
Lo recomiendo altamente a periodistas amigos con los que suelo trabajar, así que quien quiera usarlo puede ir a: https://replicate.com/openai/whisper
La lA susurradora acabó con los fastidiosos minutos para "desgrabar" una entrevista o transcribir cualquier audio que se tenga a mano.
Siempre es mejor tenerlo en .mp3
El modelo no solo modificó la forma de gestionar los audios en redacciones de impresos o medios digitales, radiales, televisivos o las propias redes, sino que aceleró la escritura de los periodistas y creadores de contenido, que no son la misma cosa.
Y es que cuando se tiene un asistente al que se le ingesta un audio de 5, 10 o más minutos y te devuelve un texto casi perfecto en menos de 2 minutos, dependiendo de la extensión del archivo, transcrito, incluso con pausas y, si la entonación de la pregunta es clara, hasta con los signos de interrogación, esto es aceleración pura y dura.
Esto aporta valor directo al periodismo como herramienta de construcción de textos e historias, les da velocidad, ayuda a llegar más rápido, que, después de todo, también es una de las ambiciones del oficio, llegar rápido y llegar bien.
Todo quiere ir más rápido en este mundo.
¿Necesitas datos de contexto para una historia y hay audios en YouTube? Pues fácil, descárgate el audio, hay plugins para capturar audios de ventana, y pásale el audio a Whisper.
¿Tienes una entrevista de 30 minutos con un entrevistado que habla lento?, pásale el audio a Whisper
¿Estás en un evento científico y debes reseñarlo con total exactitud en frases y tecnicismos?, dale el audio a Whisper
Mientras estás redactando otros tramos de tu trabajo, tu asistente susurradora irá masticando los audios para entregártelos.
La ventana de Whisper se ve así:
Puedes cargar el audio haciendo clic o drag a drop. No suelo tocar más opciones de las necesarias. Recomiendo que pongas sí el lenguaje del audio que va a ingestar, sea Español, Inglés, Italiano, Francés.....
En la ventana derecha, output, podrás ver el avance de la transcripción y su resultado final.
Si quieres entender más acerca de la arquitectura y el funcionamiento de Whisper entra aquí.
Carlos Moreno