Tecnología & Cultura Digital

¿Cómo se clona la voz mediante herramientas de inteligencia artificial?

A través del uso de algoritmos y el aprendizaje automático se puede crear copias sintéticas de la voz de cualquier persona.

2024-05-25

Por Europa Press

La inteligencia artificial (IA) está proliferando en diversos campos y uno de ellos es la tecnología de clonación de voz, que cada vez cuenta con más herramientas para su uso y que, a su vez, está ocasionando una serie de preocupaciones entre los usuarios y profesionales ante a los posibles casos de uso indebido, como es la reciente polémica con la actriz Scarlett Johansson, que busca respuestas sobre si OpenAI utilizó su voz sin consentimiento para crear la voz de Sky en el 'chatbot' ChatGPT.

La clonación de voz mediante herramientas de IA consiste en, a través del uso de algoritmos y el aprendizaje automático, crear copias sintéticas de la voz de cualquier persona. En algunos casos estas herramientas permiten replicar el habla de una persona mediante muestras de audio de tan solo unos segundos, consiguiendo resultados realistas.

Abren espacios para personas que buscan formarse en inteligencia artificial y programación

Así, a diferencia de las voces sintéticas generadas a través de un ordenador, que se crean con tecnologías de conversión de texto a voz, la clonación de voces utiliza la voz real de una persona y, a partir de ello, genera una interpretación realista de la original.

En este sentido, existen diversas herramientas impulsadas por IA que facilitan la clonación de la voz. Un ejemplo de esta tecnología es VALL-E de Microsoft que, mediante algunas grabaciones de audio de tan solo tres segundos, es capaz de imitar la voz del hablante preservando incluso las emociones y el entorno acústico del mensaje.

Lo mismo ocurre con la herramienta recientemente anunciada de Open AI, Voice Engine, un nuevo modelo de IA capaz de crear voces personalizadas y naturales con una única muestra de audio de 15 segundos.

¿Qué son las PC con inteligencia artificial y cuánto cuestan?

Así, estas herramientas presentan múltiples ventajas y facilidades a la hora de utilizar la voz en distintos tipos de contexto, ya sea para la creación de asistentes de voz personalizados, para ayudar a personas con problemas del habla, para el desarrollo de videojuegos o, incluso, para entornos laborales, con aplicaciones al marketing o a la traducción de contenido.

Sin embargo, las tecnologías de clonación de voz también están levantando algunas preocupaciones entre los usuarios y los profesionales de la voz que, ante la posibilidad de un uso indebido de la IA, prevén posibles problemas como la suplantación de la voz y, por tanto, de la identidad.

12 ejemplares al año por $75

SUSCRIBIRSE