Videojuegos

15.ai, el sitio que te permite usar voces de personajes populares para que digan lo que quieras

El increíble logro se da gracias a algoritmos y redes neuronales

¿Alguna vez te imaginaste a GLaDOS de Portal saludándote como una vieja amiga? ¿O a Bob Esponja Pantalones Cuadrados manándote una felicitación de cumpleaños? ¿O qué tal a Sans de Undertale y a Steven Universe a invitarte a formar parte de su equipo? La buena noticia es que todo esto ya se puede volver realidad sin que tengas que pagar un solo peso.

¿Qué es 15.ai?

15.ai es un nuevo sitio de Internet que está volviéndose muy populuar, básicamente porque sintentizó las voces de personajes muy populares de series, caricaturas y videojuegos y permite que la gente haga que estas voces digan lo que sea. El funcionamiento es increíblemente sencillo, pues solamente tienes que seleccionar la voz origen, escribir lo que quieras que diga y hacer clic en un botón. Incluso, los más clavados pueden cambiar algunos parámetros como la intencionalidad o el tono.

Naturalmente todas las voces disponibles en este momento están en ingles, por lo que lo que escribas también debe estar en inglés si quieres que suene natural. No obstante, a medida que la base de datos aumente, es posible que empecemos a escuchar voces en otros idiomas. Si estás interesado, puedes probar 15.ai haciendo clic aquí.

¿Qué voces están disponibles en 15.ai?

En este momento, hay disponibles decenas de voces de diferentes medios. En este momento, puedes elegir desde caricaturas como Bob Esponja, Daria o My Little Pony hasta videojuegos como Portal, The Stanley Parable y Persona 4 o incluso películas y series como Doctor Who y 2001: una odisea del espacio. Puedes ver todas las voces disponibles aquí.

¿Cómo funciona 15.ai?

Básicamente, 15.ai utiliza algoritmos y redes neuronales para entrenar a las voces sintetizadas, y en teoría puede ir mejorando a medida que más datos vayan alimentando estas redes. Si bien los resultados ya son excepcionales, sin duda pueden mejorar más. A continuación te dejo la explicación entendida, que se encuentra en la sección de Acerca De en el sitio:

"Esta es una herramienta de conversión de texto a voz de aprendizaje profundo para generar voces de varios personajes. Las voces se generan en tiempo real utilizando múltiples algoritmos de síntesis de audio y redes neuronales personalizadas entrenadas con muy pocos datos disponibles. Este proyecto demuestra no solo una reducción significativa en la cantidad de audio requerida para clonar voces de manera realista mientras se conservan sus prosodias afectivas, sino también la viabilidad de una aplicación de síntesis de voz bajo demanda, estable y de mejora autónoma que tiene como objetivo imitar una voz de disponibilidad limitada. A partir de enero de 2021, esta iteración actual del algoritmo (v11.2.x) es la más avanzada en los campos de la clonación de voz y la síntesis de voz".

¿Qué te parece 15.ai? ¡Déjanos tus comentarios!

Deja tu comentario

Nuevo

  • Nuevo

Subir
Advertising