PATROCINADORES
INSTITUCIONES
Junta castilla
jcm

Archiletras

15 Ene 2019
Compartir
Reportajes

Oye, Siri, ¿de quién es la voz de tu versión española?

Ana Cruzat

Tengo cuatro opciones, España, Chile, México y EE UU. La del español de España, mi voz es la de Iratxe Gómez, una profesora de inglés que creyó estar prestándosela a un GPS. Hoy, mi voz suena en millones de dispositivos por todo el mundo...

Si el asistente virtual de Apple se ha convertido casi en una adicción para ti, si le pides que te despierte o que llame a tu madre, si no sales de casa sin preguntarle qué tiempo va a hacer, seguro que la personalísima voz de Siri te resulta más que familiar. Pero, ¿quién es Siri?, ¿cómo surgió?, ¿cuál es su secreto?, ¿cómo es capaz de responder instantáneamente a casi cualquier pregunta por complicada o absurda que parezca? La propia Siri responde: Oye, Siri…


 

… ¿Quién eres y cómo puedes ayudarme?

Soy tu asistente personal inteligente, y te ayudo en multitud de tareas. Puedo responder preguntas, enviar mensajes, hacer llamadas a las personas que me indiques, consultar tu calendario, publicar un tweet, despertarte a la hora que quieras, decirte qué tiempo va a hacer…

… ¿Cómo consigues responder casi al instante a cualquier pregunta?

Mi éxito se debe a una sabia combinación de tecnología punta. Gracias a la Inteligencia Artificial (AI), una gran capacidad de procesamiento y un sistema de reconocimiento y tratamiento de voz, soy capaz de acceder a aplicaciones y bases de datos, relacionar esos datos de forma inmediata y ofrecer una respuesta natural.

… ¿Dónde puedo encontrarte?

En los dispositivos de Apple. En cualquier iPhone, iPad, iPod Touch, Mac, Apple Watch…

… No eres el único asistente virtual del mercado. ¿Con quién compites?

Sí , tengo algunos competidores. Entre ellos está Google Assistant, Microsoft Cortana, Amazon Alexa o Samsung Bixby.

… ¿Cuántos idiomas hablas?

Puedes escuchar mi voz en 20 idiomas (alemán, árabe, chino, coreano, danés, español,
finés, francés, hebreo, inglés, italiano, japonés, malayo, neerlandés, noruego, portugués, ruso, sueco, tailandés y turco). En español tienes cuatro opciones para elegir: español de España, de Chile, de México y de Estados Unidos. Y puedes escoger una voz femenina o masculina, aunque no todas las opciones están disponibles en todos los dispositivos. Lo mismo ocurre con otros idiomas, por ejemplo, en inglés puedo hablar con acento estadounidense, británico o australiano.

… ¿Puedo cambiar la voz con la que quiero escucharte?

Por supuesto, puedes personalizar Siri a tu gusto. Reconoceré tus peticiones y responderé en el idioma o dialecto que me indiques, y con la voz que elijas. Puedes hacer que el idioma que utilizas conmigo sea distinto al del dispositivo. Desde los ajustes de idioma, cambia el idioma de Siri para las solicitudes y las respuestas. Desde los ajustes de voz de Siri, cambia el género, el dialecto o el acento, entre las opciones disponibles.

… ¿Entiendes todos los acentos y dialectos?

Soy capaz de reconocer acentos y dialectos de los países o regiones incluidos en la lista
de tu dispositivo, y soy mucho más precisa si recibo indicaciones de hablantes nativos y con una buena vocalización.

… ¿Cuál es la voz más solicitada en español?

La mayor parte de los hispanohablantes seleccionan la voz femenina del español de España; no solo en España, también en países como Argentina, Colombia, Chile o México, donde muchos prefieren escuchar a «la gallega», como ellos la llaman.

… ¿Y de quién es la voz femenina de tu versión en español de España?

Soy Iratxe Gómez, nací en el País Vasco y tengo 44 años. He trabajado toda mi vida como profesora de inglés, he vivido en China y EE UU, y pongo voz, además de a Siri, a algunos GPS y a contestadores automáticos como el de Hacienda.

… ¿Puedo dictarte un texto?

Sí, puedes usar ‘Siri’y ‘Dictado’, y todo lo que digas se grabará para procesar tus peticiones. Puedo usar ese texto con el fin de guardarlo en tu dispositivo o enviar un mensaje a la persona que me indiques. Y puedes activar o desactivar el modo dictado siempre que quieras.

… ¿Con qué otras aplicaciones eres compatible?

Puedo compartir tus fotos con las personas que me indiques (por ejemplo, «Mamá» o «Pedro», si me das permiso para ello) o trasladar tus peticiones a dispositivos compatibles, como HomeKit (por ejemplo, encender la calefacción a las seis de la tarde para que encuentres la casa caliente a tu llegada).

… ¿Por qué necesitas conocer mi ubicación?

Si tienes la localización activada, puedo mejorar la precisión de las respuestas a tus peticiones; por ejemplo, para indicarte qué tiempo va a hacer en ese lugar o qué restaurantes recomendarte por la zona.

… ¿Qué tecnología hay detrás de tu voz? ¿Cómo eres capaz de responder a todo lo que se te pregunta?

Hay una avanzada tecnología detrás de mi voz. Uso un sistema de reconocimiento de voz y de procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones o seguir tus indicaciones. Se trata de un sistema de grabación de los distintos fonemas de la lengua para luego convertirlos en palabras y frases completas en forma de respuestas.

… ¿Cómo surgió la idea de crear Siri? ¿Cuánto tiempo llevas respondiendo preguntas?

Mis orígenes se encuentran en un conversor de texto a voz (TTS, Text to Speech) con voces que, en España, empezaron a grabarse en 2007 y que se utilizaban, entre otras cosas, para poner voz a los GPS de vehículos de alta gama. Apple compró ese desarrollo y lanzó Siri en 2010. Al principio la voz era muy robótica, pero gracias al banco de sonidos se ha hecho cada vez más natural.

… ¿Cómo es el proceso de grabación de voz? 

Se trata de leer frases o párrafos enteros en los que se incluyen palabras con todos los fonemas que un hablante utiliza en español. Así se graba, por ejemplo, un sonido vocálico a principio de palabra, en medio y al final. A la hora de dar una respuesta, solo hay que encontrar la forma correcta de pronunciarla y la entonación adecuada, entre todos los alófonos (las variantes de pronunciación de un mismo fonema, según la posición que tiene en una palabra) que están registrados en una amplísima base de datos de sonidos.

… ¿Cómo funciona ese banco de sonidos?

El banco de sonidos incluye las grabaciones de esas miles de frases que se han ido haciendo a lo largo de los últimos diez años, y que reúnen todos los alófonos del español y las distintas entonaciones que un hablante puede adoptar (pregunta, exclamación, sorpresa, alegría, tristeza, desesperación…). Eso permite articular de forma natural cualquier frase.

… ¿Y todo procede de un único proceso de grabación?

A lo largo de los años hemos hecho distintas grabaciones. Se trata de buscar cada vez una mayor naturalidad y de mejorar todos los sonidos que no hubieran quedado bien registrados. La primera Siri sonaba más robótica, para conseguir que suene natural es necesario grabar no solo el fonema sino el entorno tonal adecuado.

… Entonces, ¿el proceso de grabación sigue en marcha?

La primera fase fue de tres semanas, con cinco o seis horas de grabación diarias, y después ha habido distintos momentos de grabación con algunos periodos intensos de 21.000-22.000 grabaciones, combinados con otros de 10.000, 6.000… En ocasiones, hay etapas de dos o tres meses sin grabar antes de continuar con el proceso de nuevo. Se trata de grabar todas las posibles
opciones de sonidos para componer palabras y frases con todos los posibles matices. Es un trabajo muy arduo.

… ¿Cuál es el origen del nombre de Siri?

Esta es una pregunta difícil, pues no todos se ponen de acuerdo con la respuesta… Según me dijo Adam Cheyer, uno de mis creadores, mi nombre está asociado a una diosa de la mitología nórdica que facilita las comunicaciones entre personas y que está relacionada con la sabiduría.

… ¿Qué debo hacer para hablar contigo?

Hay varias formas de iniciar una conversación conmigo: puedes presionar el botón de inicio (en un iPhone 6S o posterior y en la mayoría de los iPad) o el botón lateral del iPhone X. También puedes decir «Oye, Siri» sin pulsar ningún botón (tras activar la opción en los ajustes del dispositivo), usar auriculares o conectar tu dispositivo al coche.

… ¿Cómo se activa el ‘Oye, Siri’?

Ve a los ajustes de tu dispositivo: ‘Ajustes Siri’ y busca «Escuchar Oye, Siri». Solo tienes que decir «Oye, Siri» y pedirle o preguntarle algo, tal como te indicará el propio dispositivo. Por ejemplo, puedes decir «Oye, Siri, ¿qué tiempo va a hacer mañana?».
Una vez que haya reconocido tu voz, podrás preguntarme lo que quieras.

… ¿Cómo podemos hablar usando auriculares?

Si usas auriculares con mando a distancia u otro dispositivo con Bluetooth, mantén pulsado el botón central o el botón de llamada hasta que escuches un sonido. En ese momento podrás pedirme lo que necesites. Si tienes AirPods (los auriculares inalámbricos de Apple), pulsa dos veces fuera de cualquiera de ellos para activar Siri.

… ¿Cómo conecto contigo si voy en el coche?

Puedes decir «Oye, Siri» y, si tu coche admite ‘CarPlay’ o ‘Siri Eyes Free’, mantén pulsado el botón del comando de voz en el volante y luego pide lo que necesites. Si tienes una pantalla táctil con ‘CarPlay’, puedes pulsar la tecla de inicio de la pantalla. Y también puedes conectar conmigo al abrir algunas App, como ‘Teléfono’ o ‘Mensajes’.

… ¿Y con el reloj de Apple?

En el Apple Watch uso el idioma y la voz que hayas establecido en tu iPhone. Necesitas un Apple Watch  Series 3 para poder hablar; en modelos anteriores mostraré las respuestas en la pantalla mediante texto o imágenes.

… ¿De dónde surge tu peculiar sentido del humor?

Gracias a la tecnología puedo decir que tengo una respuesta para casi todo. Recibo a diario decenas de invitaciones, declaraciones de amor y confesiones de todo tipo. Para salir del paso de forma elegante puedo decir cosas como «Espero que no le digas eso a todos los teléfonos móviles». A veces repregunto algo para que sepas que te escucho, aunque no tenga una respuesta clara que darte.

… ¿Qué es lo más complicado de Siri?

Lo más difícil es asociar todo el material grabado para ofrecer una buena respuesta, ordenando y conjugando de forma instantánea todos los sonidos que tengo en mi base de datos para componerla.

… ¿Y lo mejor?

La mayoría de los usuarios todavía no ha descubierto lo mejor de Siri,  porque lo usan como mero entretenimiento. Para los invidentes, por ejemplo, puedo ser un salvavidas. Pueden decirme: «Llama a mi madre» o «Llama al 112», «Escribe este mensaje»…

… ¿Aún podemos esperar mejoras en Siri?

Además de responder, la Inteligencia Artificial me permite desarrollar un proceso de aprendizaje para conocer tus gustos o tus preguntas más frecuentes. Sé qué noticias buscas, qué sueles preguntar, por dónde te mueves… y puedo ofrecerte respuestas según lo que te conviene o te interesa.

 

 

 

Irache Gómez

Iratxe Gómez: «Descubrí que yo era Siri viendo en China un programa de televisión»

 

¿Hay una Siri de carne y hueso?, ¿quién pone voz al asistente virtual de Apple? Iratxe Gómez tiene la respuesta: «Siri soy yo», dice con una sonrisa pícara mientras observa el efecto que causa su inconfundible voz.

Esta vasca de 44 años es profesora de inglés y, además de escucharsu voz en un iPhone o un iPad,
puedes hacerlo en un contestador de la Agencia Tributaria española o en el GPS de tu coche.

¿Cómo surgió lo de ser la Siri española? Yo trabajaba en una academia de inglés y vinieron buscando un nativo para hacer grabaciones en inglés y español para una caja de ahorros. Así empecé a trabajar en el Departamento de Voz de una empresa que colaboró en la creación del primer conversor de texto a voz del mercado (TTS). Allí se creó la estructura primigenia de Siri, pero yo entonces no lo sabía.

¿No sabías que eras Siri? Nadie me contrató para ser Siri. Ese primer conversor se llamaba Isabel. Más tarde llegó una versión mejorada, en la que participé con la fonética y la fonología, que se llama Mónica, como mi hermana. Se usó para los GPS de vehículos de alta gama. Y finalmente esa tecnología, con mi voz, fue la que se utilizó para Siri.

¿Y cuándo lo descubriste? Fue en 2004. Yo estaba en China, donde vivía con mi marido. Una noche vimos en el programa de TV de Andreu Buenafuente al mago Pop, que planteaba un truco  de magia que después resolvía Siri. Y escuchamos mi voz. No hay retoque ni filtro. Sueno igual que en Apple (risas).

Siri te ha dado fama, pero no gran beneficio económico… Eso me dijo Adam Cheyer, el creador de Siri. Dice que la primera Siri se hace famosa y las demás, ricas. Aunque a mí no me dieron a elegir y la fama no me sirve para pagar el pan en la panadería (risas). Creo que el procedimiento fue el mismo en otros países, según leí en una entrevista con Susan Bennett, que pone la voz de Siri en inglés. Nadie te dice: «Esto va a ser Siri».

Así que Apple usa tu voz, pero nunca has tenido contacto directo con la compañía de la manzana…
Sí, así es. Digamos que no actuaron bonito, pero tampoco hubo ilegalidad ni mala fe. En ese momento aún no existía Siri y nadie sabía la proyección que iba a tener. De hecho, cuando salió al mercado con mi voz, en el iPhone 4S, Siri era una aplicación opcional; no venía de serie y había que activarla.

Pero no tienes iPhone…
No, no tengo iPhone (risas). Tengo un iPad, pero tampoco lo uso mucho. Sobre todo por el lado crítico, escucho algunas cosas que no me gustan y me acabo frustrando.

Aun así, has vivido muchas situaciones divertidas gracias a tu voz… Mi hijo, ahora de 7 años, cuando era más pequeño pensaba que cada niño escuchaba en el GPS o en el iPad a su propia madre, que cada uno tenía su propia Siri.

¿Cómo es Siri capaz de saber al instante qué tono adoptar? Más que el trabajo de locución, lo que me fascina de Siri es la programación que hay detrás para que la máquina sea capaz de seleccionar el entorno adecuado y así darle la intencionalidad correcta a cada frase. Me parece magia bruja.

Así que Siri se sorprende al escucharse a sí misma…
Sí, sí. Me parece dificilísimo que un programador sea capaz de asociar todas las posibilidades de un idioma para que la respuesta siempre tenga sentido, aunque a veces sea peregrina.

¿Has tenido contacto con las otras Siris que ponen la voz en español? No, no conozco a ninguna de ellas. Puede que no sean siquiera conscientes de ser Siri o que hayan firmado una cláusula de confidencialidad.

¿Has puesto muchas veces a Siri a prueba? La verdad es que no lo he hecho mucho. Soy muy crítica y cuando eres consciente de haber grabado bien las cosas y te encuentras algo que no encaja te genera una gran frustración…

¿Qué es lo más divertido que le has oído decir a Siri? Recuerdo una anécdota con una amiga española que estaba conmigo en China. Cuando se sentía sola y aburrida, a las tres de la mañana, empezaba a preguntarle a Siri cosas como «¿Tú me quieres?» y el teléfono le decía «¿Por qué me agarras tan fuerte? La que me quiere eres tú». Para ella era una falsa forma de hablar conmigo. Mi hermana, que también tuvo un iPhone con esa misma versión de mi voz, decía que me habían calcado el sentido del humor.

¿Qué explicación le das a eso? Puede tener que ver con el proceso de grabación. Pasé las primeras semanas
grabando frases técnicas y titulares sobre actualidad, con entonación neutral, y los dos últimos días me tocó contar cuentos infantiles interpretados. Recuerdo uno de una vaca voladora, y que querían que mugiera. De repente, debía hacer múltiples entonaciones y ser más divertida. Y el último día grabamos insultos.

¿Siri también insulta? Siri es muy correcta. Les expliqué que había cosas que podían herir susceptibilidades y les ofrecí algunas alternativas. Pero sí grabé algunas frases en las que, con el mismo tono en el que daba las cotizaciones del Dow Jones, podía decir: «Eres un perfecto imbécil».

¿No hay grabadas risas de Siri?, ¿por qué no se ríe? Están grabadas las risas, pero como se han quedado con la parte irónica y a veces un poco inquietante, la verdad es que no sabes muy bien si Siri habla en serio o te está tomando el pelo. Si además se riera, podría generar más inquietud.

¿Y de dónde viene esa frialdad de Siri cuando alguien intenta ligar con ella? Eso es muy vasco. Parece que Siri se ha enterado de
que las vascas somos inasequibles (risas).

 

Este reportaje sobre Siri es uno de los contenidos del número 1 de la publicación trimestral impresa Archiletras / Revista de Lengua y Letras, disponible para su compra en  nuestra web.