Desde 1999, la compañía ha venido desarrollando soluciones y servicios de reconocimiento de voz, enfocados a servicios de atención telefónica al cliente. Sin embargo, actualmente Ydilo se ha embarcado en el desarrollo de soluciones multimodales ¿Qué ha propiciado ese salto?
Viene favorecido por nuestro principal cliente, Vodafone, con quien trabajamos desde noviembre de 2004, que nos advirtió de que el lanzamiento de la red 3G se iba a acelerar y que pensáramos cómo podíamos mejorar la atención al cliente apoyándonos en las nuevas prestaciones que ofrece la tercera generación móvil. Inicialmente diseñamos una maqueta para adaptarlo al programa de fidelización de Vodafone (el 114) y a la operadora le pareció interesante. Al final conseguimos tener lista una plataforma de servicios multimodales en junio de 2005 y firmamos el primer contrato a finales de año donde ofrecemos atención al cliente y servicios de redes.
El pasado mes de febrero Ydilo acudió al Congreso 3GSM, celebrado en Barcelona para presentar soluciones y servicios de multimodalidad para la nueva generación de telefonía 3G ¿Qué aporta la compañía en esta área?
En el 3GSM pudimos observar que ninguna empresa se aproxima al problema de cómo acertar con los servicios que demanda el usuario de móviles. Si bien es cierto que hay tecnología similar a la nuestra en WAP, pocos ofrecen voz y datos al tiempo. Nosotros favorecemos la apertura de sesiones de voz y datos simultáneas y sincronizadas, algo que no hemos visto en otros fabricantes.
Ydilo también anuncia su apuesta por emplear tecnología IMS para la gestión de contenidos multimedia. ¿Cuál es su estrategia en este sentido?
El estándar IMS asociado con la tecnología 3G aún necesita un periodo de madurez para traducirse en negocio real. En la actualidad seguimos hablando de puertos de telefonía, pero cuando saltamos a IMS debemos cambiar el chip y hablar de sesiones. En nuestro caso particular la complicación tecnológica no existe porque hemos construido una plataforma capaz de adaptarse a las demandas de una plataforma 3G para IMS (People Base/People Base IMS).
De todos modos, nuestra apuesta por IMS es a largo plazo, no nos gusta trabajar en vacío, de modo que calculamos que nuestra entrada fuerte en IMS aún tardará un año, mientras esperamos que el mercado madure.
Todos los grandes fabricantes tienen alguna propuesta en el área de telefonía IP ¿Cómo se abrirá hueco una firma como Ydilo?
El mercado de la telefonía IP, aunque pueda verse desde el exterior como un segmento aún por evolucionar, está perfectamente estructurado, de modo que encontramos tres grandes áreas: el nivel de acceso, el nivel de infraestructuras y la capa de servicios. Ydilo se sitúa claramente en esta última. Somos una empresa de nicho y sólo nos lanzaremos a hacer negocio cuando toda la infraestructura esté perfectamente desplegada con servicios de reconocimiento del lenguaje natural. Además seguiremos con nuestra máxima de no querer vender licencias, sino servicios; somos conscientes de que el reconocimiento de voz está lejos de ser una commodity y debemos dejarlo evolucionar. La experiencia nos dice que cualquier paso mal dado implica un fracaso sonoro y una fuerte inversión tirada, todos recordamos los millones invertidos en su día por Omnitel (Vodafone Italia) que acabaron en nada.
Su solución para terminales de tercera generación YDILO ATENCIÓN INTERACTIVA dispone de una plataforma de interacción dinámicamente adaptada en función del terminal receptor ¿Qué grado de aceptación está teniendo entre los usuarios de dispositivos móviles?
Hasta ahora los clientes no han tenido una preferencia clara en cuanto a dispositivos y se trabaja tanto con terminales con sistema Windows como Symbian. Donde se puede medir más el grado de aceptación es en los servicios aportados, aunque siempre con ciertas dudas ya que servicios como la videollamada -de la que se preveía un gran éxito- no triunfan como se esperaba. Para asegurarse ciertas garantías hay que adaptar el contenido que se ofrece al dispositivo sobre el que vaya a correr y en esta adaptación todos los proveedores implicados en la cadena de producción juegan un papel importante. El éxito o el fracaso nunca es cosa de uno solo, como tampoco depende de una sola aplicación el aumento de la facturación en este mercado, ya nadie busca crecer varios dígitos confiando todo su potencial en una killer application o en un dispositivo concreto.
El año pasado la compañía facturó 9,4 millones de euros ¿Qué inversión han realizado en I+D para desarrollar servicios para 3G y qué ganancias esperan obtener este año?
Para Ydilo, 2006 es un año de pruebas en materia de 3G y esperamos que 2007 sea el año del despliegue de servicios de reconocimiento de voz en dispositivos móviles de última generación. La compañía hasta la fecha ha invertido 500.000 euros y ha dedicado el esfuerzo de 16 personas que se han volcado en esta área de negocio. Según nuestros cálculos, los desarrollos ejecutados sobre la plataforma deberán probarse en un entorno con un gran número de llamadas en el IVR lo que implica mayores esfuerzos que traducido en cifras nos lleva a estimar que la inversión total se elevará a los 750.000 euros a finales de 2006.
Usted mismo ha reconocido que actualmente no hay una aplicación estrella y nadie sabe qué servicio acabará siendo más demandado o sucumbirá ante la indiferencia del consumidor ¿Qué le hace pensar que el reconocimiento de voz y el lenguaje natural se harán un hueco entre las preferencias del usuario ?
La experiencia me dice que cualquier previsión en este sector tiene un margen de error grande y, al final, los proveedores saben que en parte se aventuran a los caprichos de la demanda. La historia me da la razón: nadie pensaba que el SMS en la telefonía móvil generaría tantos ingresos, como tampoco se apostaba hace una década por la televisión digital cuando la tecnología estaba lista. No podemos afirmar nada a ciencia cierta, excepto que la infraestructura para convertir voz en datos es posible y que la interfaz más natural para favorecer la comunicación entre personas es la voz y no el teclado. Con todas estas premisas jugaremos nuestra baza contando con la certeza de que la voz es el vehículo natural para establecer una comunicación a través del móvil, sabiendo además que la tercera generación posibilita ofrecer servicios de información donde el consumidor interactúa con una máquina inteligente capaz de resolver problemas relativamente complejos analizando las respuestas del usuario.