1

La Base de Datos no es el Futuro de los Datos

la-base-de-datos-no-es-el-futuro-de-los-datos

Zubair e Iqbal Talib

Intelligenx es una empresa particular, nace gracias al desarrollo de Zubair Talib un estudiante del MIT que  desarrolla algoritmos de búsqueda y compresión para el Laboratorio de micro procesadores de Motorola, este trabajo constituye su tesis de grado y lo hace merecedor a la Medalla de Oro del MIT.

Una vez recibido, su padre Iqbal un raro caso de un Keniata hijo de diplomáticos Indios, que hasta los cinco años habló Zulú, educado en Inglaterra y realizando su carrera de grado en USA, le financió 5 años de trabajo en I+D para convertir la tesis en un producto robusto capaz de ser líder mundial en su segmento.

Pero a la hora de acumular IQ la cosa no termina allí, quien sostiene esta particular afirmación de que “La base de Datos no es el Futuro de los Datos” es el Ingeniero Pablo Abdian, quien detenta 3 títulos de Ingeniero y fue el artífice de lograr que un indio traslade su software factory de India a Tandil, provincia de Buenos Aires.

¿Por qué razón las bases no es el futuro de los datos?

Es una cuestión de performance, las bases de datos fueron diseñadas para bases mucho mas pequeñas de lo que es la media actual, por arriba de los 30 millones de registros comienzan a perder performance de manera importante y resulta inapropiada para generar soluciones que requieren respuestas en tiempos que sean lo más cercano a tiempo real.

¿Podría ser más específico y darnos un ejemplo práctico?

Un muy importante Banco Latinoamericano, no llamó por que tenía una amenaza latente de seguridad, el tiempo de indexación de sus logs de todo un día era de 11 horas, utilizaban un servidor de 4 procesadores y 4 Gb de ram. Nosotros tomamos los datos los colocamos en una notebook con 2Gb de ram e indexamos todo en 20 minutos.

Se podrán imaginar que no es posible brindar seguridad a un sistema con una demora de 11 horas para saber que ocurre en mis logs.

Otro caso similar ocurrió con una empresa de telecomunicaciones que necesitaba guardar los registros de llamadas durante 30 días y estos registros sumaban 30 billones de registros, Cuando tenían un requerimiento judicial para buscar un dato específico en su base, le llevaba mas de 24 horas encontrar un dato y recibían mas de 30 requerimientos judiciales al mes…

Otro caso interesante en el que confluyen la capacidad de Search con las capacidades de interoperabilidad de nuestro producto se dio en el Ministerio de Justicia de Brasil, con cinco regiones y cientos de juzgados que tenían plataformas y sistemas diferentes y consultar jurisprudencia era una tarea imposible.

Con nuestro producto generamos una capa de interoperabilidad que se adapta a todas y cada una de las plataformas de cada juzgado y disponibilizamos cualquier documento en tiempos que no superan los 150 milisegundos.

Pero hay algo que no comprendo, la percepción es que las herramientas de searching son algo gratuito, ¿Cuál es el diferencial?

Encontrar 14.000.000 de resultados para una única búsqueda puede que sea gratis, pero encontrar un solo resultado, el correcto es una tarea diferente y no muchas soluciones tienen esta capacidad de searching, ni la posibilidad de generar cubos OLAP para masajear los datos y resolver problemas que con las bases de datos de hoy es imposible resolver.

Adolfo Manaure

Entusiasta seguidor de la tecnología y las innovaciones que cambian el mundo. Director Editorial y COO en The HAP Group.