Big Data: Un tsunami de información en las empresas

Por Mundo Contact | 24 enero 2012 | Tecnología

La explosión de la información demanda estrategias concretas por parte de las organizaciones para identificar y explotar su potencial de negocio

Actualmente se crean diariamente más de 2.5 quintillones de bytes de datos procedentes de sensores, dispositivos móviles, transacciones electrónicas, redes sociales, etc. Este número sigue aumentando a tasas sorprendentes; de hecho, el 90% de los datos que hoy existen se han generado en los últimos dos años.

Lee este artículo completo en el número más reciente de la Revista Mundo Contact.

Big Data: Un tsunami de información en las empresas

Por Mundo Contact | 1 enero 2012 | Articulos, Tecnología

Revista Mundo-Contact

   

Big Data: Un tsunami de información en las empresas

La explosión de la información demanda estrategias concretas por parte de las organizaciones para identificar y explotar su potencial de negocio

Jorge Cervantes

Si ya has escuchado el concepto ‘Big Data’, o grandes datos, sabes que es una de las tendencias más importantes en la industria de TI y un tema que le interesa a empresas de todos tamaños.

El término fue acuñado para describir grupos de datos que llegan a crecer tanto que es difícil manejarlos usando las herramientas tradicionales para administrar bases de datos.

Para manejar Big Data, es necesario implementar nuevas tecnologías y soluciones que permitan sacar ventaja de cantidades gigantescas de datos desordenados o poco estructurados, a fin de tomar decisiones críticas.

No solo las compañías de tecnología en el sector financiero y las grandes cadenas comerciales: prácticamente cualquier industria se enfrenta a estos retos.

El mundo hiperconectado de hoy genera cantidades de información que son como un mar caótico y furioso. Las empresas miran a ese mar como indomable, sin saber muy bien cómo navegar o surfear en él. Esas grandes olas de información se llaman Big Data y hoy las empresas tienen la oportunidad  beneficiarse de ellas.

Actualmente se crean diariamente más de 2.5 quintillones de bytes de datos procedentes de sensores, dispositivos móviles, transacciones electrónicas, redes sociales, etc. Este número sigue aumentando a tasas sorprendentes; de hecho, el 90% de los datos que hoy existen se han generado en los últimos dos años.

Es famosa la frase de Eric Schmidt, Director General de Google: “Entre el nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada. Ahora creamos cinco exabytes cada dos días”.

Ya desde 2010, una encuesta de IBM/MIT Sloan Management Review revelaba que de 3,000 ejecutivos en 30 industrias de 100 países, el 60% de los encuestados señalaban tener más datos de los que efectivamente podían usar.

Un estudio de 2011 de IBM entre más de 1,700 ejecutivos de marketing de 19 industrias y 64 países deja entrever que el tema es crítico, ya que 71% admitió que sus organizaciones no están preparadas para manejar la explosión de los datos.
 
Estos tsunamis de información están inundando a empresas de todos tipos, tamaños y de diversas industrias, sin embargo parece increíble lo poco que se están aprovechando.

Mundo Contact habló con tres especialistas del tema para entender los retos y beneficios de hacerle frente a ese mar de datos.

Datos enormes

Miguel Chanona“Para ser exitoso manejando Big Data, es básico contar con una solución capaz de registrar y procesar grandes volumenes de datos (terabytes y petabytes) a la velocidad que éstos se generen, descartando aquéllos que no son relevantes.  La solución debe ser capaz de manejar múltiples tipos de datos y grandes volúmenes para convertirlos en información relevante para el negocio, apoyando los procesos y soluciones para la toma de decisiones” señaló Miguel Angel Chanona, Gerente de Soluciones de Administración de la Información en IBM de México.

Cuando hablamos de Big Data, se puede decir que los datos son enormes en tres aspectos: volumen, variedad y velocidad.

Volumen: Big Data viene en tamaño grande; las empresas están indundadas de información que alcanza terabytes e incluso petabytes de datos. Variedad: Big Data va más allá de los datos estructurados tradicionalmente, es decir que hay información desordenada y de muchos tipos: texto, audio, video, ligas, números y más. El reto en este rubro consiste en enfrentar grandes cantidades de información ‘no estructurada’ y hacer sentido de ella. Velocidad: Cuando hablamos de Big Data, también hablamos de información que fluye y crece a grandes velocidades. Por ejemplo, bases de datos que están actualizándose desde muy diversas fuentes y que necesitan ser analizadas en cortos períodos para tomar decisiones críticas de negocio.

Además de implicar grandes retos en estos tres ejes, Big Data representa oportunidades maravillosas para convertir esos mares de datos en oro puro con fines de inteligencia, ya que al hacer sentido de esta información, se alcanzan respuestas a preguntas que sin una solución adecuada son muy difíciles de responder.

Anteriormente era difícil acceder a los frutos de esos análisis complejos, pero ahora empresas como IBM, EMC y SAS, entre otras, ofrecen soluciones que permiten leer patrones en esas tormentas de información.

Ante el contexto actual en el que existen diversos tipos de datos estructurados, semiestructurados y no estructurados, las empresas deben contemplar la administración y el manejo eficiente de Big Data para sus procesos operativos y de toma de decisiones, si quieren permanecer competitivas.  

Eficiencia e inteligencia

Ramón MartínezPor su parte, Ramón Martínez, Director Comercial de SAS México, indica que una manera inteligente de aprovechar Big Data es con una estrategia de Grid Computing, que permita dividir trabajos masivos de información para que se trabajen en paralelo o por piezas. Con ello, es posible tener varios grupos de máquinas atendiendo procesos de trabajo segmentados, aprovechando así la potencia de cada uno de los equipos y reduciendo tiempos de respuesta.

“Un ejemplo para entender esto lo vemos en los bancos, con diversas unidades de negocio y datos que requieren análisis en tiempo casi real: si el área de marketing o de préstamos necesitan hacer análisis, es posible si se segmenta o se divide la capacidad de procesamiento en diferentes procesadores”, comenta Martínez.

La forma tradicional de hacer las cosas es tener todos los datos apilados en un solo lugar de manera ineficiente, con largas colas de espera por los resultados. SAS implementa una ‘malla’ o grid de servidores que comparten recursos y analítica.  Así, retomando el ejemplo del banco, se aísla el procesamiento analítico de las áreas de negocio en servidores por separado, más uno que consolida o integra a los demás. De esta forma se comparten diferentes recursos de manera eficiente, en un esquema de High Performance Computing. 
 
SAS utiliza un paradigma para Big Data que busca la eficiencia en el manejo de los datos de gran volumen, con velocidad, veracidad y aprovechando la complejidad de la información. Ello se conoce como VVVV (por las siglas de velocidad, variedad, volumen y valor).

Cuando se trata de grandes datos, además de mover un gran volumen de información de un lado a otro es necesario acceder a ella a una velocidad adecuada, ya que de esta forma se mejora la productividad.

La veracidad de la información se refiere a manejar los datos de manera confiable para que no se corrompan, pero lo más importante es saber organizarlos y entender qué significan para extraer un valor de esa complejidad.

“Las soluciones de Big Data están orientadas a tres grandes ventajas: minimizar el riesgo, maximizar productividad y aprovechar al máximo los costos e inversiones”, enfatiza Martínez.

Del almacenamiento al entendimiento

Rubén MoralesLos datos son la materia prima para la toma de decisiones en las organizaciones. Almacenar Big Data puede ser complicado cuando no se cuenta con la infraestructura óptima para ello, y ahora las empresas deben pensar no solo en almacenar, sino en usarla rápidamente de la manera más inteligente posible.

Para Rubén Morales, Arquitecto de Soluciones de EMC, los datos almacenados de una manera estática y monolítica (tablas, registros, aplicaciones) no dejarán de ser un simple registro hasta que se le otorgue movimiento a la información. Así, cada registro tendrá relevancia para aquellos usuarios que accedan a ella por niveles.
 
Cuando la información ya tiene sentido, se le puede abordar de diversas formas: puede utilizarse para hacer Business Intelligence, Analytics o Minería de Datos.

Los datos seguirán creciendo, tanto los estructurados como los no estructurados, pero pueden ayudar a tomar decisiones más certeras en fenómenos complejos y armar escenarios de negocio, así como conducir a respuestas con un alto nivel de certeza ante problemas o preguntas difíciles.

Un ejemplo poco ortodoxo del manejo de Big Data es entender el sentir de la gente sobre una película, para que la casa productora decida si hará una secuela. Para ello debe analizar la mayor cantidad de información al respecto: miles o millones de tweets, posts en blogs, comentarios en Facebook, votos en sitios especializados, etc. 

Para hacer el análisis de esos diversos tipos de información, hay que aplicar modelos para generar patrones de analítica, es decir, descubrir orden en el caos.

No solo los grandes pueden disfrutar de estas herramientas de inteligencia, ya que “para las pequeñas y medianas empresas hay propuestas a través de la nube, mediante las cuales se podría hacer mineria de datos. Es una muy buena práctica solventar entre todos la infraestructura para abatir costos y hacer llegar esta tecnología a empresas pequeñas, al gobierno y a las universidades”, comenta Morales.
 
“El reto más importante que enfrentan las empresas en este momento es darle valor a esas grandes cantidades de información. Entre más asertivo se sea en la toma de decisiones, habrá un mayor beneficio”, apunta el ejecutivo.

Big Data