¿Qué es Big data?


Big Data es el tratamiento informatizado de grandes cantidades de información, la definición de lo que es Big Data no ha cambiado con el tiempo, puesto que los sistemas informáticos son cada vez más potentes y cada vez pueden almacenar y procesar más datos de lo que se podía antes. Además dependen de la capacidad del procesador, para algunos el problema está en procesar cientos de gigabytes, mientras que para otros se trata de petabytes cuando se encuentran con problemas.

"Big data" es un término aplicado a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. Los tamaños del "big data" se encuentran constantemente en movimiento creciente, de esta forma en 2012 se encontraba dimensionada en un tamaño de una docena de terabytes hasta varios petabytes de datos en un único data set.

La combinación de las redes sociales como una nueva forma de vida y el número cada vez mayor de dispositivos para mantenerse conectado, han dado lugar a la generación de una fuente sin explotar de datos. Estos datos presentan un gran potencial para ayudar a las empresas a competir y avanzar. De la misma forma, el volumen, la velocidad y la variedad sin precedentes de los datos significa que las empresas que no están equipadas para analizarlos y extraer su valor empresarial potencial, enfrentan retos significativos. A medida que las organizaciones comienzan a analizar este tipo de información, es importante que la solución elegida pueda abordar tanto la inteligencia de negocios (business intelligence) como las variables clave.

Ahora que tuvieron un buen paneo de lo que es Big Data pasaremos a presentarles que es lo que ofrecen las empresas más grandes del mercado a lo que a software empresarial se refiere, por supuesto que estamos hablando de SAP, Oracle, Microsoft y el sistema Hadoop.

¿Qué piensan los ejecutivos sobre Big Data?



Proveedores de herramientas para Big Data


Big Data de SAP



La herramienta emblema de SAP para el análisis de Big Data es SAP HANA.  HANA resumiendo es la aplicación in-memory de SAP que consiste en un hardware y software ya enlatado que permite una velocidad de procesamiento nunca visto hasta la actualidad. Permite obtener unos increibles tiempos de respuesta al momento de realizar una consulta comparándolo con los "viejos sistemas"  de base de datos.

Los servidores de SAP HANA pueden variar en su dimensión dependiendo del requerimiento de la empresa, pero para que se den una idea actualmente IBM está vendiendo un HANA con 100 TB de RAM.

Pueden obtener más información en español respecto a esta herramienta en el foro de SAP HANA o directamente ver información en inglés en http://help.sap.com/hana

Las herramientas de explotación de información para HANA brindadas por SAP son: Business Objects (BO) Web Intelligence, BO Dashboard Design, SAP Lumira, SAP Design Studio y BO Analysis.  De estas aplicaciones hablaremos más adelante en próximos post.

Se aclara que la información puede ser explotada por cualquier herramienta que utilice los conectores más utilizados del mercado tales como ODBC y JDBC. Empresas como Microstrategy ya contemplan la conexión directa por lo que se pueden realizar excelentes análisis con una potencia impresionante detrás que permitirá obtener la información que querramos a una velocidad inimaginada hasta hace poco tiempo.

Big Data de Microsoft


Big Data Microsoft


Arrancamos citando esta frase brindada por el vicepresidente de ingeniería de Microsoft:
"Cuando se trata de inteligencia de negocios, Microsoft SQL Server 2012 demuestra que la plataforma no ha dejado de avanzar y mantenerse al día con las novedades que se están produciendo en big data ".

David Mariani, Vice Presidente de Ingeniería, Klout
De su frase podemos decir que SQL Server 2012 es la herramienta que propone Microsoft para contener grandes volúmenes de datos.

Microsoft además propone utilizar en sus Windows Server y sistemas Azure la implementación de HD Insight que permite recaudar información tanto de por ejemplo un sistema Hadoop que tiene los datos desestructurados como desde un SQL Server Parallel Data Warehouse.

Big Data de Oracle


Oracle Big Data


Oracle Big Data ofrece una gama de productos para la organización de grandes volúmenes de datos, como:


También tienen herramientas como Oracle Exadata y Oracle Exalitics que es la herramienta de procesamiento en memoria brindada por Oracle para competir con SAP.

Tienen una muy buena presentación de la herramienta de Oracle en: http://www.oracle.com/lad/solutions/ent-performance-bi/business-intelligence/exalytics-bi-machine/overview/index.html

Big Data y Microstrategy


Cómo mencionamos en el apartado de SAP HANA, Microstrategy es una excelente herramienta para el análisis de la información. Sus nuevos caballitos de batalla son Visual Insight que permite un análisis in memory consumiendo de muchas fuentes de datos al mismo tiempo, tales como Datamarts, bases de datos, archivos planos, entre otros.

Pueden ver una excelente imagen comparativa de sus herramientas en: http://www.microstrategy.es/software/business-intelligence/high-performance/test-results/

Big Data y QlikView


Hace algún tiempo atrás mostramos las posibilidades de QlikView para trabajar con Big Data, los invitamos a pasar por este post para conocer más detalles de este esquema de trabajo.

Comentarios