Conferencia de Data Analytics con AWS

16/03/2016
Teresa Berzosa

El pasado 24 de Febrero tuvo lugar un evento de repercusión mundial en Barcelona, seguro que ya sabéis de que estamos hablando… ¡Efectivamente! El Mobile World Congress. Mind Analytics asistió, como no podía ser de otra manera, a las conferencias que dio Amazon Web Services en el WTC: Data Analytics con AWS.

Abrió la sesión el Sr. Werner Vogels, CTO y vicepresidente de Amazon.com, donde introdujo los pilares con los que se basa AWS: Seguridad, confianza, rendimiento, escalabilidad y coste. Seguidamente dividió AWS en 6 áreas:

Área 1: Analytics everywhere. Es importante analizar la informaión recopilada del pasado y la que se está obteniendo del presente con el fin, mediantes modelos predictivos y aprendizajes automáticos, de realizar predicciones.

Área 2: Data is the core. Los diferentes sistemas que ofrece AWS para almacenar los datos, imágenes, ficheros, entre otros.

Área 3: A choice in computer. Escoger el mejor modelo que necesite cada empresa para montar si arquitectura, si virtual, en containers o funciones.

Área 4: Simplifying Mobile. AWS ofrece unos recursos para testear las aplicaciones como si se ejecutaran en entornos de teléfonos móviles o tabletas.

Área 5: Connected devices everywhere. Se introduce en el mundo del Internet de las Cosas (IoT – Internet of Things)

Área 6: Deep Security Everywhere. Y en último lugar, pero no menos importante, es garantizar toda la seguridad desde cualquier lugar.

Una vez finalizada la intervención de CTO se iniciaron cuatro sesiones específicas para el mundo del Big Data

  1.  Los Datos no estructurados son aquellos que se obtienen de las redes sociales, ficheros Multimedia o textos libres que no siguen una estructura. Toda esta información se debe almacenar de tal forma que sea fácil y rápido acceder a ella. Para ello nos ofrece el Elastic MapReduce (EMR).
  2. Los Datos Estructurados son aquellos que almacenamos en Bases de Datos y AWS nos ofrece Redshift. Lo más importante es de la forma que se almacena la información entre los diferentes servidores y como se indexan los campos para que las consultas sean lo más eficientes posibles.
  3.  Los Datos en Tiempo Real, lo que se llama Data Stream, Amazon nos ofrece una plataforma para estos datos llamada Kinesis. Esta plataforma se divide en una familia de productos
    • Kinesis Stream: Procesa TeraBytes de información en tiempo Real.
    • Kinesis Firehose: Permite guardar los datos directamente en AWS, tanto en S3 como en Redshift.
    • Kinesis Analytics: Permitirá realizar analíticas en tiempo real sin necesidad de guardar los datos y las consultas se podrán realizar mediante SQL estándar aunque la información se encuentre almacenada en sistemas no relacionales.
  4. El Aprendizaje de los Datos es lo que se entiende como Business Intelligence en el que, a partir de los datos que se alimentan en el sistema, se analizan para tomar las decisiones oportunas. Para ello han creado Amazon QuickSight con el que se permitirá crear de forma rápida informes y análisis ad-hoc y dashboards

Image and video hosting by TinyPic

Al término de cada sesión, el técnico Danilo Poccia realizó unas demostraciones en tiempo real para mostrarnos como funciona cada herramienta de AWS.

En el evento fueron invitadas varias empresas como testimonio de los beneficios que aporta tener la tecnología de AWS en las empresas. Estas empresas fueron: RavenPack que tiene una infraestructura en AWS para su Big Data; Veniam hablándonos sobre el Internet de las Cosas en Movimiento y Wallapop que usa el análisis de los datos sobre AWS.

Esperamos que os guste el artículo y os sirva de ayuda a todos los que no pudisteis asistir al MWC, especialmente a los que os apasiona este campo  🙂

Happy Analizing!

Autor: Albert Coca Viñas