viernes, 29 de abril de 2016

El mundo de los algoritmos

Hoy he cogido una infografía de thinkbigdata.in.
Los algoritmos son la forma matemática en que se expresa la posible explicación a un problema.
Existen distintos tipos de algoritmos, casi todos ellos basados en estadística.  No existen algoritmos mejores ni peores, existen algoritmos más apropiados para cada tipo de problema.
Regresiones, modelos bayesianos, k-medias, arboles de decisión, clusters, redes neuronales... Si además hablamos de big data y machine learning, el algoritmo nos va dar la información oculta en los grandes datos.


lunes, 18 de abril de 2016

¿Qué es un Data Lake?

La tecnología evoluciona y la recopilación de datos de empresa también.  Las bases de datos relacionales que podían ser una buena opción hasta ahora, se van quedando cortas, por el volumen de información que la empresa genera.
Los Data Lake permiten que en las empresas se almacenen datos tanto estructurados como no estructurados, de distintas fuentes y que además estos puedan ser utilizados por los usuarios a los que se les de permiso en distintas categorias.  Todo el almacenamiento se basa en metadatos y pueden convivir tanto nuestra base de datos tradicional, como  lecturas de redes sociales o datos obtenidos en streaming.
La finalidad de los Data Lake es que la empresa pueda obtener beneficio del análisis de toda la información que se esté guardando.

Datalake

viernes, 1 de abril de 2016

Curso gratuito Big Data

El próximo 13 de Abril, comienza el curso en español y gratuito, "Big Data: el valor añadido de los datos en tu negocio".  En la plataforma mooc MiriadaX.
El contenido del curso consiste en una introducción al mundo Big Data, orientada a conocer cómo extraer valores escondidos de los datos manejados en cualquier negocio. Se explicarán técnicas de minería de datos aplicadas en los terminos de Big Data. También se considerarán aspectos de seguridad y privacidad.

https://miriadax.net/web/big-data-el-valor-anadido-de-los-datos-en-su-negocio
El curso intenta responder a las nuevas necesidades que han surgido recientemente en una sociedad  donde cada vez más la cantidad de datos y variables que rodean a la solución de un problema se incrementa de forma exponencial día a día. El objetivo del curso es proporcionar las bases necesarias para comprender y resolver la problemática de encontrar valores añadidos de los propios datos de un negocio utilizando herramientas dentro del campo del Big Data. Estas bases incluyen conocimientos generales sobre el paradigma Big Data, aspectos de seguridad, privacidad, coste, interfaces y el uso de técnicas de minerías de datos aplicadas al Big Data.
Google+