La necesidad de analizar grandes cantidades de datos ha tenido un crecimiento significativo en los últimos años. Una solución a este problema se resolvió mediante el uso del paradigma MapReduce ,cuya implementación open source es Apache Hadoop. Los programas de Hadoop están escritos en el API de Java, sin embargo, otros lenguajes utilizan un enfoque más abstracto con base en el paradigma MapReduce, como Pig o Jaql. Este artículo tiene como objetivo mostrar, mediante un ejemplo práctico, el uso de Pig para analizar grandes volúmenes de datos.

Enlace: http://www.ibm.com/developerworks/ssa/data/library/bigdata-apachepig/

Join The Discussion

Your email address will not be published. Required fields are marked *