La necesidad de analizar grandes cantidades de datos ha tenido un crecimiento significativo en los ├║ltimos a├▒os. Una soluci├│n a este problema se resolvi├│ mediante el uso del paradigma MapReduce ,cuya implementaci├│n open source es Apache Hadoop. Los programas de Hadoop est├ín escritos en el API de Java, sin embargo, otros lenguajes utilizan un enfoque m├ís abstracto con base en el paradigma MapReduce, como Pig o Jaql. Este art├şculo tiene como objetivo mostrar, mediante un ejemplo pr├íctico, el uso de Pig para analizar grandes vol├║menes de datos.

Enlace: http://www.ibm.com/developerworks/ssa/data/library/bigdata-apachepig/

Join The Discussion

Your email address will not be published. Required fields are marked *