Archivado | Analiza Tweets con Jupyter Notebooks

Contenido archivado

Fecha de archivo: 2019-05-15

Este contenido ya no se actualiza ni se mantiene.
El contenido se proporciona “como está”.
Dada la rápida evolución de la tecnología, algunos contenidos, instrucciones o ilustraciones pueden haber cambiado.

Resumen

Construido para desarrolladores que pueden no tener experiencia en data science, este Code Patterns representa una vía rápida para el aprovechamiento de datos de Twitter y extraer Insights interesantes, enriquecidos previamente desde IBM Cloud analizando gran cantidad de información con de Jupyter notebooks.

Descripción

Como parte de nuestro esfuerzo continuo por democratizar la ciencia de datos, el objetivo de este Code Patterns es enseñar a los desarrolladores que tienen un interés en aplicaciones de data science, pero no necesariamente un enfoque especializado. Le mostramos cómo crear rápidamente potentes visualizaciones de datos utilizando IBM y tecnologías de código abierto, eliminando así la necesidad de contar con equipos especializados en data science. Reduce el tiempo de evaluación con una base de conocimiento, lo que generalmente toma mucho más tiempo para construir.

A partir de este escenario, aprenderá a crear un almacén dashDB que contenga datos de Twitter, y datos avanzados como: sentimiento, género y ubicación. Después de crear un servicio de Insights para Twitter mediante IBM Cloud, cargará los tweets en dashDB y los analizará en Jupyter Notebook utilizando SparkContext y pandas (biblioteca de análisis de datos Python). Con Jupyter, usted podrá compartir fácilmente los resultados con otros. También vamos a demostrar cómo puede crear visualización de datos con Matplotlib y Google GeoChart.

Flujo

Diagrama de las etapas para crear la aplicación

  1. El desarrollador añade los servicios IBM Cloud que se necesitan para esta aplicación, dashDB para Analísis, e Insights para Twitter.
  2. El desarrollador crea una libreta en IBM Cloud utilizando DSX Spark Service.
  3. SparkContext permite que el desarrollador ejecute tareas en el clúster de Spark.
  4. dashDB analiza los tweets cargados y los tweets especificados de Twitter.

Instrucciones

¿Listo para poner este Code Pattern en uso? Los detalles completos sobre cómo comenzar a ejecutar y usar esta aplicación se encuentran en el archivo README.

Aviso

El contenido aquí presentado fue traducido de la página IBM Developer US. Puede revisar el contenido original en este link.