Profundizando en la API de Twitter: iPhone 4S vs. Galaxy Nexus

Analizamos algunos datos interesantes al profundizar en el debate entre el iPhone 4S y el Galaxy Nexus utilizando la API de búsqueda de Twitter. En el mundo actual, existe una gran cantidad de datos disponibles en línea que pueden utilizarse para investigación, análisis de mercado e inteligencia competitiva. Si bienGrandes volúmenes de datos"Puede ser un problema para aquellos que lo producen, lo almacenan y lo procesan, pero es muy beneficioso para nosotros, quienes buscamos respuestas. Afortunadamente, parte de esos datos están disponibles para ser consultados en línea, y, en particular, existe una gran cantidad de información sobre las interacciones en las redes sociales.

En este artículo, exploraremos cómo utilizar la API de búsqueda de Twitter desde MapForce, la herramienta de mapeo, conversión e integración de datos de Altova, para recopilar datos sobre las publicaciones recientes de los usuarios ("tuits") en dos temas muy populares: la comparación entre el "iPhone 4S" de Apple y el "Galaxy Nexus" como el último teléfono Android destacado, y para extraer algunos datos estadísticos sobre los usuarios que participan en esas discusiones. Una de las ventajas de la gran cantidad de datos disponibles hoy en día es que podemos consultarlos de maneras interesantes y extraerles nuevos significados.

Si bien existen, sin duda, muchos servicios que ya ofrecen información sobre las tendencias en temas de Twitter (por ejemplo, Trendistic), estos servicios solo ofrecen tendencias muy básicas y no nos permiten realizar análisis más profundos. Sin embargo, todos los datos subyacentes están disponibles si se está dispuesto a aprender un poco sobre las APIs de servicios web y cómo utilizarlas para extraer datos XML para su posterior procesamiento. Como punto de partida, utilizaremos la API de búsqueda de Twitter para consultar el flujo de los tuits más recientes y obtener los 100 mensajes más recientes que mencionen "Galaxy Nexus". Las Directrices de uso para la búsqueda en Twitter nos indican que utilizar ambas palabras en una consulta hará que se utilice el operador predeterminado, que es "Y", por lo que vamos a buscar publicaciones que contengan "Galaxy Y Nexus". Entonces, intentemos eso y solicitemos los 100 elementos más recientes:

http://search.twitter.com/search.atom?q=galaxy+nexus&rpp=100

Si sigue este enlace, obtendrá una segunda ventana que mostrará una gran cantidad de datos XML sin formato, estructurados de acuerdo con las especificaciones del formato de sindicación Atom. Alternativamente, podría solicitar los datos en formato JSON, si desea procesarlos directamente mediante código JavaScript, pero utilizaremos el formato Atom basado en XML para que podamos analizar fácilmente los datos y extraer la información que necesitamos. Visualizar el resultado de la búsqueda anterior en un navegador no es muy intuitivo, por lo que podemos echar un vistazo rápido a los datos XML en nuestro editor de XML preferido utilizando la función "Abrir desde URL":

Como pueden ver, los datos de cada entrada incluyen un código de idioma. Por lo tanto, en este ejemplo, extraeremos datos de este hilo de Twitter, así como de un segundo resultado de búsqueda sobre el "iPhone 4S", y los combinaremos en un archivo XML intermedio para un análisis posterior. Extraer datos XML es realmente fácil en MapForce: utilizando la opción "Insertar archivo XML", podemos insertar una fuente XML y, nuevamente, especificar la misma URL que antes. Si es necesario, MapForce creará automáticamente un esquema XML para los datos proporcionados, lo que nos permitirá visualizarlo y extraer información de él:

En nuestro mapeo, hemos incluido dos fuentes en el lado izquierdo: una que utiliza una cadena de consulta para buscar "Galaxy Nexus" y otra para buscar "iPhone 4S". En el lado derecho, hemos añadido un esquema XML simple que nos permitirá agregar nuestros datos y analizarlos de manera más conveniente en el futuro. En este caso, la correspondencia entre los dos lados es sencilla, ya que solo estamos extrayendo información básica sobre el usuario, la fecha y el idioma del tuit. Sin embargo, en otras aplicaciones, la correspondencia podría ser más compleja e incluir funciones, así como consultas a otras fuentes de datos, bases de datos o servicios web... La visualización de los datos XML resultantes se puede realizar directamente dentro de MapForce utilizando la pestaña de salida, y esto es lo que vemos como resultado de nuestra transformación de datos:

Ahora podemos utilizar fácilmente las funciones de generación de informes de StyleVision para agrupar estos datos por idioma dentro de cada tema y contar el número de publicaciones en cada idioma. Luego, podemos presentar estos datos en forma de gráficos circulares, lo que produce los siguientes resultados interesantes:

Obviamente, estos datos dependen en gran medida de la fecha y la hora de la ejecución, así como de los anuncios específicos que se estén realizando sobre estos productos, por lo que las cifras variarán considerablemente. Sin embargo, se pueden utilizar como una herramienta útil para monitorizar diferentes tendencias específicas de cada idioma. Una vez configurado, el informe se puede actualizar fácilmente con un simple clic para obtener una instantánea en ese momento determinado. Para un análisis a más largo plazo, sería necesario modificar un poco la configuración para consultar más de 100 tuits recientes. En este artículo, hemos utilizado la API de búsqueda de Twitter como un ejemplo de fuente de datos y solo hemos analizado el idioma como un único punto de datos, pero existen muchas otras fuentes de datos interesantes disponibles en línea, y este enfoque se puede utilizar en todas ellas de manera similar. Si desea experimentar con otras fuentes de datos y otros tipos de información que desee extraer, le invitamos a que lo pruebe por sí mismo.

A Se ofrece una versión de evaluación gratuita de MapForce, con una duración de 30 días, y no existen límites sobre cómo puede utilizarlo las demás características de la herramienta de mapeo y conversión de datos de Altova para tareas de procesamiento de datos que van más allá del análisis de tendencias en redes sociales