Extracción de tablas de datos de páginas web

TableToolsEn diversas ocasiones tenemos necesidad de extraer información de tablas publicadas en sitios web, actividad que para algunos de nosotros es muy frecuente, sobre todo cuando dedicamos parte de nuestro trabajo a la investigación y análisis de datos desde las organizaciones de la sociedad civil.

Aunque esto parace muy complicado es en realidad algo muy fácil de hacer con la herramienta adecuada.

Para facilitar esta tarea sugerimos utilizar el complemento TableTools2 para los navegadores Firefox o Iceweasel que nos permite copiar estos datos en menos de dos minutos; aunque también permite ordenar, buscar, filtrar, resumir, combinar y comparar tablas html, además de hacer gráficos de las mismas.

Vamos al sitio del complemento y hacemos click sobre el botón Add to Firefox para instalarlo.

Después probamos su uso en una tabla de datos publicada por el Instituto Electoral del Distrito Federal, que contiene los resultados de la elección de diputados del 2012 de mayoría relativa de los 40 distritos que existen en el D.F, en la pestaña condensado por distritos.

Tabla1

Aquí colocamos el puntero del mouse sobre la primera celda de la primera fila (Distrito), hacemos click derecho con el mouse y en la parte inferior del menú que se despliega seleccionamos TableTools2 y después la opción Copiar.

Tabla2

Entonces se despliega otro menú y seleccionamos la primera opción: Copiar como texto delimitado por tabulador, con lo que extraemos los datos y ahora podemos pegarlos en una tabla en un programa de manejo de hojas de cálculo, como nosotros utiloizamos software libre sugerimos el programa Calc de LibreOffice.

Tabla3

Abrimos una hoja de cálculo, seleccionamos la primera celda de la primera fila, hacemos click con el botón derecho del mouse y se despliga un menú, donde verificamos que la opción de separador sea la misma que cuando extrajimos los datos, en este caso la opción  de separador es Tabulador, hacemos click sobre aceptar y listo.

Tabla5

Tenemos ahora en una hoja de cálculo los datos que copiamos de la página web para hacer el análisis que consideremos adecuado.

Tabla6Los invitamos a explorar las otras opciones que nos permite TableTools2 y también a instalar y probar el complemento Table2Clipboard con el que podemos realizar tareas similares.

@oliveraherbert

 

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s