Scraping de contenidos e integración en Drupal 8

Ponente: 

Aplicación de un caso práctico de extracción de contenidos de la web de la Universidad de Santiago de Compostela (USC) usando técnicas de scraping para su posterior integración en Drupal 8.

Un pequeño resumen de los apartados que veremos:

* Instalación de las herramientas necesarias (Scrapy)
* Tipos de crawlers
* Expresiones para recuperación de contenidos dentro del árbol DOM (expresiones regulares, Xpath, CSS)
* Limpieza de código HTML, tratamiento de imágenes y ficheros
* Integración en Drupal utilizando Drush

Información

Nivel experiencia: 
Intermedio
Audiencia: 
Desarrolladores
Casos de estudio
Versión de Drupal: 
Drupal 8.x