Usuario:Lmorillas/intropyaytozgz/html

Lectura de una página html
El proceso básico consiste en utilizar un parser para analizar el documento. Amara tiene 3 parsers: amara.parse amara.bindery.parse amara.bindery.html.parse

Para usar documentos html usaremos el tercero, que además soporta documentos no válidos (tagsoup). El objeto que devuelve el parser es el que usamos para leer y modificar un documento web.

Búsqueda de las entradas de una revista
Barrapunto publica sus entradas como Para extraer los nombres de los artículos de la primera página:

Más ejemplos en http://wiki.xml3k.org/Amara/Recipes