Crear un web crawler con perl. Paso 2.
Ya hablamos de como encontrar lo que buscamos, ahora nos vamos a centrar en el código necesario para usar la expresión regular.
#!/usr/bin/perl
use strict;
use DBI;
use LWP::Simple;
Con esto comienza nuestro script, el cual llamaremos script.pl .
Ahora vamos a crear nuestro primer metodo con perl :
sub metodo(){
my $regex =
"<div class="personas"><p class="nombreytelefono">Nombre: <strong>([^>]+)</strong><br />Telefono: <strong>([^>]+)</strong></p></div>";
#definimos una variable regex en la que guardamos nuestra expresion regular
my $pagina = get ("http://cualquierpagina.com");
if (m/$regex/g){
print "Encontramos una persona llamada: ".$1."cuyo telefono es : ".$2.";
#"m/$regex/g" quiere decir que vamos a encontrar (match) lo que dice la expresion regular (regex) , pero TODOS los grupos (g)
#$1 y $2 corresponden al nombre y telefono (marcados entre parentesis en la expresion regular).
}
}
Con eso, y paciencia, encontraremos cualquier tipo de datos que se imprima en el html.
Esto solo pretende ser un "Como empezar", y no una guia completa que te haga el trabajo ;).