1. Artigoo.com
  2. »
  3. Cómo se hace y Educación
  4. »
  5. Manuales y Guías
  6. »
  7. Crear un web crawler con perl. Paso 2.

Crear un web crawler con perl. Paso 2.

Ya hablamos de como encontrar lo que buscamos, ahora nos vamos a centrar en el código necesario para usar la expresión regular.

 

#!/usr/bin/perl

use strict;

use DBI;

use LWP::Simple;

Con esto comienza nuestro script, el cual llamaremos script.pl .

Ahora vamos a crear nuestro primer metodo con perl :

sub metodo(){

my $regex = 

"<div class="personas"><p class="nombreytelefono">Nombre: <strong>([^>]+)</strong><br />Telefono: <strong>([^>]+)</strong></p></div>";

#definimos una variable regex en la que guardamos nuestra expresion regular

my $pagina = get ("http://cualquierpagina.com");

if (m/$regex/g){

print "Encontramos una persona llamada: ".$1."cuyo telefono es : ".$2.";

#"m/$regex/g" quiere decir que vamos a encontrar  (match) lo que dice la expresion regular (regex) , pero TODOS los grupos (g)

#$1 y $2 corresponden al nombre y telefono (marcados entre parentesis en la expresion regular).

}

}

 

 

Con eso, y paciencia, encontraremos cualquier tipo de datos que se imprima en el html.

Esto solo pretende ser un "Como empezar", y no una guia completa que te haga el trabajo ;).

Comparte este Goo: Meneame Fresqui Bitácoras Apezz Enchílame Reddit Mister Wong Facebook Delicious Digg Technorati Google Live MySpace Twitter

¿Te ha parecido útil este Goo?  o  No.

¿Tiene contenido inapropiado?

Envía el Goo a un amigo:

Aún no hay ningún comentario. Se el primero en comentar este goo!

Deja tu comentario:

Si quieres recibir un mail cuando alguien responda un comentario en este goo, marca esta casilla.