Domanda su possibile script

09-07-2010, 15.26.27

Salve a tutti, apro questo thread per farvi una domanda semplice:
sarebbe possibile utilizzando fsockopen o cURL prendere i link presenti in una pagina e copiarli in un file .txt? o almeno i numeri che sono alla fine dei link presenti in quella pagina...
Ho cercato un pò in giro ma non ho trovato niente di che

Spero di essermi spiegato bene....grazie anticipatamente.

**javascripter** · 09-07-2010, 16.46.16

È possibile, per recuperare i link puoi usare le espressioni regolari.
La funzione che dovrai utilizzare sarà: preg_match_all

Puoi fare una ricerca sulle espressioni regolari, se hai problemi non esitare a chiedere aiuto.

09-07-2010, 16.57.17

Ti ringrazio per la risposta ma una cosa che non mi è chiara è come cercare i link dopo essermi connesso al sito:
per connettermi uso questo script

Codice PHP:


<?php

$fp = fsockopen("www.sito.it", 80, $errno, $errstr, 30);

if (!$fp) {

    echo "$errstr ($errno)<br />\n";

} else {

    $out = "GET HTTP/1.1\r\n";

    $out .= "Host: www.sito.it\r\n";

    $out .= "Connection: Close\r\n\r\n";

    fwrite($fp, $out);

    while (!feof($fp)) {

        echo fgets($fp, 128);

    }

    fclose($fp);

}

?>

in pratica ho capito che devo usare quella funzione ma non saprei come modificare lo script di sopra

**javascripter** · 09-07-2010, 17.06.01

Prima di tutto hai bisogno di salvare il sorgente in una variabile e poi applicare l'espressione al sorgente stesso ( scusa ma ti modifico lo script, al posto di fsockopen userò curl ).

Codice PHP:


<?php
$ch = curl_init('http://www.sito.it/');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$code = curl_exec($ch);
curl_close($ch);

preg_match_all('/<a([^>]*)>(.+?)<\/a>/is', $code, $m); // questa regexp è generica, cattura tutti i tag <a>

$attributi = $m[1];
$contenuto = $m[2];

// con un loop ti estrai dato per dato e lo salvi nel file.

Se spieghi meglio cosa vuoi fare, ti aiuto. ( ti serve solo il link che si trova nell'attibuto href ?? )

09-07-2010, 17.42.32

In pratica dovrei crearmi un db su degli oggetti...questi oggetti vengono riconosciuti tramite id numerico che si trova in fondo al link del sito in questione...il problema è che i link si vedono solo in basso a sinistra(nella casella del browser) e solo se ci passi il mouse sopra(in pratica nell'html del sito non ci sono tag href forse perchè li generano con javascript o simili)

Se mi sono espresso male non mi resta che linkarvi un esempio:
http://www.wowhead.com/npc=28803

come vedi in quel link sotto ci sono diversi oggetti e i link che mi interessano si vedono solo se passi il mouse sopra le img, esempio:
http://www.wowhead.com/item=38551 io dovrei prendere quel 38551 o tutto il link e poi con le espressioni regolari mi ricavo il numero da solo

**javascripter** · 09-07-2010, 17.51.59

Se i link vengono generati con javascript, non credo che sia possibile recuperarli ( almeno usando solo php, senza appoggiarsi a servizi esterni ).

**karl94** · 09-07-2010, 19.06.16

Originalmente inviato da furion

In pratica dovrei crearmi un db su degli oggetti...questi oggetti vengono riconosciuti tramite id numerico che si trova in fondo al link del sito in questione...il problema è che i link si vedono solo in basso a sinistra(nella casella del browser) e solo se ci passi il mouse sopra(in pratica nell'html del sito non ci sono tag href forse perchè li generano con javascript o simili)

Se mi sono espresso male non mi resta che linkarvi un esempio:
http://www.wowhead.com/npc=28803

come vedi in quel link sotto ci sono diversi oggetti e i link che mi interessano si vedono solo se passi il mouse sopra le img, esempio:
http://www.wowhead.com/item=38551 io dovrei prendere quel 38551 o tutto il link e poi con le espressioni regolari mi ricavo il numero da solo

Tutte quelle informazioni sono presenti nel sorgente HTML, sotto forma di oggetto Javascript, ma credo che possa leggerle anche con json.
Guarda attentamente le righe 139 e successive.

09-07-2010, 19.18.19

ho fatto una rapida ricerca per sapere cosa fosse json e non c'ho capito gran che su come usarlo :V

**karl94** · 09-07-2010, 19.24.42

Prima di tutto, hai letto la voce su Wikipedia?

09-07-2010, 19.32.55

sisi avevo letto proprio quello cercando su google :V

**javascripter** · 09-07-2010, 20.31.10

In php puoi usare semplicemente json_decode, l'importante è che recuperi l'oggetto.

09-07-2010, 21.13.41

quindi catturo tutti gli id con le espressioni regolari e poi le passo a json_decode? mi sto intrecciando :S

Discussione: Domanda su possibile script

Strumenti discussione

Display

Domanda su possibile script

Regole di scrittura