A volte è utile avere un elenco di tutti gli URL contenuti in una pagina Web. L’elenco fornisce una mappa del sito che può aiutarti a esplorare il sito più facilmente e fornisce informazioni utili sugli altri siti con collegamenti nella pagina. È possibile creare un piccolo script PHP che utilizza un’espressione regolare per estrarre tutti gli URL in una pagina Web, archiviarli in un database MySQL e visualizzare l’elenco sullo schermo.
Ottieni i contenuti della pagina web
La funzione PHP “file_get_contents” fornisce un modo semplice per caricare l’intero contenuto di una pagina Web in una singola variabile stringa. Una volta in una variabile, è facile analizzare l’intero contenuto della pagina con un’espressione regolare. Passa l’URL della pagina Web alla funzione e controlla il valore restituito per “false” nel caso in cui il recupero non sia riuscito. Per esempio: