Ciao a tutti, sto scrivendo un tool per l'importazione automatica di cataloghi forniti dai vari rivenditori. In pratica il rivenditore fornisce al negozio un catalogo in formato .xls e il mio script legge il contenuto, estrae i dati del prodotto e genera un csv.
quindi il mio script estrae il link con SimpleXLSX e lo include nel csv finale. Fin qui nessun problema. Quello che invece non funziona e' l'importazione delle immagini dal sito di provenienza. Il xls del fornitore non include i link alle immagini dei prodotti e non vuole farlo, nemmeno se scarico il catalogo dopo essermi loggato con un utente autorizzato.
Quindi l'unica soluzione sarebbe quella di estrarre i link delle immagini come la pagina del prodotto fa, ovvero con un API gestito da JS che carica le immagini dinamicamente.
Come vedete il sito e' di pubblico dominio, quindi scaricare le immagini dei prodotti dovrebbe essere 100% legale. L'idea che ho avuto e' di simulare un caricamento della pagina come farebbe un normale utente che cerca il prodotto(e visualizza le immagini quindi) e ad li mi ricavo i links.
Potrei farlo per esempio con tolls come "Selenium" o cose simili ma mi sto chiedendo se e' installato su Altervista o no, o se eistono altri modi per ottenere il risultato
Selenium non è installato su AlterVista. Puoi vedere cosa è installato con phpinfo().
Se non ho capito male, vorresti recuperare delle immagini che non sono presenti nel csv.
Non conosoco un metodo generico in PHP per recuperare contenuti caricati dinamicamente via JS.
Le alternative richiedono un'analisi specifica del singolo sito, quindi non sono automatizzabili in modo generale.