Visualizzazione risultati 1 fino 2 di 2

Discussione: Installazione Selenium per risolvere URL immagini

  1. #1
    rigidbodyinteractive non è connesso Utente AlterBlog
    Data registrazione
    18-02-2019
    Messaggi
    39

    Predefinito Installazione Selenium per risolvere URL immagini

    Ciao a tutti, sto scrivendo un tool per l'importazione automatica di cataloghi forniti dai vari rivenditori. In pratica il rivenditore fornisce al negozio un catalogo in formato .xls e il mio script legge il contenuto, estrae i dati del prodotto e genera un csv.

    Il file xls contiene i links alla pagina del prodotto sul sito del fornitore, per esempio: https://ca.universaldist.com/item/de...5-caec876e2cc1

    quindi il mio script estrae il link con SimpleXLSX e lo include nel csv finale. Fin qui nessun problema. Quello che invece non funziona e' l'importazione delle immagini dal sito di provenienza. Il xls del fornitore non include i link alle immagini dei prodotti e non vuole farlo, nemmeno se scarico il catalogo dopo essermi loggato con un utente autorizzato.

    Quindi l'unica soluzione sarebbe quella di estrarre i link delle immagini come la pagina del prodotto fa, ovvero con un API gestito da JS che carica le immagini dinamicamente.

    Come vedete il sito e' di pubblico dominio, quindi scaricare le immagini dei prodotti dovrebbe essere 100% legale. L'idea che ho avuto e' di simulare un caricamento della pagina come farebbe un normale utente che cerca il prodotto(e visualizza le immagini quindi) e ad li mi ricavo i links.

    Potrei farlo per esempio con tolls come "Selenium" o cose simili ma mi sto chiedendo se e' installato su Altervista o no, o se eistono altri modi per ottenere il risultato

  2. #2
    L'avatar di alemoppo
    alemoppo non è connesso Staff AV
    Data registrazione
    24-08-2008
    Residenza
    PU / BO
    Messaggi
    23,330

    Predefinito

    Selenium non è installato su AlterVista. Puoi vedere cosa è installato con phpinfo().

    Se non ho capito male, vorresti recuperare delle immagini che non sono presenti nel csv.
    Non conosoco un metodo generico in PHP per recuperare contenuti caricati dinamicamente via JS.
    Le alternative richiedono un'analisi specifica del singolo sito, quindi non sono automatizzabili in modo generale.

    Ciao!

Regole di scrittura

  • Non puoi creare nuove discussioni
  • Non puoi rispondere ai messaggi
  • Non puoi inserire allegati.
  • Non puoi modificare i tuoi messaggi
  •