Paweł
Koralewski
starszy programista,
wiem ile nie wiem
Temat: zapis strony html z assetami
Szukam gotowej klasy/skryptu, która zapisze na dysku stronę HTML o adresie podanym jako parametr. Zależy mi, aby zapisane zostały również wszelkie assety (skrypty, cssy, obrazki).Skrypt ten będę chciał zmodyfikować, aby zapisywał obrazki, które pokazują się w LightBoxie.
A w ogóle to szukam skryptu, który zapisze mi aukcję z allegro oraz ofertę z otomoto :)
Przemysław R. pracownik
Temat: zapis strony html z assetami
ale czemu akurat PHP? wget to potrafi
Wojciech
Wendt
Właściciel,
Netidea.pl
Temat: zapis strony html z assetami
sprawdź to http://nilopc.net/php/web-scraper-2011-10-04.zipskrypt pobiera elementy z innych stron więc a aukcjami nie powinno być problemu.
Temat: zapis strony html z assetami
Paweł Koralewski:
Szukam gotowej klasy/skryptu, która zapisze na dysku stronę HTML o adresie podanym jako parametr. Zależy mi, aby zapisane zostały również wszelkie assety (skrypty, cssy, obrazki).
Skrypt ten będę chciał zmodyfikować, aby zapisywał obrazki, które pokazują się w LightBoxie.
A w ogóle to szukam skryptu, który zapisze mi aukcję z allegro oraz ofertę z otomoto :)
Czyżbyś wygrał przetarg dla US na soft do inwigilacji userów na allegro? :D
Pobierz sobie cały kod strony:
$www = file_get_contents('alledrogo.pl');
Później wyrażeniem regularnym przeleć ten kod w poszukiwaniu linków w head - CSS, JS, img
i pobierz je następnie za pomocą np. CURL
dopasuj zmieniająć linki pod własne ustawienia, zapisz i masz gotowy zrzut działający na swoim serwerze.Dawid M. edytował(a) ten post dnia 19.02.12 o godzinie 13:15
Paweł
Koralewski
starszy programista,
wiem ile nie wiem
Temat: zapis strony html z assetami
Przemysław R.:
ale czemu akurat PHP? wget to potrafi
wget nie pobierze obrazków, które są wyświetlane JSem
Przemysław R. pracownik
Temat: zapis strony html z assetami
Paweł Koralewski:
Przemysław R.:
ale czemu akurat PHP? wget to potrafi
wget nie pobierze obrazków, które są wyświetlane JSem
a skąd weźmiesz interpreter JS po stronie PHP?
Paweł
Koralewski
starszy programista,
wiem ile nie wiem
Temat: zapis strony html z assetami
Przemysław R.:
Paweł Koralewski:
Przemysław R.:
ale czemu akurat PHP? wget to potrafi
wget nie pobierze obrazków, które są wyświetlane JSem
a skąd weźmiesz interpreter JS po stronie PHP?
Nie napisałem, że chcę robić to automatycznie. Linki dla Lightboxa czy innego skryptu wyświetlającego obrazki najczęściej już są w treści strony, trzeba je tylko wyłuskać. Ewentualnie dopytać serwer. Dla każdej strony (serwisu), którą chciałbym sobie zachowywać, zamierzam to przeanalizować ręcznie.
Przemysław R. pracownik
Temat: zapis strony html z assetami
Paweł Koralewski:
a skąd weźmiesz interpreter JS po stronie PHP?
Nie napisałem, że chcę robić to automatycznie. Linki dla Lightboxa czy innego skryptu wyświetlającego obrazki najczęściej już są w treści strony, trzeba je tylko wyłuskać. Ewentualnie dopytać serwer. Dla każdej strony (serwisu), którą chciałbym sobie zachowywać, zamierzam to przeanalizować ręcznie.
no to będzie działać do kolejnej zmiany - lipa trochę, wymaga ciągłego pilnowania
Paweł
Koralewski
starszy programista,
wiem ile nie wiem
Temat: zapis strony html z assetami
Przemysław R.:
no to będzie działać do kolejnej zmiany - lipa trochę, wymaga ciągłego pilnowania
Co konstruktywnego wniosły Twoje wypowiedzi?
To było pytanie retoryczne, proszę nie odpowiadaj.
Mam nadzieję, że ktoś inny podpowie coś, czego będę mógł uźyć w tym konkretnym przypadku.
Przemysław R. pracownik
Temat: zapis strony html z assetami
Paweł Koralewski:
Przemysław R.:
no to będzie działać do kolejnej zmiany - lipa trochę, wymaga ciągłego pilnowania
Co konstruktywnego wniosły Twoje wypowiedzi?
ale to jest konstruktywna odpowiedź, tyle że jej nie zrozumiałeś
każda zmiana po stronie serwera automatycznie wymusza zmianą w kodzie czegokolwiek co będzie ci pobierać dane - to fakt oczywisty
jeżeli chcesz mieć bardziej eleganckie rozwiązanie to automatyzuj przeglądarkę po stronie serwer, tyle że to też nie da 100% pewności że nie będziesz musiał poprawiać co jakiś czas
a co do reszty po co się obruszać na tak oczywiste fakty?
