Igor Janicki

Igor Janicki Software maker.
Java, Perl ...

Temat: coś do ściągania stron na Word/Acrobat

Szukam jakiegoś programu, skryptu, który umożliwi ściągnięcie (i archiwowanie) zawartości stron internetowych do plików RTF/DOC/PDF.

jest zgoda autora, więc nie ma żadnych problemów z prawem autorskim.

od paru dni przeszukuję net, od czasu do czasu, coś instaluję. avast czasem wyje. niestety programy albo nie dają się instalować albo nie da rady wypróbować przed zapłaceniem, względnie to nie jest to o co chodzi.

gdyby to było parę stroniczek - to bym zachował przez przeglądarkę, ale trochę tego jest.

może jest coś do uruchomienia wsadowego niczym cURL ?
Piotr Ż.

Piotr Ż. Director of UX EMEA

Temat: coś do ściągania stron na Word/Acrobat

Igor Janicki:
Szukam jakiegoś programu, skryptu, który umożliwi ściągnięcie (i archiwowanie) zawartości stron internetowych do plików RTF/DOC/PDF.

no al ew czym problem w zasadzie? acrobat pelny [nie reader] i jedziesz ba da sie nawet oskryptowac
Igor Janicki

Igor Janicki Software maker.
Java, Perl ...

Temat: coś do ściągania stron na Word/Acrobat

nie mam pełnego acrobat'a
mam (stary) Word.

no i lepszy byłby plik wyjściowy RTF.
Michał Sznurawa

Michał Sznurawa Scala Developer

Temat: coś do ściągania stron na Word/Acrobat

Na Twoim miejscu podzieliłbym to zadanie na dwie części. Najpierw bym tą stronę ściągnął na dysk, a potem dopiero przekstałcał do wybranego formatu.

Ściągnąć można np. tym czymś http://www.httrack.com/ albo jakiś własny mały skrypcik popełnić (właśnie z wykorzystaniem wspomnianego curla). Potem zostaje skonwertować, ale chyba łatwiej znaleźć konwerter między formatami niż program pt. "ściągnij i przekształć";)

Ewentualnie jest taka fajna biblioteka dla PHP nazywa się html2pdf (ew. ps) http://www.tufat.com/s_html2ps_html2pdf.htm - można jej podać adres url podstrony, a skrypt ściąga html i tworzy na jego podstawie pdf/ps. No ale to nie będzie rtf;)
Łukasz C.

Łukasz C. Senior Technical
Architect

Temat: coś do ściągania stron na Word/Acrobat

hmm moze wget pozniej find i html2pdf ?
Piotr Skiba

Piotr Skiba Własna działalność
gospodarcza / Web
Developer /
Programista

Temat: coś do ściągania stron na Word/Acrobat

Skorzystaj z TeleportPro - wprawdzie nie zachowuje dokładniej struktury plików na serwerze tak jak http://www.httrack.com/ ale zgrywa wszystko :)

Także masz wybór httrack albo teleport pro

konto usunięte

Temat: coś do ściągania stron na Word/Acrobat

Igor Janicki:
do kopii zawartości polecam WebCopier - pełen automat
http://www.maximumsoft.com/products/wc_windows/overvie...
... TeleportPro sobie nie radzi z niektórymi serwisami

możesz też zapisać strony do MHT - idealna kopia 1:1
Opera i IE mają wbudowaną obsługę jako "zapisz jako",
dla FireFox ściągasz http://www.unmht.org/unmht/en_index.html i tam jest opcja zapisu kilku strona na raz też z automatu

Zapis bezpośrednio do PDF umożliwi Ci
http://pdfmyurl.com/
http://web2.pdfonline.com/

Następna dyskusja:

Tworzenie stron internetowy...




Wyślij zaproszenie do