Website kopieren

plutoniumsulfat

Enthusiast
Thread Starter
Mitglied seit
01.12.2015
Beiträge
2.835
Hallöle,

ich suche eine Möglichkeit, eine komplette Webseite zu kopieren, damit ich darin offline browsen kann.

Ich habe es schon mit dem WinHTTrack versucht, allerdings sichert der mir - warum auch immer - keine Bilder und auch einige tiefere Links, obwohl ich die Linktiefe nicht beschränkt habe und Bilder auch nicht ausgeschlossen.

Kann mir jemand weiterhelfen?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Moin, moin,

habe auf Grund der Anfrage gerade einen kleinen Selbstversuch für eine kleine Homepage (4 Ordnerebenen tief) gemacht.

Dazu die Software WinHTTrack in der Version 3.49-2 (httrack_x64-noinst-3.49.2.zip) vom USB-Stick aus gestartet.

An den Programmeinstellungen ist nur das Filter um *.mp4-Dateien erweitert worden, sonst keine Einstellungen vorgenommen.

Danach den Kopiervorgang gestartet und vielleicht 3min gewartet - für ca. 500MB.

Anschließend die kopierte Webseite lokal aufgerufen - ohne Probleme, alles wurde kopiert (einschließlich aller Bilddateien und Videos) und neu verlinkt, auch die externen Links funktionieren.

Gruß eines Matrosen aus LDS
 
Genau das klappt leider nicht. Die Textbeiträge klappen nach vielen Versuchen, die Bilder nimmt er nicht. Wobei selbst der Text mit knapp 100MB einige Stunden gedauert hat.
 
Kann es auch an der Struktur der Seite selbst liegen?

Die Beiträge liegen unter domain.de/Unterseite. Die Bilder sind unter domain.de/Unterseite2/images/ zu finden, allesamt mit kryptischem Namen direkt in diesem Verzeichnis.
 
Die von mir getestete Struktur der Webseite ist sehr einfach und sieht z.B. wie folgt aus:

domain.de\bilder2010\790x592\thumbs\DSC00441.jpg

struktur-server.jpg
 
Zuletzt bearbeitet:
Wie muss ich die Einstellungen ändern, damit es bei meiner Seite passt?
 
Habe das Kopieren mit einer anderen Homepage wiederholt. Beispiel: Homepage Gemeinde Tiefenort - Gemeinde Tiefenort an der Werra

Der Kopiervorgang startete ganz normal. Mit fortschreitender Kopierzeit war aber festzustellen, dass die einzelnen kopierten Inhalte (z.B. Bilder) nicht mehr in der zweiten Zeile im unteren Fensterteil "scannen" angezeigt werden (WinHTTrack-07.jpg). Was wird da noch kopiert??

Den Kopiervorgang habe ich dann nach ca. 1,5 Stunden abgebrochen. (Hätte man wahrscheinlich schon früher machen können?!)

Ein Aufruf der kopierten Homepage mit allen Inhalten war aber problemlos möglich.

WinHTTrack-01.jpg
WinHTTrack-02.jpg
WinHTTrack-03.jpg
WinHTTrack-04.jpg
WinHTTrack-05.jpg
WinHTTrack-06.jpg
WinHTTrack-07.jpg
WinHTTrack-08.jpg
 
Ich glaube es nicht....

hab jetzt mal alles so wie bei dir eingestellt und siehe da: Er lädt jetzt auch die Bilder mit.

Ich hab bei den Filterregeln die Dateitypen über Links einschließen hinzugefügt und nicht über die Häkchen....
 
Update: Geht natürlich doch nicht. Das kann doch nicht wahr sein. Wenn ich die Links zu den Bildern einzeln hinzufüge, klappt es, aber das Oberverzeichnis funktioniert nicht?
 
Um welche Seite handelt es sich denn?


Gesendet von iPad mit Tapatalk Pro
 
Das kann ich leider nicht verraten, auch wenn das die Fehleranalyse schwierig gestaltet, ich weiß :d

Edit: Als Fehlermeldung kommt nur 404 - scheinbar wird kein Inhalt im Verzeichnis gefunden, obwohl welcher da ist. Warum?
 
Zuletzt bearbeitet:
Die Fehlermeldung "404" könnte hier wohl darauf hinweisen, dass im Verzeichnis der Webseite ein Link vorhanden ist und verfolgt wird, dieser aber nicht korrekt ist und somit das Ziel des Links nicht gefunden werden kann (z.B. eine verlinkte Seite, der Link zu dieser Seite enthält aber eine absolute Pfadangabe).
 
Die Bilder liegen alle direkt im Verzeichnis, einzeln lassen sie sich laden
 
Möglicherweise kommt dir CORS / cross-origin in die Quere.

Das ist ein Sicherheitsfeature im Web, das die Ausführung von fremdem Schadcode verhindern soll. Normalerweise kommt man als Anwender damit nicht in Berührung, aber manche Browser verhalten sich anders, wenn der Content lokal und nicht auf einem Server liegt.
Du kannst es mal mit einem anderen Browser probieren, vielleicht hast du Glück.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh