per C *.html Dateien herunterladen?

Vorher

Semiprofi
Thread Starter
Mitglied seit
22.03.2003
Beiträge
3.916
Ort
Wien (Österreich)
Hallo Leute.

Ich wollte fragen ob dies möglich ist. Habe google schon bemüht aber mit c und html naja da kommt eigentlich alles aber nichts sinnvolles.

Also kurz zusammengefasst ich möchte *.html Dateien herunterladen und in einem Ordner ablegen

Sollte ja eigentlich trivial sein. :)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
kurze frage, zu welchem zweck... willst du seiten offline betrachten? Denn falls ja musst du bedenken, dass nur den Quelllcode einer seite bekommst in dem sich viele referenzen befinden, vorallem auf bilder etc
 
In VB.net gibt es ein Element dafür. Nennt sich Webbrowser und ist im Prinzip der IE nur ohne URL und Buttons und so. Das tolle an dem Gerät ist, dass man damit die Seite runterladen kann und dann zur Laufzeit bearbeiten. Also kannst du dir deinen eigenen IE basteln, der aus luxx zum Beispiel delux macht und schon hättest du auf dieser Seite hier anders benannte Links. Die Funktionalität wär immernoch gegeben. Damit lassen sich auch hidden Fields befüllen. Alles was du dir eben in dem Zusammenhang vorstellen kannst ist damit möglich.

Ob es das in C auch gibt kann ich dir nicht sagen.
 
Mir geht es rein um den Text(Quelltext) der sich auf der Seite befindet. Bilder oder sonstiges Interessieren mich nicht.
 
rechte Taste => Quelltext anzeigen.

ist das was Du haben willst?
 
"Ja" aber eben mit C und die *.html-Datei lokal speichern. Das ganze soll dann in einer Schleife ablaufen um mehrere *.html-Dateien zu speichern. Oder die URL's kommen aus einer Liste mal schauen wie ich das regle das werde ich dann schon sehen.
 
Das einzige was mir im moment einfaellt wie man das ganze lösen könnte und wie ich es zb auch unter php machen würde. Ist eine Connection zum Webserver zu öffnen. also so zusagen sock_open("forumdeluxx.de",80) oder wie auch immer der befehl heißt und an den einen http request absetzen.
 
Das einzige was mir im moment einfaellt wie man das ganze lösen könnte und wie ich es zb auch unter php machen würde. Ist eine Connection zum Webserver zu öffnen. also so zusagen sock_open("forumdeluxx.de",80) oder wie auch immer der befehl heißt und an den einen http request absetzen.

jup

genau so ne klasse hab ich grad erst in C# geschrieben.... allerdings dürfte es in C noch schwieriger werden, da er afaik selber sockets basteln muss etc, sprich noch tiefer in die Materie hinein muß
 
Muss es denn unbedingt in C# sein?
Ansonsten kann ich dir den httrack an Herz legen, stell den Filter auf rein html ein und du kannst soviele Seiten wie du willst per link in einer liste herunterladen.
 
Hm ich will es einmal mit C probieren. Wenn das nicht klappt muss ich so und so die Seiten mit einem Programm herunterladen und dann weiter bearbeiten. Von Vorteil wäre gewesen das ich einfacher die URLs einstellen kann...
 
Das einzige was mir im moment einfaellt wie man das ganze lösen könnte und wie ich es zb auch unter php machen würde. Ist eine Connection zum Webserver zu öffnen. also so zusagen sock_open("forumdeluxx.de",80) oder wie auch immer der befehl heißt und an den einen http request absetzen.

Sockets sind die einzige Möglichkeit wie du die Daten kriegen kannst. Schau dich etwas zu dem Thema um, gibt genug Info Material. Wenn du auf C++ setzt kannst du die neue Boostlib Asio benutzten.

mfg squall
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh