Seitenquelltext öffnen und durchsuchen

Du bist neu in der Welt von C++? Dann schau hier herein!
Antworten
Paddre
Beiträge: 30
Registriert: 10. Februar 2009 09:46

Seitenquelltext öffnen und durchsuchen

Beitrag von Paddre »

Moinmoin.

Ich möchte ein C++-Programm schreiben welches den Quellcode einer Webseite öffnet und diesen nach bestimmten Wörtern durchsucht.

Da ich nch relatic frisch in C++ bin weiß ich nicht genau wie ich anfangen soll.

Das nützlichste ergebnis meiner Suche erscheint mir dieses:
Es läuft alles über Sockets.
Du baust eine Socket auf Port 80 zum Webserver auf (wenn die Seite auf Port 80 läuft) und sendest den Header (RFC).
Danach gibt dir der Server etwas als Text auf den gleichen Socket zurück.
Dies ist dann die Webseite. (HTML oder was auch immer)
Dies kannst du dann durch einen Parser der eben HTML, XHTML, Flash, JS, oder was auch immer versteht.
Es können auch Binärdaten wie Bilder, Dateien oder ähnliches kommen.
Denke mal darauf kann man aufbauen...aber leider bringen mir diese theoretischen Vorschläge überhaupt nix, weil ich einfach nicht das know-how habe um das umzusetzen. Hoffe ihr könnt mir helfen oder mich auf nützliche Seiten verweisen (ja ich habe schon google getreten und die SuFu dieses Forums benutzt)

Das programm soll eine Übung für mich sein und benötigt zunächst keine grafische Oberfläche, da die URL bekannt ist.

Vielleicht hat ja jemand etwas ähnliches schonmal gemacht und kann mir helfen :)
RHBaum
Beiträge: 1436
Registriert: 17. Juni 2005 09:58

Beitrag von RHBaum »

Die frage iss, wie lowlevel soll deine uebung sein ???
Und was genau willst du lernen ?
C++ ? QT ? HTTP ?

wenn du alles lowlevel machen willst, solltest du dich mit c++ (da bitte gezielteren fragen) mit sockets (da bitte auch detailierte fragen) und HTTP auskennen.

zu HTTP kannst dir erste Informationen und prinzipielle Funktionsweissen hier anschauen
http://de.wikipedia.org/wiki/HTTP

bei detailierten fragen den links da folgen :-)

Ein ueberblick was sockets genau sind bekommst hier:
http://de.wikipedia.org/wiki/Socket_(Software)
Und nen eindruck ueber die windows spezifische Implementation hier ...
http://www.cbuilder.de/artikel/socket_c ... ut_op.html

Unter QT wuerde man QHttp wahrscheinlich nutzen ....
http://doc.trolltech.com/4.5/qhttp.html
Damit wuerde das ganze dann wahrscheinlich nen 5 zeiler werden ....

Ciao ...
Godless
Beiträge: 7
Registriert: 25. März 2009 20:21
Wohnort: Karlsruhe

Beitrag von Godless »

Jürgen Wolf hat dazu in seinen Büchern einige interessante Kapitel geschrieben. Eines davon ist sogar als Openbook kostenlos verfügbar. Es ist zwar für C geschrieben, die API ist aber letztendlich dieselbe. Hier mal ein Link: http://openbook.galileocomputing.de/c_v ... #Xxx999328 . Außerdem hat er auch ein spezifisches C++-Kapitel dazu in seinem Buch C++ von A-Z, wo auch beschrieben wird, wie man das ganze objektorientiert umschreibt, das allerdings nicht online verfügbar bist, da müsstest du überlegen ob dir das 40 ¤ wert ist.
Linux for life
Wer braucht Microschrott?
Antworten