Bin mir nicht ganz sicher, wo ich das mal erwähnen soll, deshalb melde ich mich hier.
Okay, ggf. passt es auch
dort ... aber ich bleib erstmal in der Komfortzone.
TLDR: Überlegung, wie man ggf. ein paar der Bildinhalte aus Sammelthreads für die Zeit nach dem abload Aus bewahren könnte ohne x-hundert Links manuell zu bearbeiten.
Wir hatten ja schon wiederholt und an verschiedenen Ecken das Thema, dass abload zum 30.06. seinen Dienst einstellt.
Für einen selbst bzw. Nutzer mit Account haben sie ja auf ihrer Seite auch dankbarerweise einfache Methoden gelistet, sich seine ganzen Bilder herunterzuladen.
Das ist zwar gut für einen selbst, aber für Ressourcen wie das Forum mit teils umfangreichen Datenbanken nicht optimal.
Als Verfechter von RAM-OC denke ich da z.B. an große OC-Listen, die auch verschiedene Migrationsschritte im Forum überlebt haben, aber z.T. randvoll sind mit abload links.
Beispiele wären da für mich die große
32M-Liste im Speicher Unterforum oder die
DDR1 OC Liste hier im Nostalgiebereich.
Viele Nutzer sind nichtmehr aktiv oder haben ggf. die Screenshots nichtmehr, dennoch sind viele, wenn auch nicht alle, der Bilder momentan noch online. Um solange es noch geht an der Stelle vielleicht zu versuchen, wenigstens einen Teil dieser Datenbanken zu retten, hab ich mir anhand meiner zwei Beispiele mal etwas Gedanken gemacht und rumprobiert.
Im Ergebnis kam ich jetzt auf folgenden Weg, mit dem Ziel die gleiche Linkliste, wie abload sie den eigenen Usern bereitstellt threadspezifisch zu erzeugen.
1. Seitenquellcode bzw. den Startpost des Threads als .txt ziehen
2. Ein kleines Python Skript, dass die .txt abfrühstückt und abload Links rauszieht, die dabei punktuell etwas hübsch macht und als duplikatfreie Linkliste auswirft
3. Mit dem Windows cmd Befehl, den auch abload für die eigenen Bilder vorschlägt, die Liste via curl Befehl abarbeiten und die Bilder runterladen
es fehlen die Schritte ab 4, um die Bilder wieder im Forum hochzuladen und einzufügen, aber um das Problem kann man sich auch nach dem 30.06. noch kümmern.
Die Bilder haben nach dem Download denselben Namen wie im ursprünglichen abload Link, dadurch hätte man ein eindeutiges Mapping auf die ab 01.07. toten Links in den Sammelthreads. So wäre also immerhin die Relation von Bild zu Listeneintrag auch über die Abschaltung von abload hinaus erhalten, ob und wie man den Reupload / Linkaustausch dann formschön realisiert / automatisiert bekommt, kann man sich dann immernoch in Ruhe überlegen.
Um es mal an meinen zwei Beispielthreads zu verdeutlichen:
Für die 32M OC-Liste kam ich auf 3210 Links auf der ersten Seite des Threads, nach Download hab ich nun 3086 Bilder im Verzeichnis.
Vorbehaltlich anderer Probleme/Fehler wird die Diskrepanz wohl einfach gelöscht sein, legen jedenfalls Stichproben nahe.
Für die DDR1 IC SuperPi Liste kam ich auf 202 Links, nach Download sind es 201 Bilder, nur eins war nichtmehr online.
Fakt ist, man kann nicht alles retten. Der Aufwand stünde wohl auch in keinem Verhältnis zum Ergebnis, deshalb hab ich mich bei dem Gedankengang bewusst mal auf Sammelthreads mit größeren Listen bezogen, da die nötigen Informationen nicht auf 200 Seiten in Beiträgen von 300 Usern verteilt sind, sondern schon stark gebündelt und meist in einheitlicher Struktur, was nicht nur das Erfassen sondern auch ein ggf. späteres Aktualisieren deutlich erleichtern sollte.
Soweit mal zu meiner Überlegung und meinen Experimenten. Ich bin sicher, meine hingefrickelte Skriptlösung treibt ernsthaften Entwicklern Tränen in die Augen und technisch gibt es garantiert einfachere Wege, die ich nur grad nicht kenne / sehe / etc. , falls Bedarf besteht werf ich das Skript aber auch noch hier rein. Ich bin leider den gesamten Juni über noch ziemlich ausgebucht, aber da der Termin für das Ende von abload nunmal steht und mir das heute Nacht beim Blick in alte 32M Ergebnisse wieder bewusst wurde, wollte ich zumindest mal testen, ob man da nicht doch was retten kann.
Dem ein oder anderen fallen vielleicht auch noch andere Sammelthreads mit derartigen Listen ein, die erhaltenswert wären.
Da viele der Listen auch von Mods wie
@stunned_guy und
@emissary42 gepflegt werden, gibt es eventuell auch elegantere Optionen die Threads zu parsen.