Abmahnfalle: Gelöschte Webseiten ungewollt im Webarchiv

Sie kennen das bestimmt auch. In regelmäßigen Abständen aktualisieren Sie die Seite Ihrer Gemeinde. Neue Texte, neue Bilder und irgendwann kommt bestimmt auch eine neue Webseite. Sie laden neue Fotos, Texte oder sogar Ihren Gemeindebrief als pdf auf Ihre Seite und löschen natürlich wieder viel. Und damit ist es aus dem Internet verschwunden? Eine klare Antwort: Sehr häufig NEIN!!!!!!
Aber wie kann das sein, dass wenn Sie etwas auf Ihrer eigenen Seite löschen, es immer noch da ist? Wie kann es sein, dass sämtliche Foto, Texte, pdfs immer noch online sind? Und zwar seit 2003!!!

 

Die Antwort ist ganz einfach

Sogenannte Webarchive durchforsten das Internet und legen Kopien von fast allen Webseiten an, und das seit nunmehr 13 Jahren. Z.B. unter http://archive.org/web/ finden Sie einer dieser „Wayback Maschinen“. Tippen Sie mal oben in der Leiste Ihre Internetadresse ein und warten Sie ab was passiert. Bei den meisten Seiten bekommen Sie eine Historie der letzten 13 Jahren.

Was hat für Folgen?

Zum einen hat es einen guten Grund warum alte Daten nicht mehr online sind, da sie ja auch nicht mehr aktuell oder auch zeitgemäß sind. Zum anderen dienen aber auch die Netzarchive Abmahnfirmen als Beweis für z.B. vergangene Urheberrechtsverstöße. Da kann es durchaus sein, dass Sie ein Schreiben bekommen in Bezug auf einem Verstoß, der schon lange nicht mehr online ist.

Was kann ich dagegen tun?

Im Prinzip ist es ganz einfach. Sie müssen dem Webarchiv sagen, wenn du wieder auf meiner Seite bist, speichere mich nicht ab und lösche alles was du von mir hast. Leider fragt mich das Webarchiv nicht ob es speichern darf, sondern ich muss ihm sagen, dass es dies nicht tun soll. Speichern Sie auf dem Toplevel Ihrer Internetseite (z.B. www.ihredomain.de/robots.txt) die Textdatei (robots.txt) mit folgendem Inhalt:
User-agent: ia_archiver
Disallow: /

So wird dem Webarchiv beim nächsten Besuch gesagt, speichere mich nicht und lösche alles von mir. Bei meiner Kirchengemeinde Gustav-Adolf war alles innerhalb von zwei Tagen gelöscht.

Nachtrag 20. Oktober 2016: Für unsere Musterwebsite-Kunden haben wir aktuell den entsprechende Eintrag vorgenommen.

Kommentare

3

"Im Prinizip ist es ganz einfach" schreiben Sie, wie man dem Webarchiv sagt, dass es unsere Website nicht abspeichern darf und alles löschen soll. Ich soll auf dem Toplevel unserer Internetseite einen Inhalt abspeichern.
Wo ist der Toplevel meiner Internetseite? Wie komme ich dort hin und wo speichere ich diesen Text?
Ihr Tipp war für mich wenig hilfreich, außer, dass ich auf ein Problem aufmerksam gemacht wurde, dem ich hilflos gegenüberstehe...

Toplevel bedeutet, dass die Datei mit dem Namen robots.txt nicht in einem Unterordner abgespeichert werden soll, sondern auf der obersten Ebene ihres Webspaces. Auf diesen Speicherplatz ihrer Website müssen sie natürlich Zugriff haben, z.B: mit FTP. Wenn ihre Website www.ihredomain.de heißt, dann muss man die Datei robots.txt so wie angegeben unter http://www.ihredomain.de/robots.txt abrufbar sein.

Für die Musterwebsites wird das Vernetzte Kirche für Sie erledigen.

Vielen Dank Vernetzte Kirche dafür, dass Sie das für mich erledigt haben.
Ich hatte beim letzten Kommentar leider wieder nichts verstanden... :-)