Monthly Archives: Januar 2005

Secret Tags at work

When I thought about a better way to tell legitimate users from evil-doing spammers, I came up with [Secret Tags][st].

Today I have two up and running Secret Tag implementations. Both work very well, and I am here to demonstrate this.

From Jan 25th until today there were 312 attempts to spam WWWorker. 40% of these, 125 in numbers, where blocked because of a missing Secret Tag in the form data. The other 60% were sorted out by MT-Blacklist.

For many spam attempts blocked by MT Blacklist a second attempt from the same IP and only seconds after the first got blocked because of a missing Secret Tag. Looks like the spammer had two different comment texts, one with already blacklisted content and a second with content not yet blacklisted text. Fortunatly Secret Tags were there to get rid of this new spam.

One thing my Anti-Spam Tactics is missing. It does not share data between the blacklist and Secret Tags. We need to insert content of comments blocked via Secret Tags into the blacklist. This way we could be sure to be able to block even more spam using only one system.

Conclusions?
* Secret Tag do work in the specified way: Block spam without harming legitimate users.
* Never rely on only one system. Always use two or three systems that work independently and overlapping, but not in exactly the same way.
* Share data between your systems where appropriate.
* Harming your legitimate users with [nofollow][nfn] is not necessary.

[st]: http://www.itst.org/web/269-secret_tags_an_alternative.shtml
[nfn]: http://www.itst.org/nonofollow/

NO NOFOLLOW Initiative

Mal auf deutsch: nofollow ist Bockmist. Es hilft nicht gegen Spam, nagt an der Struktur des Webs und teilt in eine Zweiklassengesellschaft. NO NOFOLLOW!

Leider bin ich graphisch nicht wirklich begabt, daher kann ich nur mit dem [Button Maker][bm] was basteln:

[bm]: http://kalsey.com/tools/buttonmaker/

nfn-button.png

**Schritt 1** - Nehmt den Button und baut ihn bei Euch ein.
**Schritt 2** - Verlinkt ihn auf http://www.itst.org/nonofollow/

Wenn jemand einen tollen Button basteln kann oder meinen zugegeben schnell zusammengeschusterten Text verbessern will, immer her damit.

Siehe auch [Mit einem Attribut gegen Comment Spam? Nope.][sa]

[sa]: http://www.itst.org/web/309-mit_einem_attribut_gegen.shtml

20 Jahre Usenet-Timeline bei Google

Google hat eine nette Liste von Postings im Usenet zusammengestellt, die besondere Ereignisse kommentieren oder zum ein Thema zum ersten Mal aufgreifen.

* Nov 1982: [Early reference to emoticons][emo]
* Feb 1983: [First Me Too post][me]
* Jun 1992: [First BOFH post][bofh]

[emo]: http://groups.google.com/groups?selm=bnews.sri-unix.4439
[me]: http://groups.google.com/groups?selm=bnews.csu-cs.1997
[bofh]: http://groups.google.com/groups?selm=1992Jun10.091440.8536%40waikato.ac.nz

Nette Idee: den ersten Post zu einem Thema finden. Wer findet einen früheren?

* Jan 1995: [Don’t feed the troll][troll]

[troll]: http://groups-beta.google.com/group/alt.sex.wanted/msg/0bd2a177f70e8185

[via vowe dot net :: 20 Year Usenet Timeline]

PS: Das könnte auch ein amüsantes Forenspiel werden, bei dem ein Forum nach den ersten Post zum Thema X durchsucht wird. Der Gewinner bekommt 100 Gummipunkte ;) (Note to self: Idee für das nächste [Geburtstagsgewinnspiel][gtag] notieren).

[gtag]: http://www.itst.org/web/163-phpbbde_wird_3.shtml

Mit einem Attribut gegen Comment Spam? Nope.

[Dieser schnelle Hack][Google] ist keine Lösung sondern gerade mal ein Workaround. Wir sollten die Ursachen bekämpfen, nicht die Symptome.

Maßnahmen gegen Symptome implizieren das man gegen die Ursache nichts tun kann — also geht man dem Motto *besser als nichts* vor. Von Google hätte ich mehr erwartet (nicht das ich hier [Google in der Pflicht][Kai] sehen würde).

In der Diskussion über Spam tauchen immer wieder Argumente auf, die auf falschen, oder sagen wir mal naiven Annahmen basieren. Tatsächlich aber sieht es so aus:

* Spam ist **nicht** zielgerichtet.
* Für Spam gilt **Masse statt Klasse** — Hauptsache viel und schnell.
* Kommentar-**Spam ist billig** — E-Mail-Spam ist auch nicht wirklich teuer.

Weitere Meinungen bei [Alp][] und [Moe][].

[Google]: http://www.google.com/googleblog/2005/01/preventing-comment-spam.html
[Kai]: http://www.it-weblog.de/archives/000974.html
[Alp]: http://uckan.info/2005/01/19/das-neue-link-attribut-der-suchmaschinenbetreiber/
[Moe]: http://weblog.plasticthinking.org/item/2005/1/19/link-format-zur-verhinderung-von-kommentarspam

PS: Warum wir jetzt (X)HTML ändern müssen, nur damit Google wieder mit seinem PR angeben kann ist mir nicht verständlich.

Update: ZDNet hat auch eine Newsmeldung dazu. Leider ist die inhaltlich, ja wie sag ich das jetzt, … [sinnfrei][zdnet]. Das [englische Original][orig] liest sich hingegen einwandfrei. [via [Stefan][whocares] per IM]

[zdnet]: http://www.zdnet.de/news/tkomm/0,39023151,39129530,00.htm
[orig]: http://news.com.com/Google+aims+to+outsmart+search+tricksters/2100-1024_3-5540740.html?tag=cd.hed
[whocares]: http://whocares.de/archive/000703.php

Atom 0.4

There it is, The Atom Syndication Format 0.4.

[Changes from 0.3][changes]:
* Update URI terms for 2396bis.
* Add Category construct (PaceCategoryRevised).
* Insert paranoid XHTML interpretation guidelines.
* Adjust atom:copyright, per chairs’ instruction.
* Add atom:host as child element of atom:entry, per chairs’ direction (PacePersonConstruct).
* Add link/content co-constraint (PaceContentOrLink).
* Remove atom:origin as a side effect of adding atom:head to atom:entry (PaceHeadInEntry).
* Add optional length attribute to atom:link (PaceLinkRelated).
* Add Link registry to Link Construct, IANA Considerations placeholder (PaceFieldingLinks).
* Change definition of atom:updated (PaceUpdatedDefinition).

[changes]: http://www.atompub.org/2005/01/10/draft-ietf-atompub-format-04.html#rfc.section.B

Personally I find the handling of a document’s dates is well done. We have [atom:updated][upd] and [atom:published][pub] to indicate the most important dates describing documents: when was it originally published and when took the last update place.

[Originally we discussed][orig] five dates:
* Created: the date the entry was originally created
* [Dateline][dl]:the date the publisher wishes visibly to assign to the entry (note RFC3339 problems on this one)
* [Issued][iss]([¹][pub]): the date the entry was first made available
* [Modified][mod]: the most recent date on which any aspect of the entry’s content changed
* [Updated][upd]([²][upd2]): the most recent date on which the publisher wishes to draw attention to the entry’s having changed

[dl]: http://intertwingly.net/wiki/pie/PaceDateline
[iss]: http://intertwingly.net/wiki/pie/IssuedElement
[pub]: http://intertwingly.net/wiki/pie/PaceDatePublished
[mod]: http://intertwingly.net/wiki/pie/PaceDateModified
[upd]: http://intertwingly.net/wiki/pie/PaceDateUpdated
[upd2]: http://intertwingly.net/wiki/pie/PaceDateUpdated2

Created never made it into a pace, Dateline died rather quickly, Issued became Published, Modified was dropped and Updated is now THE date in an Atom element.

[upd]: http://www.atompub.org/2005/01/10/draft-ietf-atompub-format-04.html#rfc.section.5.9
[pub]: http://www.atompub.org/2005/01/10/draft-ietf-atompub-format-04.html#rfc.section.5.10
[orig]: http://intertwingly.net/wiki/pie/DateSurvey

This looks like a solid solution to me — but only time and usage will tell whether it really is or not ;)

Browser-Statistik phpBB.de

Im Laufe der vergangenen zwölf Monate hat der IE sehr stark verloren, zur Freude der Mozillas.

Bei der Gelegenheit: Sowohl die [internationalen Supportforen][mz] der Mozillas als auch der [deutsche Firefox-Ableger][ff] benutzen phpBB ;)

**Browser-Statistik [phpBB.de][pd] im Januar 2004**
stats0104.png

**Browser-Statistik [phpBB.de][pd] im Januar 2005**
stats0105.png
Firefox ist unter den Mozillas subsummiert, Firebird eine Erinnerung [AWStats][aw] demnächst mal upzudaten ;)

[pd]: http://www.phpbb.de/
[aw]: http://awstats.sourceforge.net/
[mz]: http://forums.mozillazine.org/
[ff]: http://firefox.uni-duisburg.de/forum/

DNS ist scheiße

Das Netzwerk, auf dem phpBB.de liegt, feiert heute seinen ersten Geburtstag. Das wäre völlig unbemerkt an uns vorbei gegangen, wenn nicht heute morgen keines der Webs - unter anderem phpBB.de - mehr erreichbar gewesen wäre.

Das lief so ab:

Es ist 13:37h. Mein Handy bimmelt, eine SMS. Clif ist dran ‘Der Server löpt nicht.’ Oops, schnell Rechner an und nachgeschaut. Putty gestartet, Login auf cat, tippertipper. Hmm, Lastprobleme sinds nicht, der Server läuft auf Sparflamme. OK, Browser gestartet, Bookmarks auf, phpBB.de. Lange nix, dann ‘phpbb.de kann nicht gefunden werden.’ Wie bitte? Konsole auf, ping phpbb.de… Nix. OK, nslookup phpbb.de… Host not found. Wah?! Nochmal nach Putty, der DNS läuft 1a. Seltsam. OK, pingen wir mal die Nameserver. Äh, das ist nicht gut… host not found für alle drei. Schiet.

Also, DNS läuft auf der Maschine, über die IP kommt man auf alle Dienste, das Problem liegt in der Namensauflösung.

Vorrübergehend am Ende meines Lateins Jens anrufen: ‘Ja, ich weiß’, sagt er, der Gute. ‘Unser Hostename ist seit heute morgen nicht mehr registriert. Regfish hats verpeilt den Domainnamen zu verlängern. Daran sieht man mal, das Cat-Proof Network ist heute ein Jahr alt.’

Nach kurzer Diskussion werde ich in ehrwürdigen Kreis derer aufgenommen, die begriffen haben, das DNS scheiße ist.

Da man keine IP-Adressen als Nameserver eintragen kann, sondern Hostnamen benutzen muss, beißt sich die Katze selbst in den Schwanz — und in diesem Fall sorgt das dafür, das mehrere Webs nicht auf dem üblichen Web erreichbar sind, obwohl alle Dienste einwandfrei laufen — weil der Hostname, über den die Nameserver laufen, gelöscht wurde. Wie Kai so schön sagt: Schade drum.

Aber hey, wozu gibts die hosts-Datei? Genau für solche Fälle wohl, in denen DNS zeigt, wie bescheuert es ist.

Siehe auch [Nameserver mit Gedächnisverlust][gv].

[gv]: http://www.itst.org/web/134-nameserver_mit_gedaechnisverlust.shtml

Schadenfreude ist die schönste Freude ;)

Hoffentlich nimmt Herr Huth (keine Links für Trolle) bald den selbigen und tritt als *Internet-Sicherheitsexperte* ab. Andererseits muss man den Redaktionen auch eine nicht unerhebliche Desinformiertheit unterstellen.

Stellt sich die Frage, wie man als fachfremder Redakteur zwischen *gut und kompetent* und *doof und null Ahnung* unterscheiden soll.

MyChannel.de: Staatsanwaltschaft beendet Ermittlungen - Golem.de

[Stimmen aus der Blogosphäre][bs]
[Lustige Peter-Links][lp]

[bs]: http://blogg.de/search.php?search=huth
[lp]: http://www.antihuth.de/