Idee für Spamassassin-Score
23. August 2007
Mal sehen, ob wir die Zeit finden, folgende Idee mal testweise umzusetzen. Mal angenommen, jede eingehende Mail geht durch den Spamassassin und kriegt einen Score. Und jetzt würden wir das Spamassassin-Log in Echtzeit parsen und für jede Mail speichern: Quell-IP, Timestamp und ob sie Ham oder Spam ist. Das speichern wir in einer Datenbank. Alle Einträge fliegen nach Zeit X wieder raus. Vor die Datenbank hängen wir einen Server, der auf nem UDP-Socket Port 53 lauscht und ähnlich wie bei einer RBL antwortet. Mit dem Unterschied, daß die Antwort nicht nur ein Ja/Nein wie bei einer RBL ist, sondern eine Wahrscheinlichkeit zwischen 0 und 1.
Dann schreiben wir uns ein kleines Spamassassin-Modul, das bei jeder Mail eine solche DNS-Anfrage macht und jeder kann selbst einen Multiplikator bestimmen, der in den Spamassassin-Score mit einfließt. Damit das Ganze Sinn macht, müßten allerdings mehrere Mailserver mitmachen. Und da wäre eine verteilte Datenbank sinnvoll, die die Sache mit der Vertrauenswürdigkeit aber nicht gerade unerheblich kompliziert.
Aber spinnen wir mal nicht ganz so weit, ein Script zum Parsen der SA-Logs und das Füttern einer Datenbank sind schnell geschrieben und für erste Tests würde ein Preforking Perl-Script auch reichen, das als DNS fungiert. Wer macht mit?

