Nota circa la classificazione ``spam``

La classificazione/filtraggio dello spam opera sostanzialmente su 3 fronti:

a. cercando di capire se il testo delle mail e'
spam (pattern matching e statistiche bayesiane):
se il messaggio "assomiglia" a qualche messaggio
archiviato come spam il suo punteggio aumenta.

b. mail-routing: se un messaggio e' passato da uno degli host che
solitamente sono sorgente di spam il suo punteggio di
``spammossita'`` aumenta.

Se il punteggio totalizzato da un messaggio supera una certa soglia (6.31,
per default) il messaggio viene classificato come spam e lo header
``X-Spam-Status:`` viene impostato a ``Yes``. Il valore di questo header
puoi' essere poi utilizzato (spam-filtering) per dirottare il messaggio in
un folder appositamente creato o puo' essere automaticamente cancellato).

c. graylisting
Questo sistema e' diverso dagli altri; non si preoccupa di
come sia fatto il messaggio ma ogni qual volta arriva un
messaggio per un utente U da uno host H il server si salva
la coppia (U,H) in un database e dice al mailserver
``richiamami dopo, adesso non posso``.
Se dopo n-minuti (l'algoritmo si complica ma l'idea e' questa)
lo host H si (ri)presenta con il messaggio per l'utente U
il messaggio viene accettato.
Solitamente i sistemi che spediscono spam sono impegnati
a spedire milioni di mail e non ``hanno risorse`` per
soddisfare le richieste ``service-temporaily-unavailable``
e quindi molto spam non arriva proprio.

NOTA: Nel caso di mail forwarded da un altro mailsystem le contromisure
``a`` e ``b`` sono, in linea di principio, ancora applicabili mentre la
strategia ``c`` viene resa inutile in quanto il messaggio ``richiamami
dopo`` viene dato al server che inolta il messaggio e non allo spam-bot.