[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Spam (fwd)
From: |
Ricardo J. Lemus C. |
Subject: |
Spam (fwd) |
Date: |
Thu, 27 Mar 2003 22:35:26 -0400 (CLT) |
Esto lo mando Magnungo.
Seria bueno revisarlo.
--
Ricardo J. Lemus C. [Linux-user: 54183] address@hidden
Facultad de Ciencias Fisicas y Matematicas Universidad de Chile
"Laziness is a very important system administrative virtue" from
Essential System Administration, 2nd Ed. by AEllen Frisch, O'Reilly &
Associates, p. 342.
---------- Forwarded message ----------
Date: Wed, 19 Mar 2003 21:38:59 -0400
From: Mañungo <address@hidden>
To: address@hidden
Subject: Spam
Hola!
Te mande un mensaje hace tiempo, pero me da la idea de que no te llego.
Si estoy dando la lata, avisame :-)
Hice mi propia version del filtro bayesiano de graham.
En vez de un archivo score enorme, tengo dos archivos uno para spam y otro
para no-spam, con las apariciones de las palabras.
Cuando llega un e-mail hago los calculos mas complicados solo para las
palabras con frecuencia > 0 que pertenezcan al e-mail.
La mayor gracia es que cuando se cuela un spam o hay un *false positive*,
me auto-envio el e-mail con el suject [SPAM] o [NO] segun correponda y
automagicamente el procmail invoca al programa que agrega el e-mail a la lista.
Funciona increiblemente bien. Con 100 mail tengo un 89% de spam filtrado y
solo un 2% de *falses positives*. Y lo mejor de todo es que los archivos de
puntajes pesan juntos 17 Kb (contra los 400 Kb del score de ustedes).
De repente te tinca mirarlo. Esta en ~mortega/bin/bsf.
Saludos!! Mañungo
o
o o
o o
\ 0 / Malabarista de oficio,
\|/ Ingeniero en los ratos libres...
|
/ \ Malabarismo: http://www.malabarismo.cl
_/ \_ Circópata: http://www.circopata.cl
- Spam (fwd),
Ricardo J. Lemus C. <=