Tag Archives: 스팸

[SpamAssassin] Bayesian 스팸 학습 데이터 배포

스팸어쎄신을 이용하여 약 3년정도 모은 스팸메일을 학습 시킨 데이터를 공개 합니다.

별건 아니지만 저도 보관해 두었다가 다른데서 쓰기 위해 올려둘까 합니다.

자세한 사용법은 다음의 글을 참고하시면 도움이 될 듯 합니다.

http://theeye.pe.kr/entry/한국에-맞는-스팸어쎄신-설정하여-스팸-95-줄여보기

약 100만개의 스팸메일이 학습되었습니다.

본래 학습형 필터가 너무 많은것을 학습시키면 오히려 잘못 진단할 확률이 높아지는 법인데 몇일 테스트 해본 결과 충분히 잘 걸러지고 있네요.

1163895165.rar1171183768.rar1409581118.rar1145414248.rar

mod_spamhaus를 이용하여 스패머의 아파치 접근을 막아보자.

웹 서비스를 운영하는 차원에서 보면 스패머들은 매우 골치 아픈 문제입니다. 하지만 자세히 보면 이러한 공격이 특정한 패턴을 가지고 있지 않습니다.

그래서 더욱 필터링 하기가 어렵습니다. 대부분의 아이피를 조회해보면 특정 위치가 아닌 거의 전세계에서 동시에 들어오고, 그 방식도 매우 다채롭습니다.

이러한 공격에는 대부분 공격자의 명령에 따라 다른 시스템을 공격하는 좀비 PC들이 작업을 하게 됩니다.

하지만 이번에 소개해 드릴 mod_spamhaus를 Apache 웹서버에 설치하게 되면 SpamHaus에서 제공하는 스패머 블랙리스트와 대조하여 블랙리스트에 올라가 있는 시스템의 접근을 차단하게 됩니다.

보통은 sendmail과 같은 메일시스템(MTA)에 필터로 등록하여 사용하곤 하는데 이런식으로 사용하는것도 좋은 생각인것 같습니다.

스팸메일을 보내는데 이용되는 좀비PC나 스팸글을 등록하는 좀비PC나 같은 녀석들이 재활용 될테니깐요.

http://sourceforge.net/projects/mod-spamhaus/ 에서 관련 소스를 받아 설치합니다.

[code]tar -zxvf mod-spamhaus-0.7.tar.gz
cd mod-spamhaus
make
make install[/code]
apxs2를 찾을수 없다는 에러가 난다면 MakefileAPXS값을 적절한 값으로 변경해 줍니다. 저의 경우에는 apxs로 바꾸었습니다.

설치가 끝나게 되면 자동으로 httpd.conf 설정 파일에 다음의 내용이 추가 됩니다. 혹시 없다면 추가해 줍니다.

[code]LoadModule spamhaus_module   /usr/lib/apache2/modules/mod_spamhaus.so[/code]
다음으로 다음과 같은 설정을 하여 줍니다.

[code]<IfModule mod_spamhaus.c>
MS_METHODS POST,PUT,OPTIONS,CONNECT
MS_WhiteList /etc/spamhaus.wl
MS_CacheSize 256
</IfModule>[/code]
실제로 /etc/spamhaus.wl 파일을 생성해 두고 이 안에는 신뢰할수 있는 ip주소를 입력하시면 bypass 하게 됩니다.

이제 아파치를 재시작 하시면 됩니다. 이제부터 POST, PUT, OPTIONS, CONNECT 명령에 대해 spamhaus에 블랙리스트로 등록되어있는지를 확인하게 됩니다.

캐시 사이즈에 맞추어 캐시도 하게 됩니다. 적절히 설정하시면 됩니다.

참고 :
http://sourceforge.net/projects/mod-spamhaus/
http://www.howtoforge.com/how-to-block-spammers-with-apache2-mod_spamhaus-debian-etch
http://www.spamhaus.org/