The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"REGEX и subject на русском"
Вариант для распечатки Архивированная нить - только для чтения! 
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [Проследить за развитием треда]

"REGEX и subject на русском"
Сообщение от Medlar Искать по авторуВ закладки on 13-Мрт-03, 14:00  (MSK)
Мне нужно блокировать письма с любой темой, в которой встречается слово "английский", но правило regex не срабатывает.
KChSbRuSpam regex -a@CATCHED английский
SCheck_Subject
R$+                             $: $(ChSbRuSpam $1 $)
R@CATCHED                       $#error $: 553 This message may contain SPam

На все остальные (английские) слова фильтр срабатывает.
Причем при тестировании из командной строки: date|mail -sанглийский root правило срабатывает, а также и в тестовом режиме sendmail:
/map chsbruspam английский
map_lookup: chsbruspam(английский) returns @CATCHED (0)

А при тестировании с клиента (Netscape Messenging, telnet, mail) - никак.
Подскажите, где копать?

  Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "REGEX и subject на русском"
Сообщение от Bart Simpson emailИскать по авторуВ закладки on 13-Мрт-03, 15:03  (MSK)
Врать не буду, может дело в кодировке (KOI-WIN)?
Меня этот английский уже тоже достал, все руки не доходят, так что напиши краткую инстукцию, всем помогет.
  Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "REGEX и subject на русском"
Сообщение от Sampan Искать по авторуВ закладки on 13-Мрт-03, 16:07  (MSK)
Очень часто почтовые клиенты тему письма передают не 8 бит, а в кодировке, типа Subject: =?koi8-r?B?89DBzS3GyczY1NI=?=
Ну и как к этому применить regex?

Сейчас мучаю maildrop на предмет раскодировки подобных Subject на лету с последующей фильтрацией.

  Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "Yesssssss!!!"
Сообщение от Medlar Искать по авторуВ закладки on 13-Мрт-03, 17:03  (MSK)
Вы будете смеятся, но получилось!!!!!!!!
Сейчас добью и расскажу как
  Рекомендовать в FAQ | Cообщить модератору | Наверх

4. "Yesssssss!!!"
Сообщение от Camb emailИскать по авторуВ закладки on 13-Мрт-03, 19:08  (MSK)
>Вы будете смеятся, но получилось!!!!!!!!
>Сейчас добью и расскажу как

ЗдОрово!
А то я чуть было не высказал что я думаю по этому поводу (по межгороду :)
центр мать их ))

  Рекомендовать в FAQ | Cообщить модератору | Наверх

5. "Yesssssss!!!"
Сообщение от boykovyandex.ru Искать по авторуВ закладки on 14-Мрт-03, 13:52  (MSK)
>Вы будете смеятся, но получилось!!!!!!!!
>Сейчас добью и расскажу как

Дык окончательно получилось? Рассказывай.

  Рекомендовать в FAQ | Cообщить модератору | Наверх

6. "Все оказалось не так просто ..."
Сообщение от Medlar Искать по авторуВ закладки on 14-Мрт-03, 17:00  (MSK)
KChSbRuSpam regex -a@CATCHED мцкхияй|МЦКХИЯЙ|=CE=C7=CC=C9=CA=D3=CB=C9=CA|=EE=E7=EC=E9=EA=F3=EB=E9=EA|Pr6Onx6ujp|3j6\+jp8|zsfMycrTy|x8zJytPLy|7HzMnK08v

SCheck_Subject
R$+                             $: $(ChSbRuSpam $1 $)
R@CATCHED                       $#error $: 553 This message may contain ruSPam

1.Все письма с рекламой American Language Center, приходящие ко мне,
посылались через мой же почтовик для локальных клиентов (smtp-авторизация не прикручена), видимо, telnet'ом.
Посылаю себе письмо telnet'ом с "английской темой", затем
cat /var/spool/mail/mybox | egrep subject
обнаруживаю в теме ЮМЦКХИЯЙ (что соответствует "английск"), запихиваю эту абракадабру в regex - все o'k
Несмотря на отсутствие ключа -f варианты "АНГЛИЙСК" или "Английск" не ловятся, поэтому исправляю на мцкхияй|МЦКХИЯЙ (НГЛИЙСК|нглийск)

2. =CE=C7=CC=C9=CA=D3=CB=C9=CA|=EE=E7=EC=E9=EA=F3=EB=E9=EA
соответствует тому, что делает  Netscape с нглийск|НГЛИЙСК

3. Сложнее с OutlookExpress.
Pr6Onx6ujp|3j6\+jp8|zsfMycrTy|x8zJytPLy|7HzMnK08v - это результат эспериментов с OE. Первые два -кодировка win1251, остальные KOI-8.
Без варианта заглавных букв.

Прошу прощения за эмоции :)Надо было сначала все отладить хорошенько, потом кричать.

А вообще,хотя regex классная штука и ловит в день около 100 спамов по словам в адресах и темах, пора уже антиспам какой-нибудь прикрутить.
Не у всех писем с этой рекламой в теме присутствует слово "английский".

Кто-нибудь spamassasin пользуется? Как впечатление?

  Рекомендовать в FAQ | Cообщить модератору | Наверх


Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру