Boris ([info]bmt) wrote,

Очень много спама

За многие годы жизни в сети у меня накопилось существенное количество адресов и на своих доменах, и на популярных почтовых сервисах, почту с которых я собираю в своём ящике на Gmail. Мне приходит много спама. Достаточно сказать, что в папке Spam за месяц накапливается примерно 17000 писем. Сколько из них пришлось мне помечать вручную – не знаю.
После возмущения Коли по поводу большой доли нераспознанного спама в Gmail (а особенно – русскоязычного), я решил провести маленький бытовой эксперимент.
В 17 часов понедельника я очистил папку Spam в Gmail и в течение 24 часов не помечал как спам ни одно письмо, попавшее в Inbox. Они просто собирались там наравне с неспамом.
В итоге за 24 часа с вечера понедельника накопилась следующая статистика:
  • В папке Spam автоматически оказалось 772 письма, из них примерно 82 % - русскоязычные, остальные – на английском.
  • В папке Inbox оказалось 169 писем, которые я расцениваю как спам. Их них все - русскоязычные.
  • При этом неспамных писем пришло около 80 штук.
Какие-нибудь выводы? Они не утешительные:
  • 18% спама, прошедшего в ящик, не определилось как спам (или "подозрительное", как меня поправляют в комментариях). По-моему, это очень много.
  • Еще хуже, что эти письма составили более двух третей писем во входящих.
  • Наверное, англоязычный спам определяется лучше. Но почему-то его оказалось неожиданно мало. Возможно, существенная его часть была отсеяна на более ранних стадиях прохождения писем (в .masterhost или почте Яндекса или Мейла). Но вероятнее, что это таргетинг: практически все мои адреса говорят о том, что я говорю по-русски.
Однозначно, жизнь без русских спамеров была бы гораздо лучше. Несмотря на эти проблемы, я не собираюсь уходить с Gmail, так как удобства сервиса всё же перешивают.

Еще меня мучает вопрос: улучшаются ли антиспам-алгоритмы Gmail благодаря моей ежедневной ручной работе по фильтрации спама? Три минуты в день, два рабочих дня в год…

PS: Юра, спасибо, я стал продвинутым пользователем! :)

  • Post a new comment

    Error

    Your IP address will be recorded 

  • 8 comments

[info]quappa

July 8 2008, 14:30:36 UTC 3 years ago

Подсчёты неверны. gmail и любой другой антиспам бОльшую часть (90%) входящей почты просто выбрасывает. До папки SPAM доходит только то, что оказывается "сомнительным".

[info]bmt

July 8 2008, 14:36:20 UTC 3 years ago

Ну я не претендовал на профи, т.к. в этом деле не силён. Если мой "спам" назвать твоим "сомнительным", сильно ли картина изменится? Ну и если те 17000 "сомнительных" в месяц составляют лишь 10-15% всего спама - разве от этого легче?
С точки зрения обычного пользователя картина и так ужасающая, а с твоими правками - совсем ужас :)

[info]quappa

July 8 2008, 15:06:56 UTC 3 years ago

"18% спама не определилось как спам" -- ну вот здесь процент будет поменьше :)

Но вообще всё плохо. Это правда. Спам сейчас очень креативный, и конца-края ему не видно. На удивление важны такие вещи, как толковые люди за abuse@ и постоянный ручной уход за всеми видами блэк и вайтлистов.

У гугля с этим традиционный швах -- они принципиально против ручной работы. А на письма в abuse и support вообще никогда не отвечают.

[info]http://openid.yandex.ru/dshtan/

July 9 2008, 04:48:38 UTC 3 years ago

Я Вам не верю.
Этого просто не может быть.

[info]iseg

July 9 2008, 20:02:40 UTC 3 years ago

90% полноты выявления спама - это в среднем. За 1 день у одного пользователя может быть и 772/(772+169) = 82%. Не вижу противоречия.

Интереснее сколько в ящике Спам (в 772 письмах) не-спама?

0? 5? 10? Больше?

[info]bmt

July 9 2008, 20:14:13 UTC 3 years ago

Быстро пробежался по спаму за то время:
- не-спам писем лично мне: 0
- не-спам писем-рассылок: 5
- сообщений для модерации с wp-блога, в которых содержались спам-комментарии: 65

Вобщем-то, в папку Спам приходится заглядывать один раз в несколько месяцев, когда кто-то говорит, что точно отправил мне письмо. Ложных срабатываний приемлимо мало.

Что касается комментария quappa, то, как я понимаю, он имел ввиду, что реально 90% спама отсеивается при приеме письма, а уже из этих оставшихся 10% я жалуюсь на 82% полноты. То есть полнота - примерно 98%.

[info]flhack

July 9 2008, 10:11:27 UTC 3 years ago

Я заметил, что в последнее время в gmail стало больше спама прорываться. Но у меня немного другая статистика - за ~18 часов 622 письма в spam, в inbox пришло 25, из них 6 - русскоязычный спам, и 2 - англоязычный. Всего 1.2% от общего числа, все еще относительно нормально, хотя раньше было лучше. Адрес никак не выдает русскоязычность.

[info]ruslan_sem

July 24 2008, 09:15:59 UTC 3 years ago

у меня на gmail в папке спам больше 5000 писем и при этом во входящие письма со спамом попадают не больше пары штук в неделю... так что спам фильтр тренируется вроде как хорошо :)
Create an Account
Forgot your login or password?
Facebook Twitter More login options
English • Español • Deutsch • Русский…