@skobkin Я давно уже говорил, что пора наконец выучить уроки прошлого, и ввести хотя бы серые списки, которые в почте очень хорошо порезали долю спама и прочих нежелательных явлений.
Top-level
@skobkin Я давно уже говорил, что пора наконец выучить уроки прошлого, и ввести хотя бы серые списки, которые в почте очень хорошо порезали долю спама и прочих нежелательных явлений. 6 comments
@skobkin Механизм серых списков - он и так децентрализованный, если что. И это не черный список, и не белый. Это список "я этого хера с горы* впервые вижу и еще не понимаю, доверять ему или нет". * сервер, в смысле @drq Ну мы это уже в паре тредов обсуждали, да. @skobkin Я считаю, нужен комплексный подход. Метод, предлагаемый тобой тоже имеет право иметь место быть. Беда в том, что проблема спама (как и любая, на самом деле, проблема модерации, раз уж на то пошло) - не решаема аналитическими методами. Это всегда битва брони и снаряда, гонка вооружений, уравнение без корней. И некоторые думают, что это повод не решать ее в принципе. |
@drq
Да, возможно. Хотя идея тоже достаточно неприятная на самом-то деле.
Мы знаем, что благодаря таким разным спискам иметь почту на своём домене может быть не так просто как кажется.
Ну, точнее, иметь её просто, а вот чтобы она работала как ожидается - это уже другое.
Мне КАЖЕТСЯ, что можно посмотреть в это направление с поправкой на то, что списки должны быть федерированными, а не цетрализованными вроде спамхаусов. А ещё в сторону машинного обучения, которое всё дешевеет и проприетарными сетями ДАВНО используется.
Например, в чате Радио-Т работает антиспам, который сделан на коленке поверх GPT-4 по-моему.
Можно было бы подумать о том чтобы делать подобные решения с более целевой тренировкой на базе каких-нибудь llama/alpaca, etc. И подумать как их недорого дообучать на новых данных и делиться этим с другими.
@drq
Да, возможно. Хотя идея тоже достаточно неприятная на самом-то деле.
Мы знаем, что благодаря таким разным спискам иметь почту на своём домене может быть не так просто как кажется.
Ну, точнее, иметь её просто, а вот чтобы она работала как ожидается - это уже другое.
Мне КАЖЕТСЯ, что можно посмотреть в это направление с поправкой на то, что списки должны быть федерированными, а не цетрализованными вроде спамхаусов. А ещё в сторону машинного обучения, которое всё дешевеет и проприетарными сетями...