Email or username:

Password:

Forgot your password?
Йошильда :CrabVerified:

Уже который раз сталкиваюсь с тем, что сервис блокирует посетителей из России, но при этом его боты продолжают кравлить находящиеся в России сайты.

Ситуация "или трусы наденьте, или крестик снимите".

8 comments
di :python: :nyarch:

@cybertailor Я, от лица еверопейской компании, и которая работает только на европейский рынок, паршу американский сайт, который пускает только с американским айпишником. Доктор, что мне надеть, а что снять? =)

Roman

@di @cybertailor вопрос к специалисту, а ллмки нейронные есть уже для парсинга сайтов? Что бы вычленяли полезное.

di :python: :nyarch:

@3draven
Если често - никогда не интересовался вопросом. Я не помню, чтобы у меня были задачи, когда можно взять приблизительные значения из текста: цена\количество товара, значение переменной в формуле, какя-нибудь цифра из пдф отчёта итд

Из похожего видел другие сценарии, которые, в целом сводяться к базе знаний: ты загружаешь свои уже более или менее чистые данные и просишь их проанализировать со всеми графиками и пр; загружаешь документацию для онбординга новых сотрудников
@cybertailor

Roman

@di @cybertailor ну идея то на поверхности. Кто то быстро допер :) Буду знать, что такое существует, на случай если надо будет, спасибо.

Йошильда :CrabVerified:

@di
> от лица компании
> мне

Значит не тебе, а компаниям. Перестать огораживать открытый веб заборами.

di :python: :nyarch:

@cybertailor

> Значит не тебе, а компаниям
а зачем я тогда там работаю?

> Перестать огораживать открытый веб заборами
ты ещё паспорта предложи отменить /s я вообще удивлён, что веб столько продержался

hardworm ☭

@cybertailor есть такое linkenIn, Booking.com еще и рассылками заебывают. Мы для тебя что-то подобрали, но не покажем потому что ты в россии

Go Up