Уже который раз сталкиваюсь с тем, что сервис блокирует посетителей из России, но при этом его боты продолжают кравлить находящиеся в России сайты.
Ситуация "или трусы наденьте, или крестик снимите".
Йошильда :CrabVerified:
Уже который раз сталкиваюсь с тем, что сервис блокирует посетителей из России, но при этом его боты продолжают кравлить находящиеся в России сайты. Ситуация "или трусы наденьте, или крестик снимите". 8 comments
Roman
@di @cybertailor вопрос к специалисту, а ллмки нейронные есть уже для парсинга сайтов? Что бы вычленяли полезное.
di :python: :nyarch:
@3draven Из похожего видел другие сценарии, которые, в целом сводяться к базе знаний: ты загружаешь свои уже более или менее чистые данные и просишь их проанализировать со всеми графиками и пр; загружаешь документацию для онбординга новых сотрудников
di :python: :nyarch:
@3draven https://github.com/VinciGit00/Scrapegraph-ai/tree/main?tab=readme-ov-file
Roman
@di @cybertailor ну идея то на поверхности. Кто то быстро допер :) Буду знать, что такое существует, на случай если надо будет, спасибо.
Йошильда :CrabVerified:
@di Значит не тебе, а компаниям. Перестать огораживать открытый веб заборами.
di :python: :nyarch:
> Значит не тебе, а компаниям > Перестать огораживать открытый веб заборами
hardworm ☭
@cybertailor есть такое linkenIn, Booking.com еще и рассылками заебывают. Мы для тебя что-то подобрали, но не покажем потому что ты в россии |
@cybertailor Я, от лица еверопейской компании, и которая работает только на европейский рынок, паршу американский сайт, который пускает только с американским айпишником. Доктор, что мне надеть, а что снять? =)