Skip to content
wel.org.ua
wel.org.ua

  • Новини
  • Криптовалюта
  • Додатки
  • iT
  • Штучний інтелект
  • Статті
wel.org.ua

Perplexity звинувачують у зборі даних з сайтів, які чітко забороняють AI-скрапінг

Perplexity звинувачують у зборі даних з сайтів, які чітко забороняють AI-скрапінг

Наталія Кравець, 08.08.202526.08.2025

Стартап штучного інтелекту Perplexity збирає та копіює контент з вебсайтів, які чітко заявили, що не хочуть бути частиною таких процесів, згідно з інформацією від компанії Cloudflare, яка забезпечує інфраструктуру для інтернету.

Як діє Perplexity

Cloudflare опублікував дослідження, у якому стверджується, що стартап Perplexity проігнорував блокування та сховав свої дії з краулінгу та копіювання. Великий провайдер інтернет-інфраструктури звинуватив Perplexity у тому, що вони приховують свою особистість під час спроби зібрати дані з вебсторінок, намагаючись обійти побажання сайтів.

Продукти штучного інтелекту, як ті, що пропонує Perplexity, покладаються на збір великих обсягів даних з інтернету. Стартапи в цій сфері вже давно крадуть текст, зображення та відео з мережі без дозволу, щоб їх продукти могли функціонувати. Останнім часом вебсайти намагаються протистояти цьому, використовуючи стандарт Robots.txt, який вказує пошуковим системам та компаніям штучного інтелекту, які сторінки можна індексувати, а які – ні. Однак ці спроби мали змішані результати.

За даними Cloudflare, Perplexity, ймовірно, свідомо обминає ці блокування, змінюючи “user agent” своїх ботів. Це сигнал, що ідентифікує відвідувача сайту за типом пристрою та версією, а також змінюючи свої автономні системи або ASN, що є числом, що ідентифікує великі мережі в інтернеті.

“Цю активність спостерігали на десятках тисяч доменів та мільйонах запитів на день. Ми змогли ідентифікувати цього краулера, використовуючи поєднання машинного навчання та мережевих сигналів,” — йдеться в дописі Cloudflare.

Представник Perplexity Джесси Двайер назвав допис Cloudflare продажним, зазначивши в електронному листі, що скріншоти не показують доступу до контенту. У наступному листі Двайер стверджував, що бот, згаданий у блозі Cloudflare, “навіть не наш”.

Доказова база Cloudflare

Cloudflare вказав, що вперше помітив цю поведінку після скарг своїх клієнтів, які повідомляли, що Perplexity сканував і копіював їхні сайти, навіть після додавання правил на їхньому файлі Robots та для специфічного блокування відомих ботів Perplexity. Після цього Cloudflare провела тести, які підтвердили, що Perplexity справді обминає ці блокування.

“Ми спостерігали, що Perplexity використовує не лише свій заявлений user-agent, але й стандартний браузер, який намагається видати себе за Google Chrome на macOS, коли їхній заявлений краулер був заблокований,” повідомляє Cloudflare.

Компанія також зазначила, що виключила ботів Perplexity з підтвердженого списку та впровадила нові техніки для їх блокування.

Останнім часом Cloudflare зайняла публічну позицію проти краулерів штучного інтелекту. Минулого місяця компанія оголосила про запуск маркетплейсу, який дозволяє власникам вебсайтів стягувати плату з AI-сканерів, що відвідують їхні сайти. Генеральний директор Cloudflare Метью Прінс підкреслив, що штучний інтелект порушує бізнес-модель інтернету, зокрема для видавців. Минулого року Cloudflare також запустила безкоштовний інструмент для запобігання збору даних ботами з вебсайтів для навчання AI.

Новини

Навигация по записям

Previous post
Next post

Related Posts

iT ByteDance и американская компания совместно разрабатывают инновационный чип для искусственного интеллекта

ByteDance и американская компания совместно разрабатывают инновационный чип для искусственного интеллекта

24.06.202428.06.2025

Владелец социальной платформы TikTok, компания ByteDance, и американская корпорация Broadcom объединились для разработки передового процессора искусственного интеллекта.

Read More
Новини Американський страховий гігант Aflac повідомляє про крадіжку особистих даних клієнтів під час кібератаки

Як злодії витягнули дані 22,6 мільйона людей і чого це коштує нашій безпеці

19.01.202622.01.2026

У червні цього року велика американська страховка Aflac виявила значний витік даних, який став наслідком хакерської атаки. Зловмисники змогли отримати доступ до особистої інформації мільйонів клієнтів, включаючи номери соціального забезпечення та медичні дані, однак компанія не повідомила, скільки постраждалих було в результаті атаки. Деталі кібератаки Нещодавно компанія оголосила про початок…

Read More
Новини Очільник норвезької розвідки вважає, що російські хакери захопили контроль над дамбою

Очільник норвезької розвідки вважає, що російські хакери захопили контроль над дамбою

14.08.2025

У квітні російські хакери на короткий час захопили контроль над дамбою в Норвегії, внаслідок чого вивільнили мільйони літрів води, перш ніж атаку вдалося зупинити, повідомив у четвер глава норвезької розвідки. Зловмисники відкрили скидання води на дамбі Бремангер на заході Норвегії, випустивши в воду еквівалент трьох олімпійських басейнів під час чотирьох…

Read More

Последние записи

  • Клатч Трійки — благодійний турнір за Третій армійський корпус
  • Кампанія на базі S.T.A.L.K.E.R. 2 стала рекордсменом Ukrainian Creative Stories 2026
  • TikTok запускає Campus Hub
  • Конфлікт навколо уразливостей у продуктах Microsoft загострився
  • Що відомо про перші склади збірної України на Esports Nations Cup 2026

Последние коментарии

Нет комментариев для просмотра.

Категории

  • iT
  • Авто
  • Додатки
  • Ігри та кіно
  • Криптовалюта
  • Наука та космос
  • Новини
  • Пристрої
  • Статті
  • Штучний інтелект
©2026 wel.org.ua | WordPress Theme by SuperbThemes