Skip to content
wel.org.ua
wel.org.ua

  • Новини
  • Криптовалюта
  • Додатки
  • iT
  • Штучний інтелект
  • Статті
wel.org.ua

Perplexity звинувачують у зборі даних з сайтів, які чітко забороняють AI-скрапінг

Perplexity звинуватили у зборі даних з вебсайтів, які заборонили використання штучного інтелекту для сканування

Катерина Зінченко, 14.08.202531.08.2025

Стартап у сфері штучного інтелекту Perplexity займається збором і копіюванням контенту з веб-сайтів, які чітко заявили, що не бажають бути обробленими, про що повідомляє провайдер інтернет-інфраструктури Cloudflare.

Незаконна діяльність Perplexity

У понеділок Cloudflare випустила дослідження, в якому йдеться про порушення з боку Perplexity. Вони зафіксували, що стартап проігнорував блокування і затаїв свої дії зі збору даних. Дослідники компанії звинуватили Perplexity в приховуванні своєї особи під час спроби збору веб-сторінок, намагаючись обійти побажання сайтів.

Продукти штучного інтелекту, подібні до тих, що пропонує Perplexity, залежать від обробки великих обсягів даних з інтернету. Багато стартапів у галузі штучного інтелекту давно скопіювали тексти, зображення та відео з інтернету без дозволу для оптимізації своїх продуктів. Останнім часом веб-сайти намагалися протидіяти цьому, використовуючи стандартний файл Robots.txt, який вказує пошуковим системам та компаніям штучного інтелекту, які сторінки можна індексувати, а які — ні. Ці зусилля поки що принесли змішані результати.

Згідно з Cloudflare, Perplexity свідомо обходить ці блокування, змінюючи свій «user agent» для ботів, тобто сигнал, який ідентифікує відвідувача веб-сайту за типом і версією пристрою, а також змінює свої автономні системи мереж, що вказує на ідентифікацію великих мереж в інтернеті.

“Цю активність було зафіксовано на десятках тисяч доменів і мільйонах запитів на день. Ми змогли ідентифікувати цей краулер, використовуючи поєднання машинного навчання та мережевих сигналів”, — йдеться у публікації Cloudflare.

Представник Perplexity Джессі Двайер спростував публікацію Cloudflare, назвавши її “рекламним матеріалом”, і додав у листі, що скріншоти з поста “свідчать про те, що жоден контент не був доступний”. У наступному листі Двайер стверджував, що бот, згаданий у публікації Cloudflare, “навіть не належить нам”.

Cloudflare повідомила, що вперше виявила цю поведінку після скарг від своїх клієнтів, які зазначали, що Perplexity збирала дані з їхніх сайтів, навіть після того, як вони встановили правила у своєму файлі Robots.txt, щоб спеціально заблокувати відомі боти Perplexity. Після цього Cloudflare провела перевірки й підтвердила, що Perplexity обходить ці блокування.

“Ми спостерігали, що Perplexity використовує не тільки свій заявлений user-agent, але також загальний браузер, спрямований на маскування під Google Chrome на macOS, коли їхній заявлений краулер був заблокований,” — зазначили у Cloudflare.

Компанія також виключила ботів Perplexity зі свого списку перевірених і впровадила нові технології для їх блокування.

Нещодавно Cloudflare висловила публічну позицію проти AI-краулінгу. Минулого місяця Cloudflare оголосила про запуск ринку, який дозволяє власникам і видавцям веб-сайтів стягувати плату з AI-скреперів, які відвідують їхні ресурси. Головний виконавчий директор Cloudflare Меттью Прінс звернув увагу на те, що AI руйнує бізнес-модель інтернету, особливо для видавців. Минулого року Cloudflare також запустила безкоштовний інструмент для запобігання збору даних ботами для навчання AI.

Штучний інтелект

Навигация по записям

Previous post
Next post

Related Posts

Новини Google интегрирует новости Associated Press в свой ИИ-чат-бот Gemini

Google интегрирует новости Associated Press в свой ИИ-чат-бот Gemini

17.01.202517.01.2025

Google объявила, что ее чат-бот с искусственным интеллектом Gemini будет транслировать актуальные новости от агентства Associated Press (AP). Это первая сделка такого типа между техногигантом и издателем новостей.

Read More
Штучний інтелект Samsung стрімко виводить інновації на новий рівень: цього року компанія подвоює кількість пристроїв зі штучним інтелектом

Samsung стрімко виводить інновації на новий рівень: цього року компанія подвоює кількість пристроїв зі штучним інтелектом

16.01.202620.01.2026

Samsung Electronics, один з провідних гравців на ринку мобільних технологій, має амбіційні плани на найближчі роки. У 2023 році компанія планує суттєво розширити використання штучного інтелекту в своїх мобільних пристроях, подвоївши кількість моделей з функціями Galaxy AI, які в основному базуються на чатботі Gemini від Google. Цей крок стане важливим…

Read More
Штучний інтелект Штучний інтелект в Україні: Яка кількість дорослих і підлітків перетворює технологію на свій стимул до змін?

Штучний інтелект в Україні: Яка кількість дорослих і підлітків перетворює технологію на свій стимул до змін

24.11.202526.11.2025

Результати нового дослідження платформи «Дія.Освіта» вражають: 42% дорослих українців та 70% підлітків активно користуються технологіями штучного інтелекту. Це свідчить про зростаючу прихильність суспільства до інновацій, які впливають на повсякденне життя. Віцепрем’єр-міністр України, відповідальний за цифрову трансформацію, Михайло Федоров, презентував ці дані в соціальній мережі Facebook, підкресливши важливість цього аспекту для…

Read More

Последние записи

  • Клатч Трійки — благодійний турнір за Третій армійський корпус
  • Кампанія на базі S.T.A.L.K.E.R. 2 стала рекордсменом Ukrainian Creative Stories 2026
  • TikTok запускає Campus Hub
  • Конфлікт навколо уразливостей у продуктах Microsoft загострився
  • Що відомо про перші склади збірної України на Esports Nations Cup 2026

Последние коментарии

Нет комментариев для просмотра.

Категории

  • iT
  • Авто
  • Додатки
  • Ігри та кіно
  • Криптовалюта
  • Наука та космос
  • Новини
  • Пристрої
  • Статті
  • Штучний інтелект
©2026 wel.org.ua | WordPress Theme by SuperbThemes