Данный термин начал использоваться еще в далеком 2000 году. Русскоязычный сегмент рынка использует русский вариант транскрипции – капча. Капча представляет собой тест, с помощью которого отфильтровываются боты. Вся суть капчи в том, что для живого человека выполнение теста не составит никаких проблем, в то время как компьютер пока что не научился выполнять подобные задачи. В большинстве случаев CAPTCHA находит применение в случае необходимости предотвращения автоматически созданных аккаунтов, размещения спам-сообщений на различных площадках.
Виды CAPTCHA
Сегодня представлено достаточно большое количество разновидностей капч:
Графическая.Пользователь, чтобы пройти тест, должен указать цифры, буквы и прочие символы, которые демонстрируются на искаженной картинке (делается это специально для того, чтобы усложнить задачу боту).
Звуковая.Заключается в распознавании текста, что звучит на аудио. Предназначен также для тех пользователей, которые имеют проблемы со зрением. Логическая капча. Предлагает исключить лишнее из предлагаемых слов или картинок.
Образная.Пользователь должен распознавать определенные образы.
Видео.Фон с символами двигаются.
Важность защиты от ботов
Чтобы сайт развивался и продвигался, оптимизаторам необходимо принимать целый пакет дополнительных мер, с помощью которых исключается возможность распознавания капч ботами.
- Устранить уязвимости. Это можно сделать, используя скрипты.
- Исключение возможности перебора. Бот может просто начать угадывать. Если в задаче имеется десять картинок, то есть 1024 варианта, один из которых окажется верным.
- Исключить автоматическое распознавание. Сегодня созданы несколько сервисов, с помощью которых удается определить капчу. Если картинка не слишком сложная в графическом плане, то в большинстве случаев эти сервисы смогут распознать, что именно написано на капче.
Дополнительные методы обхода капчи
Роботы могут использовать повторный идентификатор пользовательской сессии; Восстановление необходимых символов на основе данных, имеющихся на странице; Сбор базы данных под различные варианты капч с помощью генераторов чисел и прочего.
Как работает CAPTCHA?
Классические CAPTCHA, которые до сих пор используются на некоторых веб-ресурсах, включают просьбу пользователей идентифицировать буквы. Буквы искажены, поэтому боты вряд ли смогут их идентифицировать. Чтобы пройти тест, пользователи должны интерпретировать искаженный текст, ввести правильные буквы в поле формы и отправить форму. Если буквы не совпадают, пользователям предлагается повторить попытку. Такие тесты распространены в формах входа в систему, формах регистрации учетной записи, онлайн-опросах и страницах оформления заказа в электронной коммерции.
Идея состоит в том, что компьютерная программа, такая как бот, не сможет интерпретировать искаженные буквы, в то время как человек, который привык видеть и интерпретировать буквы в самых разных контекстах - с разными шрифтами, разными почерками и т. Д. - обычно будет уметь их идентифицировать.
Лучшее, что могут сделать многие боты, - это ввести несколько случайных букв, что делает статистически маловероятным их прохождение теста. Таким образом, боты не проходят тест и не могут взаимодействовать с веб-сайтом или приложением, в то время как люди могут продолжать использовать его как обычно.
Продвинутые боты могут использовать машинное обучение для определения этих искаженных букв, поэтому такие тесты CAPTCHA заменяются более сложными. Google reCAPTCHA разработал ряд других тестов для отделения пользователей-людей от ботов.
Что такое reCAPTCHA?
reCAPTCHA - это бесплатная услуга, которую Google предлагает вместо традиционных CAPTCHA. Технология reCAPTCHA была разработана исследователями из Университета Карнеги-Меллона, а затем приобретена Google в 2009 году.
reCAPTCHA более продвинутый, чем типичные тесты CAPTCHA. Как и CAPTCHA, некоторые reCAPTCHA требуют, чтобы пользователи вводили изображения текста, которые компьютеры не могут расшифровать. В отличие от обычных CAPTCHA, reCAPTCHA получает текст из реальных изображений: изображения уличных адресов, текст из печатных книг, текст из старых газет и так далее.
Со временем Google расширил функциональность тестов reCAPTCHA, так что им больше не нужно полагаться на старый стиль определения размытого или искаженного текста. Другие типы тестов reCAPTCHA включают:
- Распознавание изображений
- Флажок
- Общая оценка поведения пользователя (без взаимодействия с пользователем)
Как работает тест reCAPTCHA с распознаванием изображений?
Для теста reCAPTCHA распознавания изображений пользователям обычно предоставляются 9 или 16 квадратных изображений. Все изображения могут принадлежать к одному и тому же большому изображению, или каждое может быть различным. Пользователь должен идентифицировать изображения, содержащие определенные объекты, такие как животные, деревья или уличные знаки. Если их ответ совпадает с ответами большинства других пользователей, представивших тот же тест, ответ считается «правильным», и пользователь проходит тест.
Выделение определенных объектов на размытых фотографиях - трудная задача для компьютера. Даже продвинутые программы искусственного интеллекта (AI) борются с этим - так что бот тоже будет бороться с этим. Однако человек-пользователь должен уметь делать это довольно легко, поскольку люди привыкли воспринимать повседневные объекты во всех контекстах и ситуациях.
Как работают тесты reCAPTCHA с одним флажком?
Некоторые тесты reCAPTCHA просто предлагают пользователю установить флажок рядом с утверждением «Я не робот». Однако проверка - это не фактическое действие по установке флажка - это все, что приводит к установке флажка.
Этот тест reCAPTCHA учитывает движение курсора пользователя по мере приближения к флажку. Даже самое прямое движение человека имеет некоторую степень случайности на микроскопическом уровне: крошечные бессознательные движения, которые боты не могут легко имитировать. Если движение курсора содержит в себе часть этой непредсказуемости, тогда тест решает, что пользователь, вероятно, легитимен. ReCAPTCHA также может оценивать файлы cookie, хранящиеся браузером на пользовательском устройстве, и историю устройства, чтобы определить, может ли пользователь быть ботом.
Если тест по-прежнему не может определить, является ли пользователь человеком, он может представлять дополнительную проблему, такую как тест распознавания изображения, описанный выше. Однако в большинстве случаев движения курсора пользователя, файлы cookie и история устройства достаточно убедительны.
Что позволяет работаеть reCAPTCHA без взаимодействия с пользователем?
Последние версии reCAPTCHA способны комплексно взглянуть на поведение пользователя и историю взаимодействия с контентом в Интернете. В большинстве случаев программа может решить, основываясь на этих факторах, является ли пользователь ботом, не предлагая пользователю выполнить задачу. Если нет, то пользователь получит типичный запрос reCAPTCHA.
Что инициирует запуск теста CAPTCHA?
Некоторые веб-ресурсы просто автоматически имеют CAPTCHA в качестве упреждающей защиты от ботов. В других случаях тест может запускаться, если поведение пользователя кажется похожим на поведение бота: например, если пользователи запрашивают веб-страницы или щелкают гиперссылки с гораздо большей частотой, чем в среднем.
Достаточно ли CAPTCHA и reCAPTCHA для остановки вредоносных ботов?
Некоторые боты могут обходить текстовые CAPTCHA самостоятельно. Исследователи продемонстрировали способы написать программу, которая также превосходит CAPTCHA распознавания изображений. Кроме того, злоумышленники могут использовать фермы кликов, чтобы пройти тесты: тысячи низкооплачиваемых работников решают CAPTCHA от имени ботов.
Кроме капчи, там должны быть и другие стратегии в месте для остановки нежелательных ботов (например, контент очищающих ботов , верительных начинку ботов , или спам - ботов).
Каковы недостатки использования CAPTCHA или reCAPTCHA для остановки ботов?
Плохое взаимодействие с пользователем: тест CAPTCHA может прервать поток того, что пользователи пытаются сделать, что даст им негативное представление о своем опыте использования веб-ресурса и в некоторых случаях приведет к тому, что они вообще откажутся от веб-страницы.
Не подходит для людей с ослабленным зрением: проблема с CAPTCHA заключается в том, что они полагаются на визуальное восприятие. Это делает их практически невозможными не только для слепых людей, но и для тех, у кого серьезно ослаблено зрение.
Боты могут обмануть эти тесты: как описано выше, CAPTCHA не полностью защищена от ботов, и на них нельзя полагаться при управлении ботами.
Есть ли альтернативы использованию CAPTCHA или reCAPTCHA?
Решения для управления ботами, такие как Cloudflare Bot Management, могут определять плохих ботов, не влияя на взаимодействие с пользователем, в зависимости от поведения бота. Таким образом, ботов можно уменьшить, не заставляя пользователей заполнять CAPTCHA.
Как CAPTCHA и reCAPTCHA связаны с проектами искусственного интеллекта (AI)?
Поскольку миллионы пользователей идентифицируют трудночитаемый текст и выделяют объекты на размытых изображениях, эти данные передаются в компьютерные программы AI, чтобы они также лучше справлялись с этими задачами.
В общем, компьютерные программы борются с идентификацией предметов и букв в разных контекстах, потому что в реальном мире контекст может меняться почти бесконечно. Например, знак «стоп» представляет собой красный восьмиугольник с белыми буквами «СТОП». Компьютерная программа могла довольно легко определить такое сочетание формы и слова. Однако знак остановки на фотографии может сильно отличаться от этого простого описания в зависимости от контекста: ракурса фотографии, освещения, погоды и т. Д.
Благодаря машинному обучению программы ИИ могут лучше преодолевать эти ограничения. В примере со знаком остановки программист должен передать программе ИИ кучу данных о том, что является знаком остановки, а что нет. Чтобы это было эффективно, им нужно множество примеров изображений со знаками остановки и изображений без знаков остановки, и им нужно, чтобы пользователи-люди идентифицировали их до тех пор, пока программа не соберет достаточно данных, чтобы быть эффективными.
Тут еще никто ничего не писал, стань первым!