Полная хиромантия

00:04 14/03/2017 Наука и техника
Полная хиромантия
Матановая капча спасет интернеты от школоты, хе-хе.

Специалисты корпорации Google наконец-то усовершенствовали капчу, избавив пользователя от надобности вводить слова и выполнять другие непонятные действия. Отныне технология распознавания ботов способна самостоятельно определить, человек перед ней или нет. «Лента.ру» разобралась, как начиналась война с машинами и кто в ней одерживает победу.

Новая надежда

Капча (CAPTCHA — Completely Automated Public Turing test to tell Computers and Humans Apart) — это автоматизированный публичный тест Тьюринга, направленный на выявление компьютеров среди посетителей сайтов. Этот механизм защиты должен оградить сайты от спама, автоматических регистраций, накруток и прочих нелицеприятных дел, которыми обычно занимаются боты.

Классическая капча заключается в необходимости расшифровать сильно искаженный текст, трудно распознаваемый программными алгоритмами. Технология Google с говорящим названием No CAPTCHA отходит от стандартной концепции автоматизированного теста Тьюринга и оценивает поведение пользователя в сети, а не его способность разгадывания слов.

Пользователю нужно выполнить простейшее действие — отметить галочкой утверждение «Я не робот». В этот момент специальный скрипт оценивает косвенные параметры, указывающие на возможного бота: информация о времени, проведенном на странице, IP-адрес и прочее. Если же у No CAPTCHA закрадываются сомнения в том, что пользователь — человек, то она предложит выполнить простое задание, вроде поиска определенного объекта на картинках или ввода стандартной капчи.

По сравнению с классической системой, даже нынешнее исполнение No CAPTCHA не особо обременяет пользователей. А усовершенствованная технология даже не требует ставить галочек. При проверке на экране откроется маленькое окно, в котором галочка ставится автоматически, сообщая пользователю о том, что он все-таки не робот. Если же система не уверена в этом, она запустит такой же механизм проверки, что и ранее.

Рассказывая о No CAPTCHA, разработчики ограничиваются лишь ссылками на машинное обучение и продвинутый анализ рисков, адаптируемый к новым угрозам. И их можно понять: не зная принципа работы системы, взломщики не смогут ее обойти.

Рождение легенды

Оригинальная версия капчи была разработана в 2000 году специалистами американского университета Карнеги — Меллон. Команда под руководством Луиса Фон Ана (Luis von Ahn) поставила перед собой цель создать защиту, устойчивую к распознанию и угадыванию. Это значит, что капча должна быть нерешаемой для систем распознавания текстов и прочих алгоритмов, а также ее нельзя угадать за малое число попыток (менее 1000). Но для человека она не представляет никакой трудности.

Один из первых и простейших способов обхода защиты — обратиться к обычному пользователю. Спамеры просто платили, причем смешные деньги — цент за картинку, но в бедных странах и это немало. Но в целом система была эффективна, и разработчики озадачились уже совсем другой проблемой.

Создатели капчи понимали, что на решение загадок с зашифрованным текстом миллионы пользователей тратят уйму времени, и было бы неплохо направить эти ресурсы в полезное русло. Так в 2007 году появилась reCAPTCHA, совмещающая, что называется, приятное с полезным. Ключевая ее особенность — то, что система не только защищает сайты от ботов, но и выполняет функцию расшифровки архивных документов.

ReCAPTCHA предлагает ввести пользователю не одно, а два слова, что довольно редко встречается в других системах. Секрет в том, что одно слово уже известно системе, и именно по нему будет проходить проверка, а второе взято из отсканированного документа, не расшифровываемого алгоритмом. Таким образом при прохождении теста пользователь помогает расшифровать реальный текст из старого документа. Конечно же, никто ему за это не заплатит, да и знали о такой уловке немногие.

Когда с помощью reCAPTCHA были расшифрованы архивные номера газеты The New York Times, на авторов этой системы обратили внимание в Google. В итоге «корпорация добра» купила сервис (в 2009 году) и взялась за расшифровку старых книг, а потом и за распознавание фрагментов снимков из Google Street View. Благодаря сервису в день оцифровывалось примерно 100 миллионов слов, что давало более двух миллионов книг в год.

Помимо reCAPTCHA, есть множество других вариантов. Умельцы со всего мира создают системы защиты с помощью логических и математических задач, интегрируют простенькие игры и разрабатывают все более и более продвинутые варианты. Но классическая капча с текстом остается одной из самых сбалансированных систем, хотя от ботов она уже не спасает.

Бесполезная защита

Одна из главных проблем любой капчи — ее исполнение. Боты — проблема не для пользователей, а для администраторов сайта. Перекладывать ее решение на обычных людей некорректно, тем более что при вводе очередной капчи пользователи испытывают лишь раздражение.

С развитием алгоритмов и искусственного интеллекта многие механизмы защиты стали практически бесполезными. Такая судьба постигла аудио- и видеокапчу, а также многие варианты защиты с логическими вопросами и картинками. В 2014 году сама Google продемонстрировала алгоритм, способный распознать и взломать даже максимально сложные изображения reCAPTCHA с 99,8-процентной вероятностью. Кстати, этот показатель даже выше, чем у человека.

Немало претензий и к самой reCAPTCHA. В первую очередь, необходимость вводить два слова увеличивает время выполнения задания. Не стоит забывать и о том, что пользователь помогает расшифровывать книги, тем самым выполняя работу для Google, и за эту работу ему никто не платит. Поэтому шаг поискового гиганта по изменению привычной капчи на нечто более умное и незаметное выглядит верным. Остается под вопросом лишь то, насколько умно система будет работать и точно ли облегчит жизнь рядовым пользователям.

Влад Массино

Комментирование разрешено только первые 24 часа.

Комментарии(31):

1 2+1
9 +0−0Aleksandre Ice06:40:55
14/03/2017
Матановая капча спасет интернеты от школоты, хе-хе.
6 +0−0Anton Davidenko01:46:11
14/03/2017
Комментарий удалён.
Капчи на тебя нет, ботяра
3 +0−0uhguri pouhrfg02:48:39
14/03/2017
Капча "Я не робот" реально достала. Хуже только реКапча была. "Я не робот" постоянно, процентов в 80% случаев, заставляет выбирать витрины или еду на картинках, где хрен что разглядишь. С первого раза, без картинок, проверку проходишь очень редко.
Что касается рекапчи, то я всегда вводил только одно слово, проверочное. А то, что было из книги для оцифровки, я игнорировал, точнее вводил что угодно.
2 +0−0Jello To12:05:45
14/03/2017
"Этот механизм защиты должен оградить сайты от спама, автоматических регистраций, накруток и прочих нелицеприятных дел, которыми обычно занимаются боты."
Нелицеприятный - книжн. не основанный на лицеприятии, на стремлении угодить кому-либо; беспристрастный, справедливый.
2 +0−0Somebodyhere10:50:48
14/03/2017
Каким же нужно быть жлобом, чтобы ныть, что Гугл - да и кто угодно - не заплатил за помощь в расшифровке одного-единственного слова. И это для оцифровки книг, которые потом выкладываются в открытый доступ. Для всех. Переломились вы помочь, бедные.
2 +0−0uhguri pouhrfg02:50:34
14/03/2017
6 +0−0Anton Davidenko01:46:11
14/03/2017
Капчи на тебя нет, ботяра
Он модератору приплачивает. Давно заметил что модеры тут только нормальных людей вроде меня банят, а со спамом никто не борется.
2 +0−0Ilia The God01:46:09
14/03/2017
Капча умер, да здравствует Капча!
1 +0−0Дмитрий Волков22:23:02
14/03/2017
0 +0−0№-186014122:06:51
14/03/2017
Жлобство из-за того, что пользовать получает двойную капчу. С другой стороны, для знающих английский такую капчу словами отгадать и ввести легче, чем набор букв и цифр.
Кстати она моя самая любимая. У меня, да и у многих, думаю, не очень хорошо с цветовым зрением. Обычная капча с кучей намешанных цветастых букв и цифр - настоящая мука. А здесь всего то быстро ввести пару слов. Как правило весьма читабельных.
1 +0−0Дмитрий Волков22:20:10
14/03/2017
0 +0−0Pomedork011:50:00
14/03/2017
Секундочку... насчет РеКапчи просветите: она состоит из 2 слов, из которых сам сайт, ее запрашивающий "знает" только второе. Пользователь должен прочитать и ввести первое слово и т.о. его "оцифровать". Но если сайт НЕ ЗНАЕТ этого слова, получается вводить по сути можно что угодно?
Каким образом эту сложность решили?
Можно что угодно. Но пользователь не знает первое это слово или второе и пытается ввести оба правильно. Даже если в незнакомом машине слове будет ошибка, то при выборке, например, из 100 пользователей, кто "разгадывал" это же слово, всё равно большинство даст некий "верный" ответ, его программа и поймёт как расшифровку. Весьма умная эксплуатация юзеров для расшифровки нечитаемых оцифровывающими программами слов. Честно - не знал об этом.
1 +0−0Роман Фандеев15:13:31
14/03/2017
0 +0−0Pomedork011:50:00
14/03/2017
Секундочку... насчет РеКапчи просветите: она состоит из 2 слов, из которых сам сайт, ее запрашивающий "знает" только второе. Пользователь должен прочитать и ввести первое слово и т.о. его "оцифровать". Но если сайт НЕ ЗНАЕТ этого слова, получается вводить по сути можно что угодно?
Каким образом эту сложность решили?
Я так думаю что не оцифрованное слово принимается любое... те владелец сайта таким образом оплачивает за счет своих посетителей услугу гугла за предоставленный сервис. Вроде все честно и полезно.

А гугл показыает это слово 1 000раз и берет в оцифрованный вариант тот что ввели не менее скажем 99% одинаково. Те получил полезную работу, а не денежку с вебмастера за предоставление услуги по защите.
1 +0−0Mack Tech13:00:21
14/03/2017
2 +0−0Somebodyhere10:50:48
14/03/2017
Каким же нужно быть жлобом, чтобы ныть, что Гугл - да и кто угодно - не заплатил за помощь в расшифровке одного-единственного слова. И это для оцифровки книг, которые потом выкладываются в открытый доступ. Для всех. Переломились вы помочь, бедные.
То то за последние несколько лет исчезли почти все легальные сайты с книгами, а сейчас и библиотек для чтения как таковых почти нет. Открытый доступ в интернете скорее исключение чем правило и дальше будет хуже, дело не в жлобстве, а использовании как минимум дважды человека в своих интересах тратя его время и частенько нервы.
1 +0−0Сергей Санин11:30:24
14/03/2017
а какая изящная задумка рекапчи!
респект! ;)
1 +0−0Pomedork010:45:30
14/03/2017
Вылитый Охлобыстин на заглавном скрине из ПвД.
0 +0−0Максим Незнайка02:37:13
15/03/2017
0 +0−0Sergei Krutov01:38:20
15/03/2017
смысл в том, что бот твой а человек сервис. Я привел пример, что эти каптчи уже давным давно не работают, а только создают трудности пользователям
Ну в простых случаях работают. Подход простой - если тебя захотят сломать целенаправленно - сломают, но от банальных краулеров - капча спасает нормально.
0 +0−0Sergei Krutov01:38:20
15/03/2017
0 +0−0Максим Незнайка01:32:31
15/03/2017
Смысл передавать координаты боту, если человек все равно уже задействован?
смысл в том, что бот твой а человек сервис. Я привел пример, что эти каптчи уже давным давно не работают, а только создают трудности пользователям
0 +0−0Максим Незнайка01:32:31
15/03/2017
0 +0−0Sergei Krutov23:16:58
14/03/2017
Это статья 5 летней давности? Давно уже есть такие сервисы как смерть от каптчи, где картинки посылаюся какому индусу, тот кликает, и координаты передаются обратно к боту. который тупо кликает по тем координатам. на все про все занимает секуд 5.
Смысл передавать координаты боту, если человек все равно уже задействован?
0 +0−0Sergei Krutov23:16:58
14/03/2017
0 +0−0Макс Анохин11:03:09
14/03/2017
Если 85% говорят, что написано morning, а 15, что moming, то в чистовик пойдёт первое
Это статья 5 летней давности? Давно уже есть такие сервисы как смерть от каптчи, где картинки посылаюся какому индусу, тот кликает, и координаты передаются обратно к боту. который тупо кликает по тем координатам. на все про все занимает секуд 5.
0 +0−0№-186014122:06:51
14/03/2017
2 +0−0Somebodyhere10:50:48
14/03/2017
Каким же нужно быть жлобом, чтобы ныть, что Гугл - да и кто угодно - не заплатил за помощь в расшифровке одного-единственного слова. И это для оцифровки книг, которые потом выкладываются в открытый доступ. Для всех. Переломились вы помочь, бедные.
Жлобство из-за того, что пользовать получает двойную капчу. С другой стороны, для знающих английский такую капчу словами отгадать и ввести легче, чем набор букв и цифр.
0 +0−0Максим Незнайка20:53:37
14/03/2017
-1 +0−0Elena Li12:44:59
14/03/2017
думаете, большинство честно и прилежно расшифровывало вместо того, чтобы экономить своё время?))
Конечно
0 +0−0Артем Олегов15:28:12
14/03/2017
1 +0−0Pomedork010:45:30
14/03/2017
Вылитый Охлобыстин на заглавном скрине из ПвД.
А почему у него на лице флаг ЙЁпонии?
1 2+1
Самые
^^^Наверх^^^Обратная связь