Завязка простая: в начале июля генеральные прокуроры американских штатов Небраска и Оклахома обратились с открытым письмом в компанию Google, прося пояснить, как много денег она имеет с рекламы, которую размещают в роликах (или рядом) YouTube, скажем так, сомнительной легальности. В самом деле, на «Ютубе» полно видеоматериалов, посвящённых таким темам, как покупка наркотических препаратов без рецепта, подделка документов, перепродажа краденых вещей, поиск пиратского контента, выбор борделя и т. п. Существование целого пласта такого контента — не новость, ему даже посвящают полномасштабные исследования (см., к примеру, совсем свежий отчёт некоммерческого Digital Citizens Alliance: там и медикаменты, и «левак», и проститутки; скриншоты из него иллюстрируют сегодняшнюю колонку). Но «заливают» ролики простые пользователи, а вот Google, не моргнув глазом, вешает тут же рекламные объявления.
Речь не идёт о цензуре: прокуроры не настаивают на удалении самих роликов, по крайней мере без суда, да и склонить к этому Google вряд ли удастся: она давно уже держится принципиальной позиции «Свобода слова прежде всего». Однако авторов письма беспокоит денежный интерес: поисковому гиганту стоило бы поостеречься зарабатывать на в высшей степени сомнительном контенте. Ведь таким образом приличная компания вступает в партнёрские отношения с производителями материалов, которые точно не стоит видеть детям, а очень может быть, что и взрослым — тоже.
В Google проблему понимают; это можно утверждать, потому что совсем недавно её уже штрафовали за очень похожий проступок — показ рекламных объявлений от продавцов несертифицированных медикаментов (см. «Как Google виагрой торговала»). Это было два года назад и кое-чему компанию научило: по крайней мере заявки от рекламодателей она теперь проверяет тщательно, чем уменьшила поток нелегальной рекламы на 99,9% (по её же собственной оценке). Но с рекламой проще: там можно проверить ключевые слова, выделить смысловую составляющую, наконец, изучить сайт, на который ссылается объявление. Что компания и делает, используя «значительные людские и технические ресурсы» (конец цитаты). Однако, вопрошая, почему же тогда Google не прекратит и показ рекламы рядом с сомнительными роликами, прокуроры невольно превращаются в того самого недовольного пользователя из классического примера выше.
О святая простота! YouTube — третий по посещаемости сайт глобальной сети. Больше миллиарда уникальных посетителей в месяц, 100 часов нового видео каждую минуту: как можно — и можно ли вообще — контролировать эту лавину? Безусловно, автоматика здорово помогает. Например, обнаружение роликов, нарушающих авторские права, теперь почти полностью автоматизировано: движок под названием Content ID ежесуточно сканирует свыше 200 лет новых видеозаписей — и, обнаружив сходство с «защищёнными копирайтом» произведениями, выдаёт сигнал на удаление нелицензионных копий. Но как отловить ролик, в котором, например, учат подделывать водительское удостоверение?
И не подумайте, что Google одинока. «ВКонтакте», у которой на изъятых (украинской полицией) с месяц назад серверах была якобы обнаружена детская порнография, оказалась в очень похожей ситуации. Почему компания, составленная из краснодипломников с зашкаливающим IQ, не в состоянии тотчас же удалять попадающие на её территорию незаконные материалы? Уж не потому ли, что пользователей, привлечённых таким контентом, можно какое-то время кормить рекламой? Ответ держал лично Павел Дуров, разразившийся пространным, но неубедительным письмом. (Положа руку на сердце, вы верите, что «ВКонтакте» не имеет возможности подсчитать, сколько уникальных пользователей смотрело конкретный ролик?) Самое важное в ответе Павла — фраза «(такие) Видеоролики… моментально удаляются по жалобам пользователей и служб мониторинга». Запомните её.
Скажу больше: все крупные интернет-компании рано или поздно сталкиваются с той же проблемой. Ещё до взрыва социальных сетей Yahoo! извинялась за свирепствовавших в её чат-румах педофилов. Закрыв десятки тысяч чатов, названия которых хоть как-то намекали на интим с детьми (опять же повезло: чистый текст легко анализировать), она в конце концов пошла на сотрудничество с правоохранительными органами. А ещё раньше тем же «болела» Microsoft.
Абстрагируясь от специфики каждого отдельного случая, в сухом остатке мы имеем печальный вывод: техника бессильна перед объёмом. Нам пока нечего противопоставить множащимся терабайтам контента, кроме собственных глаз. Проблема чем-то напоминает борьбу с порнографией — идентифицировать которую и человек-то не всегда в состоянии, не то что машина (см. «Идентификация порно»). Только здесь ещё сложней: как может та же Google ограничить монетизацию сомнительного контента, если даже чёткого определения такого контента не существует? (Что-то явно нелегально, а для признания незаконным остального требуется решение суда.)
Единственным более или менее действенным средством остаётся «гражданский контроль», который гиганты и эксплуатируют. Сигнал о сомнительности той или иной контент-единицы подают сознательные пользователи (на YouTube, к примеру, для этого имеется флажок «сообщить о нарушении»), а специальная команда ревьюеров / служба мониторинга, действуя круглосуточно, оперативно рассматривает жалобы и выносит материалу приговор. Так обстояло дело шесть лет назад, три года, и точно так всё обстоит сегодня: что «ВКонтакте», что Google, периодически отчитывающаяся о состоянии дел, ни словом не упоминают об автоматизации задачи.
Медленно? Увы. Но заменить человека пока нечем.
К оглавлению
Неделя из жизни «очкариков»: авантюристы, энтузиасты, ау!
Евгений Золотов
Опубликовано 23 июля 2013
До попадания киберочков Google Glass на прилавки остаётся ровно полгода, и события начинают приобретать ощутимый нервозный оттенок. Google, выбравшая для бета-тестирования революционного продукта посторонних людей, да ещё и людей с фантазией — тысячи экземпляров Glass Explorer Edition были розданы нынешней весной энтузиастам, блеснувшим творческой жилкой, — виновата сама: сразу было понятно, что такие тестировщики будут использовать Очки не для селфшотов (см. «Очки Google в руках простых пользователей»). Однако происходящее сейчас на этом направлении интересно и ещё по одной причине, которую, если позволите, оставим в секрете до конца сегодняшней колонки. Я расскажу о нескольких ярких конфликтных случаях из жизни «очкариков», а вы попробуйте догадаться, что объединяет их всех — кроме собственно Очков.
Если вы следите за новостями, Стивен Балабан должен быть вам знаком. Этот 24-летний американец с забавным именем и внешностью десятиклассника нашумел ещё год назад, когда основанная им компания Lambda Labs произвела на свет инструментарий для распознавания лиц в Facebook. Фейсбуковцев тогда как раз жгла на костре правозащитная инквизиция за попытку сделать «узнавание по лицу» стандартной функцией соцсети, так что Балабан с товарищем оказались в нужное время в нужном месте: их API заинтересовал многих, и к настоящему моменту (если верить им самим) разработка даже приносит какие-то деньги. Правда, из разряда «бета» она пока так и не вышла: поиграться с движком (и удивиться, как ужасно — для такого известного продукта — он лажает) можно на официальном сайте компании.
Распознавание лиц по сей день остаётся одной из самых желанных функций Google Glass. Представьте только: Очки помогут вам никогда не забывать людей, немедленно узнать всё о человеке из его соцстранички, вспомнить, о чём вы говорили с ним в прошлый раз. Но мало справиться с параноиками-правозащитниками. Нужно ещё отточить сам механизм распознавания. Движок Lambda Labs (на фото — результат его работы), даже выбирая всего из шести человек в идеальных условиях, пока явно слаб.
В общем, Балабан в теме face recognition человек неслучайный. И минувшей весной, когда — вот уже повезло! — он оказался в списке счастливчиков, получивших гугловские Очки, вопроса, для чего их приспособить, перед ним не стояло. В конце мая Lambda Labs адаптировала свой движок распознавания лиц для Glass, а уже 1 июня Google поставила крест на этом и любых других подобных приложениях — по крайней мере до тех пор, пока не прояснятся правовые аспекты. Что бы на его месте сделали вы? Балабан решил написать собственную операционную систему для Google Glass.
Google запрещает слишком многое. Её Очки нельзя продавать, сдавать в аренду и даже дарить. Приложения обязаны быть прозрачны: пользователь должен знать, что делает устройство в текущий момент и куда отправляются собранные им данные. Порнография, взрослый контент? Не приведи боже. Распознавание лиц? Ну, вы в курсе. Нарушили? В лучшем случае приложение исключат из списка доступных, в худшем — отключат ваш экземпляр Очков без возврата денег. Такой набор ограничений беспрецедентен для мобильной электроники: даже Apple не решается диктовать покупателям условия пользования «железом». Однако продуктивней не ахать и охать, а спросить, как именно контроль реализован.