Программное обеспечение для распознавания лиц - это мощная технология, представляющая серьезную угрозу гражданским свободам. Это также процветающий бизнес. Сегодня десятки стартапов и технологических гигантов продают услуги по распознаванию лиц отелям, розничным магазинам - даже школам и летним лагерям. Бизнес процветает благодаря новым алгоритмам, которые могут идентифицировать людей с гораздо большей точностью, чем даже пять лет назад. Чтобы улучшить эти алгоритмы, компании обучили их на миллиардах лиц - часто без чьего-либо разрешения. Действительно, велики шансы, что ваше собственное лицо является частью «обучающего набора», используемого фирмой по распознаванию лиц, или частью базы данных клиентов компании.

Потребители могут быть удивлены тем, что некоторые компании используют тактику, чтобы «вылавить их лица». Например, по крайней мере в трех случаях фирмы получали миллионы изображений, собирая их с помощью фото приложений на телефонах людей. На данный момент существует немного юридических ограничений на программное обеспечение для распознавания лиц, что означает, что мало кто может сделать, чтобы помешать компаниям использовать ваше лицо таким образом.

В 2018 году камера собрала лица пассажиров, когда они спешно спускались по взлетно-посадочной полосе аэропорта недалеко от Вашингтона, округ Колумбия. Вся структура была просто набором для Национального института стандартов и технологий (NIST), чтобы продемонстрировать, как он может собирать лица «в дикой природе». Эти лица станут частью повторяющегося конкурса NIST, который приглашает компании по всему миру для проверки своих программных обеспечений по распознаванию лиц.

В этих учениях добровольцы дали согласие агентства использовать их лица. Вот как это работало в первые дни распознавания лиц; академические исследователи постарались получить разрешение на включение лиц в свои наборы данных. Сегодня компании находятся на переднем крае распознавания лиц, и они вряд ли попросят явного согласия на использование чьего-либо лица, если они вообще заморачиваются на какие-либо разрешения.

Компании, в том числе лидеры отрасли, такие как Face ++ и Kairos, конкурируют на рынке программного обеспечения для распознавания лиц, который растет на 20% каждый год и, как ожидается, к 2022 году будет стоить 9 миллиардов долларов в год, согласно Market Research Future. Их бизнес-модель включает лицензирование программного обеспечения для растущего числа клиентов - от правоохранительных органов до розничных продавцов и средних школ - которые используют его для запуска собственных программ распознавания лиц.

В гонке за создание лучшего программного обеспечения победителями станут компании, чьи алгоритмы могут идентифицировать лица с высокой степенью точности без получения так называемых ложных срабатываний. Как и в других областях искусственного интеллекта, создание лучшего алгоритма распознавания лиц означает накопление большого количества данных, в данном случае - лиц, в качестве учебного пособия. Хотя компании могут использовать санкционированные коллекции, составленные правительством и университетами, такие как «База данных лиц Йельского университета», эти учебные наборы относительно малы и содержат не более нескольких тысяч лиц.

Эти официальные наборы данных имеют другие ограничения. Многие испытывают недостаток в расовом разнообразии или не могут различить дополнительные условия - такие как тени или шляпы или косметика - которые могут изменить то, как лицо выглядит в реальном мире. Чтобы создать технологию распознавания лиц, способную обнаруживать людей «в дикой природе», компаниям требовалось больше изображений. Еще больше.

«Сотни не достаточно, тысячи не достаточно. Вам нужны миллионы изображений. Если вы не тренируете базу данных с людьми в очках или с цветными людьми, вы не получите точных результатов », - говорит Питер Трепп, генеральный директор FaceFirst, калифорнийской компании по распознаванию лиц, которая помогает ритейлерам проверять наличие преступников в магазине.

Приложение для этого

Где компания может получить миллионы изображений для обучения своему программному обеспечению? Одним из источников являются базы данных полицейских снимков, которые общедоступны в государственных органах, а также продаются частными компаниями. Например, калифорнийская компания Vigilant Solutions предлагает коллекцию из 15 миллионов лиц в рамках своего «решения» по распознаванию лиц.

Однако некоторые стартапы нашли еще лучший источник лиц: приложения для личных фотоальбомов. Эти приложения, которые собирают фотографии, хранящиеся на телефоне человека, обычно содержат несколько изображений одного и того же человека в самых разных позах и ситуациях - богатый источник обучающих данных.

«У нас есть потребители, которые отмечают одного и того же человека в тысячах различных сценариев. Находясь в тени, надев головной убор», - говорит Дуг Эли, генеральный директор Ever AI, стартапа по распознаванию лиц в Сан-Франциско, который был запущен в 2012 году как EverRoll, приложение, помогающее потребителям управлять своими коллекциями фотографий.

Еver AI, которая привлекла $ 29 миллионов от Khosla Ventures и других фирм венчурного капитала Силиконовой долины, участвовала в последнем конкурсе NIST по распознаванию лиц и заняла второе место в категории «Mugshots» конкурса и третье в «Faces in the Wild». Успех огромной базы данных компании, которая, по оценкам Ever AI, насчитывает 13 миллиардов изображений.

В прежние времена, когда Ever AI был просто приложением для фотографий, его агрессивная маркетинговая стратегия вызывала противоречия и временно вынуждала Apple запретить EverRoll в App Store в 2016 году. Примечательно, что приложение побудило пользователей отправлять рекламные ссылки всем своим телефонным контактам. Пользователи также обвинили его в том, что он «сожрал» их данные.

«Первое, что приложение делает, даже при установке, - это собирает все ваши телефонные номера, затем эта вещь начинает собирать все ваши фотографии и помещать их в облако», - написал Грег Миллер, владелец техасской студии портрета, в обзоре на Facebook в 2015 году.

Четыре года спустя Миллер с ужасом обнаружил, что в приложении, которое когда-то называлось EverRoll, все еще были его фотографии, и что теперь это была компания по распознаванию лиц.

«Нет, я не знал об этом, и я не согласен с этим ни на шаг», - говорит Миллер Fortune. «Все это отслеживание является реальной проблемой. Ничто не является личным больше, и это просто чертовски пугает меня».

Эли, генеральный директор Ever AI, говорит, что компания не передает идентификационную информацию о лицах в своей базе данных, а использует только фотографии для обучения своему программному обеспечению. Он добавил, что компания сродни социальной сети, из которой люди могут «удалиться». Эли также отрицал, что Ever AI собирался стать компанией по распознаванию лиц с самого начала, заявив, что отказ от приложения для фотопечати, ставшего теперь закрытым, был деловым решением. В настоящее время клиенты Ever AI используют его для целого ряда видов деятельности, включая управление корпоративными идентификаторами, розничную торговлю, телекоммуникации и правоохранительные органы.

EverRoll - не единственная компания по распознаванию лиц, которая когда-то предлагала потребительское фото-приложение. Другим примером является Orbeus, стартап из Сан-Франциско, незаметно приобретенный Amazon в 2016 году, который когда-то предлагал популярный органайзер изображений PhotoTime.

 

По словам давнего сотрудника Orbeus, большая коллекция фотографий с людьми в общественных местах сделали стартап привлекательной целью для приобретения.

«Amazon искал эту возможность. Они приобрели компанию, а затем закрыли приложение», - говорит сотрудник, отказавшийся от идентификации, ссылаясь на соглашения о неразглашении.

Сегодня приложение PhotoTime больше не существует, хотя Amazon продолжает продавать другой продукт Orbeus, известный как Rekognition. Продукт представляет собой тип программного обеспечения для распознавания лиц, используемого правоохранительными органами и другими организациями.

Amazon отказалась предоставить подробную информацию о том, в какой степени приложение для фотографий Orbeus использовалось для обучения программному обеспечению Rekognition, заявив лишь, что оно получает данные для своего ИИ проектов, в том числе распознавание лиц, из различных источников. Компания добавила, что не использует сервис Prime Photo своих клиентов для обучения своих алгоритмов.

Real Networks - еще одна компания, которая использует приложение для создания потребительских фотографий для обучения алгоритму распознавания лиц. Компания, базирующаяся в Сиэтле, когда-то известная своим онлайн-видеоплеером эпохи 1990-х годов, сегодня специализируется на программном обеспечении, которое может распознавать лица детей в школах. В то же время она предлагает приложение для смартфонов, предназначенное для семей под названием RealTimes, которое, по словам одного из критиков, послужило предлогом для получения лицевых данных.

«Приложение позволяет пользователям делать видео слайд-шоу из своих собственных фотографий. Представьте, что мама собирает видео слайд-шоу, чтобы отправить его бабушке, и эти изображения используются для обучения набора данных для использования на молодых лицах. Это довольно ужасно», - говорит Клэр Гарви, профессор Джорджтаунского университета, опубликовавшая влиятельный отчет о технологии распознавания лиц.

Real Networks подтвердила, что приложение для фотографий помогает улучшить инструмент распознавания лиц, но добавила, что для этой цели используются дополнительные источники данных.

Во всех этих случаях, когда компании использовали фотоприложение для сбора лиц для обучения, они не просили явного разрешения потребителей. Вместо этого фирмы, по-видимому, получили юридическое согласие в рамках своих соглашений об обслуживании.

Это, однако, больше, чем то, что сделали некоторые другие компании по распознаванию лиц. По словам Патрика Гротера, который проводит соревнования в сфере распознаваний лиц NIST, компании, занимающиеся распознаванием лиц, часто пишут программы, которые «забирают» фотографии с таких сайтов, как SmugMug или Tumblr. В этих случаях нет даже предлога согласия со стороны тех, чьи лица попадают в тренировочные наборы.

Этот подход «помоги себе сам» был подчеркнут в недавнем отчете NBC News, в котором подробно рассказывается, как IBM откачивала более миллиона лиц с сайта Flickr для обмена фотографиями в рамках исследования компании в области искусственного интеллекта. (Джон Смит, курирующий технологию искусственного интеллекта в исследовательском подразделении IBM, сказал NBC News, что компания взяла на себя обязательство «защищать частную жизнь отдельных лиц» и будет работать с теми, кто требует удалить свое лицо из набора данных.)

Все это поднимает вопросы о том, что компании делают, чтобы защитить лицевые данные, которые они собирают, и должны ли правительства обеспечивать больше контроля. Проблемы будут становиться все более острыми, так как распознавание лиц распространяется на более широкие слои общества и стимулирует бизнес больших и малых компаний.

От магазинов до школ

Программное обеспечение для распознавания лиц не является новым. Примитивные версии этой технологии существуют с 1980-х годов, когда американские математики начали определять лица как ряд числовых значений и использовали вероятностные модели для нахождения соответствия. Сотрудники службы безопасности в Тампе, штат Флорида, развернули его в Супербоуле 2001 года, так же казино использовали его в течение многих лет. Но за последние несколько лет что-то изменилось.

«Распознавание лиц переживает нечто революционное», - говорит Гротер из NIST, добавляя, что изменение наиболее заметно с быстротечными или некачественными изображениями. «Основная технология изменилась. Старая технология была заменена алгоритмами нового поколения, и они удивительно эффективны».

Эта революция в распознавании лиц происходит благодаря двум факторам, которые более широко трансформируют область искусственного интеллекта. Первый - это развивающаяся наука глубокого обучения, система распознавания образов, напоминающая человеческий мозг. Второй - беспрецедентный избыток данных, которые можно хранить и анализировать при низких затратах с помощью облачных вычислений.

Неудивительно, что первыми компаниями, которые в полной мере воспользовались этими новыми разработками, стали Google и Facebook. В 2014 году социальная сеть запустила программу под названием DeepFace, которая может различать, принадлежат ли два лица одному и тому же человеку с точностью до 97,25%, что эквивалентно тому, какая точность была в тестах у реальных людей. Год спустя Google превысил это с помощью своей программы FaceNet, которая получила 100% -ную оценку точности, по данным фирмы по безопасности Gemalto.

Сегодня эти компании и другие технологические гиганты, такие как Microsoft, являются лидерами в распознавании лиц - в немалой степени благодаря их доступу к большим базам данных лиц. Однако все большее число стартапов также публикуют высокие оценки точности, поскольку они ищут свою нишу на растущем рынке программного обеспечения для лица.

Только в США таких стартапов насчитывается более десятка, в том числе Kairos и FaceFirst. По словам исследователя рынка PitchBook, Силиконовая долина стремительно разворачивается в этом секторе, в котором раскрываются десятки инвестиционных сделок, заключенных за последние несколько лет. По данным PitchBook, средний общий объем инвестиций за последние три года составляет 78,7 млн долларов. По стандартам Силиконовой долины это не сногсшибательное число, но отражает значительную ставку венчурных капиталистов на то, что по крайней мере несколько стартапов по распознаванию лиц превратятся в крупные компании.

Бизнес-модели для компаний по распознаванию лиц все еще появляются. Сегодня большинство вращается вокруг лицензирования программного обеспечения для организаций. Согласно данным Crunchbase, годовой доход для таких стартапов, как Ever AI и FaceFirst, относительно скромен: от 2 до 8 миллионов долларов. Amazon и другие технологические гиганты, тем временем, не раскрыли, какая часть их доходов поступает от лицензирования распознавания лиц.

В течение многих лет самыми заядлыми платящими клиентами за распознавание лиц были правоохранительные органы. Однако в последнее время все большее число организаций, в том числе сеть магазинов Wal-Mart, используют программное обеспечение для выявления и получения дополнительной информации о людях, которые входят в их помещения.

Это, безусловно, касается клиентов калифорнийской компании FaceFirst, которая продает программное обеспечение для распознавания лиц сотням розничных продавцов, в том числе продуктовым магазинам и аптекам. Его генеральный директор Трепп говорит, что большинство его клиентов используют эту технологию для выявления преступников, заходящих в их магазины, но розничные торговцы все чаще проверяют ее для других целей, таких как распознавание VIP-клиентов, которые могут оставить больше денег.

Тем временем Amazon, похоже, использует широкую сеть в своих усилиях по поиску бизнес-моделей для распознавания лиц. По сообщениям, помимо продаж в отделы полиции, розничный гигант работает с отелями, чтобы помочь им ускорить процедуру регистрации.

«Компании со всего мира приезжают в Amazon и говорят:« Это то, что мы хотели бы, чтобы вы делали ». Тогда ты понимаешь, что это твое сладкое место. Интерес повсюду», - говорит неназванный человек, присоединившийся к Amazon, когда компания приобрела Orbeus, фирму по распознаванию лиц.

Эти усилия, в случае с Amazon, не обошлись без противоречий. В июле прошлого года ACLU(*Американский союз защиты гражданских свобод) проверил программное обеспечение компании, сравнив лица каждого члена Конгресса с базой данных осужденных преступников. В результате теста было получено 28 ложных срабатываний, большинство из которых были цветными представителями Конгресса. В ответ ACLU призвал запретить использование технологии распознавания лиц правоохранительными органами. Между тем, собственные сотрудники Amazon оказали давление на компанию, чтобы оправдать продажу программного обеспечения отделам полиции и Службе иммиграции и таможенного контроля США.

С тех пор некоторые члены Конгресса, в том числе член палаты представителей Джерролд Надлер и сенатор Рон Уиден, Обратились к правительственному ведомству по подотчетности с просьбой расследовать использование программного обеспечения для распознавания лиц. Корпоративные лидеры также обеспокоены применением технологии. Среди них: президент Microsoft Брэд Смит, который в декабре призвал к государственному регулированию.

Но, несмотря на растущую обеспокоенность, использование технологии распознавания лиц расширяется, поскольку компании находят новые и новые места и возможности для их продажи. К ним относятся Real Networks, создатель приложения для семейных фотографий, которое бесплатно предлагает свое программное обеспечение школам по всей стране. Компания говорит, что сотни школ в настоящее время используют его. В интервью журналу Wired генеральный директор Роб Глейзер говорит, что начал эту инициативу как беспристрастное решение дебатов о безопасности в школе и контроле над оружием. В настоящее время веб-сайт Real Networks демонстрирует свою технологию как способ, позволяющий организаторам мероприятий «распознавать каждого фаната, клиента, сотрудника или гостя» - даже если их лицо закрыто.

Real Networks - не единственная компания по распознаванию лиц, предлагающая продукты, ориентированные на детей. Техасский стартап под названием Waldo поставляет эту технологию сотням школ, а также детским спортивным лигам и летним лагерям. На практике это включает использование программного обеспечения Waldo для сканирования изображений, снятых видеокамерами или официальными фотографами, а затем сопоставление лиц детей с базой данных изображений, предоставленных родителями. Те родители, которые не хотят участвовать, могут отказаться.

По словам генерального директора Родни Райса, школы ежегодно делают десятки тысяч фотографий, и лишь немногие из них можно увидеть в выпускном журнале. Распознавание лиц, по его словам, является эффективным способом распространения оставшихся фотографик среди тех людей, которые хотели бы иметь их.

В настоящее время служба ведет свою деятельность более чем в 30 штатах США.

Рост Waldo и FaceFirst показывает, как бизнес помогает нормализовать распознавание лиц, которое еще недавно было предметом научной фантастики. И поскольку технология распространяется на большее количество секторов американской экономики, все больше компаний будут собирать копии наших лиц - либо для обучения своим алгоритмам, либо для распознавания клиентов и преступников - даже когда растет вероятность ошибок или злоупотреблений.

Будущее вашего лица

В эпизоде 2017 года из техно-антиутопического сериала «Черное зеркало» взволнованная мать беспокоится о том, что ее дочь ведет себя плохо. Чтобы идентифицировать ее, она загружает изображение ее лица в службу идентификации лица потребителя.

Такой сценарий, когда-то надуманный, сегодня кажется реальным. Хотя опасения по поводу распознавания лиц были сосредоточены на его использовании правительствами, его развертывание частными компаниями или даже частными лицами - в стиле «черного зеркала» - создает очевидные риски для конфиденциальности.

По мере того, как все больше компаний начинают продавать распознавание лиц, а наши лица попадают в большее количество баз данных, программное обеспечение может завоевать популярность среди вуайеристов(*любители тайного наблюдения). Торговцы и арендодатели могут также использовать его для выявления тех, кого они считают нежелательными, и тихо удерживать жилье или услуги от них.

«Любой, у кого есть видеокамера и место с большим количеством пешеходов, может начать собирать базы данных изображений, а затем использовать это аналитическое программное обеспечение, чтобы увидеть, соответствует ли оно тому, что вы скомпилировали», - говорит Джей Стэнли, аналитик компании ACLU.

Существует также риск взлома. Андрей Барысевич из Geberi Advisors, фирмы по кибербезопасности, говорит, что он видел профили, украденные из национальной индийской базы данных биометрии для продажи на интернет-сайтах «темной сети». Он еще не видел базы данных американских лиц для продажи, но добавил: «Это всего лишь вопрос времени». Если такое случится, украденная коллекция лиц клиентов из отеля или магазина может помочь преступникам совершить мошенничество или кражи личных данных.

Поскольку технология распространяется без особого надзора со стороны правительства, лучшая надежда на ограничение ее неправильного использования может принадлежать самим производителям программного обеспечения. В интервью Fortune генеральные директора стартапов по распознаванию лиц заявили, что они глубоко настроены на угрозы частной жизни. Некоторые, в том числе генеральный директор FaceFirst, назвали распространение предостерегающих систем в Китае.

Руководители также предложили два способа, которыми отрасль может ограничить злоупотребление своими технологиями. Первый заключается в тесном сотрудничестве с покупателями их программного обеспечения, чтобы гарантировать, что клиенты не будут развертывать его произвольно. Например, Элей из Ever AI говорит, что его компания придерживается более высоких стандартов, чем Amazon, который, как он утверждает, предоставляет инструмент Rekognition практически всем желающим.

В ответ на вопрос о том, как он контролирует злоупотребление, Amazon предоставила ранее опубликованное заявление Мэтта Вуда, который занимается зарубежными службами искусственного интеллекта в Amazon Web Services, указав на политику компании, запрещающую деятельность, которая является незаконной или вредной для других.

Другой потенциальной гарантией конфиденциальности, на которую ссылаются руководители по распознаванию лиц, является использование технических мер, обеспечивающих невозможность взлома лиц, указанных в их базах данных.

Райс, генеральный директор Waldo, говорит, что лица хранятся в виде буквенно-цифровых хешей. Это означает, что даже в случае нарушения данных конфиденциальность не будет нарушена, поскольку хакер не сможет использовать хеши для восстановления лиц и их личности. Точка зрения была поддержана другими.

Райс также опасается, что законодатели могут принести больше вреда, чем пользы, разработав правила использования лицевой технологии.

Между тем, некоторые компании, разрабатывающие программное обеспечение для распознавания лиц, используют новые методы, которые могут уменьшить необходимость в больших коллекциях лиц для обучения их алгоритмам. Так обстоит дело с Kairos, стартапом по распознаванию лиц в Майами, который называет крупную сеть отелей среди своих клиентов. По словам главного сотрудника службы безопасности Стивена Мура, Kairos создает «синтетические» данные о лицах для воспроизведения широкого спектра выражений лица и условий освещения. Он говорит, что эти «искусственные лица» означают, что компания может полагаться на меньшие наборы лиц реального мира при создании своих продуктов.

Все эти меры - надзор за клиентами по распознаванию лиц, надежная защита данных и синтетические средства обучения - могут ослабить некоторые проблемы конфиденциальности, связанные с использованием наших лиц компаниями. В то же время Трепп из FaceFirst полагает, что беспокойство по поводу технологии уменьшится, когда мы станем более знакомы с ней.