Ваша история на YouTube раскрыта. Исследователь выявляет недостатки безопасности при передаче видео

Обнаружен недостаток безопасности трафика YouTube

Исследовав, как интернет-провайдеры (ISP) могут оптимизировать свои услуги для улучшения качества просмотра видео пользователями, эксперт по кибербезопасности Ран Дубин понял, что интернет-провайдеры могут определять не только качество просмотра – они могут, если захотят, определить точное названия видео, которые смотрели их пользователи.

Метод Дубина отличается от обычных подходов к мониторингу тем, что он только анализирует трафик, в то время как традиционные методы мониторинга смотрят на незашифрованные данные, используют недостатки в протоколе или анализируют отдельные пакеты.

Хотя YouTube использует шифрование для защиты ваших данных, пояснил Дубин ExpressVPN, любой, кто смотрит вашу сеть, может точно определить, что вы смотрите, но есть способ защитить себя..

Отображение потоков на шаблоны

Дубин рассказал ExpressVPN,

«Я обнаружил, что все потоки на самом деле имеют очень четкую картину. И эти шаблоны могут быть определены ».

Ваш браузер делает две вещи, когда вы используете YouTube для потоковой передачи видео:

  1. Он открывает зашифрованный канал с YouTube, через который передаются все данные.
  2. Он запрашивает и получает небольшие разделы видео с определенным качеством, в зависимости от скорости вашего сетевого подключения.

Несмотря на шифрование, механизмы кодирования генерируют достаточно данных для искушенных пассивных наблюдателей, чтобы собрать воедино то, что вы наблюдали. В чужих руках эти данные могут быть легко проданы или иным образом использованы для нацеливания и дискриминации практически любого.

Каждое видео имеет уникальную прослеживаемую подпись

Исследование Дубина показало, что во время загрузки вашего видео любой, кто наблюдает за подключением – например, ваш интернет-провайдер, хакер, подключающийся к вашей сети Wi-Fi, или государственное учреждение – может со временем следить за различными схемами потоков зашифрованных данных..

Этот шаблон существует потому, что видео загружаются порциями, создавая пики и молчание в потоке трафика. Анализируя количество битов на пик, определяемое, например, количеством цветов или быстрых перемещений в этом фрагменте видео, создается подпись для видео, позволяющая однозначно идентифицировать его..

Отрывок слайда из лекции Дубина на Black Hat Europe 2016Слайд-отрывок из лекции Дубина на Black Hat Europe 2016. С разрешения Р. Дубина.
Ран Дубин, Амит Двир, Офир Пеле и Офер Хадар. «Я знаю, что вы видели в последнюю минуту – дело браузера Chrome». Лекция, Black Hat Europe 2016, Лондон, 3 ноября 2016 г..

Чтобы сопоставить каждый шаблон с видео, пассивный наблюдатель должен иметь предварительно скомпилированный список всех видео, которые он хочет отслеживать. Хотя было бы сложно составить список всех видео, доступных на YouTube (учитывая, что каждую минуту загружается около 300 часов нового контента), можно составить такой список для популярных видео или видео, представляющих интерес..

Потенциал для нарушения конфиденциальности

Хотя определение того, какое видео вы смотрели, не является небольшим подвигом, этот пассивный анализ может стать очень проблематичным, если группы с неправильными мотивами смогут определить, смотрели ли вы какое-либо видео в одном из этих предварительно скомпилированных списков:

  • Видео, связанные с конкретным политиком
  • Видео, связанные с определенным движением сопротивления
  • Информационные видеоролики об определенных состояниях здоровья
  • Видео, связанные с прекращением курения или другой зависимостью

Это повышает вероятность того, что кто-либо может стать жертвой преследования, преследования или дискриминации со стороны своего правительства, интернет-провайдера или поставщика медицинского страхования, просто по каким видео он просматривал.

Как работает пассивный анализ сетевого трафика YouTube

Представьте себе наблюдателя, стоящего возле вашего дома и наблюдающего за всеми пакетами, доставляемыми к вашей двери.

Несмотря на то, что каждый пакет имеет разные размеры, форму и вес, наблюдатель может сопоставить их с каталогом известных пакетов и сделать вывод о том, что вы заказали, даже если они никогда не открывали ваши пакеты..

Когда вы используете YouTube, каждый пакет имеет не только уникальную подпись, но и IP-адрес отправителя (YouTube) и получателя (вас). С помощью этих IP-адресов наблюдатель может определить, связан ли пакет с видео YouTube, а также ваша личность.

Этот наблюдатель может быть хакером, который управляет роутером в вашей местной кофейне, администратором сети Wi-Fi в вашем кампусе или вашим интернет-провайдером..

Дубин: «Я мог бы даже догадываться, какое видео вы смотрите после примерно 30-40 секунд времени просмотра».

Исследования Дубина применимы даже тогда, когда вы смотрите только часть видео – и, возможно, в реальном времени. «У меня есть другая демонстрация, показывающая, что я также могу предсказывать часть видео в реальном времени. Однако точность этого алгоритма еще не определена ». По его оценкам, для просмотра видео, которое вы смотрите, требуется от 30 до 40 секунд..

Стоит ли беспокоиться о видеомониторинге??

Да и нет. Хотя наблюдение в этот момент возможно, оно является дорогостоящим, поскольку наблюдатель должен будет составить список всех видео YouTube, которые он хочет идентифицировать, а затем проанализировать их один за другим. Это может показаться обременительным, но это нужно сделать только один раз для каждого интересующего видео.

Изменяющиеся условия сети могут создавать дополнительные проблемы, поскольку потеря пакетов и сетевые задержки создают неопределенность. Тем не менее, Дубин показал, что он все еще может достичь очень высокого уровня успеха прогнозирования в этих условиях.

Поскольку предварительно записанные шаблоны только вероятностно совпадают с наблюдаемыми, очень большой набор данных, вероятно, будет содержать некоторые ложные совпадения. Дубин объяснил, что, хотя в его исследовании наблюдалось ноль ложноположительных результатов при размере выборки 2000 видеороликов, резкое увеличение количества заголовков может увеличить это число, поскольку «функция Bit-Per-Peak не может быть уникальной на 100%».

Хотя этот анализ теоретически может применяться и к другим сервисам и типам данных (например, Netflix, Facebook или Spotify), Дубин не будет рассуждать о том, какие другие сервисы могут быть уязвимы. Но он говорит, что он может планировать свои следующие исследовательские проекты вокруг таких услуг, как эти.

Как защитить свою активность на YouTube от отслеживания

В то время как YouTube теоретически может добавить запутанность в их видео, Ран Дубин дает совет о том, как вы можете защитить себя сегодня:

«Вы можете использовать VPN [или] вы можете использовать сети Tor, чтобы сделать идентификацию намного сложнее».

Использование сети, такой как Tor или VPN, удаляет непосредственный инструмент идентификации: ваш IP-адрес. Используя VPN, наблюдатель по-прежнему сможет видеть, какое видео было просмотрено с VPN-сервера, но этот трафик будет смешиваться с сотнями трафика других пользователей, что мешает определить, кто и откуда смотрит.

Возвращаясь к метафоре пакета, VPN или Tor по существу создают хранилище пересылки, которому адресованы и отправлены все пакеты. Внутри они накапливаются, переупаковываются, и добавляется случайная начинка для дальнейшей запутывания. Поскольку переупакованные товары отправляются на ваш дом, наблюдатель больше не может догадаться, что находится внутри или кто отправил посылки..

Ваш интернет-провайдер или любой другой наблюдатель между вами и вашим провайдером VPN будет видеть еще меньше информации. Из-за мер запутывания, применяемых современными приложениями VPN, ваши шаблоны трафика больше не будут соответствовать тем, которые они могли предварительно записать, делая данные, которые они собирают от вас, бессмысленными.

Остерегайтесь ваших метаданных!

Даже зашифрованные данные переносят метаданные. При потоковой передаче видео YouTube через HTTPS эти метаданные представляются в виде временных меток, IP-адресов, размера видео, длины видео и, как показал Дубин, схемы, с которой передаются данные..

Прокси-сети, такие как сеть Tor или VPN, могут помочь в удалении этих метаданных путем их запутывания или маршрутизации через уровни прокси..