Открытые данные на службе
журналиста-расследователя: основы
Чем отличаются поисковые запросы в Google и Yandex, почему надо подписываться на Instagram детей публичных должностных лиц и что скрывают в себе метаданные документов и фотографий. Об этом и многом другом – в карточках АНРИ.
Карточки подготовлены по материалу вебинара заместителя гендиректора Центра антикоррупционных исследований и инициатив «Трансперенси Интернешнл – Россия»* Ильи Шуманова в рамках проекта Альянса независимых региональных издателей (АНРИ) с использованием гранта Президента РФ на развитие гражданского общества, предоставленного Фондом президентских грантов.
*«Трансперенси» – неправительственная международная организация по борьбе с коррупцией и исследованию уровня коррупции по всему миру. Отделение в России существует с 1999 года. Признана в России организацией, выполняющей функции иностранного агента.
Центр регулярно публикует расследования, в том числе антикоррупционные: например, сколько россияне платят за командировки чиновников, лоббизм в Госдуме, «Тюрьма как бизнес», посвященное коррупции в системе ФСИН.
За одну минуту в Интернете, различных сервисах и социальных сетях генерируется гигантский объем информации: около миллиона входов в Facebook, почти полмиллиона твитов, 38 миллионов сообщений в WhatsApp, более четырех миллионов просмотров видео в YouTube. Часть этой информации оказывается публичной в виде открытых сообщений в социальных сетях, постах, опубликованных видео.
Открытые данные в контексте журналистики часто называют OSINT (Open Source Intelligence), или разведкой открытых источников. По словам самих разведчиков, большая часть информации (от 80 до 95%) по нужной теме собирается как раз из открытых источников. Главное – уметь ими пользоваться.
1.
Что могут рассказать о человеке открытые данные?
Социальные сети буквально фонтанируют личной информацией. По данным аналитиков, более 90% пользователей соцсетей френдятся в них с членами семьи и реальными друзьями, связаны с сокурсниками и одноклассниками, многие поддерживают связь с коллегами.
Углубившись в аккаунты, можно узнать следующую информацию о человеке:
- Круг общения, контакты
- Дату рождения и место проживания
- Семейный статус
- Родителей, детей и других родственников
- Место образования и работы
- Стиль жизни и увлечения
- Наличие домашних животных и марку машины
- Метаданные фотографий и документов
- Места отдыха и даты путешествий
- Имущество и обладание предметами роскоши.
Стоит учитывать, что в разных странах распространены как глобальные соцсети, так и локальные. Например, россияне активно пользуются не только Facebook и Instagram, но и «Вконтакте» с «Одноклассниками».
2.
Какие данные можно найти в базах данных и реестрах?
Традиционно в каждой стране на национальном уровне ведутся различные реестры данных: коммерческие и некоммерческие организации, недвижимость и кадастр, решения судов, задолженности по налогам, госзакупки, информация об арестованном имуществе, разыскиваемые персоны, информация о доходах и имуществе чиновников и т.п.
На международном уровне существуют аналогичные базы данных: базы глобальных расследовательских групп (Investigative journalists DB), платные базы данных (Commercial DB), Offshore/ bank leaks – база утечек информации, International Organization DB, OCCRP Aleph – базы данных из глобального архива, охватывающего 233 страны.
3.
Какие инструменты использовать для поиска и извлечения данных?
Чтобы не утонуть в потоке инструментов, расследователи структурировали их по направлениям применения:
- сервис OSINT (англоязычная платформа, на которой собраны бесплатные инструменты для поиска и сбора данных)
- набор инструментов Bellingсat (команда журналистов-расследователей, которая публикует результаты расследований о зонах военных действий, используя метод анализа данных из открытых источников)
- наборы инструментов журналиста-расследователя на русском языке можно найти на портале Международной сети журналистов-расследователей.
Опытные расследователи профессионально используют общеизвестные инструменты вроде поисковиков Google и Яндекс: например, применяют инструменты углубленного поиска, то есть вбивают в строку поиска не только искомые слова и источники, но и символы, типы документов (doc, xlxs, pdf), их статус «для служебного пользования» и т.п.
Так, использование кавычек в поисковой строке помогает находить в результатах выдачи слова, точно совпадающие с искомым словом. Это особенно актуально в том случае, если вы ищете нестандартное слово или фразу.
Подробнее об операторах поиска в Google и Яндекс можно узнать здесь.
4.
Как журналисту искать и применять данные из открытых источников? Кейсы.
Кейс: Елена Батурина и недвижимость в Лондоне
Использованные инструменты: Реестр британских компаний, Instagram, Google street view
Для того чтобы найти недвижимость, принадлежащую семье экс-мэра Москвы Юрия Лужкова в Лондоне, журналисты «Трансперенси Интернешнл – Россия»* пробили фамилию «Luzhkova» в реестре британских компаний и отметили связанные с ней адреса на Google street view (этот сервис позволяет посмотреть архив фотографий улицы и узнать, например, какая машина постоянно стоит у дома, какие строительные работы проводились). Журналисты нашли Instagram дочери Батуриной и там обнаружили фотографию крыльца особняка ее мамы. Сопоставив картинки из Instagram и Google street view, журналисты выяснили, какой недвижимостью пользуется семья бывшего мэра Москвы.
Кейс: Полковник Андрей Щиров и дело Ивана Голунова
Использованные инструменты: поиск автомобиля и парковочных сессий, поиск по телефону
Начальник отдела МВД Андрей Щиров, задержавший спецкора «Медузы» Ивана Голунова, оказался владельцем нескольких гектаров земли в Подмосковье и дорогой иномарки. Почти все имущество записано на 64-летнюю маму-пенсионерку.
Изначально журналисты располагали лишь данными об автомобиле Щирова. С помощью сервиса по поиску машин и парковок журналисты выяснили, что новенький внедорожник Volvo записан на пенсионерку-мать полковника Щирова. Там же журналисты нашли информацию о платных парковках автомобиля и обнаружили номер телефона. Журналисты пробили номер и выяснили, что он принадлежит полковнику, который, соответственно, пользовался автомобилем.
Кейс: Фальсификация документов директором федерального госпредприятия
Использованные инструменты: сервис извлечения метаданных из документа.
Летом 2017 года журналисты центра «Transparency International –Россия»* обнаружили у гендиректора ФГУП «Российские сети вещания и оповещения» Игоря Зорина незадекларированную зарубежную недвижимость и доли в коммерческих предприятиях в США. В сентябре 2017 года Зорина уволили по представлению прокуратуры в связи с утратой доверия.
После публикации расследования журналисты выяснили, что сотрудники госпредприятия исправили антикоррупционные декларации за 2016-й год задним числом: правки были внесены в антикоррупционную декларацию бывшего руководителя предприятия Игоря Зорина. В нее внесли сведения о его зарубежных активах.
Чтобы доказать это, журналисты использовали сервис извлечения метаданных из документа и узнали дату создания деклараций. Оказалось, документ «залили» через неделю после публикации первого расследования.
*«Трансперенси» признана в России организацией, выполняющей функции иностранного агента.