EN

Открытые данные на службе
журналиста-расследователя: основы

Чем отличаются поисковые запросы в Google и Yandex, почему надо подписываться на Instagram детей публичных должностных лиц и что скрывают в себе метаданные документов и фотографий. Об этом и многом другом – в карточках АНРИ.

* Карточки подготовлены по материалу вебинара заместителя гендиректора Центра антикоррупционных исследований и инициатив «Трансперенси Интернешнл – Россия» Ильи Шуманова в рамках проекта Альянса независимых региональных издателей (АНРИ) с использованием гранта Президента РФ на развитие гражданского общества, предоставленного Фондом президентских грантов.


«Трансперенси» – неправительственная международная организация по борьбе с коррупцией и исследованию уровня коррупции по всему миру. Отделение в России существует с 1999 года.

Центр регулярно публикует расследования, в том числе антикоррупционные: например, сколько россияне платят за командировки чиновников, лоббизм в Госдуме, «Тюрьма как бизнес», посвященное коррупции в системе ФСИН.


За одну минуту в Интернете, различных сервисах и социальных сетях генерируется гигантский объем информации: около миллиона входов в Facebook, почти полмиллиона твитов, 38 миллионов сообщений в WhatsApp, более четырех миллионов просмотров видео в YouTube. Часть этой информации оказывается публичной в виде открытых сообщений в социальных сетях, постах, опубликованных видео.

Открытые данные в контексте журналистики часто называют OSINT (Open Source Intelligence), или разведкой открытых источников. По словам самих разведчиков, большая часть информации (от 80 до 95%) по нужной теме собирается как раз из открытых источников. Главное – уметь ими пользоваться.

​1.

​​​Что могут рассказать о человеке открытые данные?

Социальные сети буквально фонтанируют личной информацией. По данным аналитиков, более 90% пользователей соцсетей френдятся в них с членами семьи и реальными друзьями, связаны с сокурсниками и одноклассниками, многие поддерживают связь с коллегами.

Углубившись в аккаунты, можно узнать следующую информацию о человеке:

- Круг общения, контакты

- Дату рождения и место проживания

- Семейный статус

- Родителей, детей и других родственников

- Место образования и работы

- Стиль жизни и увлечения

- Наличие домашних животных и марку машины

- Метаданные фотографий и документов

- Места отдыха и даты путешествий

- Имущество и обладание предметами роскоши.

Стоит учитывать, что в разных странах распространены как глобальные соцсети, так и локальные. Например, россияне активно пользуются не только Facebook и Instagram, но и «Вконтакте» с «Одноклассниками».

​​2.

​​Какие данные можно найти в базах данных и реестрах?

Традиционно в каждой стране на национальном уровне ведутся различные реестры данных: коммерческие и некоммерческие организации, недвижимость и кадастр, решения судов, задолженности по налогам, госзакупки, информация об арестованном имуществе, разыскиваемые персоны, информация о доходах и имуществе чиновников и т.п.

На международном уровне существуют аналогичные базы данных: базы глобальных расследовательских групп (Investigative journalists DB), платные базы данных (Commercial DB), Offshore/ bank leaks – база утечек информации, International Organization DB, OCCRP Aleph – базы данных из глобального архива, охватывающего 233 страны.

​3.

​​​Какие инструменты использовать для поиска и извлечения данных?

Чтобы не утонуть в потоке инструментов, расследователи структурировали их по направлениям применения:

- сервис OSINT (англоязычная платформа, на которой собраны бесплатные инструменты для поиска и сбора данных)

- набор инструментов Bellingсat (команда журналистов-расследователей, которая публикует результаты расследований о зонах военных действий, используя метод анализа данных из открытых источников)

- наборы инструментов журналиста-расследователя на русском языке можно найти на портале Международной сети журналистов-расследователей.

Опытные расследователи профессионально используют общеизвестные инструменты вроде поисковиков Google и Яндекс: например, применяют инструменты углубленного поиска, то есть вбивают в строку поиска не только искомые слова и источники, но и символы, типы документов (doc, xlxs, pdf), их статус «для служебного пользования» и т.п.

Так, использование кавычек в поисковой строке помогает находить в результатах выдачи слова, точно совпадающие с искомым словом. Это особенно актуально в том случае, если вы ищете нестандартное слово или фразу.

Подробнее об операторах поиска в Google и Яндекс можно узнать здесь.

​​4.

​​​Как журналисту искать и применять данные из открытых источников? Кейсы.

Кейс: Елена Батурина и недвижимость в Лондоне

Использованные инструменты: Реестр британских компаний, Instagram, Google street view

Для того чтобы найти недвижимость, принадлежащую семье экс-мэра Москвы Юрия Лужкова в Лондоне, журналисты «Трансперенси Интернешнл – Россия» пробили фамилию «Luzhkova» в реестре британских компаний и отметили связанные с ней адреса на Google street view (этот сервис позволяет посмотреть архив фотографий улицы и узнать, например, какая машина постоянно стоит у дома, какие строительные работы проводились). Журналисты нашли Instagram дочери Батуриной и там обнаружили фотографию крыльца особняка ее мамы. Сопоставив картинки из Instagram и Google street view, журналисты выяснили, какой недвижимостью пользуется семья бывшего мэра Москвы.

Подробнее.


Кейс: Полковник Андрей Щиров и дело Ивана Голунова

Использованные инструменты: поиск автомобиля и парковочных сессий, поиск по телефону

Начальник отдела МВД Андрей Щиров, задержавший спецкора «Медузы» Ивана Голунова, оказался владельцем нескольких гектаров земли в Подмосковье и дорогой иномарки. Почти все имущество записано на 64-летнюю маму-пенсионерку.

Изначально журналисты располагали лишь данными об автомобиле Щирова. С помощью сервиса по поиску машин и парковок журналисты выяснили, что новенький внедорожник Volvo записан на пенсионерку-мать полковника Щирова. Там же журналисты нашли информацию о платных парковках автомобиля и обнаружили номер телефона. Журналисты пробили номер и выяснили, что он принадлежит полковнику, который, соответственно, пользовался автомобилем.

Подробнее.


Кейс: Фальсификация документов директором федерального госпредприятия

Использованные инструменты: сервис извлечения метаданных из документа.

Летом 2017 года журналисты центра «Transparency International –Россия» обнаружили у гендиректора ФГУП «Российские сети вещания и оповещения» Игоря Зорина незадекларированную зарубежную недвижимость и доли в коммерческих предприятиях в США. В сентябре 2017 года Зорина уволили по представлению прокуратуры в связи с утратой доверия.

После публикации расследования журналисты выяснили, что сотрудники госпредприятия исправили антикоррупционные декларации за 2016-й год задним числом: правки были внесены в антикоррупционную декларацию бывшего руководителя предприятия Игоря Зорина. В нее внесли сведения о его зарубежных активах.

Чтобы доказать это, журналисты использовали сервис извлечения метаданных из документа и узнали дату создания деклараций. Оказалось, документ «залили» через неделю после публикации первого расследования. 

Подробнее.