вторник, 22 апреля 2014 г.

Неизвестные гении обезличивания данных

На проектах мне постоянно приходится работать с обезличенными данными заказчиков. Нужно это для того, чтобы тестовые выгрузки данных, предоставленные в наше распоряжение, позволяли нам проводить разработку, не «светя» одновременно личные данные клиентов. Обычно обезличивание сводится к замене всех букв в чувствительной к разглашению информации на какой-либо знак. Например, все буквы в ФИО заменяются на букву «я», а цифры номеров телефонов на «0». Это общепринятая практика, более того, методика обезличивания обычно оговаривается в проектной документации. Но есть еще среди IT-профессионалов последователи поговорки «Заставь дурака богу молиться, он лоб расшибет».

Недавно я получил от смежного проекта, внедряемого другим подрядчиком, выгрузку обезличенную самым прогрессивным образом: к фамилии, имени и отчеству дописаны случайным образом сгенеренные пара букв. Вероятно, с таким обезличиванием можно пройти тест Тьюринга, но как только на данные смотрит глазами человек, то секретность разваливается.

Как будто этого мало, этот способ с бесконтрольным приписыванием буковок иногда порождает очень смешные сочетания. ОксанаЁБ, ОлеговНАЁБ, Игорьмо, АлександровиЧМО – чудо как хороши. Ну а вторую картинку даже не буду комментировать.

Как говорили в отличном фильме «Даун-Хаус»: «Сказочный долбоёб» сделал такую выгрузку. И ведь считает себя профессионалом, претендует на высокую зарплату и положительные отзывы коллег при аттестации персонала.