Оценка сопоставленных терпеливых данных, не раскрывая конфиденциальной информации о людях ставит значительную проблему. Команда, возглавляемая профессором доктором Хансом Саймоном от Института Хорста Горца безопасности IT в Руре-Universitat, Бохум разработал метод, который облегчает точно это. Математики искажают данные таким способом, которым отдельные пациенты остаются анонимными во время анализа.
Тем не менее, самообучающиеся компьютерные программы в состоянии обнаружить корреляции в измененных данных почти, а также в оригинальных данных.Искаженные данныеВ принципе искажение работает следующим образом: игры в кости брошены для каждого терпеливого файла; число на игре в кости добавлено ко всем ценностям в файле. Этот метод изменяет отдельные данные значительно и непредсказуемо, но в лучшем варианте развития событий это не затрагивает статистические резюме до большей степени, чем случайное колебание, которое присутствует в данных в любом случае.
В целях их работы исследователи в Председателе Теоретической Информатики установили точное определение того, что это означает в математических терминах, что пациенты должны остаться анонимными. И что это означает, что, искаженный или нет, результаты не должны отклоняться сильно друг от друга.
Чтобы ответить определенным требованиям, математики перевели проблему в геометрическом представлении.Данные, представленные как векторыКаждый терпеливый файл был представлен как вектор, т.е. стрела в геометрическом пространстве. Алгоритму оценки только разрешили задать Да/Нет вопросы, такие как: пациент курит?
Пациент весит больше чем 80 килограммов? Каждый из этих вопросов был аналогично представлен как вектор. Вектор файла и вектор вопроса, формирующий тупой угол, не символизировали ответ; острый угол выдержал за Да ответ.Вместо того, чтобы искажать оригинальные данные, исследователи выполнили тот шаг только после того, как они преобразовали данные в векторы.
Таким образом информация, имеющая отношение к отдельным пациентам, могла быть сохранена анонимной, в то время как в то же время, исследователи смогли сделать статистические заявления о сопоставленных данных всех пациентов.
