WindowsLTSB
Premium Lite
- Регистрация
- 5 Мар 2019
- Сообщения
- 10
- Реакции
- 8
Вопрос к Вектору, как бороться с одним из самых непробиваемых детектов на paypal и amazon, замером дельты времени через javascript? Смена id процессора и другого железа с помощью виртуальной машины здесь не поможет, и вот почему (автор исследования gcc):
Итак, как все это работает?
Собирается серия замеров дельты времени на frontend'е, затем данные отправляются на backend сайта.
На backend, данные нормализируются и приводятся к определенному удобному для обработки виду.
Далее в дело вступают алгоритмы, реализованные на основе машинного обучения.
Реализаций подобных алгоритмов много, но обычно суть сводится к поиску близлежащих векторов в некотором математическом многомерном пространстве. Чем вектора ближе друг к другу, тем точнее результат.
Примером подобного служит алгоритм Random forest.
Random forest — алгоритм машинного обучения, предложенный Лео Брейманом и Адель Катлер, заключающийся в использовании комитета (ансамбля) решающих деревьев.
Алгоритм сочетает в себе две основные идеи:
1) Метод бэггинга Бреймана
2) Метод случайных подпространств, предложенный Tin Kam Ho.
Алгоритм применяется для задач классификации, регрессии и кластеризации. Основная идея заключается в использовании большого ансамбля решающих деревьев,
каждое из которых само по себе даёт очень невысокое качество классификации, но за счёт их большого количества результат получается хорошим.
Данные о скорости с которой пользователь печатает, как часто пользуется мета кнопками (ctrl, shift, alt, ...), скорости с которой совершает клики мышью, скорости с которой начинает движение мыши, статистике баланса использования клавиатуры и мыши, скорости работы тех или иных кусков js кода - дают довольно уникальные характеристики как самого пользователя, так и железа используемого им.
Вы можете поменять множество параметров, таких как: IP, geo, timezone, язык, user agent, ...
Но Вас все равно идентифицируют по поведенческим характеристикам и параметрам железа описанным выше.
К сожалению, многие этого не понимают и не учитывают в своей работе.
Итак, как все это работает?
Собирается серия замеров дельты времени на frontend'е, затем данные отправляются на backend сайта.
На backend, данные нормализируются и приводятся к определенному удобному для обработки виду.
Далее в дело вступают алгоритмы, реализованные на основе машинного обучения.
Реализаций подобных алгоритмов много, но обычно суть сводится к поиску близлежащих векторов в некотором математическом многомерном пространстве. Чем вектора ближе друг к другу, тем точнее результат.
Примером подобного служит алгоритм Random forest.
Random forest — алгоритм машинного обучения, предложенный Лео Брейманом и Адель Катлер, заключающийся в использовании комитета (ансамбля) решающих деревьев.
Алгоритм сочетает в себе две основные идеи:
1) Метод бэггинга Бреймана
2) Метод случайных подпространств, предложенный Tin Kam Ho.
Алгоритм применяется для задач классификации, регрессии и кластеризации. Основная идея заключается в использовании большого ансамбля решающих деревьев,
каждое из которых само по себе даёт очень невысокое качество классификации, но за счёт их большого количества результат получается хорошим.
Данные о скорости с которой пользователь печатает, как часто пользуется мета кнопками (ctrl, shift, alt, ...), скорости с которой совершает клики мышью, скорости с которой начинает движение мыши, статистике баланса использования клавиатуры и мыши, скорости работы тех или иных кусков js кода - дают довольно уникальные характеристики как самого пользователя, так и железа используемого им.
Вы можете поменять множество параметров, таких как: IP, geo, timezone, язык, user agent, ...
Но Вас все равно идентифицируют по поведенческим характеристикам и параметрам железа описанным выше.
К сожалению, многие этого не понимают и не учитывают в своей работе.