Анализ миллиарда учётных записей, полученных в результате различных утечек баз пользователей

Материал из Викиновостей, свободного источника новостей

30 июня 2020 года

Опубликована статистика , сформированная на основе анализа коллекции из миллиарда учётных записей, полученных в результате различных утечек баз данных с параметрами аутентификации. Также подготовлены выборки с данными о частоте применения типовых паролей и списки из 1 тыс., 10 тыс., 100 тыс., 1 млн и 10 млн самых популярных паролей, которые могут использоваться для ускорения подбора хэшей паролей.

Некоторые обобщения и находки:

  • Из полученной коллекции в миллиард записей 257 млн были отброшены как повреждённые данные (хаотичные данные в неверном формате) или тестовые учётные записи. После всех фильтраций из миллиарда записей было выделено 169 млн паролей и 293 млн логинов.
  • Самый популярный пароль "123456" встречается около 7 млн раз (0.722% из всех паролей). Далее с заметным отставанием следуют пароли 123456789, password, qwerty, 12345678.
  • Доля тысячи самых популярных паролей составляет 6.607% от всех паролей, доля миллиона самых популярных паролей - 36.28%, а 10 млн - 54%.
  • Средний размер пароля - 9.4822 символов.
  • 12.04% паролей содержат спецсимволы.
  • 28.79% паролей состоят только из букв.
  • 26.16% паролей включают только символы в нижнем регистре.
  • 13.37% паролей состоят только из цифр.
  • 34.41% паролей заканчиваются цифрами, но только 4.522% из всех паролей начинаются с цифры.
  • Уникальными являются только 8.83% паролей, остальные встречаются два и более раза. Средняя длина уникального пароля 9.7965 символов. Только часть из этих паролей представляет хаотичный набор знаков, лишённый смысла, и только 7.082% включают спецсимволы, 20.02% состоят только из букв и 15.02% только из букв в нижнем регистре.
  • Зафиксирован набор из качественных паролей с высокой энтропией, которые были похожи по стилю (10-символов, случайная комбинация цифр, прописных и строчных букв, отсутствие спецсимволов, прописные буквы вначале и конце) и использовались повторно. Частота повторного использования была достаточно низка (некоторые из этих паролей повторяются 10 раз), но всё же выше, чем ожидалось.

Источники[править]

Creative Commons
Creative Commons
Эта статья содержит материалы из статьи «Анализ миллиарда учётных записей, полученных в результате различных утечек баз пользователей», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
Эта статья загружена автоматически ботом NewsBots и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии[править]

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.