logo
Коды и шифры

Частоты встречаемости букв в книжных шифрах

Рассмотрим шифрованный текст, полученный с помощью книжного шифра, в котором в качестве гаммы использован текст на английском языке. Частоты встречаемости букв алфавита в таком тексте отличаются от частот встречаемости букв в незашифрованном английском тексте. Безусловно, в шифрованном тексте, в отличие от незашифрованного, некоторые буквы - например, E и T, а также буквы, которые используются вместо пробела - встречаются уже не намного чаще других (например, Z или J). Однако и одинаковыми эти частоты не будут. Частоты встречаемости букв шифрованного текста можно оценить. При этом получается, что хотя частоты отдельных букв отличаются друг от друга не так сильно, как для отрывков обычного (незашифрованного) английского текста, тем не менее их распределение далеко от равновероятного. Обнаружение подобного распределения частот будет для криптоаналитика подсказкой о возможности использования книжного шифра. Пример такого распределения представлен в таблице 7.4. В левом столбце приведены частоты встречаемости знаков в типичном отрывке обычного английского текста (26-ти букв алфавита и 27-й "буквы", соответствующей всем знакам препинания и пробелу). В правом столбце приведены ожидаемые частоты встречаемости тех же знаков для текста, зашифрованного книжным шифром с английским текстом в качестве гаммы. В обоих случаях объем текста равен 1000 знакам, так что "в среднем" каждая буква должна была бы встретиться примерно 37 раз. Из таблицы видно, что это распределение значительно отличается от распределения букв в незашифрованном тексте. Однако и в шифрованном тексте наблюдается значительный разброс частот, хотя он и не намного больше разброса, ожидаемого в равновероятном случае (подробнее об этом см. M6).

Книжный шифр можно рассматривать как крайний случай шифра Вижанэра, в котором длина ключевого слова равна длине самого сообщения. Очевидно, что книжный шифр должен обладать большей стойкостью, нежели шифр Вижанэра, так как в последнем используется ключевое слово фиксированной длины.

Вместо использования английского текста в качестве гаммы может быть использован текст на другом языке с алфавитом не более 26 букв. Если используется французский или немецкий язык, то диакритические знаки (например, акцент или умляут) игнорируются. Использование других языков усложняет задачу криптоаналитика, по крайней мере пока он не разберется, в чем дело.