logo
Коды и шифры

Глава 7 м6. Частота встречаемости букв для книжного шифра

В книжном шифре, если пробел и знаки препинания рассматриваются в совокупности как 27-ю буква, одна и та же буква шифрованного текста может получиться в результате сложения знака гаммы с буквой сообщения в одной из 27 возможных комбинаций. Так, например, чтобы в шифрованном тексте появилась буква D, надо, чтобы возникла одна из следующих 27 комбинаций:

буква A в гамме и буква D в сообщении,

или буква B в гамме и буква C в сообщении,

или буква C в гамме и буква B в сообщении,

или буква D в гамме и буква A в сообщении,

или буква E в гамме и "пробел" в сообщении,

и т.д.

или буква Z в гамме и буква F в сообщении,

или "пробел" в гамме и буква E в сообщении.

Если для некоторой буквы # обозначить через p(#) вероятность ее появления в английском тексте, то для книжного шифра вероятность появления в шифрованном тексте буквы D будет равна

p(A)p(D) + p(B)p(C) + p(C)p(B) + p(D)p(A) + ... + p("пробела")p(E).

Используя таблицу встречаемости знаков в обычном английском тексте и считая все знаки препинания и "пробел" одной и той же 27-й буквой, можно по этой формуле подсчитать для книжного шифра предполагаемую вероятность появления в шифрованном тексте буквы D, а также, аналогичным образом, любой другой буквы.

Один частный случай относится к вычислению этих вероятностей для двух одноключевых сообщений (см. главу 3). Если случайным образом выбрать по одной букве из двух открытых сообщений, состоящих только из букв от A до Z (без знаков препинания), то вероятность совпадения этих букв равна

p(A)2 + p(B)2 + p(C)2 + p(D)2 + ... + p(Z)2,

что для английского текста составляет около 1/13. В более общем случае, для большинства обычных языков эта вероятность равна примерно

.

Так, например, если взять в качестве исходных данных частоты встречаемости 27 знаков (26 букв алфавита и пунктуационный символ) из таблицы 7.4., то в данном случае вероятность совпадения двух знаков равна

. .