如果频率分析撞上了凯撒密码,后续
上次我试着用频率表破解一个假装伪装字母偏移量的短篇文本,结果可以说是相当的不堪入目,简直就是一团乱码。
这一次我试着加大了文本量,以下是新一次的破解尝试:
老规矩,假装忘了设置的偏移量
我先摘录了《野性的呼唤》以及《简·爱》原版当中的部分片段,然后合并在了一起
接下来找了两个加密网站进行加密,如下:


放到wps里如下:

我用文档里的功能给明文和密文都做了字数统计,然后放到表格,如下:

这里可以看出,频率表已经和原文有很大部分的重叠了,果然上次失败是因为字数太少了
接下来是分析偏移量:(顺便纠错)

由于是从密文到原文计算的,所以偏移量为-3才对

偏移量已经找到了,清一色的偏移量,凯撒密码没跑了。(如果我不知道的话)
接下来就是检验频率表了
经过分析,发现:
ETA,HI,DLUW在频率表和原文之间完全一致
而ON,SR,PB,VK,XJ,QZ则是顺序交换
MFCYG则是大型的错乱
不难看出,30000字的大小还是小了。
符合率只有9/26
看来有必要学一下编程,人工查找和替换简直就不是人干的活,而且错误率还高
有意思的是,我在网上查找了一些26个字母的频率表,结果全都不一样。
不过E出现的频率最高是共识,但是第二位是T还是A,或者B就不一样了
我不知道他们从哪里找来的数字,反正我是从纸质资料上找到的。
如果各位有更加权威的字母频率表,也欢迎发在评论区里

