“有点意思……”李峥品味着说道,“这些曲线你是怎么揪出来的?什么软件?什么算法?”

“啊,没有那些……”寸头大哥揉了揉脑袋,“人眼,手工,一条条摘出来的……”

“?!?”李峥大惊。

即便只是最后三次的测试数据,包含的内容也是十分恐怖的。

举个不那么贴切的例子。

假设有一部110万字的小说,储存为一个文件,大约有2b。

你的任务是找到其中的错别字。

但你无法阅览文字,只能看懂二进制的0和1。

于是,你将这个文件用二进制的方式展开。

2b,也就是两兆个字节。

16777216比特。

一个比特,即代表一个二进制数字,0,或者一。

最终的展开结果,也就是一串长达16777216位的数列。

而寸头大哥所在做的事情,就是阅览这段不知道要多少个屏幕才能装下的超常数列。

就是通过肉眼、双手和直觉,从这16777216个0和1之中,找出他看的不顺眼的地方,有可能是错别字的地方。

谁都知道故障的病根就藏在这些数据中,但它没有语言,不会喊出来,李峥的方法,是寻找一套二进制与汉字之间的转换码,将这部小说尽可能复原,从而寻找错字。

而寸头大哥,则是埋头这些0和1,用眼睛一个个看,用双手一行行筛。