笔趣阁 > 都市小说 > 我靠打爆学霸兑换黑科技 > 第1868章 如何翻译外星文

第1868章 如何翻译外星文(1 / 3)

因此需要调整图片特征,尽可能把图片和文字的吻合度拉到最高,用多张图片交叉说明一个词汇,类似于ai学习的过程,但为了沟通的便捷性,又不能让每个字词对应的图片太多,否则会严重拉长语言学习翻译的时间。

第二代星际语言翻译器,意识到外星生命可能并没有眼睛,压根看不见屏幕,因此增加了多种可见光之外的信息传达方式,整个翻译器的体积也急剧上升,从一块小屏幕,变成了冰箱大小。

但失去了图片,信息表述变得更加困难,神童们到这个版本开始研究,生命感知世界的方式总共可以有多少种?并尝试理解不同感官在脑海中形成的世界是什么样子,再进一步推导可能的语言形式。

研究结果比较乐观,大部分生物大概率会有视觉,因为光是感知世界最及时的媒介,用其他方式感知世界,在各类场景下往往会丢失大量信息,继而在生存进化中落入下风,很难成为星际文明。

第三代星际语言翻译器,添加了更多“达成共识”的初次接触信息。

譬如加入了中性氢原子的跃迁图像,氢原子在可观测宇宙中随处可见,无论在哪个星球诞生的文明都会熟悉氢原子,而跃迁长度21.106厘米以及跃迁时间0.704纳秒是固定的,就可以在长度单位和时间单位上取得一致。

各类物理化学知识都被加入初次接触信息中,毕竟整个世界是物理化学的世界,只要在物理化学层面达成一致,就可以一点点描述万事万物,虽然可能非常麻烦,但至少可以把翻译误解降到最低。

第四代星际语言翻译器,引入了更多信息论的成果。

譬如著名的齐普夫定律,也叫省力法则,拿足够长的一大段人类文字,将其中的高频字词统计出来,大概率会出现高频词次数和次序排序的反比关系,也就是说第二高频词出现的次数会是第一高频词的二分之一,第三高频词出现的次数会是第一高频词的三分之一,往后四分之一、五分之一等等。

最初齐普夫定律是从人类文本里总结出来的,但后来生物学家们发现,海豚座头鲸之类可以互相交流的生物,声音变化分布竟然也符合齐普夫定律。

此外这一版本的翻译器尝试额外引入了多种人类语言模型,用来应对不同信息熵的外星文明语言。

信息熵也叫香农熵,由信息论祖师爷香农提出了最初公式,历经一个多世纪的学术研究,结合马尔科夫链等理论,被反复升级优化。

简单来说,符号种类数量越小,信息熵越低,符号种类数量越大,信息熵越大。

信息熵越低的语言,文字理解学习起来更容易,但相同长度的文本能表达的信息量也越少,可以理解为更费口舌更费笔墨但不费脑子,沟通效率更低。

例如英文的一阶信息熵大约是4比特,汉字一阶信息熵大约是9.6比特,不同文本样本和不同建模得出的计算值会略有误差,但差距之大显而易见。

实际生活中最直观的例子,就是同样内容的文本,例如产品说明书或者联合国文件,就会出现汉字篇幅更短的情况。

第五代星际语言翻译器,在之前几代升级的模块上进行全面加强和改错。

传递信号的模块换上了最顶尖的,精度强度都上了一个台阶,造价上了十个台阶,好在这种和外星人沟通的东西也不用考虑量产成本,价格完全无所谓。

最新小说: 重生1977,从断亲开始 灵气复苏:开局获得弑神之力 开局一首天下,塌房歌手引爆乐坛 带着Tom勇闯霍格沃茨 装甲师:开局校花错拿我甲斗腰带 绝世龙婿 朱棣:我家老四,是千古一帝? 得罪资本后,我的歌越唱越红 快穿:男主都对她一见钟情 医武至尊