过去语言的演进是相当复杂的一门学问,研究人员也还在探索中,近日脸书和Google的AI研究团队共同发布了用深度强化学习探索自然语言现象的论文,研究团队打造了一个语言框架,利用交互游戏的方式,搭配深度强化学习来训练程序代理人沟通,实验结果显示了一些自然语言的现象。
研究团队首先将程序代理人分群,组成多个社群,并在仿真的环境中,赋给程序沟通能力,仿真的环境包含简单到较为复杂的环境,像是深度神经网络,程序代理人玩的交互游戏有3项关键特征,第一是交互游戏的设计都是对称的,代理人可以同时是发言者和倾听者,第二则是让代理人讨论自身以外的事,像是在环境中的所有感知,最后则是采用部分可观测系统,通过沟通来解决游戏中的任务。
在第一个实验中,团队为了要研究2个代理人是否足够发展出公用沟通协议,测试了代理人沟通后完成游戏的成功率,结果显示2个代理人交互后,成功完成的游戏机率很高,但是代理人若独自玩游戏,成功率大概下降了约10%,研究团队认为,这样的结果显示,只有在2个以上的用户使用该语言,才会出现一个公用的语言,一个代理人发展出自己的协议后,其他的代理人就会去适应该沟通协议。
在接下来的实验中,研究团队使两个不同的语言代理人社群接触,也就是让发展出不同沟通工具的代理人社群交互,结果显示,所有的程序代理人都会学习另一个社群的语言,甚至,特定的代理人还会发展出新的沟通协议,让沟通变得更快速有效率。
而在最后的实验中,研究团队创建由相同数量代理人组成的社群串行,进行沟通,每个社群由5个程序代理人组成,研究发现,越相邻的社群代理人,越能够沟通,但是沟通的能力会随着社群距离增加而降低,串行中第一个社群和最后一个社群的代理人,完全无法理解双方的沟通协议。
根据研究的实验结果,研究团队认为,语言演化的复杂特性,并不一定要依赖演复杂的语言能力,可能通过具有感知能力的代理人在玩沟通游戏时,利用简单的社交交流行为而产生。