OpenAI开放可将自然语言转为程序代码的AI系统Codex

OpenAI改进Codex发布新版本,OpenAI Codex是一个能够将自然语言转换成为程序代码的人工智能系统,也就是说,Codex能够让开发者用简单的口语指令来编写程序,现在OpenAI将Codex的API以私人Beta测试的形式对外发布。

Codex是GitHub Copilot服务所使用的模型,而Copilot是GitHub在一个月前和OpenAI合作,所推出的人工智能程序代码编写工具,能够提供开发者整行甚至是整个函数的程序代码编写建议,相当于提供用户一个结对工程师(Pair Programmer)。Codex精通十几种程序语言,而现在用户可以将简单的自然语言指令,转换成为程序代码,也就是提供实现以自然语言接口开发应用程序的方法。

OpenAI Codex是从模型GPT-3衍生改进而来,训练资料包含自然语言,以及数十亿行开源程序代码,包括公开的GitHub存储库中的程序代码,OpenAI Codex最擅长的语言是Python,但也精通JavaScript、Go、Perl、PHP、Ruby、Swift和TypeScript,甚至连壳层十几种语言都难不倒他,而且由于Codex拥有14KB的Python程序代码内存,比起GPT-3只有4KB,在执行任何工作时,Codex都能考虑GPT-3模型3倍以上的上下文信息做决定。

GPT-3的能力主要是依据自然语言生成自然语言,而这代表GPT-3的影响力,来自于其阅读人类的作品,而OpenAI Codex具有GPT-3大部分的自然语言理解能力,但是其输出是程序代码,因此用户可以用英文,对任何软件API发出命令,Codex的价值在于,能够让计算机理解人类的意图,进而让所有人都使用计算机完成更多的工作。

Codex是一个通用程序开发模型,因此可以应用在任何程序开发任务上,官方提到,当开发者明确知道要构建什么样的程序,则撰写程序的工作会被分类为,将问题分解成更简单的问题,或是将简单的问题,对应到已经存在的程序代码,像是函数库、API和函数,接下来也是最无聊的实际程序代码编写阶段,而这正是OpenAI Codex最擅长的部分。

OpenAI已经将Codex用于转译、解释和重构程序代码,而这些仅是Codex能力的冰山一角,OpenAI规划要扩大规模,并且免费提供OpenAI Codex,而现在则是先提供私人测试版,官方提到,他们会继续查看安全性问题,并且了解该技术对于世界的影响。