Google上周在AI大会上宣布可将文本转成视频的AI模型Imagen,将通过测试用App AI Test Kitchen开放特定国家用户测试。此外,另一AI模型Phenaki产生的视频也首次问世。
Google首席执行官Sundar Pichai贴出一段蓝色气球与长颈鹿的视频,并说,这是Google首次分享以文本提示产生具有条理,并以Imagen Video系统增进品质的超高分辨率视频。
Imagen、Phenaki是Google上个月公布的两个文本转视频的AI模型,前者强调具有深刻语言理解能力,能生成照片等级视频,而后者则能将多段文本提示合增长度较长、包含不同场景的视频。不同于Imagen仅能生成数秒视频,Phenaki则可生增长数分钟的视频。
Imagen将通过AI Test Kitchen App开放给美、英、加拿大、澳洲、新西兰及肯尼亚的英语用户测试。Google 8月宣布AI Test Kitchen App,主要用于测试Google AI技术。Google第一批测试的技术是对话AI模型LaMDA(Language Model for Dialogue Applications)。
9to5Google报道,最新在AI Test Kitchen App测试的Imagen包含2个主题,一是City Dreamer,用户输入关于对城市想象的一连串文本提示,由Imagen生成视频。Wobble也是由用户输入文本提示让Imagen生成视频,只是主题变成了怪物。
Google希望能借此挑战OpenAI的DALL-E 2、Stability AI的Stable Diffusion,或是Meta的Make-A-Video。OpenAI的DALL-E 2于9月正式开放所有用户试用。Meta的Make-A-Video也已经在9月底开放给社群试用。