久违两年,脸书AI研究院首席科学家、也是卷积神经网络之父Yann LeCun,即将在9月25日再度来台,参加全球图片处理顶尖会议ICIP大会(ICIP)。这场会议更吸引了超过1千五百名全球产、学界图片处理、影音分析学者和专家来台与会。连Google、高通、微软和腾讯等科技巨头也派出自家资深研究主管,亲自来台披露最新图片处理AI研究技术或成果。

ICIP会议是IEEE学会旗下国际旗舰型会议之一,26年来首次来台举办,早在5年前,台大电机工程学系教授陈宏铭、交大电子工程学系教授杭学鸣和南加大电机工程与计算机科学教授郭宗杰,三人开始向ICIP大会提案争取,希望将全球第一流的图片处理和分析专家,带到台湾交流。陈宏铭表示,希望借此塑造一个让台湾业界跟国际学者交流的平台。
主讲者阵容超强,如陈宏铭与杭学鸣两位教授更是Yann LeCun当年在贝尔实验室的同事,彼此的座位只隔了一个转弯,这个30年的交情,让Yann LeCun一口就答应再次来台开讲。
Yann LeCun不用“非监督式学习”(Unsupervised Learning)这个词,他选用“自监督式学习(Self-Supervised Learning,SSL) ”,来描述那些不需要事先标记数据的机器学习。他认为,多数深度学习都是依赖大批标记数据的深度学习,但人和动物大多数的学习成果,多来自观察和突发性的行为,他想要从这个角度,来思考如何运用自监督式学习来打造一个可以用来预测失落片段的机器,例如句子中少掉的词,图片的破损,视频的下一个讯框,然后可以找到通则来“填满”它,让文句、图片或视频得以完整。Yann LeCun将会在演讲中提出一套特别适合适于图片补全或视频预测的SSL模式,也会以自动驾驶汽车训练为例说明。
另一位Keynote讲者法国洛桑联邦理工学院(EPFL)教育单位副校长Pierre Vandergheynst,则是从图片的上游,也就是图形信号的角度来剖析AI的可能性。他曾是多个旗舰期刊的副主编,如IEEE的信号处理(Signal Processing)或SIAM的图片科学(Imaging Sciences),目前聚焦在如何将图形信号处理(Graph Signal Processing,GSP)运用到更多机器学习和网络科学的应用,他也将从图形信号处理的根本,重新思考几种关键作法在AI系统中的发展和未来趋势。
主办方更找来HTC健康医疗业务部总经理张智威,来展现台湾技术经验,曾任Google中国研究院院长的张智威现为HTC DeepQ部门总经理,他将披露有关医疗看护的最新科技进展,包括AI、VR、区块链等技术的应用。
这届大会收到的图片处理相关论文超过2,000篇,只有945篇通过将在会中发布,接受率约45%,其中,来自中国的论文最多,共有336篇,超过总论文量的三分之一;而论文数量第二多的是美国121篇、第三是日本59篇、再来是法国54篇等;而台湾则有43篇获选,杭学鸣表示,“一般来说,台湾研究能量大概有20、30篇,由于台湾今年为地主国,难得地突破了40篇的规模。”
而今年的热门题材,仍是以AI为核心的研究,若以主题来分类,“图片/视频翻译与理解(Interpretation & Understanding)”这类型论文数量最多,提交数量有646篇,接受数量也达到291篇,几乎是第二名“图片/视频分析(Analysis)”,其142篇的两倍,也代表了这类研究是近一年来的趋势。陈宏铭说明,简单来说,图片理解技术就是让AI能自动解读图片,其应用包括人脸识别、自动驾驶汽车的物体识别与关注、照片分类等。
从今年论文发布的结果,杭学鸣也分析近来图片处理的研究趋势,开始走向用少量数据来训练AI模型。比如说,过去需要大量标记数据来训练数据,常在数据标记过程消耗大量人力,如今,则逐渐走向非监督式学习,可能只要先标记十分之一的数据,就能让AI模型依照先前的模式来学习,需要的数据量也会更少。“因为人类学习不用教一百万遍,所以AI学习方法一定要突破,才能更加趋近于人类学习的方式。”
此外,这次大会也在9月22号,安排了Tutorials工作坊,邀请14位资深学者就各自专业领域,来开设为期三小时的短期课程,每个课程将专注于一个主题,循序渐进的教导报名者学习特定技术。陈宏铭表示,Tutorials工作坊不仅开放业界参与,也鼓励企业集体报名,不仅能享有半价优惠,还能一睹国际大师的风采。

Tutorials工作坊的场次与主题。
尽管ICIP是传统的学术性会议,论文发布者多来自学研界,今年约1500位报名者中,八成是学校师生,但这些人,正是企业极力想招揽的顶尖人才。为此,许多跨国企业也积极赞助,争取现场展现最新技术的机会。如腾讯、微软、Google、高通、Facebook等五家将各找来自家资深研究人员,举办Workshop,并大会中场休息时间介绍自家技术。
Google找来Google研究技术主管、Youtube影音算法专家,将披露如何理解和分析那些来自用户贡献的内容,尤其是压缩和品质评估难题,也会介绍Google在AV1编解码器视频压缩的最新进展。而脸书则要派出多位影音基础架构团队成员,例如曾设计出Netflix串流矩阵的Ioannis Katsavounidi,他现在是脸书各种视频品质技术的主管。脸书工作坊将探讨如何大规模测量且提高视频画质,以及采用了哪些措施来降低视频处理过程中所消耗的能源。
而腾讯就找来自家媒体实验室的资深研究员,来分享如何运用CNN执行视频处理和增强技术,来构建人类感知视频的服务;微软则是找来微软研究院计算机视觉团队首席研究主管Zicheng Liu带头,来分享OCR技术的应用,以及3D人脸关注和重建的解决方案。
台湾也有多家企业展现自家产品和技术,包括联发科、义隆电子、Acer、ASUS、研华科技、AILabs等,陈宏铭表示,“这是非常难得的机会,让国外学研界对台湾的技术能力有所了解。”瑞轩科技更是提供了65英寸液晶屏幕,作为论文发布用的数字看板,这也是ICIP首次以E-Poster取代纸本海报来展出论文,甚至以多媒体形式来展演研究成果。
这次ICIP大会的传承意味特别浓厚,因为25年前,主办第一届ICIP大会的三位发起者:黄煦涛(Thomas S. Huang)、John W. Woods以及Alan Bovic,前两位分别是陈宏铭与杭学鸣的指导教授,这次大会等于是徒弟接手。主办单位首次在会中添加了纪念性质的“特别贡献奖”,邀请首届三位主办人共同参与领奖,除了尊师重道的传承涵义,也要感念三位大师多年来在图片处理领域的贡献。
不只是承上,还要启后,陈宏铭表示,借着这次与国际接轨的机会,要提拔台湾AI图片学习的人才,让下一辈的年轻人不只要参与举办活动、观摩会议的进行,同时也要累积人脉,“将来才能在国际上发挥一己之力。”
ICIP从1994年举行首届以来,今年已经迈入第26届,将在9月22号登场,截至目前,已经吸引全球超过1500名的图片处理领域的专家学者报名,直到活动当天,都能现场报名参加。
台大电机工程学系教授陈宏铭(图右)、交大电子工程学系教授杭学鸣(图左),是这次ICIP会议的幕后推手,两人相识于交大研究所,而后均曾任职于贝尔实验室,与CNN之父Yann LeCun同在一个实验室工作多年。 