Sony相机“动物眼部对焦”是怎么做到的?

近期Sony相机最热门的话题无非就是“动物眼控对焦”这项新功能了,这项目前独步业界、结合深度学习与AI的功能,在摄友圈内也获得相当多的反响与讨论,因此我们很想知道的是Sony是怎么做到的?

自从第三代机身Sony A9、A7R3、A73推出开始,Sony相机的动态追焦功能开始进入了下一个时代,其中最为人称道的就是“眼控对焦”这项功能了,使用具备眼控对焦功能的相机搭配AF-C对焦模式,在拍摄人像时几乎是无往不利,再也不用担心传统单反移焦、焦点击错、对不准焦的问题,同时也可以加快拍摄节奏,让拍摄者更即时、顺利地捕捉Model的表情与姿势。

以这项功能为基础,Sony在今年春季发布了“动物眼控对焦”功能(Real Time Eye AF for Animals),可以应对大多数的动物以及宠物,虽然在识别动物方面仍然需要一定的条件,但凡是有识别到者,“动物眼控对焦”功能几乎都可以顺利精准地完成眼部对焦。目前Sony A7R3、A73皆已在四月发布支持动物眼对焦的Ver3.0固件,Sony A9与a6400则预计在今年夏季发布Ver6.0与Ver2.0固件以支持动物眼对焦。

这项功能对摄友们来说非常新鲜,原因在于它可以降低生态与宠物摄影的拍摄门槛,同时它也给了我们一个全新的想象:未来有没有可能利用相关的AI与深度学习技术,打造出更多特殊对焦模式呢?例如赛车对焦、赛马对焦、飞机对焦⋯⋯

在三月期间,也就是Sony正式发布动物眼控对焦的更新之前,我们也有幸访问到了Sony日本图片业务部本部商品企划部统括课长(Senior Manager)-岩附豊先生(Yutaka Iwatsuki),来聊聊关于Sony相机的一些议题,不仅限于“动物眼控对焦”的功能,我们也询问了相当多关于无反相机市场、Sony系统的策略、现况、未来发展与方向,像是Sony未来会推出什么镜头呢?在全幅无反大战其中,Sony将用什么样的策略来应对Canon、Nikon、Panasonic这些品牌呢?

首先第一个问题是,相机要做到“脸部”或是“人眼对焦”算是相对容易的,目前已有不少品牌的相机已有支持眼部对焦或是人脸对焦,智能手机也早已具备脸部识别对焦功能(只是照相手机并没有像相机一般的需要这么精确的对焦点精准度),但目前只有Sony有推出动物眼对焦,从技术上来看,“动物眼对焦”无疑比“人类眼对焦”要来得困难。

要让相机做到深度学习,并且应用在对焦系统上,这必须要先有一定数量的Database才行,Sony很早就着手进行眼控对焦方面的研发了,要做到动物眼控对焦,Sony有来自全球搜集而来的数据库,这些数据并不完全是由摄影师所提供的,工程师也占了一定的比重。

虽然“动物眼对焦”与“眼控对焦”同样都是针对眼部对焦,但两者的运行方式可能并不如我们所想象得那样简单,因为相机要识别出一个“人”可能很容易,人类的脸部通常是对称的、有明显的轮廓与特征,例如眼、嘴、鼻、下巴、发线、耳朵等特征,但动物的脸部会受到毛色与斑纹等生物特征的影响,在相机看来可能不一定是左右对称的,更何况“动物”的定义何其之广,即便同样都是哺乳类动物,光是猫、狗与马、牛,它们的生理形态就完全不同。

日本Sony本部的岩附豊试着解释Sony眼控对焦的逻辑,他说,相机第一步要先做到的是在整个画面中识别出“人”,接着再识别出他的眼睛,动物眼控对焦也是同理,相机先在画面中大致识别出动物的形态,再进一步进行眼部关注对焦。笔者认为,动物眼控与人类眼控两者在后端的处理程序应该是比较接近的,但两者深度学习的数据库、识别人类和动物的方式则有所差异。

目前Sony动物眼控对焦最擅长处理的动物是猫与狗,更精确的说,应该是“猫科”与“犬科”动物,例如猫科动物就包含了狮子、豹、虎等,犬科则包含了狼等动物。由于猫狗与人类较亲近的缘故,加上人们最常拍摄的动物就是猫狗,因此这方面的数据库是最齐全的。另一方面,这也等同于让“动物眼控对焦”可以完整胜任猫/狗宠物摄影的用途。

虽然最擅长的是猫科与犬科动物,但这不代表“动物眼控对焦”没办法识别其他动物,除了哺乳类如牛、马之外,事实上像是爬虫类例如蛇、或是鸟类等等其实也是可以做到的,只是最擅长识别的还是猫与狗。岩附丰接着强调,Sony首先要做的是一步一步证明眼控对焦的科技力,未来眼控对焦会持续的演化,让各种动物的眼部识别都能够更加准确。

接着我们也与岩附豊先生聊了许多关于Sony镜头的问题,像是Sony全画幅E接环发展迄今已有5年多的历史,在市面上也有不少副厂镜头可以选择,例如Carl Zeiss蔡司、Tamron腾龙、Sigma适马、Tokina、Samyang、Laowa⋯⋯这些品牌都有推出过E-Mount的镜头。例如Sony与蔡司所推出的Batis系列镜头有部分焦段重复,也有一些镜头定位是错开的,我们想知道的是,Sony在决定新镜头的研发时,会与这些厂商有哪些程度的交流与讨论呢?

针对这点,岩附豊给了一个很肯定的答案,Sony并不会与其他品牌有任何讨论或是协调该推出哪个焦段光圈的镜头,Sony所做的只有开放E- Mount的通信协议,各家厂商可以按照这个配置来开发各种不同的镜头,彼此的镜头群也是各自独立发展的。

话虽如此,但岩附豊也说,站在Sony的立场他们认为这是一件好事,以E-Mount这个系统的50mm定焦镜头为例,除了Sony原厂镜头之外还有其他厂商的选择(例如Zeiss、Samyang、Sigma⋯⋯等),用户可以按照自己的需求来挑选最合适、且经济上可负担的镜头。目前市面上已有很多款E-Mount镜头,以Sony原厂的角度看来,市场越多人加入是越好的,如此这个系统才有更多的可能性。

言谈至此,我们也想到了在全幅无反大战下Canon、Nikon也纷纷推出了不少别具突破性的镜头,例如Canon RF 28-70mm F2 L、Nikon 14-30mm F4 S等等,相较之下Sony在“全幅无反”领域已耕耘了五年,将来会如何因应这些竞争对手所推出的镜头呢?

岩附豊表示,我们都知道镜头群是很重要的,一个相机品牌必须要持续提供充足的镜头群给摄影师选择,目前Sony E-Mount(含APS-C)一共有49颗镜头,其中有31颗是全画幅镜头、9颗是高端的GM镜头,在不久的将来Sony将会把E-Mount镜头总数扩展到60颗的规模,而未发布的这11颗镜头各种可能都有,广角/中焦段/长焦都不受限,也不限定是变焦或是定焦,这点也请Sony用户继续期待。

Sony在开发新镜头的概念是“One Mount”,因为E-Mount是个无论APS-C或是全画幅都可以共享的接环,在镜头设计的方向上Sony的目标一直都没有改变,那就是做出高品质、高分辨率的镜头,并提供多种选择给用户。以新推出的Sony FE 135mm F1.8 GM为例,它所着重的重点就是高分辨率、高速对焦、录像这三大方向。

要达到“One Mount”这项策略必须要备齐诸多样件,岩附豊说Sony在E-Mount这个系统具备五项优势,分别是更好的镜头设计、优秀的光学品质、独步业界的感光组件、结合EVF的无反优势,以及图片处理器的能力。由于有这些技术作为后盾,因此Sony在开发新产品与新镜头时,可以随时去调整光学与镜头设计来达到最好的成果,Sony也会持续开发APS-C与全画幅都可以使用的镜头来满足更多用户。

随着访谈接近尾声,包含笔者在内,我们也十分好奇一个问题,那就是Canon曾在之前对外媒的访谈中提到:“相机市场呈现衰退趋势,现在所谓新的“无反”相机,只能让现有的的单反用户转移到新的无反系统,并不会拓展新的用户”。就如我们所知,Sony是很早就开始着手开发无反系统的品牌(编按:最早的无反系统应该是M4/3),因此Sony方面是怎么看待Canon的说法呢?

针对Canon对无反相机的态度,Sony本部的岩附豊并不表示认同。他说,Sony跨入全画幅无反领域已经有5年余的时间(若计入APS-C格式的NEX-3、NEX-5则已历时9年),在这期间内Sony收到非常多用户的反馈,而Sony也因应这些反馈推出了许多产品来因应灵活的市场需求。

以较早进入无反相机研发的Sony来说,他们相当乐见相机市场的增长,与Canon表示“无反无助于吸引新用户”的说法相反,Sony的角度认为“无反相机”才能让相机技术更进一步的发展。岩附豊接着举例,就拿眼控对焦这项功能来说,过去许多摄影师必须要练习许多技术、提升对器材的掌握度(确保中央点以外的对焦点不移焦),才能拍摄出眼睛准焦的大光圈人像照片,但现在Sony相机具备了眼控对焦功能,可以让用户非常轻易的就做到这件事。

包含“眼控对焦”以及“动物眼部对焦”在内,这目前仍然是无反相机才能发挥的功能,或许有许多摄影师认为单反比较符合他们的使用习惯,对经验丰富的摄影师来说,也不难用自己的摄影技术来做到动物眼对焦这种功能。但Sony降低用户门槛、提升机身功能,可以让更多摄影师拍摄时将心力放在其他地方,例如构图、曝光、拍摄时机⋯⋯等等,借此创造出更好的作品。

不仅如此,Sony也在无反相机增至到了很多可能性,就以目前全幅无反的入门机身Sony A73(A7m3、A7III)来说,他们发现虽然这台相机的售价比较入门,但不仅只是刚进入全幅的摄影玩家,像是职业摄影师也会考虑选购A73来作为他们的主力或是第二、三台备用相机,这是Sony当初始料未及的事情。

在访谈的最后岩附豊先生做了一个总结,Sony认为相机市场仍然是持续增长的,他们也十分乐见一些竞争对手如Canon、Nikon、Panasonic相继来开拓全幅无反的市场。从2013年Sony推出A7一代开始,虽然机身设计有很多变革,但Sony的策略始终如一,仍然秉持“One Mount”的概念,并且认为相较于单反相机,“无反”是一个更具革新潜力的新产品。