去搜搜
头像
嘘!AI摄影正在永久改变手机产业格局
2019-12-11 15:08

嘘!AI摄影正在永久改变手机产业格局

文章所属专栏 前沿技术情报所

本文所属虎嗅Pro精选专栏前沿技术情报所。


This is the first time a neural engine is responsible for generating the output image.  It is computational photography mad science.

- Phil Schiller, Apple Inc.


这是首次由神经元引擎负责输出影像。这是疯狂的计算机摄影科学。

-菲尔.舒勒,苹果公司


今天的手机产业从业者都知道,人工智能是手机不可缺少的重要技术,而当中最重要的环节,是手机摄影。


苹果在本年推出iPhone 11 Pro时,更重申,它们的手机是疯狂的“计算机摄影”科学


今天《前沿技术情报所》就来解读一下:


  • 为什么人工智能对手机摄影如此重要?

  • 为什么基于人工智能技术的计算机摄影,正在永久改变手机产业发展?


你拍的一张照片,并不是一张照片


手机上的摄像头,在原理上和一般相机并没有太大分别。大家都是通过镜头吸收外界光线,然后通过影像传感器转化为电子信息,再通过影像处理器转化为我们肉眼看到的影像。


那原理相似的手机摄像头,为什么就是“计算机摄影”?它与人工智能又有关系?这是因为从电脑的角度,手机拍出来的影像,并不完全是影像,它更多的是把影像转化成有用的数据,从中作出选择和决策,再把信息用于影像的进一步优化。


图片来源:Apple iPhone 11 Keynotes


无论是 iPhone 11 也好、华为 Mate 30 Pro 也好、又或是小米9 Pro也好,今天的智能手机,在拍摄时已经不是单纯的拍“一张照片”,而是拍摄“多张照片”,然后通过人工智能算法,合成为一张照片,这种手法一般被称为“多帧合成”(Multi-frame Imaging)。


事实上,照片合成技术其实存在已久。会玩摄影、爱修图的摄影爱好者,早就会通过修图软件,合成多帧影像,来优化照片。那智能手机上的多帧合成,与人工智能有什么关系?


图片来源:Apple iPhone XS Keynotes。


以往,你在P图时需要自行决定如何合成,保留哪些细节、保留多少亮度和色彩等等。但在手机里呢?这些海量的决策和处理过程,全由电脑处理。而且,从拍摄多帧画面、合成影像、优化和输出,手机把超过一兆亿个操作,一秒之内、一键完成。整个过程无需人手干预、完全通过人工智能自主操作。(Photoshop等修图软件,后来也引入了人工智能算法,实现了一键自主合成的功能)


你拍出来的影像,并不是单纯的影像


人工智能的具体拍摄过程是怎样呢?


当你按下快门键的一刻,相机就需要在不足一秒之内,拍下4至16张不同曝光值的照片。如果智能手机使用多个不同镜头的组合,多镜头阵列也可能在用户按下快门的一刻,同一时间拍摄多张画面,然后合成不同特性的照片。但智能手机在这极短的一瞬间,不仅要拍摄,也必须进行一连串计算,准确判断出每一帧“多张照片”的不同焦距、快门、ISO 和白平衡数值,藉此采集更多的环境信息。


请注意:这绝非完整的“拍摄流程”,而仅仅是“采集信息流程”。因为真正的“照片”,根本还未生成。


这时候,智能手机会把采集得的多帧影像,通过算法找出相似的特征点,并将之准确对齐。然后,手机会再比对多帧影像里的不同信息,包括但不限于亮度、色彩、焦距、照片里的人或物,然后筛选适合的内容,进一步优化影像。


图片来源:ColorOS 公众号


我们可以用OPPO的ColorOS为例,相机在"Low Light HDR"模式,会先在精准曝光度(EV0)下拍摄4至6张照片进行合成,但同一时间也拍摄数张欠曝帧来进行二次合成。正确曝光的多帧影像,能记录暗部的画面细节,但高光部份却因过度曝光而丢失细节。但由于有了能保留高光细节的多重欠曝影像,手机就能通过算法比对光暗信息,再把两种难以共存的细节,结会为一张细节丰富的照片(上图)。


图片来源:Engadget 中文版


我们再以Google Pixel 3智能手机,拍摄背景虚化的技术为例:系统会先用双核相位对焦技术,把影像传感器的像素点划分为两组,模拟双目立体视觉,产生深度信息。再通过卷积神经网络(Convolutional Neural Network, CNN),在影像的特徵里把人物轮廓分辨出来(上图),再把人物以外的背景,按深度信息虚化。


你拿着智能手机,按下快门键的一刻,你拍下的已经不再是给眼睛看的影像,而是给电脑用的信息。这也是为什么现在的智能手机摄影,为什么会被视为“计算机摄影”的范畴。


人工智能如何帮助手机摄影


人工智能为手机摄影带来什么改变?它能改善手机摄像头的画质,也能为手机摄像头带来更多不容易实现的功能,突破手机原有的限制。


图片来源:DxOMark


智能手机使用的是小型影像传感器,感光能力往往不够用。举例说,以往我们在大逆光环境拍摄人像,测光时往往会迁就背景强光而降低进光量,很容易会把人像拍成大黑脸,又或是只顾着拍到面,但背景细节都过了(上图左一和左二)。但今天的手机,往往大量使用先前提到的智能HDR技术,通过把不同曝光值、不同影细节的影像调色和合成,让用户轻松拍出满意的作品(上图右)。


图片来源:DxOMark


另一个常见的应用场景,是夜景拍摄。由于手机摄像头感光能力不足,当遇上低光环境,就只能提升ISO来增加感光能力,影像难免产生大量噪点(上图左)。但新款智能手机能快速拍下多张大量噪点满布的照片,并与少量长曝光照片比对,以人工智能算法保留细节,再中和画面的噪点(上图右)。


也因这种多帧降噪技术,全新的智能手机(例如Google Pixel 4 和华为P30 Pro),更能以拍摄以往智能手机难以拍到的星空。


图片来源:虎嗅。


此外,由于手机难以搭配专业相机级别的镜头,所以难以做到像相应的相机镜头效果。但通过把多张照片合成为超高分辨率照片,然后再通过裁切进行无损数字变焦,智能手机就能通过小镜头,模拟专业长镜头的放大效果。同样地,智能手机也可以利用多组镜头,通过三角算法测出环境的深度信息,再将前景和背景分离和虚化,模拟出专业长焦镜头的浅景深效果(上图)。


更重要的是,计算机摄影技术主要通过后期手法,所以研发工程师进一步发挥创意,就可以产生更多传统手机、甚至是专业相机也无法做到的拍摄手法,例如:多帧防抖、全景拼接、影像超采样、多张照片合成的光轨或星轨效果。


为什么手机需要计算机摄影?


为什么智能手机需要用上“计算机摄影”技术?这是因为智能手机确实有这个需要,而手机也确实能最大程度上发挥“计算机摄影”的潜力。


以往在光学摄影的年代,判断一台相机好不好,往往是通过影像传感器的大小、以及镜头的质量来决定。专业级别的相机之所以质量杆杆,就是因为它有个全画幅或APS-C级别的大的影像传感器,以及拥有由N组非球面玻璃组成的镜头。不过也由于如此,这些专业相机往往都长得五大三粗,不太便携。


图片来源:iFixit


但必须日常携带的智能手机,不可能容纳这么大的影像传感器、更不可能容纳这么大的镜头。如果要提升手机的拍摄画质,当然不可能单靠光学手法。计算机摄影正好为难以塞进更大尺寸光学元件的手机,在技术带来重大突破。以相机测评起家的 DxOMark,更指多帧合成技术,是手机摄影的“破坏性技术”


图片来源:Bare Feats


与此同时,智能手机在半导体技术日益进步下,无论在性能或功能上均有长足的进步。今天旗舰智能手机使用的系统芯片(SoC),除了拥有电脑级别的强大性能之外,更集成了一般电脑所没有的硬件,包括:神经元引擎(Neural Engine)、多种传感器、以及多镜头设计。因此,手机能在一瞬间收集大量与影像相关的信息,并进行大量而快速的人工智能计算。


因此,相比起一般专业相机来说,智能手机更适合计算机摄影。


计算机摄影改变了手机产业


也由于计算机摄影与智能手机的“天作之合”,人工智能也永远地改变了手机产业的发展。智能手机的普及、简易及便携,大幅促使了手机摄影的发展,再加上智能手机海量的修图应用,以及其联网特性,从拍摄、修图和分享三个范畴,极大程度地促使了手机摄影生态圈的成长。


而手机摄影的生态,又反过来促使厂商进一步重视手机的摄影能力。导致在计算机摄影普及后,卖得好的智能手机,几乎都是拥有强悍计算机摄影能力的手机。以小米为例,他们的手机以往只重视堆硬件、压成本,重视性价,但后来被OPPO或vivo等广泛认为性价比低的手机品牌弯道超车。


摄影性能,不得不说是小米掉队其中的一个重要因素。


图片来源:小米


以往,老是“为发烧而生”、“不服跑个分”的小米,单纯通过最新最快的硬件、通过压缩利润来降低售价,就能在市场上占有一席位。但现在,小米也要宣布与智能手机摄影方案供应商 Light 合作,赶紧在相机测试网站DxOMark里争个第一(上图)。可见你即使能采购最好的硬件,也要有一定的人工智能和相机调校技术的积累,才能生产出优秀的摄影手机。


“多快好省”换不来优质的计算机摄影技术,智能手机的门槛,从此大幅抬高。


图片来源:华为


更要命的是:以往的手机芯片,只要时脉高,跑分快就好。但自从华为在自家手机芯片上,集成专门为人工智能开发的神经元处理器 (Neural Process Unit, NPU),在计算机摄影范畴取得巨大的优势(上图),在拍照上干翻竞争对手,而苹果的 iPhone 11 甚至直接用神经元引擎,取代传统的影像信号处理器(ISP)来输出影像。


今天的计算机摄影,已经超出算法的范畴,慢慢进入芯片级别的阶段。


手机厂商除了要有充够的人工智能技术积累,现在更要有芯片级别的支持,也逼使手机厂商必须考虑设计自家手机芯片的可能性。部份厂商即使无法完全像苹果或华为一样,采用完全自主设计的芯片,也需要像vivo一样,与芯片生产商进行合作,为自家手机深度定制芯片。


视频:下一波人工智能浪潮


随着人工智能广被应用,在拍照上使用人工智能来改善画质的手机也愈来愈多。所谓“五色令人目盲,五音令人耳聋”,当愈来愈多的手机,通过人工智能拍出优质的照片,普通用户已经不容易分辨那台手机拍出来的照片比较好看。毕竟,但智能手机始终不是专业相机,用户也不会像专业摄影师一样,讲究智能手机画质的每一个细节。


图片来源:虎嗅


故此,智能手机不可能通过计算机摄影,无限提升手机的吸引力。根据边际效用递减定律(Law of diminishing marginal utility)(上图),拍摄质量提升所带来的额外效用,将会愈来愈低,直至负值。


诚然,计算机摄影是一种变相的后期操作,所以它也是一门很具争议性的摄影技术。不少从事摄影专业的用户、或是专注于光学影像的研发工程程,会觉得这一门科学是一种邪道。先前华为P30 Pro的“P月”事件,惹来巨大的争议,也是因为很多人都会把人工智能来优化照片这回事,一定程度视作为“作弊”似的操作。所以,如果把计算机摄影无限强化,结果可能得不尝失。


手机厂商实际上也意识到问题所在,不断挖掘新的增长点,而近年短视频和VLOG也日渐流行,刚好成为计算机摄影的下一波风口。OPPO早前推出的Reno 2,就以“超级防抖”为重点功能,而华为Mate 20 Pro也在宣传自己的四摄是“电影级摄像头”,而小米CC9 Pro更以DxOMark视频榜第一名,作为核心卖点。


不过,如果说人工智能摄影技术,提高了智能手机的技术门槛的话,那通过人工智能拍视频,技术门槛更是完全不同级别。


图片来源:虎嗅。


智能手机拍摄一张照片时,要在极短时间内进行一兆亿次以上的操作,已经十分不容易,但拍摄视频的话,是要让智能手机在极短时间内,拍摄和压缩24-120张不等的照片,其难度更是不可同日而喻。当 iPhone 11 推出的时候,业界都因其强横的HDR视频所震慑(上图),可见人工智能化视频所带来的新技术门槛,将会是决定未来智能手机胜负的新战场。


技术主导下的手机战争


在功能机年代,任何人只要找个方案供应商、再找家代工厂,就能参与手机市场,这也使当年山寨手机市场野蛮生长。但当手机产业进入智能手机阶段,山寨机黯退出市场,变成资本主导的市场:通过大量的资本投放实现规模经济生产,并压低成本和抢夺最先进的硬件,就能在手机市场上占一席位。


但在人工智能的时代,智能手机的门槛进一步被拔高,手机产业也转化为技术导向的市场。


如今,希望进场的投资者,已经难以只单凭资金来换取成绩,目前的手机厂商如果没有足够的技术壁叠,也难以在未来的市场中存活。参与手机产业的从业人员们,是时候进一步把目光新的技术上。


本文所属虎嗅Pro精选专栏前沿技术情报所。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声