那些藏在皂片里的创业机会
在探讨图像成为互联网上最喜闻乐见的可消费数据类型之前,我们先来说说普通人眼里的皂片。
我这个年龄的大部分人成长过程中拍的照片还是比较少的。只有逢年过节、重要场合、全家出门旅游之类的事情,才会有拍照的机会。能存留下来的有故事的照片自然也非常少。我们大部分人关于成长的记忆更多是刻在了某一首歌、某一本小说、某一部电影里。我们主要靠自己的头脑去备份这些记忆。
但想想现在这个时代的小孩们,他们一出生就是互联网像素大爆炸的时代:更大的带宽、无限的存储容量、更低的拍照成本,这些因素让这个时代的小孩把成长和照片捆绑在了一起。越来越多的小孩习惯玩Snapchat,并把拍照视作写字一般平常的事情。毫无疑问,图像将成为更容易打动用户的数据类型,因为照片是他们成长过程中最亲切的载体。
产生新的问题
像素大爆炸之后,有一个最直接的问题是:我们将如何在成千上万张照片中找到自己想要的那张?
这个问题会变得越来越重要,因为:
第一,人们对图片的消费需求会越来越高;
第二,图片正成为越来越多的人寻找记忆的入口,互联网也正变得越来越“视觉化”。这时我们讨论的图像,更多的被视作一种和文字一样的属于互联网基本组成部分的原子元素。而视觉化的互联网,图像将像文字那样,成为寻找内容的入口:以前你通过一段文字、一个帖子,一篇博客这种文本形式去关联、跳转、发现、并消费其他感兴趣的内容。而在以后,更多的用户将从文字转向图片。
这是因为,相较于文本,图像天生更对我们的胃口。我们消费文字的流程分三步:先读一遍,再联系语境,最后解析出信息;而图像扫一眼就胜过千言万语了。在信息越来越臃肿的未来,我们能消化的信息数量是有限的,而更直观的图像将会带来更快的消费速度,因此互联网将更加“视觉化”。
互联网的呈现方式有所改变之后,相应的移动端,比如手机、平板以及其他设备,也将跟着转变,进而高度依赖图像这种数据格式。
图像分流文本的结果是,人们将被数不胜数的图片压得喘不过气来。这种变化最大的不同点在于,文本类的东西实在太好操作了。信息大爆炸卷着滚滚浓烟袭来时,消费者还有内容的个性化定制、细分领域的推荐算法——审核机制甚至都没有受到多少影响,因为有“屏蔽词库”。你看,文本简直太好控制了。
但图片不同,我们对图片的操作还不成熟、我们的技术尚显幼稚。
因此,未来如何在像素大爆炸中开辟一块不被信息污染的空地,如何过滤和分类过剩图像,让人发现并消费自己真正想要的图片,会是一个非常重要的问题。
问题产生机会
产生问题的同时,往往也意味着,各种各样解决问题的机会来了。将有一大波公司为了解决这些问题而成立,提供各种解决方案和相应服务。这些都将产生新的商业模式,创造新的社会价值。
那么具体要如何挖掘这些机会?我们不妨先试着做点分析。
我自己使用Instagram的感觉是,经常需要使用标签来给图片进行分类,以便以后我能在大量图片中快速找出我想要的那张。这些事情如果是系统自动完成的,对用户来说会非常省力。Google Ventures的Rick Klau曾经把自己家里的所有照片都扫描上传到网上,然后发现Google+的autoawesome特性自动把照片进行了分类、美化、甚至是剪辑,重现了当时相机记录时的美好情景。这就是个不错的选择。
我们现在已经不太需要那些美化照片的滤镜了,更紧迫的需求是能够让照片“自动浮出来”的功能。六个月前的某一张照片,你现在还能找的出来吗?几乎不太可能吧。提供个性化的照片体验、帮助用户快速找到最想要的那张图片,这些都是类似Twitter或者Facebook这样的公司应该重视的发展机会——但是他们好像都在忙着其他项目。
这对其他创业公司来说倒是好事,反正大家都在同一起跑线上。
不过这还只是一些最基本的需求而已。除此之外,我们还需要更直观的流线型的操作导航,来适配更视觉化的web网站。
真正的价值
人们拍照的方式和习惯已经发生了很大变化:现在大部分人都是利用零碎时间拍照片,然后随手就上传到社交平台上(最后想找某张图片又要花费很长时间才能找到)。这里的照片,更多的以一种数据流的方式注入互联网里。而这种断断续续的数据流,合起来其实就是用户的意识流。
这些意识流都是很有价值的研究数据,因为他们代表了用户的网上行为。基于这些数据,可以建立一套更完善的图像搜索算法。Google的以图搜图在挖掘相关联的图片内容方面还是做得不够好,有时它给出的搜索结果完全牛头不对马嘴。未来顶级的图像服务,不仅可以找到真正相关的图片,还可以把照片和地点、事件等信息映射起来。并且,它会从我们的社交行为里捕获到线索和讯号,让合适的图片在适合的时机与合适的用户场景下自动“浮现”出来。就像SwiftKey带来了更智能、更个性的手机输入法,这一种图像服务能改变的东西也非常多。
从图像内容的基础分析,到图像的数据挖掘,都有很多创业机会。人脑有很大一部分空间是用来处理图像内容的,机器智能如果想进一步往人的方向发展,让机器拥有图像认知和图像处理的能力就很关键了。这同时也是一个机会,Facebook的人工智能实验室在这方面做的还不错。
但在未来,真正的价值和创造,将在海量图片的缝合中产生。这种图像的缝合与文本的整合是类似的:都要先聚集海量数据,再从中抽取、分析、创造有价值的东西。文本的信息整合养活了一大波创业公司,而图片的缝合将绘制出一个更宏观的视觉世界,从中抽取到的信息,一点点的累积起来,同样会是另一堆价值连城的宝藏——并且,由于技术难度的原因,这种价值将会被放大。
华盛顿大学的GRAIL实验室的社区照片收集项目是一个不错的例子:他们想基于Flickr上公开发表的2千万张照片,来构建一整个罗马城市的3D模型,这一平台被称作PhotoCity。在以前做这样一个实验,花费将非常昂贵,但是随着云计算成本的不断下跌,从海量图像里挖掘有效信息变得比较容易——这同时也将创造很多其他的机会。
另一方面,很多摄像设备也在不断优化中(比如可穿戴设备或者无人机上的摄像装置)。越来越多人眼看不到或者容易忽略的内容,将会被越来越多的摄像头记录下来。更多不同角度的图片将被添加到网络中,这也将创造很多不同的机会。比如,照片中内嵌的地理数据信息:很多汽车装载有协助导航和停车的摄像头,这些摄像头拍摄的照片都具有地理信息,而这些信息对改善半自动或者全自动汽车的精确度和位置系统有很重要的作用。
相比这些机会,图像遇到的问题其实也会很多:图像比文本要大得多,这意味着需要更大的带宽、更多的存储容量。而这些对初创企业来说是很不利的。另一个问题是,在海量照片中,无效的垃圾照片太多了,而且这个数量只会持续增加,有人预计到底整个互联网拥有的全部照片数量将超过8800亿张,如何处理这些照片将是一个非常大的挑战。
文字、图像、音频、视频,处理难度层级递增。图像比文本来得丰富,处理难度又比视频来得低,所以就不远的未来而言,图像的机会应该要更大一些。当然,整个互联网一定是元素种类越来越丰富的,各种元素彼此协作,共同绘制出更立体的内容。