一个里程碑：谷歌实现视频内容识别，并探讨AI民主化-虎嗅网

在当地时间3月8日的Google Cloud NEXT '17 大会上的Keynote演讲中，谷歌云机器学习与人工智能首席科学家李飞飞代表谷歌发布了多个谷歌云API产品，并正式宣布了谷歌云对数据科学社区Kaggle的收购。

一个里程碑：谷歌实现视频内容识别

根据the Verge的报道，李飞飞现场演示了一个叫视频智能（Video Intelligence）的API，该API支持自动识别视频中的物体和内容，使它们变得可搜索。李飞飞表示，通过视频识别技术，“我们将开始给数字星空中一个黑暗的物质照亮光芒。”

有了该API的帮助，开发者能够开发出支持搜索和发现视频中信息的应用程序。不仅如此，它还能帮助标记视频中的场景变化。

李飞飞表示：“像素的世界已经延伸到图像以外。视频对于机器学习研究人员来说一直以来都是个挑战。但现在的该项新服务能够使得从视频中提取信息变得跟从图像中提取信息一样简单。”

如果不出意外，谷歌是公开报道中首个实现视频内容识别的科技企业，这也是人工智能的一个里程碑。国内的百度、阿里、腾讯、科大讯飞、搜狗这些个自诩“人工智能公司”或者在大力投入人工智能的公司，不知又被甩出几条街了。

谷歌人工智能应用进展

而根据机器之心在现场的报道，李飞飞还通过一些具体案例介绍了谷歌人工智能的应用进展：

零售

机器学习算法在帮助谷歌的 AdSense为消费者提供更合适的建议，但也仍还有进步的空间，比如供应链优化、随时间预测需求改变以及使用无人机或无人车为消费者快递货物等等。

媒体娱乐

比如Google Photos的自动照片标注和YouTube的推荐播放列表。虚拟现实和增强现实依赖计算机视觉来进行运动追踪、环境监测和游戏。甚至新闻报道也将可以自动生成。人工智能将能帮助我们创造更加个性化的内容，比如音乐、视频和艺术品。

金融

机器学习正在信用卡风险检测、反诈骗和洗钱等方面发挥越来越大的作用。

医疗保健

人工智能正在真正改善着人们的生活，比如布满传感器的智能化医院、增强诊断等。几个月前，谷歌大脑的研究者表明可以使用深度学习来帮助诊断糖尿病性视网膜炎。

人工智能的下一步将是“AI民主化”

李飞飞还认为，人工智能的下一步将是“AI民主化”，包括民主化计算、民主化算法、民主化数据和民主化人才四个方面。

民主化计算

李飞飞说：“去年，我们推出了Beta版的 Cloud ML Engine，今天我在这里宣布其已经实现了更广泛的可用性。Cloud ML Engine 是一个能够利用谷歌所有计算资源的平台。”

根据介绍，有了ML Engine后，用户可以使用其熟悉的TensorFlow库，把精力放在自身创意和解决方案上，谷歌云则会为用户处理基础架构和模型上的问题——用户将它们上传至谷歌云，ML Engine 能更快速地进行大规模处理，并将其部署在移动设备上。

民主化算法

李飞飞宣布了一项新产品——Vision API。她介绍道，正在稳步研发的 Vision API 具备一些非常重要的新能力。第一，谷歌把该 API 的元数据（metadata）扩展到了识别来自谷歌图像的知识图谱的数百万实体；第二，增强了光学字符识别（OCR）功能，能够从富含文本的图像中提取出文本，比如法律文件等。

民主化数据

李飞飞认为数据是民主化的另一部分，像人类一样，人工智能需要大量数据为自我发展提供洞见。因此，数据集是人工智能需要克服的最大障碍中的一个。为了实现谷歌云实现数据民主化，李飞飞在大会上宣布谷歌收购了数据科学社区Kaggle，后者聚集了超过85万数据科学家，还曾与谷歌云共同举办过YouTube 8M视频理解挑战赛。

“收购 Kaggle 之后，谷歌云将为这个庞大社区提供最先进的机器学习环境，并提供直接市场化模型的机会。”李飞飞表示。

人才民主化

谷歌云发布了Advanced Solution Lab，实现其他公司与谷歌的人才合作，以帮助他们解决复杂的机器学习问题。

“AI民主化”概念此前鲜有科技公司提及，谷歌无疑又一次领先了世界。不过国内的企业也在迎头赶上，比如每年秋天的云栖大会就是阿里巴巴展示阿里云的最佳场所，跟谷歌不同，阿里的云栖大会更像是寻找商业伙伴，而谷歌云大会更像是前沿技术探索。