如何解放编辑的双手?智能化流程助Buzzfeed触达目标受众
2018-10-25 14:00

如何解放编辑的双手?智能化流程助Buzzfeed触达目标受众

本文来自微信公众号:全媒派(ID:quanmeipai)


Buzzfeed一直都愿意第一个吃螃蟹。


在传统媒体和社交媒体割据一方的时候,Buzzfeed巧用心机,在社交媒体上排兵布阵,踩着这块他山之石再上一层。如今智能化大潮来袭,BuzzFeed这个技术宅又将如何把握潮水的方向,顺应这股急流冲向远方?


本期解密BuzzFeed的内部智能化流程。



收集决策参考的数据


在分发平台上,BuzzFeed花费了大量精力,布局多个社交媒体如Twitter,Facebook,Snapchat,Instagram,YouTube和Pinterest且取得不错的成绩:每月独立访客数量超过2亿,YouTube订阅者超过3亿。


这些不同的平台不仅是内容的展示区,同时也是实验室。


“如果你真的收集到了某一受众群体的数据,那这种策略就是有效的。我们打造的无非是这种最先进的收集渠道和技术。我们确实在内部投资了这项技术,来帮助我们掌握每个平台上发布内容的状况,比如人们是怎么看待这条内容的?互动情况怎么样?” 数据科学副总裁Gilad Lotan说。


BuzzFeed数据科学副总裁Gilad Lotan


这些数据将为内部决策提供参考,保证每一部分内容都能有同样的机会触达目标受众。


Dashboard管理数据


Dashboard是内容管理和数据分析后台,不同类型的Dashboard通过接入不同平台的数据提供差异化服务。新闻媒体把Dashboard当作内容管理系统,让记者和其他媒体工作者合作,运用多媒体手段讲故事;社交平台把Dashboard当作操控全网的指南针;提供数据分析服务的公司用Dashboard来更好地帮助用户监控内容;BuzzFeed则利用内部的多个Dashboard来集中管理从管道收集来的数据。


在这些Dashboard中,El Dashboard的操作比较简单。BuzzFeed的所有员工都可以在后台查看BuzzFeed在各个平台上发布内容(包括重新发布和改变的内容)的流量数据。比如说,在El Dashboard上既可以找到BuzzFeed垂直频道Tasty的原创视频数据,又可以查看在YouTube发布的改编视频数据。员工将会进一步比较两类视频的数据,判断不同平台上同一内容的表现,从而掌握内容的核心:推广平台,发布平台以及受众反应。



Dashbird更加直观,以意见为导向,显示的是社交乘数(sociallift)。 社交乘数是指病毒传播浏览量(BuzzFeed推广和控制之外的浏览量)和种子浏览量(BuzzFeed在自家网站和其他社交平台主动推广的浏览量)的比。在 Dashbird上可以查看内容的发布时间和发布地点,进而分析、推断最佳的发布时间和地点,衡量该内容是否达到了运营要求。



“公司里的每个人都可以登上这些后台。我觉得这些后台的力量是非常强大的。我知道有些媒体不想让作家知道这些,但是我个人觉得,知道受众的反应是非常重要的。这也是BuzzFeed 的企业文化。”Gilad说。


自动化是重中之重


BuzzFeed利用基于机器学习的模型来引导多个平台的内容发布。


跨语言爆款预测自动化


“在怎么调整内容来适应国际需求这一点上,我们考虑了很多:如果我们要翻译一部分内容,我们应该怎么识别可能会成为爆款的内容呢?” Gilad介绍道。


有BuzzFeed多年来收集的历史数据作为海量数据库,再加上启发式和逻辑回归,BuzzFeed构建的模型可以预测,有可能成为其他语言爆款的文章类型。


举一个例子,如果团队需要确定哪些内容从英语翻译成葡萄牙语之后依然能表现良好,就可以使用该模型,自动查找、分析数据,包括按国家划分的表现,所有历史文章和所有英翻葡的历史文章,逻辑回归之后输出“热度得分”。热度得分越高,成功的可能性就越大。


然后,编辑就可以根据这一建议再做定夺。


A/B测试自动化


在BuzzFeed,A/B测试也可以自动化。


A/B测试工具已经内置在CMS(内容管理系统)和所有文章中,作者可以自主选择是否要测试标题和图片的所有组合。测试结束后,结果将会发至办公写作软件Slack,标题和图片的各类组合结果便一一展现在作者眼前了。


展示位权重自动化


Feedranker是一项内部服务,利用机器学习来排名和展示BuzzFeed主页上最吸引人的内容。


多臂赌博机算法抓取所有发布的新内容,将这些内容突出展示一段时间。通过学习这些内容的流量数据和人们的互动情况,比如点击量、停留的时间、完成率、转发量等,自动调整内容在主页上的展示位置。


“这是动态的,实时变化的,实际观众的互动不断壮大这一服务。” Gilad说。


相似食谱自动化


Word2vec模型从原始文本中学习“词嵌入”,利用神经网络来理解单词之间的关联。 BuzzFeed创建了名为recipe2vec的变体模型,用于BuzzFeed的垂直频道Tasty,在食谱页面自动添加相似食谱。


Recipe2vec是一个内部系统,通过学习食谱语料库中的单词向量,自动呈现相似食谱。相似食谱并不是使用相同原料的食谱,而是具备相似的制作方法或者口味的食谱。


例如,不是所有以猪肉为原料的食谱都是相似食谱。蒜香猪排食谱页面中的相似食谱也可能是法吉塔酿鸡肉(Fajita stuffed chicken)


决策自动化


内部工具Social Mission Control可以自动确定某一内容应该要发在哪些Facebook页面上以达到推广的目的。



BuzzFeed的单词分类器将相似的单词分门别类。一旦单词分类器可以识别出BuzzFeed涵盖的所有主题的词语,它们就开始工作,自动识别不同页面上有机会推广某一内容的地方。


然后人类编辑会做出接受或拒绝该建议的决定。如果BuzzFeed没有任何人负责这一页面,或者该页面不太重要,这一过程将完全自动化。


BuzzFeed不遗余力地为发布决策系统添加更多“最先进的技术”,提高效率。个例子,优化相关性。


例如,在BuzzFeed的动物频道,用户可能常常会碰到“狗”和“动物”两个单词,所以含有这两个词语的文章一般会被系统自动决策发布到这里。但是,热狗食谱中也有“狗”字,机器应该怎么避免此类乌龙事件?神经网络应该学会理解单词,同时也要了解单词之间的关系。热狗食谱中的单词与动物文章中的单词没有关系,这意味着相关性得分较低,如此一来,便不会将这些食谱展示在动物频道了。



如果是要发布一些“常青”内容(evergreen content),自动化也可以搞定。编辑在发布这类内容之前可以快速查看相关消息。


Gilad 介绍说:


重复使用某一内容,给内容添加乘数,这是BuzzFeed在多平台生态系统中占据优势的两大法宝。我们看到了一些希望。 在一些完全是自动化操作的首页上,我们已经看到了好结果。


我们发现不同平台中发布内容的数量有所增长。而且,自动化能够更有效地将内容分发给目标受众。因为我们每天有很多内容要发布,所以会忘记一些内容。如果一家媒体需要在多个平台上发布内容,这一工具将会发挥极大的作用。


人类创作者仍然可以控制,修改机器做出的决定。Gilad认为,BuzzFeed的员工并不会产生机器抢夺工作的焦虑。因为机器只是工具,接管了工作中最无聊的部分,而他们作为公司的头脑,有了更多的时间来制定战略。



本文来自微信公众号:全媒派(ID:quanmeipai)

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP