2019-11-21 11:42

让机器写文章?路漫漫其修远

本文来自公众号:KnowingAI知智(ID:Knowing_AI),作者: 虞喵喵,题图来自:东方IC


套话文章不会写?


狗屁不通文章生成器分分钟写出一万字,保证原创、绝不重样!



这个生成器是人工智能吗?


虽然的确是用 Python 写的,遗憾的是它只是简单的循环随机内容选取脚本。



文章会从名人名言开始,接上没有实际意义的承接句,然后是点题句,再来个同样没有意义的转折句。然后再接名人名言、承接句、点题句……周而复始生生不息。



设置语句库,按顺序从中随机选取语句,再将它们组合起来。原理并不难,难得的是作者对套话文章的揣摩和创意。


如果引入人工智能,效果会更好吗?



这很难说。目前自动文本生成,即让机器写作通常采用统计方法。先用大量语料训练神经网络,再让机器根据关键词不断预测接下来的词语,最后组成句子和段落。


这样生成的文本难免有逻辑错误、无中生有等问题,效果甚至不如僵硬的模版文本生成方法。


没办法解决吗?


也许可以问问入围星新一文学奖的作品,《机器人写小说的那一天》的作者团队。



他们的做法是规定小说的构造,设定导入、进展、结尾等大模块,再将这些模块拆解成更细致的开头、环境描写等等,一步步拆解后根据具体的要求生成语句,再将语句组合起来。



这样做的结果是生成的小说内容看上去非常合理,不过已经很难说这是机器的创作,毕竟它的框架完全来自人类。


另一个神器 GPT-2 能生成质量相当不错的英文文本,原因是数据集——它的训练语料是 800 万 Reddit 网友的高质量回复。面对 Reddit 讨论很多的主题,它能给出相当不错的输出。讨论技术含量更高、不常见的内容时,就会瞬间变成人工智障。


让机器写文章,路漫漫其修远呀。


本文来自公众号:KnowingAI知智(ID:Knowing_AI),作者: 虞喵喵

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定