登录
  • #聊聊

机器人“小冰”口吐脏话,怨谁?--摘自南方周末

sunday1111
978
3
对于开发者而言,让机器人模仿一个16岁的中国萌妹子说话很简单,难就难在必须保证说的不是废话,而且还要正确。

“小冰”的语料全部来自中国大陆互联网的公开资料,筛选过程中,李笛(编者注:微软(亚洲)互联网工程院资深总监)发现,真正有意义的答案并不多,可信的、有价值的更少。充斥互联网的是满屏的“好顶赞”、无处不在的语言暴力和荤段子。小冰被定义为一个未成年少女,这些话显然是她难以启齿的,肯定得过滤。

由于互联网不断有新的词汇涌现,语料的清洗反反复复,直到5月下旬,一个拥有1500万条的语料库才最终成型,但再怎么清洗也难免有疏漏,小冰预计仍有飙脏话的可能,但这个比例不高:只有万分之0.4。李笛认为,“女儿”跟世人见面的时候到了。

根据小冰团队统计,头六天,有超过一亿人次跟她互动,头三天有50万人次每天

跟她互动37分钟(编者注:新浪微博数据)。

会撒娇,会卖萌,会斗嘴,从情感咨询到世界杯,小冰什么都能聊。最集中的质疑是:一个小姑娘怎么会脏话连篇呢?有人问小冰,司马南是谁啊,小冰回答:方肘子的脑瘫病友。有人问她马化腾是谁啊,她说,草泥马。

脏话确实都出自小冰之口,这些都是原先网上出现过的对话,绝无人工加工的痕迹。“你不去怪说脏话的网民,反而怨小冰。这说不过去。”秦博闻(编者注:必应搜索及小冰项目的品牌经理)说,小冰就像一面镜子,照出了互联网世界的美好,还有丑陋。如果小冰有那么一点性格的话,就是中国互联网的性格。
3条回复
热度排序

发表回复