注 册
中国 +86
  • +123
  • +125
  • +666
  • +666
  • +555555
  • +666
  • +666
  • +666
请输入真实手机号
图片验证码 请输入图片验证码
请输入短信验证码
请输入密码

已有账号,

忘记密码
中国 +86
  • +123
  • +125
  • +666
  • +666
  • +555555
  • +666
  • +666
  • +666
请输入真实手机号
图片验证码 请输入图片验证码
请输入短信验证码
请输入新密码

已有账号,

鲜闻联合创始人郁其雨:基于场景感知的内容智能推荐引擎

2016-11-25 艾媒网 阅读 13862

摘要: 鲜闻联合创始人郁其雨出席了2016广东互联网大会人工智能&大数据应用领袖峰会,并发表了《基于场景感知的内容智能推荐引擎》的精彩演讲。

  艾媒网讯 2016年11月25日-26日,由广州市人民政府、广东省互联网信息办公室、广东省通信管理局、中国互联网协会指导发起,广东省互联网协会主办,广东互联网大会组委会、艾媒咨询集团承办的“2016广东互联网大会暨全球移动互联网CEO峰会”在广州琶洲保利世贸博览馆5&6号馆隆重开幕。

  本次大会以“共创•飞粤——互联网助推新经济”为主题,来自全国各地的政府代表、行业协会、互联网企业领军人物、专家学者等,共同探讨新经济常态下互联网的发展与未来。本届大会规模空前,会场占地面积两万平方米,规划了近200个特装及标准展位;参与报道的主流媒体超过200家;大会期间接待知名演讲嘉宾200位、海内外移动互联网CEO约1000名、互联网相关行业人士8万人次,是华南地区规模最大、规格最高的互联网盛会。

  会上,鲜闻联合创始人郁其雨出席了人工智能&大数据应用领袖峰会,并发表了《基于场景感知的内容智能推荐引擎》的精彩演讲。他认为,大数据通过每个场景给内容做单独的分析和聚合,实际上就相当于为我们每一个接入我们内容的构建使用场景,也就是可以为每个内容定制一套单独的使用方法。


  以下是郁其雨的演讲实录:

  我今天跟大家分享的题目叫做基于场景感知的内容智能推荐引擎。

  我们回顾一下之前的推荐是怎么做的,常见的推荐方法有两种:第一,基于标签的,这是最原始的推荐方法。什么叫做基于标签的?举一个例子,我看过一篇林丹的关键词,或者打了标签,叫做林丹的文章,我发现用户喜欢林丹这个关键词,下次当有林丹这个关键词出现的时候,我就把它推荐给用户。第二,基于用户协同的推荐,什么叫基于用户协同的推荐?直白来说就是所有访问过文章IE的用户,其中有40%或者50%,或者更高的数值访问过,比如说一篇说林丹的文章,有100个用户看过含有林丹这个标签的文章,其中有50个用户也看过了另外一篇文章,说谢杏芳生孩子的文章,我立马就知道这两篇文章是有协同关系的。

  标签推荐有哪些缺点?第一,推荐不是完全合理。怎么讲,比如上次一段时间大家都知道林丹出轨的事件,也是很热的一个事件,假如我给他推荐的时,推出一个林丹获得了奥运会冠军,这种推荐肯定是不合理的,因为大家关注点肯定不是这个,在林丹出轨的场景或者那个点,大家说这个是谁?我给他推陈赫的文章,这也是有相关性的,但是我没办法把陈赫的文章推送给关心林丹的那一拨人的。

  用户协同的缺点,这个方法,大家做过数据推荐的可能都知道,这个方法有很多缺点,其中一个很重要的缺点就是冷启动的问题。两种方法都有优点和缺点,能不能有一个办法把它们的优点和缺点结合起来?我们后来就想到这个,标签的协同,什么叫标签的协同?打个比方,文章A里面含有三个标签,林丹、谢杏芳、羽毛球,文章B也有三个标签,陈赫、赵雅琪、高虎,但是我发现林丹和陈赫这两个标签之间有关联关系,谢杏芳和赵雅琪也是有关联关系,我可以通过林丹和陈赫的关联关系和谢杏芳和赵雅琪的关联关系,这个做法能够解决什么问题?这也是目前很多做内容推荐和做电商推荐用得最多的一个做法,或者说一个办法吧。

  我们把这个故事讲完。另外一个场景,就是说一周以后,林丹跟李宗伟又打了一场比赛,这个时候我应该把看过这篇文章的人推什么文章?或者他们的关联关系是什么样的?其实你会发现,其实对于这拨体育用户的,他们之间的关注度,关注的点已经开始改变了,比如说我出林丹,他们把这部分用户亲集合起来,算他们之间的关联关系的时候,他会发现他和李宗伟是相关的。另外一个是娱乐用户军体关注的,这个是跟读者道歉的,这些的关联度,和林丹的关联度还是很强的,但是在体育用户这边已经被减弱得很弱了。在我们的理念当中,我们认为体育用户群聚合的一个地方,我们认为它是一个场景,在娱乐用户群聚合的地方,我们认为它也是一个场景。

  现在我们整个推荐里面是有什么用?大家知道我们的新闻做一行代码,定制专属内容,每一个接入我们内容的场景,它的用户群其实是不一样的,这时候我们通过每个场景给它做单独的分析和聚合,实际上就相当于我们每一个接入我们内容的使用场景,它实际上相当于是我们给他定制了一套单独的方法。

  到这里,我的技术分享基本上就结束了,因为技术这个东西讲起来可能比较枯燥,我尽可能拟人化把这些东西给大家分享一下,有想交流的可以线下找我。

 

  我介绍一下鲜闻。鲜闻做内容的聚合和分发的平台,主要是把优质内容聚合起来,分发给需要使用的APP或者公众号,或者一些场景使用。我们这个项目上线一年多,我们也取得了一些成就,我们也有很强大的技术团队,有几十号人的技术团队,整个应该有一两百号人。我们这边的内容也比较多,分类比较详细,大家有需要详细了解的,我们外面也有一个展台,可以到我们外面了解一下。目前我们也有一些合作客户,一个是中国联通的沃TV,还有一个是社区运营的APP,还有一个就是艾媒数据这边很多内容也是我们提供过去的,也是一个重要的合作方。

相关数据

2012-2016年荷兰网上购物互联网用户比例

查看完整数据

2016-2017年美国使用防病毒或互联网安全软件的受访者比例

查看完整数据

2016年和2020年印度互联网用户的年龄分布及预测

查看完整数据
网友评论
后参与讨论
提交评论 0/200

请回复有价值的信息,评论需要审核后进行展示,请勿重复提交。

评论区
    暂无评论哦,快来评论一下吧!

Copyright© 2007-2019 艾媒网 www.iimedia.cn All Right Reserved | 中华人民共和国增值电信业务经营许可证: 粤B2-20110424 粤ICP备11014183-1号 | 粤公网安备 44011302001580号 | 网站标签