拉斯维加斯9888

  • ?北大主页
  • |
  • 一带一路书院
  • |
  • 用户登录
    • 教人员登录
    • 学生登录
    • 拉斯维加斯9888邮箱
  • |
  • 教怨匦聘
  • |
  • 捐赠
  • 中国·9888拉斯维加斯(股份)有限公司-官方网站
  • |
  • English
首页热点

王聪:搞懂这届消费者的硬核步骤 ,相识一下

2021-11-11

所属栏目 概想 链接 /202106gb/ghgd.jsp?urltype=tree.TreeTempUrl&wbtreeid=1061
提要是否显示

9A9AD3C5F54E31D6CF6E642FC21_8CC17EAA_DD087

“双十一”已经走过了13个年初 ,用户的精密化运营成为了各大品牌追求业绩增长的沉要发力点。通过使用合规伎俩网络和洗濯用户数据 ,再经过算法加工形成用户画像 ,企业可据此设计出针对用户需要精准推送告白和商品的推荐系统 ,实现所谓的“千人千面”(每个用户看到的购物界面不一样)的指标。

但是这些推荐系统不少都是基于机械进建算法 ,使用产品评分(即显性反。┗蛘叩慊/采办纪录(即隐性反。┝街执缶值挠没Ы换ナ萁醒盗返 ,但由于消费者在产品接触、采办和颁布评分方面的差距 ,这两种数据都可能存在严沉的自我选择误差。将带有误差的数据输入推荐系统可能会进一步强化误差 ,并导致成立的模型无法有效地预测消费者偏好。

拉斯维加斯9888治理科学与信息系统系助理教授王聪及其合作者为此提出了一种旨在去除误差的推荐系统设计规划 ,其成就Training Personalized Recommender Systems with Biased Data被第42届国际信息系统会议(ICIS)收录 ,尝试了局批注:

1.该钻研所提出的模型在评分去偏的机能上拥有优越性;

2.对产品评价高或低的用户偏差于颁布评价 ,而对产品持中性态度的用户颁布评价的意愿则较低。由于模型如果缺失的评分往往是较低的分数 ,该钻研所提出的步骤更长于解除上偏的评分;

3.通过与其他多种模型的严格对比 ,在基于误差和基于排名的测度下 ,该钻研提出的步骤在用户的评分预测、采办预测方面都优于常用最新模型。

01三种误差让理解消费者“难难难”

凭据消费者决策行为的有关理论 ,能够综合出三种类型的自我选择误差 ,即接触误差(exposure bias)、采办误差(acquisition bias)和少报误差(under report bias。

消费者在自动搜索感兴致的产品时 ,会有选择地接触分歧的产品。凭据信息追求中的选择性接触理论 ,在决策过程中 ,人们更偏差于选择性地接触支吃熹信想、进展的信息环境中 ,由此产生了接触误差。换言之 ,消费者通常选择性地接触部门产品 ,例如他们以前相识过的产品等。

采办误差能够用效用理论来诠释 ,它是说消费者只采办在他们采办前评价为正净效用的产品 ,换句话说 ,通常观察到的采办数据容易反映出相对较高的效用。由于产品评分更有可能是由对产品中意度较高的消费者评出 ,从而产生正向的误差。

少报误差是由于只有一部门消费者在采办后会提交评分而形成的。凭据消费者中意度的经典理论 ,消费者往往只在中意度极度高或极度低的情况下 ,才更偏差于泄漏自己的定见 ,因而评价会呈双峰散布 ,中央数据较少。

这三种类型的自我选择行为共同作用形成了被宽泛观察到的J形评分散布 ,这也注明数据存在显著的偏倚 ,但却常将其作为推荐系统的训练数据。具体来说 ,消费者采办和评分的整个过程 ,三种误差的起源如下图所示。

1361F57DE3701D4257571F59B1D_F823D91A_11B40

鉴于上述误差 ,将未做处置的数据用作推荐系统的输入是有问题的。然而 ,目前还没有钻研系统地思考这三种类型的误差 ,以设计一个能够全面进行去偏的推荐系统。

02一个好的去偏模型cover掉三种误差

在推荐系统设计中 ,自我选择误差被视为一个非随机数据缺失问题 ,现有文件重要从结合似然法、插值法和逆偏差评分法三种角度处置推荐系统输入数据的非随机数据缺失问题。

结合似然法构建了一个由数据天生和数据观测两部门组成的概率框架 ,即推导了数据天生和观测的结合似而后 ,利用似然最大化估计参数;插值法通过用超参数报答地代替未观测到的评分来填充评分矩阵 ,而后凭据齐全的评分矩阵来揣度参数并最幼化预测误差;逆偏差评分法通过评估评分观察的偏差(或概率)来最幼化评分预测误差 ,但即便有正确的偏差 ,逆偏差估计工具也可能由于其方差过大而无效。

通过度析消费者在采办和评价阶段的行为 ,王聪教授及其合作者提出了一个统一的天生模型 ,系统地涵盖了三种自我选择误差。该模型优化了基于有关消费者行为理论的评价观测模型 ,而后推导诞天生和观测数据的结合似然 ,并将进展最大化算法使用于参数揣度 ,同时将推算进行了简化以提高效能。


5BCB282262CBBC137CF712442BF_8E4AF30E_1CE0B

03为企业提供的启迪

该钻研网络了来自Yahoo!、Coat和Goodreads三个平台的真实数据 ,其中排除了自我选择误差的数据(通过要求Yahoo!用户随机选择一些项目进行履历和评分而获得)。

钻研通过大量尝试来评估所提出新推荐步骤的机能。了局显示 ,新步骤在评分去偏方面简直优于其他基准 ,在预测评分披露行为、预测采办行为方面同样杰出 ,同时 ,该步骤更长于解除上偏的误差。能够说 ,在各类指标上 ,该钻研提出的步骤始终优于其他基线步骤。

总的来说 ,在理论上 ,该钻研提出了一个综合的基础评分天生和评分观察过程 ,并对个性化推荐的基础评分进行了估计 ,体现了以内核理论为领导的信息技术工具设计的沉要性;在步骤上 ,该钻研是最早在设计推荐系统模型时同时思考三种类型的自我选择误差的钻研之一。

本钻研为企业提供了一些启迪。有了更正确的评分预测机造 ,推荐系统就能够提供更正确的推荐 ,这对零售商、消费者以及平台都是有利的。另表 ,由于无数情况下消费者的误差是正的 ,而该钻研提出的步骤也更合用于始终为正误差的消费数据 ,因而该步骤能够很好地适应各类场景。

该钻研也为今后的个性化推荐工作启发了新的方向。其一 ,是在推荐系统设计中进一步思考其他类型的误差;其二 ,将来可思考开发一个尺度化数据集 ,用于同时评估隐式反馈和显式反馈的去偏成效 ,其中评论内容也能够作为去偏过程的沉要凭据。

王聪 ,拉斯维加斯9888治理科学与信息系统系助理教授。于清华大学经济治理学院获得治理学博士学位 ,曾在Carnegie Mellon University(卡耐基梅隆大学)从事博士后钻研工作。重要学术钻研聚焦于机械进建、数据挖掘等技术步骤与治理问题的交叉点上 ,凭据分歧治理问题需要及其数据特点进行相应的分析步骤设计 ,以提供精准高效的解决规划。目前重要关注于电子商务、金融科技、智慧医疗等领域的决策支持步骤设计钻研。

有关链接:

国潮 ,真香!

买它买它!电商促销是若何俘获你的 | 拉斯维加斯9888前沿幼讲堂

分享
【网站地图】