狗熊会人才计划第5期作品

您所在的位置:网站首页 数据分析岗位招聘影响因素分析狗熊会 狗熊会人才计划第5期作品

狗熊会人才计划第5期作品

2024-07-07 00:08:52| 来源: 网络整理| 查看: 265

自变量中手机因素多为离散型变量,代表手机的各部件所属的类别,销售因素为数值型变量和0-1变量,是价格、评论数和是否自营。手机零部件受限于生产技艺和供应商生产能力的限制,无法满足完全个性化订制需求,所以各项参数仍然在有限的范围内;手机价格、评论数等销售情况则与现实高度连结,有较大的起伏波动。

数据描述

01

因变量描述

本次研究的因变量为手机的好评度。手机的好评度呈现明显的左偏分布,大多数手机产品好评度在90%-100%之间,集中在95%左右。好评度最低的手机产品是某卖家出售的纽曼P20,好评度至于72%,;好评度最高的手机产品好评度达到100%,包括OPPO、vivo、华为、小米等品牌旗下的34款产品,其中大多数为非自营商品。

图6 自营与非自营手机好评度对比箱线图

自变量

01

自变量:手机因素

手机品牌是消费者对手机最直接的认知,华为、小米、苹果等品牌消费者耳熟能详。数据集中共包含43个品牌的商品,其中华为的商品数目最多,占比达到41%,OPPO、小米、vivo的商品也为数不少,而国际手机市场中份额较高的苹果和三星的商品数量却相对较低。不同品牌中华为、OPPO和vivo的好评度较高,其他品牌和小米的产品的好评度较低。手机的操作系统对手机好评度也有一定影响,使用安卓系统的手机数量最多,但是其好评度明显较低,且使用安卓系统的不同手机之间好评度有较大的差别,这可能是由于各品牌对安卓系统的优化水平存在差异;使用iOS系统的苹果手机和使用其他系统的手机数量虽然较少,但好评度更高。

图2 手机品牌对好评度影响箱线图 图3 操作系统对好评度影响箱线图

用户在选购手机时越来越看重手机的摄像性能和屏幕素质。多个摄像头、高像素手机通常有更好的拍照效果;有高分辨率屏幕的手机可以给用户带来更好的视觉体验。就摄像性能而言,摄像头数量和前置摄像头的像素对手机好评度影响较小,而后置主摄像头的像素对手机的好评度会有一定的影响。多数手机后置主摄像头已经达到3000万像素的水平,部分手机已经达到6000万像素。但其他类型的手机好评度却最高,反倒是6000万以上像素的手机好评度较低。就屏幕分辨率而言,手机屏幕分辨率为超高清的手机数量较多,屏幕分辨率仍然在高清及以下的手机数量已经较少。屏幕分辨率为高清及以下的手机好评度较低,而全高清及以上的手机好评度较高,其他类型的手机好评度最高。出现这种情况的原因可能是信息采集不全或者数据合并导致更高分辨率手机被归入了其他类;也可能是由于用户关注重点不同而导致部分功能机等屏幕分辨率低的机型仍然具有较高的好评度。结合此前观察到的操作系统对手机好评度的影响,我们任务后一种情况的可能性更大。

图4 后摄主摄像素对好评度影响箱线图 图5 屏幕分辨率对好评度影响箱线图

02

自变量:销售原因

京东商城中丰富的自营商品是其标志性的特征,且一般有着较高的可信度和品质保证,销量和好评度理应较高。自营产品虽然数量较少,但评论数明显高于非自营产品。不过令人意外的是自营产品的好评度却略低于非自营产品。

图6 自营与非自营手机好评度对比箱线图

图7 手机价格对好评度影响箱线图 图8 手机评论数对好评度影响箱线图

建模分析

01

模型构建

首先我们以好评度为因变量,其他变量为自变量建立全模型,之后通过对模型的QQ图和Cook距离图的观察发现数据有偏,个别极值对模型的拟合造成了较大影响。去除极值后重新搭建并改进模型,根据AIC原则选择变量后得到优化模型,结果如表2所示:

02

模型解读

总体来看,模型F检验的p-value<0.05,表明模型整体具有显著性。调整后的判决系数为0.3438,说明模型对因变量的变化具有一定的解释度。具体到变量来讲,手机的品牌、后置和前置摄像头的像素、操作系统、价格、评论数以及是否自营对手机的好评度有显著影响;CPU、屏幕尺寸、屏幕分辨率对手机好评度有较显著的影响。

控制其他因素不变,小米、华为、OPPO、vivo手机的好评度显著高于其他品牌的手机,这些品牌已经积累了一定的口碑,用户更信任其产品。注明后置主摄像素的手机好评度却显著低于其他手机,且后摄主摄像素超过6000万的手机好评度更低;注明前摄像素的手机好评度显著高于其他手机,其中前摄像素在1000万以下的手机好评度更高。屏幕分辨率为高清及以下的手机好评度较为显著低于其他手机,用户对手机使用的视觉要求正在不断提升,仅仅是高清已经无法满足消费者的需求。安卓系统的手机好评度显著低于其他系统的手机,主要是由于不同安卓手机在系统优化上存在差别,导致用户体验良莠不齐。

图9 手机因素变量回归系数估计值柱状图

图10 销售因素变量回归系数估计值柱状图

模型结果表明,手机因素和销售因素都会影响手机的好评度。就手机因素而言,手机的品牌、操作系统、拍照性能和屏幕是手机好评度的主要影响因素;就销售因素而言,手机的价格、评论数和店家是否自营都会影响最终的好评度。

03

模型诊断

在模型基础上通过QQ图和Cook距离图选出严重偏离的值进行剔除后重新建模后绘制模型诊断图。可以看到各种诊断图的趋势都变好了。残差图中残差大小更加趋于可比,没有明显的趋势可言;QQ图更趋于一条直线;Cook距离图中也没有非常异常的点。模型的方差膨胀因子VIF值都小于10,表明模型变量之间的共线性较弱。

图12 修正后的模型诊断图

04

模型应用

通过模型可以根据手机参数与历史销售数据对手机的好评度进行初步预测,帮助品牌和销售商做出生产和销售的决策。通过模型预测,手机品牌可以在产品的设计和定价阶段发现产品在市场竞争中的优势和劣势所在,在产品正式投产前提前对可能影响产品好评度的问题进行调整和改进,避免由于好评度太低、消费者满意度不足而导致产品销量不高。销售商可以在选品阶段根据过往销售数据利用模型对不同手机进行分析比较,选择出好评度最高、销售状况最好的手机作为主力机型,避免由于选机不慎导致商品积压影响利润。

总结

本研究通过在京东商城中爬取到的手机数据对影响手机好评度的因素进行分析。手机的好评度呈现明显的左偏分布,大多数手机的好评度集中在90%-100%的区间中。通过描述统计和建模分析可以发现手机的品牌、摄像功能、显示性能和销售因素都会对手机的好评度产生影响。手机品牌间在性能、摄像、显示、销售四方面的竞争也越发激烈,也印证了我们模型的判断。对于手机品牌而言,性能、摄像、显示、销售四方面缺一不可,共同发力才能够打造出好评如潮的金字招牌。在竞争愈发激烈的手机市场中,大型品牌不断在四个层面加码,而小型品牌将在此之外寻找新的创新点以求生存。对于品牌而言,通过手机参数和历史销售情况可以给手机的设计和定价提供参考,打造更受消费者喜爱的产品;对于销售商而言,利用历史销售数据和手机设备参数可以有效遴选出最适合销售的机型,尽可能提高手机销量,避免产品积压,增加利润。

end

案例作者: 赵昊蛟,中国人民大学,狗熊会人才计划第5期学员

“人才计划”是狗熊会推出的纯公益项目。本项目旨在培养出色的数据分析人才,尤其是商业分析(Business Analysis)人才。项目通过一系列高强度的TASK,从选题、背景介绍、数据准备、数据说明与描述、统计建模等方面进行训练。强调规范守时抗压,强调自学能力、沟通表达能力与数据分析能力。

戳 “阅读原文”一起来充电吧! 返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭