个推应用统计SDK是如何用大数据做行为预测的?

个推应用统计SDK是如何用大数据做行为预测的?

关键词:

大数据,应用统计,行为预测,可视化埋点

发布日期:2019年01月31日


个推数据统计分析产品,通过可视化埋点技术及大数据分析能力从用户属性、渠道质量、行业对比等维度对 APP 进行全面的统计分析。


不仅可以及时统计用户的活跃、新增等,还可以分析卸载用户的成分、流向,此外还能实现流失、付费等用户关键行为的预测,从而帮助 APP 开发者实现用户精细化运营和全生命周期管理。其中值得一提的是,“个数”在“可视化埋点”及“行为预测”方面的创新,为 APP 开发者在实际运营中带来了极大的便利。


可视化埋点


埋点是指在产品流程的关键部位植入相关统计代码,以追踪用户行为,统计关键流程的使用程度,并将数据以日志的方式上报至服务器的过程。


目前,数据埋点采集模式主要有代码埋点、无埋点、可视化埋点等方式。


“代码埋点”是指在监控页面上加入基础 js,根据需求添加监控代码。它的优点是灵活,具有自定义设置、按需分析数据的功能。但针对复杂网站,开发者每次修改一个页面就得重新调整埋点方案,成本较大。


“无埋点”的原理是“全部采集,按需选取”,它可以对页面中所有交互元素的用户行为进行采集,先收集检测页面的内容,然后再通过界面配置决定分析哪些数据。但“无埋点”是标准化采集,如果需要设置自定义的采集方式仍需要代码埋点助力。


“可视化埋点”通常是指开发者通过设备连接用户行为分析工具,直接在数据接入管理界面上对可交互且交互后有效果的页面元素(如:图片、按钮、链接等)进行操作实现数据埋点,下发采集代码生效回数的埋点方式。个推应用统计“个数”就是可视化埋点的代表产品之一。


个推统计SDK为什么会增加可视化埋点功能?


当下移动互联网正处于高速发展且发展形势瞬息万变的阶段中,开发者需要及时根据大数据的分析、反馈,对业务功能做出调整。在传统的操作模式中,开发者了解不同节点的数据,就需要对相应代码里面的埋点进行修改,并测试发布,最后才能在应用商店审核、上线。这个周期耗时长,无法满足业务的需求。因此,个推应用统计“个数”采用“可视化埋点”的技术去帮助开发者解决这一痛点。


“个数”的可视化埋点灵活、方便,开发者不需对数据追踪点添加任何代码,只需要连接管理台并圈选页面中需要埋点的元素,即可添加随时生效的界面追踪点。同时“个数”拥有强大的数据分析能力,能够提供准确、有效的数据给开发者们。



可视化埋点主要具有以下特性:

零代码,无需代码,节省成本

免更新,新增便捷,无需升级

易测试,圈选测试,实时呈现


换而言之,可视化埋点不仅可以帮助企业节约成本,还可以提高开发人员和运营人员的工作效率。


行为预测


个推应用统计“个数”的行为预测主要包括流失预测、卸载预测、付费预测等,它的原理是基于 APP 历史行为数据构建算法模型预测用户关键行为,从而帮助开发者达到用户精细化运营和全生命周期管理的目的。


在这里需要注意的是,“个数”的行为预测与电商平台常用的个性化推荐不同,后者主要是基于用户近期的行为,如浏览记录、购买记录分析出用户可能需要的东西,而“个数”是对APP 各渠道卸载数、卸载趋势等指标的综合分析,是一种聚类分析,而非针对特定个体的行为分析。


行为预测的步骤


个推应用统计产品的行为预测主要分为以下几个步骤:

1、找到样本:从历史数据库中抽取;

2、特征抽取:将用户与数据库打通并匹配;

3、特征筛选:保留相关性高的或有价值的特征;

4、模型训练:将保留下来的特征放到模型中进行训练;

(在模型的选用上,个推应用统计“个数”主要用了逻辑回归,该模型相对深度学习等其他模型来说较为简单,但在特征的筛选上较好处理,得到的结果好解释并且稳定。)

5、参数优化:根据效果进行调整,如果结果不理想,即可返回调整参数重复以上流程。


实例分析


下面以“个数”的付费预测为例,梳理具体的实现过程。


1、目标问题分解

明确需要进行预测的问题即付费预测,以及确定时间跨度。


 2、分析样本数据

(1) 提取出所有用户的历史付费记录;

(2) 分析付费用户的构成,比如年龄层次、性别、购买力等;

(3) 提取非付费用户的历史数据(可以根据产品的需求,添加条件、或无条件地进行提取),比如活跃但非付费用户;

(4) 分析非付费用户的构成。


3、构建模型的特征

(1) 部分原始数据可以直接作为特征使用;

(2) 有些数据需要变特征,比如年龄,可以变换成少年、中年、老年等特征;

(3) 生成交叉特征,比如“中年”和“女性”两种特征,就可以合并为一个特征使用。


4、计算特征的相关性

(1) 计算特征饱和度,进行饱和度过滤;

(2) 计算特征 IV、卡方等指标,对进行特征相关性进行过滤。


5、选用逻辑回归进行建模

(1) 选择适当的参数进行建模;

(2) 模型训练好后,统计模型的精确度、召回率、AUC 等指标,来评价模型;

(3) 如果模型表现较好,则在验证集上做验证,通过后,进行模型保存和预测。


 6、预测

加载上述保存的模型,并加载预测数据,进行预测。


 7、监控

最后,运营人员还需要对每次预测结果进行关键指标监控,及时发现并解决出现的问题,防止意外情况的出现,导致预测无效或预测结果出现偏差。


有了精准的行为预测,运营者就可以将运营目标进行拆分、细化,具体到每个场景和流程当中,针对不同用户采取不同的推广渠道、运营策略。例如基于流失预测,运营者能够提前洞察到用户的流失行为,提早进行干预,通过个性化内容推荐、消息推送等运营手段对即将流失的用户进行挽留,从而降低流失率。总的来说,在大数据行为预测的帮助下,运营者能够更及时、更全面地了解用户,从而达到精细化运营的目的。


关于未来


接下来个推应用统计还将在其他领域做更多的探索,不断地挖掘大数据的潜力,结合反馈的数据进一步优化,围绕客户提供的样本数据做更深入的训练学习等,为开发者提供更全面的大数据服务。

上一篇:个推大数据:2019春节瘦身城市排行报告 下一篇:流量红利天花板,用户流失预测很有必要

更多资讯