时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{以付费阅读为例,如何通过样本量来提升测试效}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的以付费阅读为例,如何通过样本量来提升测试效内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
前半章是案例,想看干货的可直接转到后半章。 如今ABtest已被广泛应用,是否经常遇到测试成本高、观察周期长、结果不清晰的问题? 本文将通过探究测试需要的样本量来达到提升测试效率的目的。 一、思路1)定性分析:确定样本量和变量的关系。 2)定量分析:已知总体比例,计算抽样样本容量。 二、背景以付费阅读行业测试书籍为例,计算已知总体比例的抽样样本容量。 三、案例1. 数据获得付费阅读行业经常会根据书籍推广测试的后续回收增幅来对书籍质量进行评估,以确定书籍是否有推广价值。现需要对某测试书籍后续回收做有效判断,观察周期为5天。 现已有书籍平均回收经验:
2. 数据分析1)问题 对于以上表格中的数据如何评价? 在探索出样本量的规律之前,我是这么做的: 初步结论:4/1、4/3、4/5后续达标;4/2、4/4后续不达标。 这就很难仅通过5天数据对这本书进行评价了。 这时我们注意到4/1、4/2的新增uv非常少,而涨幅的偏差却很大,那么是否因为样本量的原因干扰了我们的判断呢? 答案是:是的,样本量会影响后续回收涨幅。 如果样本量影响对书籍质量的评估,那么究竟需要多少样本量才能达到理想的反馈结果呢? 2)结果 本案例中,应排除4/1、4/2、4/4三天再做评价。 4/3、4/5的测试结果为正向,因此认为这本书可以用于推广。 根据4/3、4/5的第5天增长情况对4/6进行预估,4/6预计累计5天ROI=39%,结果仍为正向。 3)分析过程(正文+干货) 定性分析:分解指标,找出变量中受样本量影响的因素,以及该因素与变量的关系。 本案例中:
得到:累计充值金额=新增uv*∑第i天留存比例*第i天充值ARPPU。 问题简化为:为保水土方保持方案证新增用户5天后有效留存,需要多少新增uv(又回到了熟悉的留存问题上了)。 现已知第5天平均留存比例为8%。 定量分析:大样本条件下,已知总体比例,求置信度(1-)下的样本容量n】 计算公式 本案例中:
计算置信区间: 计算公式 在本案例中,1.96*sqr(8%*92%1100)≈1.6%,置信区间为 (6.4%,9.6%)。 四、结论众所周知,样本量越大、测试周期越长,成本就会越高。如何降低成本是数据分析师应做的,也是文章里想要表达的。 在本案例中,至少需要新增uv=1100。 因此认为4/1、4/2、4/4为无效测试,再结合实际业务对4/5进行取舍,本案例中认为4/5是有效测试。 最后很重要! 互联网很容易获取到大样本,但样本里掺杂的因素很多,在做测试和计算样本量的时候,一定需要先做定性分析!
本文由@树无? 于。,。 ,基于 内蒙古微信朋友圈广告限制CC0 协议 |
上一篇:浅谈在探索数分之路上的“数据思维”论述
下一篇:埋点和无埋点——适用场景、步骤及一站式解决
小提示:您应该对本页介绍的“以付费阅读为例,如何通过样本量来提升测试效”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通以付费阅读为例,如何通过样本量来提升测试效的相关事宜。
关键词:2年, ABtest, 初级,