时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{如何设计数据干预策略?}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的如何设计数据干预策略?内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
8月27日,国家网信办就《互联网信息服务算法推荐管理规定(征求意见稿)》公开征求意见。在此背景下,数据干预行为即将由以前的灰色地带转为违法行为。 在法律条文正式落地以前,本文将基于笔者的个人经验分享“数据干预”这一大部分人“听过、没见过”的设计要点。 一、数据干预的价值1. 什么是数据干预这里所讲的“数据干预”指的是平台方主动发起的、对平台上的内容(视频、课程、文章……)的外显互动数据(点赞、收藏、分享、投币、播放、打赏、赞赏、关注、订阅……)抖推品牌榜进行修改(通常是注水)的行为,在阅读本文时需要与 用户侧发起的黑产刷数据行为进行区分,也不涉及金融领域的业绩造假。 2. 为什么要做数据干预数据干预是纯粹的运营导向行为,其价值逻辑主要体现在: 通过为内容资源的互动数据注水(脱水),提高(降低)目标内容在资源纷发中的推荐权重,使得该内容对象有更高/低几率出现在首页、推荐页等用户侧页面。更高/低的曝光率又能带来更高/低的真实用户参与互动。 换言之,运营可通过干预外显互动数据,为目标内容导流。 举例来说: 运营发现视频A质量优秀,但是因为各种原因,视频播放量太低;播放量起不来的话极易被系统识别为低质视频,降低推荐权重;推荐权重降低后,视频A曝光率降低,普通用户难以触达;普通用户难以触达,挖掘不了该“宝藏视频”,又会进一步导致视频的播放量起不来。如此形成了一个负向闭环。 此时,运营可利用“互动数据干预策略”,为该视频投放1万个虚假播放量、5000个虚假点赞量,投放时间为1天。投放生效后,分发系统识别到该视频最近24H内互动数据快速增长,有爆火潜力,就会将视频推荐到视频首页、今日top排行榜。 普通用户在首页、排行榜看到该视频,就会尝试观看,发现质量很高,慷慨打赏;视频的真实互动数据因此快速、持续获得增长,最终该优质视频的真实互动数据与其质量匹配,跨过了“宝藏无人识”的尴尬局面。 观众获得了优质的观看体验,up主获得收益,平台获得用户数据增长,三赢局面。 除此之外,“小闲”型用户在消费内容前,会观察所选内容的各项外显数据量。运营通过干预策略,使得外显的互动数据量显得不那么寒酸,从用户心理上引导用户继续消费路径。 举例来说:视频的播放量、点赞量是0时,对于普通用户的吸引力极低,即使分发系统已将视频曝光至用户侧,用户仍然不会进行最终消费;如果外显播放量是1000,那么普通用户会自然地点开播放按钮,真正地消费内容, 如果平台运营提出此能力需求,一般基于以下业务目的考虑: 产品冷启动:产品冷启动阶段,平台内所有的内容资源的曝光率不足,用户真实互动数据全部为0或极低,推荐系统难以有效执行. 此时做数据干预对于纷发的影响效果立竿见影。冷冷清清的氛围也难以吸引首批用户,通过数据干预营造“虚假繁荣”对于小闲用户留存非常重要。 流量扶持:“流量扶持”是一种经常被用到的运营策略,数据干预策略是流量扶持的一种主要实现形式。当平台大战、互挖创作者时,运营可将“流量扶持”作为签约条件吸引优质创作者入驻;平时亦可将“流量扶持”作为平台活动奖励。 降低长尾创作者流失率:对于广大长尾创作者来说,很难通过创作盈利以解决吃饭问题,因此大部分创作动机来源于热爱、尝试心理。 矛盾的是,因为发布内容频率低、账号沉淀的粉丝少、平台未签约导致运营扶持政策少等综合因素导致这些小创作者“为爱发电”创作的内容很难得到足够曝光,更难得到观众互动回应。 “辛辛苦苦忙碌一周,发布后观看、点赞的观众不足10个”,这种努力过后得不到回应的感觉对于这些凭热情创作的创作者无异于当头浇了一盆冷水,极大摧毁创作积极性。 通过为长尾创作者执行普遍化地数据干预策略,使得他们的创作内容普遍能收获几十个点赞量,从而鼓励他们坚持创作,不至于从平台流失。 3. 什么是“好”的数据干预策略?数据干预行为本身是数据造假行为,“造假”的最高标准自然是无限接近真实,用户(内容创作者、内容消费者)对干预行为毫无察觉。 要想达到这个标准不是件容易的事,竞争对手、黑粉、忠实用户很容易通过关联的蛛丝马迹发现端倪。建议产品经理在做设计时、运营在进行策略配置时,重点注意以下方面的控制: (1)关注互动数据项之间的整体均衡 当内容有多个互动指标时,经过干预后的外显数据整体看起来必须足够均衡、合理。若某篇文章的阅读量小于点赞量,那么这就是脑溢血型数据干预;若某个英语学习视频的分享量大于点赞量,那么看起来会“一眼假”,用户会明显察觉不合理。 某视频平台,单个视频的互动量比例不自然 (2)关注互动数据项与内容质量的匹配度 一般来说,运营做数据干预的原始初衷是帮助优质内容增加曝光量,那么质量低劣的内容资源就不应该享受太高的数据注水,否则一方面会挤占真正优秀视频的纷发空间,造成劣币驱逐良币、平台创作环境恶化,另一方面大量“小闲”用户通过“爆火”标签查看视频时,却发现“名不副实”“受到了欺骗”,自然产生对平台的恶感,产生用户流失。 (3)关注互动数据项与创作者收益的平衡 内容创作平台为了进行创作者激励,通常会将内容的互动数据表现作为创作者收入的影响因子。 具备数据干预能力后,创作者收益计算时,必然使用的是真实互动数据。然而由于信息壁垒,创作者不知道自己的外显数据为灌水后的数据,会自然地使用外显数据计算收益预期。 当最终收益下发时,创作者发现收益与预期不符,会产生强烈的被骗感,与平台的关系自然跌入冰点。解决该矛盾的通用做法是:
因此,当创作者的外显互动数据量因运营干预有了较大增长,收益却未获明显上涨时,平台方可拿其他因素进行解释。只要数据造假不至于太离谱,创作者也能接受收益与预期不符的事实。当然,总体设计上仍需要保证“互动数据表现越好,收益越高”的基本原则。 某站的收益类型多,并且不会明确告知互动数据影响收益的计算公式 (4)关注互动数据项与其他关联数据项的匹配度 例如:若某个创作者内容平均浏览量为10万,但是该创作者的关注粉丝数只有10个,那就出现“一眼假”;若某个主播专栏作者每篇文章在平台内的阅读量平均10万+,但是平台的对外财报显示月活跃用户一共10万+,那么竞争对手就可以揣测出该专栏作者的数据有水分。 某博主,粉丝数1亿,单条内容评论量只有600 互动数据与其他关联数据的匹配极易成为大坑,主要是因为: “其他关联数据”的计算、产出、发布、展示通常不受互动产品经理和策略运营控制、负责。例如上述举例中,“关注”功能归属于用户体系设计范畴,“对外财报”更是财务、数据等多部门配合的结果。若需进行协调,往往涉及跨部门的合作,非常考验产品经理和策略运营的个人能力。 “其他关联数据”的类型不可控。在做产品设计和具体的干预策略设计时,产品和运营可能已经对潜在的其他关联数据类型做了摸排,确保所有的相关数据看起来协调、自然。 但是随着时间的推移,其他业务线新增的功能体系可能会导致新的关联数据类型产生,又由于数据干预的敏感性、保密性很高,关联业务负责人不掌握具体干预信息,导致新的数据类型在设计、产出、发布时没有兼顾数据干预系统的存在,最终使得互动数据与其他关联数据不匹配。 二、实战复盘1. 数据干预的支撑系统——Bot假账号系统最广为人知的Bot假账号是微博的僵尸粉、直播平台的机器人观众。这类系统在数据干预体系中扮演基础设施的作用——被干预的虚假数据由这些账号来模拟真实用户路径从数据层进行承载。 举例来说:运营配置干预策略,为某篇文章注入100个虚假收藏量。系统即向Bot账号系统中提取100个账号,将这篇文章收藏至自己的收藏夹。后续若有第三方读者可以在假帐号的收藏夹内找到该文章。文章创作者也会收到文章被用户ABC收藏的消息推送。 Bot假帐号系统能极大提高数据干预的真实性,既可以通过体验层模拟真实用户行为,“骗”过内容创作者、内容消费者,又能够在数据层面瞒过第三方数据爬取、统计机构的数据过滤系统。 那么,Bot假账号系统的搭建设计有哪些注意要点呢? 1)重视通用性 Bot假帐号系统之所以被定义为“基础设施”,原因在于:
因此Bot假账号系统在初始搭建时应以组件思维进行规划,以适应后续可能接入的多业务类型。 2)重视账号调取的效率
3)重视假账号的真实性维护 不论假账号来源于平台内的流失用户,还是系统自行创建,都需有维护机制,确保这些账号足够真实。一个真实性过关的账号需满足:
那么,如果平台内未有Bot账号系统能力,是否就不能进行数据干预设计呢?并不是。 Bot假账号系统是进行数据干预的充分非必要条件。 特别是对于互动数据干预而言,若内容平台内被干预的互动数据项本身不存在“对外信息公开”机制,那么在进行数据干预时可以不利用假账号进行承载,仅进行简单的数值增减。 举例来说:若内容平台内,普通用户无法查看其他用户的收藏夹内容,创作者侧也没有内容被收藏的消息推送、清单统计,那么进行收藏量干预时,完全可以直接在目标内容上进行数值变更。 2. 数据干预策略设计数据干预系统的核心是策略系统,即 运营如何依据业务特征设立干预目标。 基于笔者自己的经验,干预策略的设计根据不同的维度有以下类型: (1)根据策略的生效范围,可分为单目标干预、范围干预
(2)根据策略的生效方式,可分为 自动水下策略、半自动策略、人工水上策略
(3)据策略的规则类型 可分为:数值投放策略、增长倍率策略、内容投放策略
产品经理可依据业务特点,将上述不同类型的干预类型进行混合应用,从而得出不同的干预策略设计。 3. 数据干预策略生效规则数据干预系统的难点在于策略生效规则,即程序如何进行虚假数据投放。 策略设计时需考虑的实现难点: 第一,虚假数据投放时,需兼顾不同数据项的整体平衡。 以视频互动数据干预为例,进行数据投放时,必须保证:
第二,多种干预策略对同一个目标生效时,需考虑如何避免某个数据项因策略并发导致总和异常的情况。 以某视频为例,若有5个干预策略同时对该视频生效,那么存在一定可能性,在某个特殊时间点,由于收藏量的投放速率更高,导致5个策略叠加的总收藏量大于叠加的点赞量。此时若有用户观察到该现象,即会察觉到数据异常。 第三,进行数据投放时,需符合平台内用户活跃时间段规律。 举例来说,一般用户在傍晚时段活跃程度高于凌晨0-8点,周五-周日活跃程度高于周一-周四。那么干预策略生效时,必须遵循高峰时段产生的虚拟量多、低活跃时段时产生的虚拟量少的规律。 第四,依据程序计算的应投虚假量为固定值,实际生效时应有一定浮动值。 否则,程序每次产生的虚拟量完全相同,极易引起察觉。 第五,在进行增长倍率策略生效时,需考虑到同一个干预对象的互动率随着投稿时间延续呈现先增长后降低的规律,随着播放量的增长也呈现一定的波动规律。因此干预策略生效时,也需遵循此规律。 第六,在进行干预策略设计时,产品经理需明确告知研发团队,“策略何时生效,每一次策略生效时应当产生多少虚假数量”,而不是“某段时间后,应该达到多少总虚假数量”。 因为前者是增量描述,更符合开发思维,能够帮助开发联系到如何实现;后者是存量描述,只是设定具体的目标,没有规定程序到底该怎么实现。举例来说,如果告诉开发“总投放目标量为1万,投放时间1天”,那么有可能他会实现成“前23H投放值为0,最后1H投放值为1万”。 第七,需妥善处理干预策略与风控系统的关系。对于内容平台来说,为了防止用户侧黑产数据,往往会有完善的风控系统对用户侧互动行为进行识别过滤。 那么,在进行干预策略生效时,既需要保证系统侧投放的虚拟数据可以绕过风控系统的即时拦截,又能在后续风控系统对真实用户数据进行回刷时,对该真实用户数据带来的虚假数据进行联动回刷。 那么以上这些难点,有没有什么系统的解决方法呢?有的。囿于工作保密性要求,本文不会对具体如何做进行描述,仅列出思考方向:
4.干预数据的应用和人工回调为了服务于后续数据统计分析业务,在进行干预策略设计时,需注意向开发传递以下信息:
由于:
当数据干预系统内存在多干预策略时,可能存在被干预对象的各互动数据项最终显示异常的风险。此时需要有对应的处理机制:
三、结语数据干预本身是纯运营导向的需求,极易成为双刃剑,若使用不当,非常伤害用户体验(没错说的就是微博);但作为产品经理,需要能克服抗拒情绪,客观看待数据干预系统对产品和平台方的存在必要性,并在用户体验和运营价值之间找到平衡,设计出高效、安全的干预策略。 目前笔者混迹的几个产品经理社区难以找到这方面的设计沉淀资料,本文所述内容基本没有借鉴前人经验,全靠拍脑袋和实战得出,因此肯定存在失当之处,欢迎各位产品经理大神留言指正。
本文由 @十万号子手 于,,热门的简单快速怎么挑 ,基于CC0协议。 |
上一篇:思考:数据分析与数据后台设计
下一篇:干货:电商归因模型技术方案
小提示:您应该对本页介绍的“如何设计数据干预策略?”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通如何设计数据干预策略?的相关事宜。
关键词:2年, 初级, 数据干预,