怎么快速估算一个产品的活跃用户数量?以 Twitter 为例

先说结论:使用中文的 Twitter 用户,周活跃用户大约有 10~25 万人。

注:我的工作是设计顾问,需要直接帮助企业做决策,所以本文的目标读者首先是老板们,然后是企业里负责市场、产品、运营的同行们。我专长在中小企业和创业公司领域,本文适合这类企业,或者大公司里的独立运营的小项目。阅读难度:入门。

我们拿不到让瑞幸咖啡崩盘的那种数据

大家应该都看过浑水调查瑞幸的数据了。

数据的重要性不必多言,老板们善于解读经营报表,对市场调查数据敏感,哪怕看似直觉的快速决策,往往也建立在历史经验数据基础上。在一个完美世界里,我们有无限的资本和无限的时间,当然是像浑水公司那样花钱采集数据最专业啦!

但是很遗憾,中小企业和大公司的独立项目买不起这么贵的数据。

大部分情况下,我们需要借助极其有限的资料,来估算数据,并利用估算结果来做出经营决策,比如品牌定位、产品定位、营销投放预算等等。

插图:小姐姐假装爱喝瑞幸咖啡
插图:小姐姐假装爱喝瑞幸咖啡

全世界一共有多少位钢琴调音师?

中小企业和独立项目经营中,经常会面对缺少参考值、范围很含糊、只能依靠估算来测算的奇怪问题。比如我们要估算一个城市需要多少咖啡师。

”全世界一共有多少位钢琴调音师“这个怪问题,曾经是谷歌的产品经理面试题,这种需要估算的问题称为”费米问题“(Fermi problem),类似问题还有”宇宙里有多少智能文明“。

评估类似问题的方法来自著名物理学家恩里科·费米(Enrico Fermi),也就是著名的”撒了一把纸屑就推算出原子弹爆炸当量“的那位神奇的费米。

费米的估算方法不同于麦肯锡们的正规调查方法,甚至直觉上也不符合基本的统计学,但在有限条件下,费米方法是最快、最有效获取一手数据的方法。

物理学家费米
物理学家费米

怎么快速估算 Twitter 的活跃用户?

既然是估算,不奇怪,我也用了费米的方法。(注:忽略了简体中文、繁体中文用户带来的差异,忽略了水军带来的差异,原因就不解释了)

初始数据

首先我们需要找到初始数据、参考值。我选择了 Twitter 的 #(Hashtag、关键词)功能来获取初始数据。

最近 Twitter 上的中文用户正在拿 #我为什么来推特 这个关键词,来讨论玩 Twitter 的理由,通过 Twitter 的搜索功能,可以找到有多少用户参与了 #我为什么来推特 的讨论。(点这里查看原始资料:https://twitter.com/hashtag/我为什么来推特?src=hashtag_click&f=live

Twitter 搜索 #我为什么来推特 截图

第一轮估算:用几个小时的数据,估算一天的数据

我手工数了有多少条推包括了 #我为什么来推特 这个关键词。

因为我很忙,身边也没有实习生和志愿者,所以我的计数只覆盖了几个小时。我拿这个原始数字,根据每小时 Twitter 用户的活跃度,估算出 1 天之内有多少人参与了这个关键词。

估算结果:第一天有 2000-5000 人参与了 #我为什么来推特 这个关键词。

图例:每小时 Twitter 用户活跃数(微博的数据与之相似)

第二轮估算:寻找话题半衰期的起始点

Twitter 和微博一样,话题都有半衰期,我怎么知道话题是什么时候开始的?(我怎么知道我计数时数的是第几天的数据?)

这里的估算依据是罗杰斯的创新扩散模型,因为我是活跃的 Twitter 用户,我看到 #我为什么来推特 这个关键词的时间,应该就是话题出现的第一天。

图例:罗杰斯的创新扩散模型

第三轮估算:用一天的数据,估算一周的数据

按照以往的观察,Twitter 上一个热门的中文话题,相关的讨论大约能持续 2-3 天。

这个数据有点不符合直觉,毕竟 Twitter 和微博类似,都是内容快速更迭的社交网站。注:实际上整个 Twitter 的话题半衰期,大约是 2 小时。

按照这个信息衰减的速度,我估计第一天的活跃讨论总数,是一周内所有讨论数量的 1/5。

估算结果:第一周有 10000-25000 人参与 #我为什么来推特 这个关键词。

第四轮估算:用参与用户的数量,推算活跃用户的数量

这个估算比较简单,社交网站上发布内容的用户,一般不会超过 10%,所谓”沉默的大多数“。

我们就简单一点,拿上面的一周数据乘以 10 吧。

估算结果:使用中文的 Twitter 用户,周活跃用户大约有 10~25 万人。

图例:沉默的大多数

估算的数据有多可靠?

按照我和客户们的经验,在早期决策阶段,特别是品牌策略、产品策略这些阶段,如果数据的误差不超过一个数量级,就足以帮助企业做出决策

而且!我们不是 MBA 出来的、咨询公司范儿的青年才俊,我们不喜欢纸上谈兵纯理论的事。

正常情况下,我们都会拿估算的数据,和已有的真实数据交叉对比。通过互相验证、寻找不同数据的相似性,来快速提高估算数据的准确度。

整理的真实数据可以是经营数据,也可能是市场调研、用户访谈、同行交流的结果。

如果估算的数据、上个月的报表、街头访谈的小姐姐都说不爱喝咖啡,同行的老王上次也说他在咖啡上没赚到钱……那么我们肯定不会在咖啡领域投钱了。

后话

以上是一个小时快速写的短文,数据基于心算。而且我不是数据专家,我的初衷是向我各位客户老板们汇报我的工作方法。

实际操作中,我们并不会像上文那么粗略地估计。比如我们会请实习生采集更多数据,比如我们会去查找比对 Twitter 的历史数据,比如我们会拿初步分析的毛数据,和客户一起快速筛选和细化。

在品牌定位这种实际场景下,基于估算的数据分析可能会持续 1-2 周。估算得到的数据,能让我们的在无法进行定量分析的情况下,得到更多的决策依据。

欢迎大家留言一起交流,或者直接联系我,我们一起来帮您的品牌和产品估算数据。

Scroll to Top