设计

设计 | 怎么快速估算一个产品的活跃用户数量？以 Twitter 为例

先说结论：使用中文的 Twitter 用户，周活跃用户大约有 10~25 万人。

注：我的工作是设计顾问，需要直接帮助企业做决策，所以本文的目标读者首先是老板们，然后是企业里负责市场、产品、运营的同行们。我专长在中小企业和创业公司领域，本文适合这类企业，或者大公司里的独立运营的小项目。阅读难度：入门。

我们拿不到让瑞幸咖啡崩盘的那种数据

大家应该都看过浑水调查瑞幸的数据了。

数据的重要性不必多言，老板们善于解读经营报表，对市场调查数据敏感，哪怕看似直觉的快速决策，往往也建立在历史经验数据基础上。在一个完美世界里，我们有无限的资本和无限的时间，当然是像浑水公司那样花钱采集数据最专业啦！

但是很遗憾，中小企业和大公司的独立项目买不起这么贵的数据。

大部分情况下，我们需要借助极其有限的资料，来估算数据，并利用估算结果来做出经营决策，比如品牌定位、产品定位、营销投放预算等等。

全世界一共有多少位钢琴调音师？

中小企业和独立项目经营中，经常会面对缺少参考值、范围很含糊、只能依靠估算来测算的奇怪问题。比如我们要估算一个城市需要多少咖啡师。

”全世界一共有多少位钢琴调音师“这个怪问题，曾经是谷歌的产品经理面试题，这种需要估算的问题称为”费米问题“（Fermi problem），类似问题还有”宇宙里有多少智能文明“。

评估类似问题的方法来自著名物理学家恩里科·费米（Enrico Fermi），也就是著名的”撒了一把纸屑就推算出原子弹爆炸当量“的那位神奇的费米。

费米的估算方法不同于麦肯锡们的正规调查方法，甚至直觉上也不符合基本的统计学，但在有限条件下，费米方法是最快、最有效获取一手数据的方法。

怎么快速估算 Twitter 的活跃用户？

既然是估算，不奇怪，我也用了费米的方法。（注：忽略了简体中文、繁体中文用户带来的差异，忽略了水军带来的差异，原因就不解释了）

初始数据

首先我们需要找到初始数据、参考值。我选择了 Twitter 的 #（Hashtag、关键词）功能来获取初始数据。

最近 Twitter 上的中文用户正在拿 #我为什么来推特这个关键词，来讨论玩 Twitter 的理由，通过 Twitter 的搜索功能，可以找到有多少用户参与了 #我为什么来推特的讨论。（点这里查看原始资料）

设计 | 怎么快速估算一个产品的活跃用户数量？以 Twitter 为例 1 — Twitter 搜索 #我为什么来推特截图

第一轮估算：用几个小时的数据，估算一天的数据

我手工数了有多少条推包括了 #我为什么来推特这个关键词。

因为我很忙，身边也没有实习生和志愿者，所以我的计数只覆盖了几个小时。我拿这个原始数字，根据每小时 Twitter 用户的活跃度，估算出 1 天之内有多少人参与了这个关键词。

估算结果：第一天有 2000-5000 人参与了 #我为什么来推特这个关键词。

图例：每小时 Twitter 用户活跃数（微博的数据与之相似）

第二轮估算：寻找话题半衰期的起始点

Twitter 和微博一样，话题都有半衰期，我怎么知道话题是什么时候开始的？（我怎么知道我计数时数的是第几天的数据？）

这里的估算依据是罗杰斯的创新扩散模型，因为我是活跃的 Twitter 用户，我看到 #我为什么来推特这个关键词的时间，应该就是话题出现的第一天。

设计 | 怎么快速估算一个产品的活跃用户数量？以 Twitter 为例 2 — 图例：罗杰斯的创新扩散模型

第三轮估算：用一天的数据，估算一周的数据

按照以往的观察，Twitter 上一个热门的中文话题，相关的讨论大约能持续 2-3 天。

这个数据有点不符合直觉，毕竟 Twitter 和微博类似，都是内容快速更迭的社交网站。注：实际上整个 Twitter 的话题半衰期，大约是 2 小时。

按照这个信息衰减的速度，我估计第一天的活跃讨论总数，是一周内所有讨论数量的 1/5。

估算结果：第一周有 10000-25000 人参与 #我为什么来推特这个关键词。

设计 | 怎么快速估算一个产品的活跃用户数量？以 Twitter 为例 3 — 不同平台的信息半衰期。图表来源

第四轮估算：用参与用户的数量，推算活跃用户的数量

这个估算比较简单，社交网站上发布内容的用户，一般不会超过 10%，所谓”沉默的大多数“。

我们就简单一点，拿上面的一周数据乘以 10 吧。

估算结果：使用中文的 Twitter 用户，周活跃用户大约有 10~25 万人。

图例：沉默的大多数

估算的数据有多可靠？

按照我和客户们的经验，在早期决策阶段，特别是品牌策略、产品策略这些阶段，如果数据的误差不超过一个数量级，就足以帮助企业做出决策。

而且！我们不是 MBA 出来的、咨询公司范儿的青年才俊，我们不喜欢纸上谈兵纯理论的事。

正常情况下，我们都会拿估算的数据，和已有的真实数据交叉对比。通过互相验证、寻找不同数据的相似性，来快速提高估算数据的准确度。

整理的真实数据可以是经营数据，也可能是市场调研、用户访谈、同行交流的结果。

如果估算的数据、上个月的报表、街头访谈的小姐姐都说不爱喝咖啡，同行的老王上次也说他在咖啡上没赚到钱……那么我们肯定不会在咖啡领域投钱了。

后话

以上是一个小时快速写的短文，数据基于心算。而且我不是数据专家，我的初衷是向我各位客户老板们汇报我的工作方法。

实际操作中，我们并不会像上文那么粗略地估计。比如我们会请实习生采集更多数据，比如我们会去查找比对 Twitter 的历史数据，比如我们会拿初步分析的毛数据，和客户一起快速筛选和细化。

在品牌定位这种实际场景下，基于估算的数据分析可能会持续 1-2 周。估算得到的数据，能让我们的在无法进行定量分析的情况下，得到更多的决策依据。

欢迎大家留言一起交流，或者直接联系我，我们一起来帮您的品牌和产品估算数据。

倪爽设计顾问，倪爽设计工作室

设计 | 怎么快速估算一个产品的活跃用户数量？以 Twitter 为例

我们拿不到让瑞幸咖啡崩盘的那种数据

全世界一共有多少位钢琴调音师？

怎么快速估算 Twitter 的活跃用户？