先说结论:使用中文的 Twitter 用户,周活跃用户大约有 10~25 万人。
注:我的工作是设计顾问,需要直接帮助企业做决策,所以本文的目标读者首先是老板们,然后是企业里负责市场、产品、运营的同行们。我专长在中小企业和创业公司领域,本文适合这类企业,或者大公司里的独立运营的小项目。阅读难度:入门。
我们拿不到让瑞幸咖啡崩盘的那种数据
大家应该都看过浑水调查瑞幸的数据了。
数据的重要性不必多言,老板们善于解读经营报表,对市场调查数据敏感,哪怕看似直觉的快速决策,往往也建立在历史经验数据基础上。在一个完美世界里,我们有无限的资本和无限的时间,当然是像浑水公司那样花钱采集数据最专业啦!
但是很遗憾,中小企业和大公司的独立项目买不起这么贵的数据。
大部分情况下,我们需要借助极其有限的资料,来估算数据,并利用估算结果来做出经营决策,比如品牌定位、产品定位、营销投放预算等等。
全世界一共有多少位钢琴调音师?
中小企业和独立项目经营中,经常会面对缺少参考值、范围很含糊、只能依靠估算来测算的奇怪问题。比如我们要估算一个城市需要多少咖啡师。
”全世界一共有多少位钢琴调音师“这个怪问题,曾经是谷歌的产品经理面试题,这种需要估算的问题称为”费米问题“(Fermi problem),类似问题还有”宇宙里有多少智能文明“。
评估类似问题的方法来自著名物理学家恩里科·费米(Enrico Fermi),也就是著名的”撒了一把纸屑就推算出原子弹爆炸当量“的那位神奇的费米。
费米的估算方法不同于麦肯锡们的正规调查方法,甚至直觉上也不符合基本的统计学,但在有限条件下,费米方法是最快、最有效获取一手数据的方法。
怎么快速估算 Twitter 的活跃用户?
既然是估算,不奇怪,我也用了费米的方法。(注:忽略了简体中文、繁体中文用户带来的差异,忽略了水军带来的差异,原因就不解释了)
初始数据
首先我们需要找到初始数据、参考值。我选择了 Twitter 的 #(Hashtag、关键词)功能来获取初始数据。
最近 Twitter 上的中文用户正在拿 #我为什么来推特 这个关键词,来讨论玩 Twitter 的理由,通过 Twitter 的搜索功能,可以找到有多少用户参与了 #我为什么来推特 的讨论。(点这里查看原始资料)
第一轮估算:用几个小时的数据,估算一天的数据
我手工数了有多少条推包括了 #我为什么来推特 这个关键词。
因为我很忙,身边也没有实习生和志愿者,所以我的计数只覆盖了几个小时。我拿这个原始数字,根据每小时 Twitter 用户的活跃度,估算出 1 天之内有多少人参与了这个关键词。
估算结果:第一天有 2000-5000 人参与了 #我为什么来推特 这个关键词。
图例:每小时 Twitter 用户活跃数(微博的数据与之相似)
第二轮估算:寻找话题半衰期的起始点
Twitter 和微博一样,话题都有半衰期,我怎么知道话题是什么时候开始的?(我怎么知道我计数时数的是第几天的数据?)
这里的估算依据是罗杰斯的创新扩散模型,因为我是活跃的 Twitter 用户,我看到 #我为什么来推特 这个关键词的时间,应该就是话题出现的第一天。
第三轮估算:用一天的数据,估算一周的数据
按照以往的观察,Twitter 上一个热门的中文话题,相关的讨论大约能持续 2-3 天。
这个数据有点不符合直觉,毕竟 Twitter 和微博类似,都是内容快速更迭的社交网站。注:实际上整个 Twitter 的话题半衰期,大约是 2 小时。
按照这个信息衰减的速度,我估计第一天的活跃讨论总数,是一周内所有讨论数量的 1/5。
估算结果:第一周有 10000-25000 人参与 #我为什么来推特 这个关键词。
第四轮估算:用参与用户的数量,推算活跃用户的数量
这个估算比较简单,社交网站上发布内容的用户,一般不会超过 10%,所谓”沉默的大多数“。
我们就简单一点,拿上面的一周数据乘以 10 吧。
估算结果:使用中文的 Twitter 用户,周活跃用户大约有 10~25 万人。
图例:沉默的大多数
估算的数据有多可靠?
按照我和客户们的经验,在早期决策阶段,特别是品牌策略、产品策略这些阶段,如果数据的误差不超过一个数量级,就足以帮助企业做出决策。
而且!我们不是 MBA 出来的、咨询公司范儿的青年才俊,我们不喜欢纸上谈兵纯理论的事。
正常情况下,我们都会拿估算的数据,和已有的真实数据交叉对比。通过互相验证、寻找不同数据的相似性,来快速提高估算数据的准确度。
整理的真实数据可以是经营数据,也可能是市场调研、用户访谈、同行交流的结果。
如果估算的数据、上个月的报表、街头访谈的小姐姐都说不爱喝咖啡,同行的老王上次也说他在咖啡上没赚到钱……那么我们肯定不会在咖啡领域投钱了。
后话
以上是一个小时快速写的短文,数据基于心算。而且我不是数据专家,我的初衷是向我各位客户老板们汇报我的工作方法。
实际操作中,我们并不会像上文那么粗略地估计。比如我们会请实习生采集更多数据,比如我们会去查找比对 Twitter 的历史数据,比如我们会拿初步分析的毛数据,和客户一起快速筛选和细化。
在品牌定位这种实际场景下,基于估算的数据分析可能会持续 1-2 周。估算得到的数据,能让我们的在无法进行定量分析的情况下,得到更多的决策依据。
欢迎大家留言一起交流,或者直接联系我,我们一起来帮您的品牌和产品估算数据。