只要剔除不利的数据,剩下都是想要的结论。
(资料图)
前两天青年节的时候,有份“青年置业报告”刷屏了。报告里有组核心的数据是:
有68.5%的青年,拥有可以支付30%及以上首付的存款。
这组数据翻译成人话有两层意思:
一个是:青年财力雄厚,背房贷大有可为!
另一个是:不拿来买房的存款,不是好存款。
斯基记得青年节的由来,好像是歌颂抗争精神。
在青年节去研究年轻人怎么付首付、背房贷,本身是件很滑稽的事情。
按照一般的经验,如果听到一个观点太离谱,别急着反驳,可以看看是哪位专家说的。
看到一个调查数据反常识,别急着研究论证,可以先看看是哪个机构发布的。
这样操作,能避免咱们生无谓的气、浪费宝贵的时间。
斯基看了下,发布这份《2023年青年置业报告》的,是大名鼎鼎的58同城、安居客。
这份报告的真实性,肯定像安居客平台上标榜的真实房源一样:
诚实可靠。
如果这是一份编造的数据报告,倒也不值得大伙儿去讨论。
问题是,在题为“青年置业”的报告里,想成为“青年”,首先要满足一系列门槛。
比如参与调查的青年生在1985-2005年,即便你年近四十,当需要统计购房能力时,仍然允许你年轻。
比如青年要工作在一线及部分热门二线城市,三四线的年轻人,扭头就被开除了青年籍。
比如调研的青年学历以本科为主,言下之意,没上过大学凑什么买房的热闹?
以及,参与调研的有八成都是非单身,超三成月收入在1—1.5万,近六成的青年拥有自有住房……
斯基想问问,哪个学校的哪本书教的这样做统计?哪个条件能代表青年这个群体?
严谨点说,这份报告的结论应该是:
调查显示,68.5%的高学历、高收入、一二线城市青年可付房款首付。
但话又说回来了,咱们又何必跟安居客这样的企业讨论“严谨”呢?
从学术角度说,这个调查属于典型的样本谬误,先射箭后画靶,搞选择性统计。
只要剔除不利的数据,剩下都是我想要的结论。
形象点说,这份报告就像是老师在班里问:没来的同学,请举手示意。
就像记者在春运的火车上采访大伙:
今年春节回家的车票,大家都买到了吗?
有人关心年轻人怎么背房贷,有人关心大家赚得多不多。
今年初的时候,网上有份薪酬报告讲的是去年四季度的情况,结论说是:
第四季度全国平均招聘薪酬10558元。
其中,北京以13930元招聘月薪居于榜首,上海13832元次之,深圳13086元紧随其后。
这份报告一出来,热搜上就挂了个“你的月薪有过万吗?”的扎心问题。
过去这类炒作“月薪、收入有没有拖后腿?”的报告杂七杂八,大伙看多了也脱敏了,骂一句“野榜”一笑了之。
但发这份报告的是大名鼎鼎的智联招聘,算是打工人找工作最先想到的几个平台之一。
即便这种大平台,发出来的东西也禁不起推敲,整篇统计报告居然找不到样本量,翻来覆去就一句:
基于智联招聘2022年在线招聘数据库的数据监测统计分析。
说人话就是:他自己的数据库,他自己设计的统计规则。
智联招聘这类报告,和安居客做的报告都有一个通病:隐藏筛选的漏斗。
在招聘市场上,线上招聘的渗透率才有多少?一个公司想招保洁员,会先在线上筛选一遍简历吗?
即便是线上招聘,智联也绝不是一家独大,几家在线招聘平台打得火热,智联的数据库能反映多大的市场比例?
最关键的是,这份报告里说的是“招聘薪酬”,理论上就是企业在发布招聘广告时开出的空头支票。
眼看着那边企业写着薪酬6-8千,哪知道他真的照着6元—8000元来发薪水。
这么说吧,这样算出来的平均招聘薪酬,就是马云来了,也禁不住这样平均啊。
一个个本来都是讲故事的能手,干什么非要搞数据统计呢?
在安居客的招股书上,这个平台的收入主要是向发广告的房产中介收端口费。
智联招聘的营收模式,也依赖企业冲着海量优质的人才简历充值付费,之前还被央视曝出过非法售卖简历的丑闻。
这类信息服务平台,一方面需要广大用户维持流量和人气,一方面也需要企业出钱来为服务买单。
因此,它们是有动机去“制造”一份数据报告的。
把焦虑拉满,话题弄得尖锐些,把流量刷上去,热度炒起来。
对小年轻们说:别人都准备好首付了,工资也赚那么高了,你还不来看房子、投简历?
对大公司们说:我这里看房人气爆棚、简历量激增,咱们签的合同年框、充值的月费可不能停。
看着安居客的报告买房子,盯着智联的报告找工作。
大家都有光明的未来!
往好了说,这是篇企业制作的高级广告,还真不能说他一派胡言,毕竟的确能拿出一堆问卷和数据。
但往坏了说,这类掩耳盗铃的调查,既不能反映全面真实的情况,一定程度上也会误导、挑拨社会情绪。
往大了说,老这么干风险其实也不小。
统计学既是科学,也是艺术,更是立场。
小数据要听大数据指挥,小账目不能脱离大账目的声调。
有时候你自己觉得数据已经很漂亮了,可万一有人觉得不够呢?
很多时候,用统计数据来炒作舆论、引导大众,本身也是一种信用的消耗。
如果假的次数太多,慢慢也就没人相信数据、敬畏数据了。
因此统计学可能会有方法论的争议,但至少不能被当成利益目标的工具,不能是个任人打扮的小姑娘。
不能披着统计学的外衣,搞弄虚作假的那一套。
设置样本的时候搞点倾向性调查,统计方法上剔除些不利因素,写报告的时候再添油加醋润点色。
一通操作下来,明明前线丢盔弃甲、溃不成军。
报告里也能写成:仓皇追击、胜利转进、昨日大捷、今又大捷。
一句话,战报可能会说谎,战线不会。
来源:老斯基财经(ID:laosijicj) 作者:波旁斯基