只要剔除不利的数据,剩下都是想要的结论。
前两天青年节的时候,有份“青年置业报告”刷屏了。报告里有组核心的数据是: 有68.5%的青年,拥有可以支付30%及以上首付的存款。 这组数据翻译成人话有两层意思: 一个是:青年财力雄厚,背房贷大有可为! 另一个是:不拿来买房的存款,不是好存款。 斯基记得青年节的由来,好像是歌颂抗争精神。
(相关资料图)
在青年节去研究年轻人怎么付首付、背房贷,本身是件很滑稽的事情。按照一般的经验,如果听到一个观点太离谱,别急着反驳,可以看看是哪位专家说的。 看到一个调查数据反常识,别急着研究论证,可以先看看是哪个机构发布的。 这样操作,能避免咱们生无谓的气、浪费宝贵的时间。 斯基看了下,发布这份《2023年青年置业报告》的,是大名鼎鼎的58同城、安居客。 这份报告的真实性,肯定像安居客平台上标榜的真实房源一样:
诚实可靠。
如果这是一份编造的数据报告,倒也不值得大伙儿去讨论。 问题是,在题为“青年置业”的报告里,想成为“青年”,首先要满足一系列门槛。 比如参与调查的青年生在1985-2005年,即便你年近四十,当需要统计购房能力时,仍然允许你年轻。 比如青年要工作在一线及部分热门二线城市,三四线的年轻人,扭头就被开除了青年籍。 比如调研的青年学历以本科为主,言下之意,没上过大学凑什么买房的热闹?
以及,参与调研的有八成都是非单身,超三成月收入在1—1.5万,近六成的青年拥有自有住房…… 斯基想问问,哪个学校的哪本书教的这样做统计?哪个条件能代表青年这个群体? 严谨点说,这份报告的结论应该是: 调查显示,68.5%的高学历、高收入、一二线城市青年可付房款首付。
但话又说回来了,咱们又何必跟安居客这样的企业讨论“严谨”呢?从学术角度说,这个调查属于典型的样本谬误,先射箭后画靶,搞选择性统计。 只要剔除不利的数据,剩下都是我想要的结论。形象点说,这份报告就像是老师在班里问:没来的同学,请举手示意。 就像记者在春运的火车上采访大伙: 今年春节回家的车票,大家都买到了吗? 有人关心年轻人怎么背房贷,有人关心大家赚得多不多。 今年初的时候,网上有份薪酬报告讲的是去年四季度的情况,结论说是: 第四季度全国平均招聘薪酬10558元。 其中,北京以13930元招聘月薪居于榜首,上海13832元次之,深圳13086元紧随其后。 这份报告一出来,热搜上就挂了个“你的月薪有过万吗?”的扎心问题。 过去这类炒作“月薪、收入有没有拖后腿?”的报告杂七杂八,大伙看多了也脱敏了,骂一句“野榜”一笑了之。 但发这份报告的是大名鼎鼎的智联招聘,算是打工人找工作最先想到的几个平台之一。
即便这种大平台,发出来的东西也禁不起推敲,整篇统计报告居然找不到样本量,翻来覆去就一句: 基于智联招聘2022年在线招聘数据库的数据监测统计分析。 说人话就是:他自己的数据库,他自己设计的统计规则。智联招聘这类报告,和安居客做的报告都有一个通病:隐藏筛选的漏斗。 在招聘市场上,线上招聘的渗透率才有多少?一个公司想招保洁员,会先在线上筛选一遍简历吗? 即便是线上招聘,智联也绝不是一家独大,几家在线招聘平台打得火热,智联的数据库能反映多大的市场比例? 最关键的是,这份报告里说的是“招聘薪酬”,理论上就是企业在发布招聘广告时开出的空头支票。
眼看着那边企业写着薪酬6-8千,哪知道他真的照着6元—8000元来发薪水。
这么说吧,这样算出来的平均招聘薪酬,就是马云来了,也禁不住这样平均啊。
一个个本来都是讲故事的能手,干什么非要搞数据统计呢?在安居客的招股书上,这个平台的收入主要是向发广告的房产中介收端口费。 智联招聘的营收模式,也依赖企业冲着海量优质的人才简历充值付费,之前还被央视曝出过非法售卖简历的丑闻。 这类信息服务平台,一方面需要广大用户维持流量和人气,一方面也需要企业出钱来为服务买单。 因此,它们是有动机去“制造”一份数据报告的。把焦虑拉满,话题弄得尖锐些,把流量刷上去,热度炒起来。 对小年轻们说:别人都准备好首付了,工资也赚那么高了,你还不来看房子、投简历? 对大公司们说:我这里看房人气爆棚、简历量激增,咱们签的合同年框、充值的月费可不能停。 看着安居客的报告买房子,盯着智联的报告找工作。 大家都有光明的未来! 往好了说,这是篇企业制作的高级广告,还真不能说他一派胡言,毕竟的确能拿出一堆问卷和数据。 但往坏了说,这类掩耳盗铃的调查,既不能反映全面真实的情况,一定程度上也会误导、挑拨社会情绪。 往大了说,老这么干风险其实也不小。 统计学既是科学,也是艺术,更是立场。小数据要听大数据指挥,小账目不能脱离大账目的声调。 有时候你自己觉得数据已经很漂亮了,可万一有人觉得不够呢? 很多时候,用统计数据来炒作舆论、引导大众,本身也是一种信用的消耗。 如果假的次数太多,慢慢也就没人相信数据、敬畏数据了。 因此统计学可能会有方法论的争议,但至少不能被当成利益目标的工具,不能是个任人打扮的小姑娘。 不能披着统计学的外衣,搞弄虚作假的那一套。 设置样本的时候搞点倾向性调查,统计方法上剔除些不利因素,写报告的时候再添油加醋润点色。 一通操作下来,明明前线丢盔弃甲、溃不成军。 报告里也能写成:仓皇追击、胜利转进、昨日大捷、今又大捷。 一句话,战报可能会说谎,战线不会。
(ID:laosijicj)作者:波旁斯基 转载请注明来源及作者 侵权必究
这狗到底仗了谁的势?
别老惦记着吃年轻人豆腐
本文作者可以追加内容哦 !