晋江文学城
下一章 上一章  目录  设置

13、第十三章 内生性 内生性,就 ...


  •   内生性,就是我们是彼此的因果。

      陆明远发现了一个问题。
      他所有的分析,都假设出差天数是一个外生变量——也就是说,出差是工作决定的,和他无关,和她无关,是外部强加给他们的。
      但这个假设可能不成立。
      也许,他出差多,是因为家里有什么让他想离开?也许,他出差少,是因为家里有什么让他想留下?也许,出差天数本身,就是他们婚姻的函数。
      这叫内生性。内生性是指解释变量和被解释变量之间存在双向因果关系。他出差影响她的情绪,她的情绪也可能影响他出差。他不开心的时候想离开,她不开的时候他想逃避。出差,可能不是原因,而是结果。
      他需要检验内生性。
      他开始想一个问题:他为什么出差?
      表面原因:工作。他是统计局的,需要去各地调研、开会、检查。这是客观要求。
      但深层原因呢?同样的工作,有的人出差多,有的人出差少。他为什么是出差多的那个?
      因为他想出差。
      他想出差的理由:出差可以逃避日常的琐碎,逃避家里的沉闷,逃避和她无话可说的尴尬。出差的时候,他是自由的,不用面对她的眼神,不用回答“什么时候回来”的问题,不用想那些他不想想的事。
      他翻出自己那些年的日记——他也写日记,只是不常写。出差的时候偶尔写几笔,记录一下行程和心情。
      1995年3月:“又要出差了。这次去广州。家里气氛不太好,出去散散心也好。”
      1998年7月:“出差,去昆明。走的时候她在睡觉,没告别。这样挺好,不用说话。”
      2002年9月:“出差,去成都。最近在家里总觉得憋得慌,出来透透气。”
      2005年11月:“又要出差了。这次时间长,半个月。她没说什么,我也没说什么。”
      2008年5月:“出差。她父亲刚走,我应该在家陪她。但在家也不知道说什么。出来吧。”
      2012年8月:“出差。家里越来越安静了。她在的时候也安静。出来反而轻松点。”
      2015年4月:“出差。这次走之前,她看了我一眼,想说什么,没说。我也没说。”
      2019年10月:“出差。这一年出了太多差,118天了。但不想停。停下来就要面对那些我不想面对的东西。”
      这些日记里,有一个共同的潜台词:他想离开。
      不是因为工作,是因为家里。是因为和她在一起的时候,他不知道该说什么,不知道该做什么,不知道该用什么样的表情面对她。出差,成了他的避难所。
      所以,出差天数,不是外生的。它是内生的。是他们婚姻的函数。
      陆明远做了一个统计:把他出差的心情和她的情感指数做相关。
      他把他日记里关于“想出差”“不想回家”之类的表述,量化成一个“逃避指数”。1到5分,1分是“不想出差”,5分是“特别想出差”。
      1995年3月:想出差,4分。当时她的情感指数?他查了一下,1995年她情感指数5分(他之前估的),不算太低。
      1998年7月:想出差,5分。她的情感指数4分。
      2002年9月:想出差,4分。她的情感指数3分。
      2005年11月:想出差,3分。她的情感指数3分。
      2008年5月:想出差,5分。她的情感指数3分。
      2012年8月:想出差,4分。她的情感指数3分。
      2015年4月:想出差,4分。她的情感指数3分。
      2019年10月:想出差,5分。她的情感指数2分。
      把“逃避指数”和她的情感指数做相关:
      逃避指数均值=4.25,情感指数均值=3.25
      协方差= -0.87
      相关系数= -0.68
      -0.68,中等到强的负相关。她越不开心,他越想出差。他想出差的时候,往往是她不开心的时候。
      所以,这是一个双向关系:
      他出差 →她不开心
      她不开心 →他想出差 →他出差更多 →她更不开心
      这是一个恶性循环的反馈回路。
      陆明远画了一个因果图:
      他不开心 →他想出差 →他出差 →她更不开心 →他更想出差 →他更出差 →她更更不开心 → ……
      这个回路,循环了三十一年。
      他想,如果把这个回路画成一条曲线,应该是一条螺旋下降的线。每循环一次,他们的关系就恶化一点。他出差的次数增加一点,她的情感指数下降一点。然后他再增加一点,她再下降一点。
      直到2019年,她降到2分,他升到118天。最低点和最高点相遇。
      然后2020年,疫情打断了他出差,他被迫在家。她确诊,他被迫面对。那个恶性循环被打断了。
      但太晚了。
      为了检验内生性,陆明远需要找到一个工具变量。工具变量是那些影响他出差、但不直接影响她情感的因素。
      他想到了几个可能的工具变量:
      1.国家统计局的年度调研计划。每年计划去哪些省份、多少次,这是上面定的,和他无关,和她无关。
      2.交通便利程度。高铁开通之前,去某些地方要坐飞机,时间长;高铁开通之后,可以当天往返,时间短。这些变化是外部的。
      3.经济形势。经济好的时候,调研多;经济差的时候,调研少。这也是外部的。
      4.天气。台风、大雪、洪水,会影响出差。这也是外部的。
      他把这些数据找出来。
      统计局年度计划:他找老同事要了一份2007-2021年城调司的年度调研计划,每年计划出差的次数。
      交通便利程度:他查了高铁开通年份。2008年第一条高铁开通,之后逐年增加。他用“高铁通达城市数”作为指标。
      经济形势:他用GDP增速。
      天气:他查了每年影响出差的恶劣天气天数——台风登陆次数、大雪封路天数等。
      然后他做两阶段最小二乘回归。
      第一阶段:出差天数 = a + b1×调研计划 + b2×高铁通达 + b3×GDP增速 + b4×恶劣天气 + ε
      第二阶段:情感指数 = c + d×出差天数(预测值) + e×健康 + f×年份 + μ
      如果第一阶段的工具变量是有效的,那么第二阶段的d就是出差天数对情感指数的“干净”影响,剔除了内生性偏误。
      结果出来了。
      第一阶段:
      调研计划系数 = 0.78 (p=0.001)
      高铁通达系数 = -0.32 (p=0.03)
      GDP增速系数 = 0.24 (p=0.12)
      恶劣天气系数 = -0.15 (p=0.08)
      R? = 0.58
      调研计划越多,他出差越多。高铁越通达,他出差越少(因为可以当天往返,不用过夜)。GDP增速影响不显著。恶劣天气影响边缘显著。
      第二阶段:
      出差天数(预测值)系数 = -0.058 (p=0.002)
      健康系数 = 2.01 (p=0.04)
      年份系数 = -0.08 (p=0.09)
      R? = 0.67
      出差天数的系数是-0.058,和他之前简单回归的-0.062差不多。说明内生性偏误不大。即使剔除了双向因果的影响,出差仍然显著地降低她的情感指数。
      但有一个细微的差别:系数从-0.062变成-0.058,变小了一点。说明之前的高估了一点点——因为内生性的存在,她不开心的部分原因,被错误地归到了出差上。实际上,她不开心的原因里,有一部分是让他想出差的原因。
      但0.004的差别,很小。不足以改变结论。
      陆明远又做了一个检验:用他的“逃避指数”作为内生性的代理变量。
      他把逃避指数放进第一阶段。
      第一阶段:出差天数 = a + b1×调研计划 + b2×高铁通达 + b3×逃避指数 + ε
      结果:
      调研计划系数 = 0.71 (p=0.002)
      高铁通达系数 = -0.28 (p=0.04)
      逃避指数系数 = 0.43 (p=0.01)
      R? = 0.67
      逃避指数显著。他想出差的时候,出差天数就多。这印证了内生性的存在——出差不只是工作,也是他的选择。
      第二阶段用预测的出差天数回归:
      出差天数(预测)系数 = -0.055 (p=0.003)
      R? = 0.69
      还是差不多。
      所以结论是:内生性存在,但影响不大。出差天数的负向效应,是稳健的。
      陆明远又做了另一个方向的检验:她的情感指数是否影响他的出差决策。
      这需要用一个联立方程模型。
      方程1:情感指数 = a1 + b1×出差天数 + c1×健康 + ε1
      方程2:出差天数 = a2 + b2×情感指数 + c2×调研计划 + d2×高铁通达 + ε2
      用两阶段最小二乘法估计。
      结果:
      方程1:出差系数 = -0.059 (p=0.002)
      方程2:情感指数系数 = -2.34 (p=0.04)
      两个方程都显著。
      方程2的系数-2.34意味着,情感指数每下降1分,他的出差天数增加2.34天。她不开心,他就想走。她想他留,他偏要走。
      这个循环,在数据里得到了证实。
      陆明远看着这个结果,想起了一个词:互为因果。
      他和她,互为因果。
      他出差,她不开心。她不开心,他更想出差。他更出差,她更不开心。循环往复,直到无法挽回。
      这个循环是什么时候开始的?
      他想,可能是1994年。那一年他们开始吵架。吵完,他出差。出差回来,还吵。再出差,再回来,再吵。
      也可能是1998年。那一年他们开始不说话。不说话,他出差。出差回来,还不说话。再出差,再回来,再不说。
      也可能是2008年。那一年她父亲去世,他没陪她。她不开心,他逃避,出差。出差回来,她更不开心,他更逃避。
      没有明确的起点。只有无数个循环,一圈一圈,把他们的感情磨薄。
      陆明远画了一个反馈回路的图。
      起点:他出差。
      →她不开心。
      →他觉得家里气氛不好,想逃避。
      →他更想出差。
      →他出差更多。
      →她更不开心。
      →他更想逃避。
      →他出差更多更多。
      →她更更不开心。
      → ……
      这个回路,可以用一个差分方程来描述:
      E_t = α - β× T_t + γ× H_t
      T_t = δ - θ× E_{t-1} + φ× X_t
      E是情感指数,T是出差天数,H是健康,X是外部因素。
      代入数据,可以模拟出他们三十一年的轨迹。
      他试着模拟一下。
      初始值:1990年,T=30(估),E=9。
      然后迭代。
      1991年:T=40,E=8.5
      1992年:T=60,E=7.8
      1993年:T=80,E=6.5
      1994年:T=90,E=6.0
      1995年:T=95,E=5.5
      1996年:T=95,E=5.5
      1997年:T=100,E=5.0
      1998年:T=105,E=4.5
      1999年:T=100,E=5.0
      2000年:T=90,E=5.8
      2001年:T=95,E=5.3
      2002年:T=100,E=4.8
      2003年:T=30,E=7.0(非典打断)
      2004年:T=90,E=5.8
      2005年:T=100,E=4.8
      2006年:T=105,E=4.3
      2007年:T=87,E=4.0
      2008年:T=92,E=3.0(父亲去世)
      2009年:T=85,E=3.0
      2010年:T=88,E=4.0
      2011年:T=95,E=3.0
      2012年:T=102,E=3.0
      2013年:T=98,E=4.0
      2014年:T=105,E=4.0
      2015年:T=110,E=3.0
      2016年:T=108,E=3.0
      2017年:T=112,E=3.0
      2018年:T=115,E=3.0
      2019年:T=118,E=2.0
      2020年:T=43,E=7.0(疫情+确诊)
      2021年:T=12,E=8.0
      这个模拟,和真实数据高度吻合。
      循环的规律:每循环一次,E下降一点,T上升一点。直到某个外力打断(非典、疫情),然后短暂恢复,然后继续循环。
      这个外力,就是命。
      陆明远想起一个概念:因果推断。
      在统计学里,要推断因果关系,需要满足三个条件:相关、时序、排除其他解释。
      他和她的数据,满足相关:出差和情感,高度相关。满足时序:出差在前,情感在后(滞后期3天分析证明了)。
      但排除其他解释?很难。因为存在内生性。
      内生性意味着,因果关系可能是反的:她的情感影响他的出差,而不是他的出差影响她的情感。
      但他的工具变量分析表明,即使剔除了反向因果,出差的影响仍然存在。所以,因果关系是双向的。
      他影响她,她也影响他。
      他们是彼此的因果。
      陆明远想到一个更深的问题:如果他们是彼此的因果,那最初的因是什么?
      是什么让他开始想出差?是什么让她开始不开心?
      他翻出最早的日记。1990年,他们刚结婚的时候,他出差少,她开心。1991年,他开始出差多一点,她开始不开心一点。1992年,他出差更多,她更不开心。
      但1991年他为什么开始出差多一点?是工作需要,还是家里有什么让他想离开?
      他回忆1991年。那一年,他们有没有什么矛盾?好像没有。那一年,她有没有什么不开心?好像也没有。那一年,就是正常的一年。
      所以,最初的因,可能就是工作。工作需要他出差,他就去了。去了之后,她开始不开心。她不开心,他开始想逃避。他想逃避,就更想出差。然后循环开始。
      工作,是外生的冲击。是那个最初推动他们的力量。
      但如果没有这个冲击,他们会不会一直幸福下去?
      他不知道。
      陆明远又想到一个问题:如果他不出差,他们会不会有别的矛盾?
      也许会有。也许他会觉得闷,会觉得无聊,会觉得和她在一起没话说。也许他不出差,他们也会吵架,也会冷战,也会不说话。
      出差,只是一个出口。一个让他可以逃避的出口。
      如果没有这个出口,他可能会用别的方式逃避:喝酒、打牌、加班、玩手机。方式不同,本质一样。
      所以,内生性的本质,不是出差。是他想逃避。
      他想逃避,所以出差。出差让她不开心,所以她更让他想逃避。循环。
      他想逃避的原因是什么?
      是因为他不知道怎么面对她。不知道怎么和她说话,不知道怎么让她开心,不知道怎么经营他们的婚姻。
      他不会。也没人教他。
      所以他就逃了。
      陆明远翻出自己那些年的日记,重新看一遍。这一次,不是看他想出差的理由,而是看他不想面对的东西。
      1995年3月:“家里气氛不太好。”——什么气氛?沉默的气氛。她不说话,他也不说。他不知道该说什么。
      1998年7月:“走的时候她在睡觉,没告别。这样挺好,不用说话。”——不用说话,真好。说话太累了,不知道说什么,说什么都错。
      2002年9月:“最近在家里总觉得憋得慌。”——憋得慌,是因为她总用一种眼神看他。那种眼神,他说不清楚,但看了就想躲。
      2005年11月:“她没说什么,我也没说什么。”——什么都没说,但什么都说了。那些沉默里,有失望,有疲惫,有放弃。
      2008年5月:“在家也不知道说什么。”——她父亲刚走,他应该说点什么。但他说不出来。他怕说错,怕她哭,怕自己不知道怎么安慰。
      2012年8月:“家里越来越安静了。她在的时候也安静。”——安静得让人发慌。两个人都不说话,只能听见钟表的声音。
      2015年4月:“她看了我一眼,想说什么,没说。我也没说。”——那个眼神,他记得。想说什么,但没说。是怕说了也没用,还是说了会更糟?
      2019年10月:“不想停下来。停下来就要面对那些我不想面对的东西。”——那些东西是什么?是她的眼睛,是她的沉默,是她生病了却不告诉他的事实,是他自己不知道该怎么办的无力。
      他想逃避的,不是她。是他自己。是他自己面对她时的无能。
      那天晚上,陆明远做了一个梦。
      梦里他站在一个镜子前,镜子里是他自己。但他看到的不是自己,是她的眼睛。那双眼睛看着他,不说话,就那么看着。
      他想躲开,但躲不开。那双眼睛一直看着他。
      他说:“你想说什么?”
      那双眼睛不说话。
      他说:“我知道我错了。”
      那双眼睛还是不说话。
      他说:“我错了。我不该逃。我应该留下来,应该和你说话,应该陪着你。”
      那双眼睛眨了眨,然后慢慢闭上了。
      他醒了。
      凌晨四点,窗外还是黑的。他躺在床上,心跳得很快。
      那双眼睛,是她的眼睛。是那些年她看他的眼睛。
      那些眼神里,有期待,有失望,有疲惫,有放弃。但他都没看懂。他只觉得憋得慌,想逃。
      现在他看懂了。
      但太晚了。
      陆明远起床,走到书桌前。他打开那个文件袋,写到:
      “林墨:
      我终于知道什么是内生性了。内生性,就是我们是彼此的因果。
      我出差,你不开心。你不开心,我更想出差。我更多出差,你更不开心。这个循环,转了三十一年。
      最初的因,是工作。工作需要我出差,我就去了。但后来的因,是我自己。我想逃,所以出差。我逃的,不是你,是我自己面对你时的无能。
      我不知道该怎么和你说话。不知道该怎么让你开心。不知道该怎么经营我们的婚姻。所以我就逃了。
      逃到外地,逃到会议室,逃到那些不用面对你的地方。
      逃的时候,我以为我自由了。但每次回来,看到你的眼睛,我就知道,我逃不掉。
      你的眼睛一直看着我。看了三十一年。
      我没看懂。现在看懂了。
      那双眼睛里,有1990年的笑,1994年的泪,2003年的梦,2007年的孤独,2008年的痛,2013年的苦中带甜,2019年的绝望,2020年的相依,2021年的不舍。
      还有那些年,你什么都没说,但什么都说了的眼神。
      对不起,让你用眼睛说了三十一年。
      从今以后,我会看。看你的眼睛,看那些数据,看我们三十一年的因果。
      然后,不再逃。”
      写完之后,他把信折好,放回文件袋。他想,天亮之后,他要去做一件事:去她墓前,把这些信烧给她。
      但不是现在,因为还没有完全“看完”那三十几页的数据。

  • 昵称:
  • 评分: 2分|鲜花一捧 1分|一朵小花 0分|交流灌水 0分|别字捉虫 -1分|一块小砖 -2分|砖头一堆
  • 内容:
  •             注:1.评论时输入br/即可换行分段。
  •                 2.发布负分评论消耗的月石并不会给作者。
  •             查看评论规则>>