吸烟致癌? 2009-07-08 22:30 | (分类:默认分类)
转一篇过时的文章
--------------------------------------------------------
吸烟致癌?
by 朱家祥
如果这个叙述为真, 其中的因果关系不言可喻: 吸烟是因, 肺癌是果. 要检定这个因果关系, 定义被解释变量为Y=0 或 1 (Y=1, 代表有肺癌; Y=0, 无肺癌). 解释变量为X1, X2,…其中X1是每日吸烟的数量(单位, 支/天). 想法很简单: 用横剖面数据来估计二元回归如Logit 或Probit, 然后检定X1系数的显着性. 如果显着, 我们不但可以确认此因果关系, 还可以计算, 例如, 每日吸烟量为10支的人(X1=10), 会比完全不吸烟的人(X1=0)提高了多少得肺癌的机率.
二个重点:
(1)
如果除了X1之外的其他变量, X2, X3,…(其他可影响得肺癌的因子)没有选好, X1系数的估计将产生偏误(inconsistency), 于是显着性检验变得毫无意义, 因果关系将受到扭曲.
(2)
横剖面数据必须要避免取样的偏误(sample selection bias). 样本一定要包含有肺癌及无肺癌这二类的观察值.
在这二个问题上, 哎…多少人犯了错误!! 在官方与非官方讨伐吸烟的声明中, 我们看到的全是一面倒的言论. 血淋淋吸烟有害的数据根本就是统计的谎言.但是一般人没有统计知识, 任由媒体操弄洗脑. 就算没有统计知识, 运用常识推断, 也不至于对媒体的报道, 毫不犹豫的照单全收. 我不是鼓吹吸烟无害, 只是感慨媒体的强大洗脑能力. 类似的问题, 二氧化碳导致温室效应的说法也是统计的谎言, 一般人也被洗脑洗的没脑了. 别弄错了, 我也是赞成环保的. 但是始终没看到合理的统计证据. 这些把温室效应当口号的人居然还可以预测200年后地球的气温会上升若干度!! 你相信有人可以预测如此遥远未来的事? 你相信只用二氧化碳排放量就可以预测200年后地球的气温??我是根本不相信的. 不然, 把预测模型端上来辩论呀! 把预测标准误也公布嘛…我非常怀疑他们有预测的标准误.
吸烟与肺癌的关联(Association, or correlation)早在1940年代就观察到不少死于肺癌的人, 他们的肺都是黑黑的. 再一追究, 发现这些人都有吸烟. 于是吸烟与肺癌的相关性就产生了. 但是从相关性到因果性, 基本统计学告诉我们, 这之间是有极大的距离. 例如, 假设数据又显示, 死于肺癌的人大都居住在城市. 请问城市是否为肺癌的因?? 口才好的会说, 城市不是因, 城市的空气污染才是因! 是吗? 我也可以想象另一个原因, 住在城市的压力大,生活步调比较紧张, 所以致癌. 说真的, 我可以有一大堆想当然耳的原因. 这些都可以和肺癌有相关性, 但却不一定有因果性. 请问: 一个住在城市的吸烟者死于肺癌, 究竟何者才是因? 你要如何解释一个住在乡下的吸烟者没有肺癌? 这些关于因果性的问题, 仅靠相关性(不管它多么显著)是无法回答的. 关键是: 如果要探讨吸烟与肺癌的因果关系, 其他X2,X3,...的变量若没控制好, 终究是徒劳无功的. 还有, 别忘了
“取样的偏误”, 只检视死于肺癌的人的样本能有说服力?
美国官方, US National Institute of Health的 National Cancer Institute (http://www.cancer.gov/cancertopics/factsheet/Tabacco/cancer)在首页上就看的到:
"Cigarette smoking causes 87% of lung cancer death."
这就是误导的统计数字! 计算方法很简单.就从死于肺癌的人计算他们之中有吸烟的比例. 这种数据也拿出来忽弄人?? 我干脆也说空气污染造成了100%肺癌死亡. 于是要活命的全搬去乡下吧! 因果性是要有理论的. 可是,吸烟导致肺癌的过程仍然没有医学根据(有谁知道更新的医学发现,还请告知). 据我所知, 没有人能解释吸烟是如何导致肺癌. 假设, 有一种致癌因子X会因为吸烟而更活跃, 请问, 肺癌的因是致癌因子X, 还是吸烟? 答案当然是致癌因子X。可是当致癌因子X没发现之前,吸烟就会被误认为是因。医学上若不把肺癌搞清楚, 仅用统计数据分析来支持吸烟会致癌是有很大的困难度的. 如果在
“所有”吸烟人口中有87%的人得了肺癌, 不需要太多的统计分析, 我也会很认真地去考虑因果关系存在. 但是就美国的数据来看,在所有吸烟人口中大约有6%的人得了肺癌. 另外有94%没有耶!! 就从这个数据来看, 你认为吸烟与肺癌因果关系有多强?? 在这6%的人,他们的饮食,居住环境,运动习惯. . .有多少异同?谁可够勇敢地立下结论说:他们全是因为吸烟导致肺癌?同样地, 纵然死于肺癌的人全住在城市, 我们也得看看“所有”的城市人口有多少比例是死于肺癌. 有思考的人都会明白这个简单的道理吧!
吸烟致癌的统计分析大致上比较了二种样本: 吸烟人样本和不吸烟人样本(controlled sample). 事实上, controlled sample根本没control好. 也就是说, X2,X3…等其他因子没控制好. 这样的比较分析, statistically unsound. 还请高人提供这方面有严谨的统计分析的期刊论文参考. 其他有“取样的偏误”的分析, 根本不值一看. 用这二个重点(其他致癌因子的控制,与取样的偏误)来批判, 我还未看到可接受的统计分析.
我写这些, 并没有接受烟草公司的赞助. 我赞成戒烟(不是因为致不致癌,而是吸烟会上瘾), 也赞成环保(我讨厌脏乱)。但是, 我看不慣媒体以及卫道人士用粗造的统计数据来洗大家的脑. 算是職業病吧!
后记 -May 2nd
吸烟致不致癌? 我不知道. 因为我只是从统计学的角度来看这个问题, 只是 “一个” 角度而已. 仅由一个角度是不好断言吸烟致不致癌的. 我很清楚以偏槪全的危险. 我想说的只是: 现有的统计证据不足以支撑吸烟致癌的主张. “不足以支撑” 和
“反对” 是有很大的距离的.我完全没有误导吸烟无害或鼓励吸烟的意思.
有个评论说的不错: “吸不吸烟是个人价值取向问题,媒体的舆论是为了引导健康的生活方式.” 或许我该说: 吸烟致癌是媒体善意的统计谎言吧. 然而, 媒体在其他很多问题上脱不了misinform的责任,
温室效应/全球暖化就是另一个例子.
---------------------------------------

朱家祥
经济学教授。美国加州大学(圣地亚哥分校)经济学博士(1990年)。主要研究与教学领域:计量经济学理论、时间序列分析、财务金融实证分析。 |