另开一贴，专门讨论里氏表

keon · 发表于 2009-4-22 17:44:02

恩，至此可以分家了，yincantcook你在这个贴子专门和岚星讨论数学问题吧，免得你们的问答被我和岚星大段大段的引用冲散了。双方请以一问一答的方式盖楼，问题以1,2,3的次序清楚列明。

------------------------------------yincantcook的问题---------------------------------------

数学，我喜欢，俺工科出身，又在社科混过。尔等社科废柴敢跟我讲统计，真是自寻死路。
来，岚星，辩论的事情留给keon，我们在统计上来两手，我只管证明加总的技术问题。

还是误差，就一个问题，你口口声声说李氏表very good,那么，我问你，下面的误差测试了没有
1.受测者（评判）的随机误差：由于环境，时间等影响，就算是同一个评判，他的分数也会在一个范围内浮动，那么，这个浮动值在你的测试里面是一个什么样的范围？

---------------------------------------------------------------------------------------------------

[ 本帖最后由 keon 于 2009-4-22 19:07 编辑 ]

汪一峰 · 发表于 2009-4-23 09:45:55

我本科5年有3年半在统计学专业。我当观众。

litterbincab · 发表于 2009-4-24 00:07:05

围观

岚星 · 发表于 2009-4-24 13:44:46

------------------------------------yincantcook的问题---------------------------------------

数学，我喜欢，俺工科出身，又在社科混过。尔等社科废柴敢跟我讲统计，真是自寻死路。

原帖由 keon 于 2009-4-22 17:44 发表
------------------------------------yincantcook的问题---------------------------------------

数学，我喜欢，俺工科出身，又在社科混过。尔等社科废柴敢跟我讲统计，真是自寻死路。

不过，对yincancook这段不知天高地厚的话，我将每见一次都批一次。

首先，yincancook并不知道，我的学历结构是工学学士、经济学硕士、管理学博士（在读）。所以凭着“俺工科出身，又在社科混过”就想在我面前摆谱，他还没这个资格。

当然，各位看官不必奇怪，yincancook同学习惯于对自己不了解的人和事乱发表意见，这点在那边楼里已经有了N多处明证。我已经习以为常了。

第二，这段话本身就体现了yincancook只能算是“混过社科”。
社会科学研究中影响因素太多，所以对统计实证方法的要求比理工科要高出至少一个数量级！这不是玩笑，曾经看过一个报道，在诺贝尔奖的酒会上，经济学家们讨论起计量统计方法问题来，物理学家和化学家们经常连话都插不上！再去翻翻很多统计学的顶尖杂志，往往都是从社会科学研究问题上展开的。比如西蒙当年拿诺奖的论文，投世界最顶级的统计学杂志，那些评审专家竟然看不懂。最后好像说是当时计量统计领域最牛的学者给了审稿意见：“我也看不懂，不过我验证了几个主要结论，似乎都是对的，所以我觉得应该发表。”

而yincancook连这样的学术常识都不知道，竟然说什么“俺工科出身，尔等社科废柴敢跟我讲统计，真是自寻死路”。这话简直就像说“俺学五子棋出身，尔等围棋废柴敢跟我比‘算路’，真是自寻死路”。对于这种话，我除了“无知且无畏”之外，实在给不出更恰当的评价了……

yincantcook · 发表于 2009-4-24 13:55:09

此番解说，徒显你色历内荏。好好回答问题是正经

一字亦为我师嘛

[ 本帖最后由 yincantcook 于 2009-4-25 13:25 编辑 ]

汪一峰 · 发表于 2009-4-24 19:34:16

原帖由 yincantcook 于 2009-4-24 13:55 发表
此番解说，徒显你色历内茬。好好回答问题是正经

这位杨小彦兄，您才认得几个字，就敢出来显摆啊？

连色厉内荏都不会说，还“色厉内茬”，真是让人笑掉大牙。

j13a · 发表于 2009-4-25 13:15:06

原帖由 汪一峰 于 2009-4-24 19:34 发表

这位杨小彦兄，您才认得几个字，就敢出来显摆啊？

连色厉内荏都不会说，还“色厉内茬”，真是让人笑掉大牙。

j13a · 发表于 2009-4-25 13:15:07

原帖由 汪一峰 于 2009-4-24 19:34 发表

这位杨小彦兄，您才认得几个字，就敢出来显摆啊？

连色厉内荏都不会说，还“色厉内茬”，真是让人笑掉大牙。

智能ABC而已,没有什么好钻牛角尖

现在全国都在等你的大部头论文呢.

寒溪沉沙 · 发表于 2009-4-25 13:23:18

这里开始考证了，我也学过几年统计，但资历肯定是废柴之流，于是只围观而已。

野鸡辩手 · 发表于 2009-4-25 13:28:45

阿猫阿狗的无资历的飞香港市民的野鸡辩手前来参拜

白色巨塔 · 发表于 2009-4-25 13:38:33

当年有个队伍比赛，对方提问，说对方辩友啊，有个男人每天打她老婆三顿，有一天良心发现，说我今天只打你两顿，这算不算这男人在关怀他老婆啊？

此队答曰，当然是！！

然后yincantcook前辈点名称赞此队，论证严谨，资料翔实

所以，6楼你和他较真什么

黑猫花狗 · 发表于 2009-4-25 14:09:43

原帖由 keon 于 2009-4-22 17:44 发表
数学，我喜欢，俺工科出身，又在社科混过。尔等社科废柴敢跟我讲统计，真是自寻死路。

自我感觉真好啊，听口气天下第一啊。

木雁 · 发表于 2009-4-25 22:52:28

都忙着围观了……这个引发战争的帖子的本意也不能置之不理呵。我来插两句嘴吧。

争论的问题的核心问题是是应当采取投票还是评分制度。而反对评分制度的原因，似乎在于不同评委之间的打分有没有可加性。

其实如果我们极端一点看问题，就不难发现投票制也是一种打分。评委只需对“总体评价”一个问题打分。选项只有两阶，0分或满分，投或不投。
那么，如果我们进一步，将两阶化为三阶，其实质发生了飞跃的变化吗？显然没有。如果评委只需对队伍作出“差、中、优”三阶评价，我相信这个分数的可加性依然良好。

而再进一步进而四阶、五阶、六阶……这期间依然不会发生任何质变，但很显然，随着阶数的上升，其尺度对评委来讲越来越难把握，评委之间评分的可加性越来越差。如果是1-100分的评判对于评委来说就基本达到无从把握的程度了。我如果做评委碰到这样的打分表，一向以只打0和100两个分数来表达自己的不满，并借此胁迫其他评委学我————如果你不学我，比赛的胜负我的影响力就超过你。借此把比赛实质化为投票制。

理清了这个关系，我们就无需作什么投票和评分的比较了。投票只是一个最极端的两阶打分表而已。它可加性最好。3阶的可加性很显然也不错，那么如浙大所用的5阶的究竟如何呢？岚星前辈信誓旦旦地保证很好，对此我很怀疑。我觉得我如果当评委的话，如果不接受比较严格的训练，绝对不可能把握4分的“很好”与5分的“非常好”之间的区别。而这必然影响我打分和其他评委之间的可加性，甚至即使让我自己打两次分，结果都有可能不同。

“在这个综合评分过程中，里克特量表保证了“评委可以说出自己为什么这一项打4分，而即不是3分也不是5分”，”这个，我反正是做不到。不知道浙大的评委如何做到的。而如果满分是2分，那么是0分还是1分还是2分我就比较容易把握。如果满分是1分,那就更好了。

而除了评委之间的得分是否可加，评委自己给各个环节的打分可否相加也是一个问题。浙大似乎是用权重的办法处理的。比如陈词＝3；自由对话＝2；攻辩（正攻反守）＝攻辩（反攻正守）＝1；中场小结＝3；自由辩论＝6；回答观众提问＝3；结辩＝3；整体＝10什么的。

我认为，姑且抛开这个权重是否合理，一个问题在于很多环节之间的关系完全不在一个层次上，不可能用权重去表达。就比如浙大的比赛也有最后的“偏题性”的考量，一旦偏题就是直接判胜负而无需和其他进行相加了。但是，可以直接影响胜负的因素还有很多，比如最常见的，如果一方的关键论据是错误的，是否可以直接判负呢？再比如一方证明了对方的核心逻辑中存在诡辩或错误，是否可以直接判负？或许还有其他很多的因素，而相信大部分人都无法接受关键论据错误与其他的表现进行加权决定胜负，而会倾向直接决定胜负。

所以为什么很多评委希望保留最后的决定权，决定在即使一方得分高的情况下，依然判相反的结果呢？就是在于比赛中有许许多多如是否偏题是否使用伪证是否逻辑错误等等可以直接决定比赛胜负的因素，而将这些处理成加权因素显然不合理。所以他们希望保留最后推翻自己打分的结果的权利。如果浙大的赛制能够更加完善，不再仅仅只有“合题性”一个可以直接决定比赛胜负的因素，那么我想至少我个人也就没有什么太多反对打分制的理由了————当然，在此之前，要解决开头提出的尺度问题。

最后，鉴于围观群众都自报家门学过几年统计，那么我也坦陈地告诉诸位，我统计是学过的，可惜是挂了的；补考倒是过了的，可惜一定是老师照顾的，不照顾一定过不去的————如果有人觉得我没有资格发表意见，或者在哪些专业的部分贻笑大方了，敬请指出，谢谢。

汪一峰 · 发表于 2009-4-25 23:26:45

算了算了就坡下驴我也不吵了挺累的拍砖这玩意就头天儿兴奋过了日子就疲惫了大家相安无事罢

岚星 · 发表于 2009-4-26 00:42:57

原帖由 yincantcook 于 2009-4-24 13:55 发表
此番解说，徒显你色历内荏。好好回答问题是正经

不说了，保持微笑～:)

（后面那句，记得上次看到时没有，谢谢先～就不引用了）

岚星 · 发表于 2009-4-26 00:59:05

原帖由木雁于 2009-4-25 22:52 发表
随着阶数的上升，其尺度对评委来讲越来越难把握，评委之间评分的可加性越来越差。
……
理清了这个关系，我们就无需作什么投票和评分的比较了。投票只是一个最极端的两阶打分表而已。它可加性最好。3阶的可加性很显然也不错，那么如浙大所用的5阶的究竟如何呢？……我很怀疑。

木雁你的理解很对。我唯一能说的，社会科学和心理学的学者们早就用科学实证的方法证明了：5-7阶是最能保证“区分度”和“准确性”彼此平衡的（在非常严格的条件下，可以上升到10段甚至20段）。这也是为什么去看所有的社会科学的学术研究，一旦做问卷都是5-7阶。

换句话讲，如果谁证明了5-7阶情况下，受调研人员——一般不可能受过特殊训练——的评分也不具有可加性，那他等于推翻了目前社会科学及至心理学领域一切基于问卷的实证研究。

比如浙大的比赛也有最后的“偏题性”的考量，一旦偏题就是直接判胜负而无需和其他进行相加了。但是，可以直接影响胜负的因素还有很多，比如最常见的，如果一方的关键论据是错误的，是否可以直接判负呢？再比如一方证明了对方的核心逻辑中存在诡辩或错误，是否可以直接判负？或许还有其他很多的因素，而相信大部分人都无法接受关键论据错误与其他的表现进行加权决定胜负，而会倾向直接决定胜负。
……
如果浙大的赛制能够更加完善，不再仅仅只有“合题性”一个可以直接决定比赛胜负的因素，那么我想至少我个人也就没有什么太多反对打分制的理由了

这个……其实评分系统里写得很明白——“关键证据”一旦被定为伪证，同样无条件判负。（而且浙大正在考虑对这种情况给予“全校通报批评”的处分——这是“以不计入档案为限”所能给予的最高处罚。毕竟，“求是园”里“求是杯”，犯这个错误就不是“辩风”而是“学风”问题了。）

至于“核心逻辑错误”，最初也是有的。只是很多辩手和评委当时都觉得还没有能力判断，存在严重的“误伤”隐患，所以才没有放进去。不过从这三年的情况看，明年或许就可以加入了。

木雁 · 发表于 2009-4-26 12:43:33

关于第一个问题，您既然认为以下两种方法都是可选的，
1、加权评分法：
每个评委对各环节分项打分，按环节权重，加权后得到该评委给双方各自的总分。
各评委给双方的得分分别相加，总分高的那一方获胜。

2、评分定票法：
每个评委对各环节分项打分，按环节权重，加权后得到该评委给双方各自的总分。（这一步和“加权评分法”一样）
各评委“严格”按照自己给双方打的分数，把自己的那一票投给得分高的一方。总得票数高的一方获胜。

那么显然第二种方法更好的拉平了评委之间的权重，那么我们还有什么就第一个方法进行讨论的理由呢？它再好，可加性也必然远远不及第二种啊。而第二种方法，看上去至少也没什么太大的缺憾吧。

关于第二个问题，我只是略微浏览了下浙大的评分系统————没注意到它对于关键证据的规定，不好意思。但我想表明的是，场上能直接决定比赛胜负的因素或许有很多，比如除了这些提及的，若一方在场上进行了恶毒的人身攻击，肯定也会判负——但这事不经常发生，一般也不会有评分系统特意提及。那么我们是否可以在评分系统的最后提一个附加项，给予评委一个保留自主依据自己的理由更改比赛结局的权力呢————即您所提及的：

3、参考评分的投票法：
每个评委对各环节分项打分，按环节权重，加权后得到该评委给双方各自的总分。（这一步和“加权评分法”一样）
各评委参考自己的评分结果之后，“自主判定”将票投给哪一方（换言之，自己给正方打的分高，但最后把票投给反方，这是被允许的）。总得票数高的一方获胜。

当然我们希望随着评分表的进一步完善，有一天能让这个东西形同虚设，但即使那样，我觉得从有备无患的角度看，这也是有必要保留的。当然，为了防止滥用，必要的制约比如要求作出这样判决的评委阐述他的理由什么的也相应要有。

之所以如此设计，其实质就在于是否承认温朗东的帖子里所说“每个环节是不等值的，「一个质询把对手的架构拆爆」是可能存在的。 ”承认这点，就是承认某些东西可以凌驾于表现的打分之上。而这些东西如果都能和合题性等等一样被清晰写在评分表上当然好。但是，即拿“一个质询把对手的架构拆爆”为例子，比较极端一点说，如果真的发生类似状况，某队质询把对方架构拆了，但是在其他环节都严格保持沉默——一言不发——那么其质询环节满分，其他环节0分——那么他们输了？可实际发生在场上的是他们拆了对方，对方没有拆掉它们————这显然不合理啊。而这样的情况，似乎又很难比较清晰地用评分体系加以规定和诠释。所以用一个在评分体系之外的最终决定权给评委，是一个解决途径。我这样看，您觉得呢？

lion · 发表于 2012-8-16 22:07:58

支持辩论

lion · 发表于 2013-3-21 09:33:50

支持辩论

		自动登录	找回密码
密码			注册

另开一贴，专门讨论里氏表

评分

浏览过的版块