论战：为什么投票比评分好

keon · 发表于 2009-4-16 16:30:00

假设有两组高校，一组的校赛统一采用评分法（当然，评分表是统一的，并经过严格设计），另一组统一采用投票法。然后看比赛后观众和辩手的反应。将这两者做一个统计相关性分析。

我认为会有很大误差，评判评决的辩手、观众接受度受辩题（往往是不公平的题目）、地域、观众人数（只有辩手观战、还是有其他无辜第三者观战）。其实辩手的抗辩应该直接被忽略的，有明显的利益冲突嘛，我很怀疑，抛开辩手们教练们嚷嚷的因素，一场比赛无辜的观众对评委的评决都感到愤怒的会有多少。

岚星 · 发表于 2009-4-16 16:31:14

原帖由 keon 于 2009-4-16 15:23 发表

其实我能理解你的苦心，但是确实也只能表示理解

你要的是热热闹闹、一团和气、众人皆服的辩论赛，而我要的只是辩论赛而已

是因为你认为你们学校、甚至乎国内的辩论圈都有许多不理解不和谐的情况

而这些种种情况对身处香港的我基本没有遇到过

……
我们最近争论比较多的是评判资格的问题，尤其是是否应该让前辩手担任港台赛评委的问题，而不是怎么评分的问题

或许你认为我理想化，但事实是理想化的规则在我们这里运行10年情况良好，暂时看不到有改动的需要

我之前就说过，香港或者台湾没有这些很正常，政策型辩论的思维在你们那里已经很成熟，所以如果还没有出现大的问题，维持原样我并不反对。:)

只是我要补充一句：你和我要的一样，不仅仅是辩论赛，而是一个“能够健康发展”的辩论赛。

yincantcook · 发表于 2009-4-16 16:34:28

而我反对yincancook的核心不在这里，而是在“如果自己在评分表上给A打了高分，评委是否仍然有权把票投给B”。（可以参考他在41楼的发言。）

你这是在刻意曲解，我说的可是，判定胜负，根据胜负打分。
这种表面文章，我一定会做足的，怎么会出现分数跟胜负矛盾的情况

岚星 · 发表于 2009-4-16 16:39:16

原帖由 keon 于 2009-4-16 15:50 发表
我觉得几百分的小分，结果1分之差的输赢
往往比3:2的输赢更让人觉得有黑幕和无法接受
典型如03年中大对世新

名校赛的评分表问题太大了……如果你有兴趣，可以试着打一两次我们的评分表看看。我并不是说这会改变你的观点，只是相信这会使你认识到评分表不一定都会那么烂。

PS：浙大今年刚刚结束的一场比赛，3194.3比3192.5，正方胜（如果投票，3：2，结果不变）。正方实际只赢了陈词、攻辩、结辩，输了自由人、小结、自由辩、回答观众提问和整体评价。

但比赛后不管是观众还是辩手，都对结果表示完全接受。而评委也很心安——因为打的分数为什么高、为什么低、为什么高1分而不是2分等等，都能轻松的回答。:)

keon · 发表于 2009-4-16 16:42:38

哦……可能你没看清我那个例子……

是5个评委，分别给A、B两家打分。而不是裁判A、B……

我没理解错，我说的A B是指头两个给5分的评判，代号用得有歧义不好意思~

我看过你的分表，很典型的里克特量表，我的感觉是项目太多，太分散我的注意力，其实我们8角杯的分表我都有点跟不上节奏了，而那张分表的项目估计只有你这里的3/5。

且分阶太小，但凡5分满分的表我都会给0.5分，不然我觉得我也没法解释为什么两队这一轮的盘问差距竟然有1分，即1/5这么多，其实在我眼里可能也就0.2分的样子

岚星 · 发表于 2009-4-16 16:52:37

原帖由 keon 于 2009-4-16 16:23 发表
晕...说不好听点你别介意，要是我在场上看到台下的评判都是些大一大二的小p孩，我直接弃权，这是对我的侮辱。我不需要评判是专家，可是大一大二的学生对贫困、平等、民主、自由、财富、 ...

没关系，因为你认为辩论赛是在“评判对错”，而我认为，“抽签决定立场”就意味着“无法判断对错”，所以评判的是“谁讲课讲得好”。

那么，给一群大一大二的学生讲有关“贫困、平等、民主、自由、财富……”这类的课，并且由他们来判断“这个老师讲得好不好”，应该没有问题吧？

岚星 · 发表于 2009-4-16 16:57:24

原帖由 keon 于 2009-4-16 16:12 发表

首先我不会认为观众和辩手怎么想应该凌驾评委

我也不认为二者应该谁凌驾谁，但你我都认为“评委有义务让自己的评判理由得到大众的接受”。而yincancook似乎认为“评委是绝对权威，观众的选手不接受由得他们去”。

原帖由 keon 于 2009-4-16 16:12 发表

其次我不认为你有足够的sample证明主观普遍性确实存在

最后如果主观普遍性确实存在，我也会努力破坏之，千篇一律的、缺乏地方特色的辩论赛是最无聊的
马来亚、新加坡、台湾、大陆、香港，各地举办的比赛体现各地对辩论的理解和风格才有趣

我说了，目前只是希望大家一起来测试嘛～

至于风格单一化，不用担心，浙大自己就有好几种不同风格的队伍。这反映在评分表上是“你在逻辑上压我，我在表达上胜你”之类。

这实际上也是评分制的好处：评委对不同风格的偏好不好让某些队伍觉得“自己输了是因为评委不喜欢我们这种风格”。

而如果是投票制……恐怕评委就说不清了。:)

yincantcook · 发表于 2009-4-16 16:57:48

其实我觉得岚星你从头到尾都没有诚意讨论，只是忙着推销你的评分表。

我问你，评判对结果的影响是不是应该绝对一样，你到现在都不敢表态。
拿出你的guts,不要左闪右躲

keon · 发表于 2009-4-16 17:04:31

没关系，因为你认为辩论赛是在“评判对错”，而我认为，“抽签决定立场”就意味着“无法判断对错”，所以评判的是“谁讲课讲得好”。

那么，给一群大一大二的学生讲有关“贫困、平等、民主、自由、财富……”这类的课，并且由他们来判断“这个老师讲得好不好”，应该没有问题吧？

有问题，问题很大，辩手不是老师，辩手永远只看一面，尽力抬高自己、压低对手，无法回答的问题回避，占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的，在台上我的目标是赢，用一切正当的手段取得胜利，我不可能在3分钟的陈词里教会一个人什么是贫困，那三分钟里我讲的贫困，是经过细心的界定、包装、筛选的。一个不能够对这个辩题有全局认识（他不需要是研究贫困的，但凡一个25岁以上的人都会接触到一些穷苦的人，而我不相信有闲心玩辩论的大二学生懂什么是贫困）的人根本无从比较双方的观点，不能理解双方观点深层的冲突，他甚至需要我去教他“太阳从东边升起“一类浅显的道理，或是因为我没有反驳“太阳是从西边升起“而扣我分。跟这些裁判交流明显侮辱我智商...

岚星 · 发表于 2009-4-16 17:05:57

原帖由 keon 于 2009-4-16 16:12 发表

与其说形成决策，不如说清晰的判断出对错，现在的辩题设计基本都是非此即彼的，政策题永远只有应该实施或是不应该实施，美永远只有是主观或是客观，这类变题说服力永远是第一位

这个我已经说过了，“抽签决定立场”隐含假设了“两种观点目前无判断谁对谁错”。

政策只有“应该实施或不应该”吗？恐怕还存在“现在不应该，但是一年以后应该”吧？

当然，这在政策型辩论中不存在，因为讨论的就是“现在应该不应该”——这就是我说“形成决策”的原因，换言之，反方如果逼正方承认了“现在不应该”，那就胜了。

而美的问题呢？存在“我们现在应该认为美是主观感受”这个说法吗？就算存在，去辩论这个有意义吗？

所以我觉得，辩论赛要的是“虽然我们无法判断美是主观感受还是客观存在，但在这场辩论赛后，大家对这个问题有更深刻的认识”。

所以我说辩论赛是“讲课”，而评判的不是“谁对谁错”，而是“谁讲课讲得好”。不是去辩凯恩斯和哈耶克谁更正确，而是看易中天和马一孚谁的课上得好。

其实这里不是裁判解释不出来，而使观众未必能接受这个解释的问题，而且我不认为你在社会上请的评委能够清晰的解释为什么给4分，因为这意味着他必须同时回答——他认为这个小环节里5分应该是如何如何的，这类问题1万个辩手都可能有5000种解释，何况社会人士

呵呵～你说对了。这就是为什么要用里克特量表的原因——他的研究核心价值就在于证明了，当满分是5分的时候，答题人是可以回答的。而且不同答题人的回答不存在显著性差异。

keon · 发表于 2009-4-16 17:16:04

所以我觉得，辩论赛要的是“虽然我们无法判断美是主观感受还是客观存在，但在这场辩论赛后，大家对这个问题有更深刻的认识”。

所以我说辩论赛是“讲课”，而评判的不是“谁对谁错”，而是“谁讲课讲得好”。不是去辩凯恩斯和哈耶克谁更正确，而是看易中天和马一孚谁的课上得好。

这点不敢苟同，你说对问题有更深的认识这是辩论的目的，而不是辩论赛的目的。辩论赛的目、裁判的任务的就是在这40分钟里做出抉择——如果是你，你觉得谁是对的，当然这不代表胜方就拥有真理，但起码，如果现在的这场辩论不是在辩论场上，而是在国会，那么这场辩论赛后，国会就会采用胜方的建议。我们不要全面的真理，我们只要相对的胜利。

哦补充一句，现在的辩题设计基本都是非此即彼，且此彼之间是有相当对立的。诸如“知易行难“”读万卷书不如行万里路“之类的题目已经很少出现了

[ 本帖最后由 keon 于 2009-4-16 17:26 编辑 ]

yincantcook · 发表于 2009-4-16 17:17:45

原帖由 keon 于 2009-4-16 17:04 发表

有问题，问题很大，辩手不是老师，辩手永远只看一面，尽力抬高自己、压低对手，无法回答的问题回避，占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的，在台上我的目标是赢，用一切正当的手 ...

我倒是不介意有一个评判是大二学生，但是反对大部分是。个人比较讨厌的是评判背景单一化

keon · 发表于 2009-4-16 17:21:22

呵呵～你说对了。这就是为什么要用里克特量表的原因——他的研究核心价值就在于证明了，当满分是5分的时候，答题人是可以回答的。而且不同答题人的回答不存在显著性差异。

ok抛开你正在取sample不提（虽然我认为在一大堆sample里只取5个根本无法消除误差），让我们看看我们两人之间对5分理解的差别吧，恩...我们用你评分表里的第一条：思路道理是否清晰顺畅，你说说看你觉得这条给5分要满足什么条件？我写好我的，你post完我立刻post

keon · 发表于 2009-4-16 17:39:13

思路道理清晰顺畅5分——
1.立论的基调清晰、基点正确，不带任何倾向及歧视，不违背大众基本认知，对不同学者、利益团体、国家有足够代表性，而非仅一国或一家之言
2.所有观点有理有据、推导自然顺畅，推论有足够的覆盖面，不存在刻意推进、想当然、以点盖面
3.陈词结构合理、重点突出，不啰嗦、不做作、不矫情、不突兀、不折腾
4.没有刻意混淆、模糊、回避某些对自己不利的概念、事例、战场
5.做到以上那些也只有4.5，要在我手上拿5分，立论还必须勇敢大气且能投我所好，因为我未必常规哦
好像暂时也就想到这些...

[ 本帖最后由 keon 于 2009-4-16 17:46 编辑 ]

岚星 · 发表于 2009-4-16 20:23:34

原帖由 keon 于 2009-4-16 16:30 发表

我认为会有很大误差，评判评决的辩手、观众接受度受辩题（往往是不公平的题目）、地域、观众人数（只有辩手观战、还是有其他无辜第三者观战）。其实辩手的抗辩应该直接被忽略的，有明显的利益冲突嘛，我很怀疑，抛开辩手们教练们嚷嚷的因素，一场比赛无辜的观众对评委的评决都感到愤怒的会有多少。

在大样本下（样本数是变量数的5-10倍），这些因素是会被离散掉的。统计相关性和严格相关性不一样。

另外，我觉得你和yincancook可能认为，“辩手和教练对评判结果不满”是无关紧要的。而我认为，这是制约辩论赛发展的一个重要因素。

岚星 · 发表于 2009-4-16 20:29:42

原帖由 yincantcook 于 2009-4-16 16:34 发表

你这是在刻意曲解，我说的可是，判定胜负，根据胜负打分。
这种表面文章，我一定会做足的，怎么会出现分数跟胜负矛盾的情况

这一点我绝对没有曲解你，你是“根据胜负，来调整分数”，而我要的是“根据分数，确定胜负”。

你说的“表面文章”也证明，你打这个分数只是为了“让观众‘以为’评委是根据分数来评判的”。奉劝一句：别把观众当白痴。名校赛就是评分制，全辩国辩也说是实行评分制，但很多评委都是只打总分或者定了胜负再评分，这个很多人都知道。

而当观众一旦知道你试图欺骗他们，你的“公信力”只会变得更差。

岚星 · 发表于 2009-4-16 20:36:26

原帖由 keon 于 2009-4-16 16:42 发表

我看过你的分表，……项目太多，太分散我的注意力，其实我们8角杯的分表我都有点跟不上节奏了，而那张分表的项目估计只有你这里的3/5。

且分阶太小，但凡5分满分的表我都会给0.5分，不然我觉得我也没法解释为什么两队这一轮的盘问差距竟然有1分，即1/5这么多，其实在我眼里可能也就0.2分的样子

八角杯的评分表我没看到，能否请上传一份我看看？

浙大的比赛，每个环节之间有30秒时间（实际上用不了）让评委填表，然后收走该环节的评分表。基本上评委都觉得可以接受。

打0.5分没有关系。评分表的用意是“让评委能够说出自己为什么当这个分”。如果你觉得能说清自己为什么打3.5，而不是3分或4分，那就打3.5好了。:)

不过，我不觉得你能说清0.2分和0.3分、0.1分的区别到底在哪里。当然如果你能说清，那就打这样的分也无妨。

岚星 · 发表于 2009-4-16 20:50:13

原帖由 yincantcook 于 2009-4-16 16:57 发表
其实我觉得岚星你从头到尾都没有诚意讨论，只是忙着推销你的评分表。

我问你，评判对结果的影响是不是应该绝对一样，你到现在都不敢表态。
拿出你的guts,不要左闪右躲

唉……让我说你什么好……我在46楼和73楼里已经两次明确回答过：

“每个评判对结果的影响‘不必’绝对相同，只要和评标方法中的规则一样就可以了。”

我之前认可“影响力相同原则”，是认为“评标方法中的规则就满足了影响力相同（因为没有任何一位评标专家的评分在加总时给予了超过他人的权重）”。既然yincancook不认同这一点，那我也就不认可“在他的概念定义下的‘影响力相同原则’”。因为我绝不认为，评标方法中某些评委获得了比其他人不同的“影响力”！

原因很简单：

我认为：评委直接评判的不是“胜负”，而是“双方的表现”，而面对同样客观的“表现”，不同人给出不同的“评价”是正常的。比赛中，看的就是“谁能获得更高的评价”。

相反，我觉得yincancook你倒是根本没有讨论的诚意——因为你的回答让我觉得你只想让我回答你的问题，却从来不去认真分析我的文字，在理解我意思的基础上和我做进一步的讨论。

我说浙大的评分表说得多，那是因为在我见过的所有评分表中，只有浙大设计的表是合理的。而我要证明的也是“经过科学设计的评分表，比直接投票更好”。难道你要我证明那些我也认为是垃圾的评分表，比你的“多元化投票”还好？

[ 本帖最后由岚星于 2009-4-16 21:59 编辑 ]

岚星 · 发表于 2009-4-16 21:08:50

原帖由 keon 于 2009-4-16 17:04 发表
有问题，问题很大，辩手不是老师，辩手永远只看一面，尽力抬高自己、压低对手，无法回答的问题回避，占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的，在台上我的目标是赢，用一切正当的手段取得胜利，我不可能在3分钟的陈词里教会一个人什么是贫困，那三分钟里我讲的贫困，是经过细心的界定、包装、筛选的。一个不能够对这个辩题有全局认识（他不需要是研究贫困的，但凡一个25岁以上的人都会接触到一些穷苦的人，而我不相信有闲心玩辩论的大二学生懂什么是贫困）的人根本无从比较双方的观点，不能理解双方观点深层的冲突，他甚至需要我去教他“太阳从东边升起“一类浅显的道理，或是因为我没有反驳“太阳是从西边升起“而扣我分。跟这些裁判交流明显侮辱我智商...

按你的说法，凯恩斯的哈耶克也无法辩论、墨子和孟子也无法辩论……因为他们一定“永远只看一面，尽力抬高自己、压低对手，无法回答的问题回避，占优势的地方追击。”而我觉得，让他们同时给学生上课，在课堂上互相辩驳，学生由此对问题有了更深的理解，这不但可能，而且很有意义。

事实上，优秀的辩手一定会看两面——否则他不知道对方会怎么攻击自己。他也绝不能一味抬高自己和压低对手——因为他必须承认某些地方的确是对方的强项。无法回答的问题就要被扣分，追击占优势的地方就是让观众更好地理解对方的“道理”之中存在哪些不足。

追求赢没有错，你也说要“用一切正当的手段取得胜利”，问题在于，哪些是“正当的手段”？大陆一大批评委认为“巧下定义”是非常赞的技巧！所以大陆一批队伍都喜欢玩文字游戏。而评分表恰恰是给他们一个引导——哪些是应该被视为“正当手段”的。

“太阳升起”那个例子，我同意你的说法——常识性问题是不适用白纸典范的。

但你凭什么认为那些比如“对贫困的理解”也属于常识？我就不相信没老师教你（包括书本这样的老师），你自己能对相关问题有高于观众的理解。

所以，给观众讲清就是老师的责任。如果你觉得讲不清，那就看对手是不是讲得比你清吧。

最后说一句：浙大有很多来自贫困山区的学生，我个人认为他们比你这样有钱去香港读大学的人更懂得什么叫“贫困”。

岚星 · 发表于 2009-4-16 21:18:33

原帖由 keon 于 2009-4-16 17:16 发表

这点不敢苟同，你说对问题有更深的认识这是辩论的目的，而不是辩论赛的目的。辩论赛的目、裁判的任务的就是在这40分钟里做出抉择——如果是你，你觉得谁是对的，当然这不代表胜方就拥有真理，但起码，如果现在的这场辩论不是在辩论场上，而是在国会，那么这场辩论赛后，国会就会采用胜方的建议。我们不要全面的真理，我们只要相对的胜利。

哦补充一句，现在的辩题设计基本都是非此即彼，且此彼之间是有相当对立的。诸如“知易行难“”读万卷书不如行万里路“之类的题目已经很少出现了

当你引入“国会”的时候，就是我说的“政策型辩论”了——你见过国会去讨论“美是主观客观”“人肉搜索是否利大于弊（不是要不要立法禁止）”这类题目的吗？:)

所以“国会就会采用胜方的建议”，是因为国会要“做出决策”。而当国会没有必要决策，甚至没有国会，的时候，“在这40分钟里做出抉择”为什么“一定”是辩论赛的目的？（注意我并没有否认，“可以是”。）

所以我才说，政策型辩论赛那样评判，没问题。

但非政策辩论赛，再那样评判就有些滑稽了——纯粹为了胜利，去争这种口舌游戏，没有必要做出决策，却非要判断哪个观点更正确（选出胜方）。这样的辩论赛，我不觉得有什么意义。

		自动登录	找回密码
密码			注册

论战：为什么投票比评分好

浏览过的版块