找回密码
 注册

QQ登录

只需一步,快速开始

楼主: yincantcook

论战:为什么投票比评分好

[复制链接]
发表于 2009-4-16 16:30:00 | 显示全部楼层
假设有两组高校,一组的校赛统一采用评分法(当然,评分表是统一的,并经过严格设计),另一组统一采用投票法。然后看比赛后观众和辩手的反应。将这两者做一个统计相关性分析。


我认为会有很大误差,评判评决的辩手、观众接受度受辩题(往往是不公平的题目)、地域、观众人数(只有辩手观战、还是有其他无辜第三者观战)。其实辩手的抗辩应该直接被忽略的,有明显的利益冲突嘛,我很怀疑,抛开辩手们教练们嚷嚷的因素,一场比赛无辜的观众对评委的评决都感到愤怒的会有多少。
发表于 2009-4-16 16:31:14 | 显示全部楼层
原帖由 keon 于 2009-4-16 15:23 发表

其实我能理解你的苦心,但是确实也只能表示理解

你要的是热热闹闹、一团和气、众人皆服的辩论赛,而我要的只是辩论赛而已

是因为你认为你们学校、甚至乎国内的辩论圈都有许多不理解不和谐的情况

而这些种种情况对身处香港的我基本没有遇到过

……
我们最近争论比较多的是评判资格的问题,尤其是是否应该让前辩手担任港台赛评委的问题,而不是怎么评分的问题

或许你认为我理想化,但事实是理想化的规则在我们这里运行10年情况良好,暂时看不到有改动的需要


我之前就说过,香港或者台湾没有这些很正常,政策型辩论的思维在你们那里已经很成熟,所以如果还没有出现大的问题,维持原样我并不反对。:)

只是我要补充一句:你和我要的一样,不仅仅是辩论赛,而是一个“能够健康发展”的辩论赛。
 楼主| 发表于 2009-4-16 16:34:28 | 显示全部楼层
而我反对yincancook的核心不在这里,而是在“如果自己在评分表上给A打了高分,评委是否仍然有权把票投给B”。(可以参考他在41楼的发言。)

你这是在刻意曲解,我说的可是,判定胜负,根据胜负打分。
这种表面文章,我一定会做足的,怎么会出现分数跟胜负矛盾的情况
发表于 2009-4-16 16:39:16 | 显示全部楼层
原帖由 keon 于 2009-4-16 15:50 发表
我觉得几百分的小分,结果1分之差的输赢
往往比3:2的输赢更让人觉得有黑幕和无法接受
典型如03年中大对世新


名校赛的评分表问题太大了……如果你有兴趣,可以试着打一两次我们的评分表看看。我并不是说这会改变你的观点,只是相信这会使你认识到评分表不一定都会那么烂。

PS:浙大今年刚刚结束的一场比赛,3194.3比3192.5,正方胜(如果投票,3:2,结果不变)。正方实际只赢了陈词、攻辩、结辩,输了自由人、小结、自由辩、回答观众提问和整体评价。

但比赛后不管是观众还是辩手,都对结果表示完全接受。而评委也很心安——因为打的分数为什么高、为什么低、为什么高1分而不是2分等等,都能轻松的回答。:)
发表于 2009-4-16 16:42:38 | 显示全部楼层
哦……可能你没看清我那个例子……

是5个评委,分别给A、B两家打分。而不是裁判A、B……


我没理解错,我说的A B是指头两个给5分的评判,代号用得有歧义不好意思~

我看过你的分表,很典型的里克特量表,我的感觉是项目太多,太分散我的注意力,其实我们8角杯的分表我都有点跟不上节奏了,而那张分表的项目估计只有你这里的3/5。

且分阶太小,但凡5分满分的表我都会给0.5分,不然我觉得我也没法解释为什么两队这一轮的盘问差距竟然有1分,即1/5这么多,其实在我眼里可能也就0.2分的样子
发表于 2009-4-16 16:52:37 | 显示全部楼层
原帖由 keon 于 2009-4-16 16:23 发表
晕...说不好听点你别介意,要是我在场上看到台下的评判都是些大一大二的小p孩,我直接弃权,这是对我的侮辱。我不需要评判是专家,可是大一大二的学生对贫困、平等、民主、自由、财富、 ...


没关系,因为你认为辩论赛是在“评判对错”,而我认为,“抽签决定立场”就意味着“无法判断对错”,所以评判的是“谁讲课讲得好”。

那么,给一群大一大二的学生讲有关“贫困、平等、民主、自由、财富……”这类的课,并且由他们来判断“这个老师讲得好不好”,应该没有问题吧?
发表于 2009-4-16 16:57:24 | 显示全部楼层
原帖由 keon 于 2009-4-16 16:12 发表

首先我不会认为观众和辩手怎么想应该凌驾评委


我也不认为二者应该谁凌驾谁,但你我都认为“评委有义务让自己的评判理由得到大众的接受”。而yincancook似乎认为“评委是绝对权威,观众的选手不接受由得他们去”。



原帖由 keon 于 2009-4-16 16:12 发表

其次我不认为你有足够的sample证明主观普遍性确实存在

最后如果主观普遍性确实存在,我也会努力破坏之,千篇一律的、缺乏地方特色的辩论赛是最无聊的
马来亚、新加坡、台湾、大陆、香港,各地举办的比赛体现各地对辩论的理解和风格才有趣


我说了,目前只是希望大家一起来测试嘛~

至于风格单一化,不用担心,浙大自己就有好几种不同风格的队伍。这反映在评分表上是“你在逻辑上压我,我在表达上胜你”之类。

这实际上也是评分制的好处:评委对不同风格的偏好不好让某些队伍觉得“自己输了是因为评委不喜欢我们这种风格”。

而如果是投票制……恐怕评委就说不清了。:)
 楼主| 发表于 2009-4-16 16:57:48 | 显示全部楼层
其实我觉得岚星你从头到尾都没有诚意讨论,只是忙着推销你的评分表。

我问你,评判对结果的影响是不是应该绝对一样,你到现在都不敢表态。
拿出你的guts,不要左闪右躲
发表于 2009-4-16 17:04:31 | 显示全部楼层
没关系,因为你认为辩论赛是在“评判对错”,而我认为,“抽签决定立场”就意味着“无法判断对错”,所以评判的是“谁讲课讲得好”。

那么,给一群大一大二的学生讲有关“贫困、平等、民主、自由、财富……”这类的课,并且由他们来判断“这个老师讲得好不好”,应该没有问题吧?



有问题,问题很大,辩手不是老师,辩手永远只看一面,尽力抬高自己、压低对手,无法回答的问题回避,占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的,在台上我的目标是赢,用一切正当的手段取得胜利,我不可能在3分钟的陈词里教会一个人什么是贫困,那三分钟里我讲的贫困,是经过细心的界定、包装、筛选的。一个不能够对这个辩题有全局认识(他不需要是研究贫困的,但凡一个25岁以上的人都会接触到一些穷苦的人,而我不相信有闲心玩辩论的大二学生懂什么是贫困)的人根本无从比较双方的观点,不能理解双方观点深层的冲突,他甚至需要我去教他“太阳从东边升起“一类浅显的道理,或是因为我没有反驳“太阳是从西边升起“而扣我分。跟这些裁判交流明显侮辱我智商...
发表于 2009-4-16 17:05:57 | 显示全部楼层
原帖由 keon 于 2009-4-16 16:12 发表

与其说形成决策,不如说清晰的判断出对错,现在的辩题设计基本都是非此即彼的,政策题永远只有应该实施或是不应该实施,美永远只有是主观或是客观,这类变题说服力永远是第一位


这个我已经说过了,“抽签决定立场”隐含假设了“两种观点目前无判断谁对谁错”。

政策只有“应该实施或不应该”吗?恐怕还存在“现在不应该,但是一年以后应该”吧?

当然,这在政策型辩论中不存在,因为讨论的就是“现在应该不应该”——这就是我说“形成决策”的原因,换言之,反方如果逼正方承认了“现在不应该”,那就胜了。

而美的问题呢?存在“我们现在应该认为美是主观感受”这个说法吗?就算存在,去辩论这个有意义吗?

所以我觉得,辩论赛要的是“虽然我们无法判断美是主观感受还是客观存在,但在这场辩论赛后,大家对这个问题有更深刻的认识”。

所以我说辩论赛是“讲课”,而评判的不是“谁对谁错”,而是“谁讲课讲得好”。不是去辩凯恩斯和哈耶克谁更正确,而是看易中天和马一孚谁的课上得好。



其实这里不是裁判解释不出来,而使观众未必能接受这个解释的问题,而且我不认为你在社会上请的评委能够清晰的解释为什么给4分,因为这意味着他必须同时回答——他认为这个小环节里5分应该是如何如何的,这类问题1万个辩手都可能有5000种解释,何况社会人士


呵呵~你说对了。这就是为什么要用里克特量表的原因——他的研究核心价值就在于证明了,当满分是5分的时候,答题人是可以回答的。而且不同答题人的回答不存在显著性差异。
发表于 2009-4-16 17:16:04 | 显示全部楼层
所以我觉得,辩论赛要的是“虽然我们无法判断美是主观感受还是客观存在,但在这场辩论赛后,大家对这个问题有更深刻的认识”。

所以我说辩论赛是“讲课”,而评判的不是“谁对谁错”,而是“谁讲课讲得好”。不是去辩凯恩斯和哈耶克谁更正确,而是看易中天和马一孚谁的课上得好。


这点不敢苟同,你说对问题有更深的认识这是辩论的目的,而不是辩论赛的目的。辩论赛的目、裁判的任务的就是在这40分钟里做出抉择——如果是你,你觉得谁是对的,当然这不代表胜方就拥有真理,但起码,如果现在的这场辩论不是在辩论场上,而是在国会,那么这场辩论赛后,国会就会采用胜方的建议。我们不要全面的真理,我们只要相对的胜利。

哦补充一句,现在的辩题设计基本都是非此即彼,且此彼之间是有相当对立的。诸如“知易行难“”读万卷书不如行万里路“之类的题目已经很少出现了

[ 本帖最后由 keon 于 2009-4-16 17:26 编辑 ]
 楼主| 发表于 2009-4-16 17:17:45 | 显示全部楼层
原帖由 keon 于 2009-4-16 17:04 发表



有问题,问题很大,辩手不是老师,辩手永远只看一面,尽力抬高自己、压低对手,无法回答的问题回避,占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的,在台上我的目标是赢,用一切正当的手 ...


我倒是不介意有一个评判是大二学生,但是反对大部分是。个人比较讨厌的是评判背景单一化
发表于 2009-4-16 17:21:22 | 显示全部楼层
呵呵~你说对了。这就是为什么要用里克特量表的原因——他的研究核心价值就在于证明了,当满分是5分的时候,答题人是可以回答的。而且不同答题人的回答不存在显著性差异。


ok抛开你正在取sample不提(虽然我认为在一大堆sample里只取5个根本无法消除误差),让我们看看我们两人之间对5分理解的差别吧,恩...我们用你评分表里的第一条:思路道理是否清晰顺畅,你说说看你觉得这条给5分要满足什么条件?我写好我的,你post完我立刻post
发表于 2009-4-16 17:39:13 | 显示全部楼层
思路道理清晰顺畅5分——
1.立论的基调清晰、基点正确,不带任何倾向及歧视,不违背大众基本认知,对不同学者、利益团体、国家有足够代表性,而非仅一国或一家之言
2.所有观点有理有据、推导自然顺畅,推论有足够的覆盖面,不存在刻意推进、想当然、以点盖面
3.陈词结构合理、重点突出,不啰嗦、不做作、不矫情、不突兀、不折腾
4.没有刻意混淆、模糊、回避某些对自己不利的概念、事例、战场
5.做到以上那些也只有4.5,要在我手上拿5分,立论还必须勇敢大气且能投我所好,因为我未必常规哦
好像暂时也就想到这些...

[ 本帖最后由 keon 于 2009-4-16 17:46 编辑 ]
发表于 2009-4-16 20:23:34 | 显示全部楼层
原帖由 keon 于 2009-4-16 16:30 发表


我认为会有很大误差,评判评决的辩手、观众接受度受辩题(往往是不公平的题目)、地域、观众人数(只有辩手观战、还是有其他无辜第三者观战)。其实辩手的抗辩应该直接被忽略的,有明显的利益冲突嘛,我很怀疑, 抛开辩手们教练们嚷嚷的因素,一场比赛无辜的观众对评委的评决都感到愤怒的会有多少。


在大样本下(样本数是变量数的5-10倍),这些因素是会被离散掉的。统计相关性和严格相关性不一样。

另外,我觉得你和yincancook可能认为,“辩手和教练对评判结果不满”是无关紧要的。而我认为,这是制约辩论赛发展的一个重要因素。
发表于 2009-4-16 20:29:42 | 显示全部楼层
原帖由 yincantcook 于 2009-4-16 16:34 发表

你这是在刻意曲解,我说的可是,判定胜负,根据胜负打分。
这种表面文章,我一定会做足的,怎么会出现分数跟胜负矛盾的情况


这一点我绝对没有曲解你,你是“根据胜负,来调整分数”,而我要的是“根据分数,确定胜负”。

你说的“表面文章”也证明,你打这个分数只是为了“让观众‘以为’评委是根据分数来评判的”。奉劝一句:别把观众当白痴。名校赛就是评分制,全辩国辩也说是实行评分制,但很多评委都是只打总分或者定了胜负再评分,这个很多人都知道。

而当观众一旦知道你试图欺骗他们,你的“公信力”只会变得更差。
发表于 2009-4-16 20:36:26 | 显示全部楼层
原帖由 keon 于 2009-4-16 16:42 发表

我看过你的分表,……项目太多,太分散我的注意力,其实我们8角杯的分表我都有点跟不上节奏了,而那张分表的项目估计只有你这里的3/5。

且分阶太小,但凡5分满分的表我都会给0.5分,不然我觉得我也没法解释为什么两队这一轮的盘问差距竟然有1分,即1/5这么多,其实在我眼里可能也就0.2分的样子


八角杯的评分表我没看到,能否请上传一份我看看?

浙大的比赛,每个环节之间有30秒时间(实际上用不了)让评委填表,然后收走该环节的评分表。基本上评委都觉得可以接受。

打0.5分没有关系。评分表的用意是“让评委能够说出自己为什么当这个分”。如果你觉得能说清自己为什么打3.5,而不是3分或4分,那就打3.5好了。:)

不过,我不觉得你能说清0.2分和0.3分、0.1分的区别到底在哪里。当然如果你能说清,那就打这样的分也无妨。
发表于 2009-4-16 20:50:13 | 显示全部楼层
原帖由 yincantcook 于 2009-4-16 16:57 发表
其实我觉得岚星你从头到尾都没有诚意讨论,只是忙着推销你的评分表。

我问你,评判对结果的影响是不是应该绝对一样,你到现在都不敢表态。
拿出你的guts,不要左闪右躲


唉……让我说你什么好……我在46楼和73楼里已经两次明确回答过:

“每个评判对结果的影响‘不必’绝对相同,只要和评标方法中的规则一样就可以了。”

我之前认可“影响力相同原则”,是认为“评标方法中的规则就满足了影响力相同(因为没有任何一位评标专家的评分在加总时给予了超过他人的权重)”。既然yincancook不认同这一点,那我也就不认可“在他的概念定义下的‘影响力相同原则’”。因为我绝不认为,评标方法中某些评委获得了比其他人不同的“影响力”!

原因很简单:

我认为:评委直接评判的不是“胜负”,而是“双方的表现”,而面对同样客观的“表现”,不同人给出不同的“评价”是正常的。比赛中,看的就是“谁能获得更高的评价”。


相反,我觉得yincancook你倒是根本没有讨论的诚意——因为你的回答让我觉得你只想让我回答你的问题,却从来不去认真分析我的文字,在理解我意思的基础上和我做进一步的讨论。

我说浙大的评分表说得多,那是因为在我见过的所有评分表中,只有浙大设计的表是合理的。而我要证明的也是“经过科学设计的评分表,比直接投票更好”。难道你要我证明那些我也认为是垃圾的评分表,比你的“多元化投票”还好?

[ 本帖最后由 岚星 于 2009-4-16 21:59 编辑 ]
发表于 2009-4-16 21:08:50 | 显示全部楼层
原帖由 keon 于 2009-4-16 17:04 发表
有问题,问题很大,辩手不是老师,辩手永远只看一面,尽力抬高自己、压低对手,无法回答的问题回避,占优势的地方追击。我在台上讲贫困和在台下讲的贫困问题是截然不同的,在台上我的目标是赢,用一切正当的手段取得胜利,我不可能在3分钟的陈词里教会一个人什么是贫困,那三分钟里我讲的贫困,是经过细心的界定、包装、筛选的。一个不能够对这个辩题有全局认识(他不需要是研究贫困的,但凡一个25岁以上的人都会接触到一些穷苦的人,而我不相信有闲心玩辩论的大二学生懂什么是贫困)的人根本无从比较双方的观点,不能理解双方观点深层的冲突,他甚至需要我去教他“太阳从东边升起“一类浅显的道理,或是因为我没有反驳“太阳是从西边升起“而扣我分。跟这些裁判交流明显侮辱我智商...


按你的说法,凯恩斯的哈耶克也无法辩论、墨子和孟子也无法辩论……因为他们一定“永远只看一面,尽力抬高自己、压低对手,无法回答的问题回避,占优势的地方追击。”而我觉得,让他们同时给学生上课,在课堂上互相辩驳,学生由此对问题有了更深的理解,这不但可能,而且很有意义。

事实上,优秀的辩手一定会看两面——否则他不知道对方会怎么攻击自己。他也绝不能一味抬高自己和压低对手——因为他必须承认某些地方的确是对方的强项。无法回答的问题就要被扣分,追击占优势的地方就是让观众更好地理解对方的“道理”之中存在哪些不足。

追求赢没有错,你也说要“用一切正当的手段取得胜利”,问题在于,哪些是“正当的手段”?大陆一大批评委认为“巧下定义”是非常赞的技巧!所以大陆一批队伍都喜欢玩文字游戏。而评分表恰恰是给他们一个引导——哪些是应该被视为“正当手段”的。


“太阳升起”那个例子,我同意你的说法——常识性问题是不适用白纸典范的。

但你凭什么认为那些比如“对贫困的理解”也属于常识?我就不相信没老师教你(包括书本这样的老师),你自己能对相关问题有高于观众的理解。

所以,给观众讲清就是老师的责任。如果你觉得讲不清,那就看对手是不是讲得比你清吧。

最后说一句:浙大有很多来自贫困山区的学生,我个人认为他们比你这样有钱去香港读大学的人更懂得什么叫“贫困”。
发表于 2009-4-16 21:18:33 | 显示全部楼层
原帖由 keon 于 2009-4-16 17:16 发表

这点不敢苟同,你说对问题有更深的认识这是辩论的目的,而不是辩论赛的目的。辩论赛的目、裁判的任务的就是在这40分钟里做出抉择——如果是你,你觉得谁是对的,当然这不代表胜方就拥有真理,但起码,如果现在的这场辩论不是在辩论场上,而是在国会,那么这场辩论赛后,国会就会采用胜方的建议。我们不要全面的真理,我们只要相对的胜利。

哦补充一句,现在的辩题设计基本都是非此即彼,且此彼之间是有相当对立的。诸如“知易行难“”读万卷书不如行万里路“之类的题目已经很少出现了


当你引入“国会”的时候,就是我说的“政策型辩论”了——你见过国会去讨论“美是主观客观”“人肉搜索是否利大于弊(不是要不要立法禁止)”这类题目的吗?:)

所以“国会就会采用胜方的建议”,是因为国会要“做出决策”。而当国会没有必要决策,甚至没有国会,的时候,“在这40分钟里做出抉择”为什么“一定”是辩论赛的目的?(注意我并没有否认,“可以是”。)

所以我才说,政策型辩论赛那样评判,没问题。

但非政策辩论赛,再那样评判就有些滑稽了——纯粹为了胜利,去争这种口舌游戏,没有必要做出决策,却非要判断哪个观点更正确(选出胜方)。这样的辩论赛,我不觉得有什么意义。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|华语辩论网 ( 粤ICP备20050268号-1 )

GMT+8, 2025-7-31 00:17 , Processed in 0.049888 second(s), 14 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表