找回密码
 注册

QQ登录

只需一步,快速开始

楼主: yincantcook

论战:为什么投票比评分好

[复制链接]
 楼主| 发表于 2009-4-15 09:59:52 | 显示全部楼层
我先重申一次我对判别胜负的意见
1.票数决定
2.自由投票,每个评判自主判断胜负,无论是开局中局还是终局决定胜负皆为评判之自由,分表仅为参考。
3.根据胜负填写分数,在不改变胜负的情况下,可针对个别选手,个别环节作出分数调整,表示鼓励,表扬,批评。
4.在比赛结束后,讨论开始前的一个限定时间提交分表,并签字做实。

--------------------------
我们的分歧的在于,我坚持评判的主观意愿高于一切因素,并且不受分表束缚

[ 本帖最后由 yincantcook 于 2009-4-15 10:40 编辑 ]
 楼主| 发表于 2009-4-15 10:32:13 | 显示全部楼层
又及,关于评判的问题,岚星问

目前,很多评委对于辩论的理念存在偏差,很多评委不看逻辑、不重思想,只关心语言华彩、包袱段子。那些让辩论赛变得没有任何意义的“定义游戏”被很多评委当成“值得赞许的辩论技巧”。辩论赛越来越滑向“口舌之争”、“文明的吵架”。

我答曰,评判多样性即可解。而岚星也不反对。

但接下来的意见却让我费解,请不同背景的评判虽有难度,但是对于一个相对较大的比赛,比如省赛,已经不是难事,再上一级的全辩国辩更加是小事一件。

而且评委的倾向性是引导辩风的主要手段,你想多注重逻辑什么的,多请些律师,工程教授就可以,矫枉必须过正嘛。这个手段远比什么so call设计完美的分表简单实在。

至少我个人就不相信请五个不同背景的评判会比请五个完美的评判难。

何必舍易取难?
 楼主| 发表于 2009-4-15 10:43:38 | 显示全部楼层
最后回到我的问题,很显然岚星曲解了我的问题。
我要问的是每个评判对结果的影响是不是应该绝对相同

[ 本帖最后由 yincantcook 于 2009-4-15 12:29 编辑 ]
发表于 2009-4-15 13:13:18 | 显示全部楼层
原帖由 yincantcook 于 2009-4-15 09:59 发表
我先重申一次我对判别胜负的意见
1.票数决定
2.自由投票,每个评判自主判断胜负,无论是开局中局还是终局决定胜负皆为评判之自由,分表仅为参考。
3.根据胜负填写分数,在不改变胜负的情况下,可针对个别选手,个 ...

我们的分歧的在于,我坚持评判的主观意愿高于一切因素,并且不受分表束缚


根据这个回答,我判断你选择的是我前面说的“参考评分表的自由投票法”。

针对你的后一句话,我想问“评判‘针对什么’的主观意愿高于一切因素”?是针对“双方表现”,还是“比赛胜负”?


我判断,我们的分歧是两点:

1、你认为“加权评分”不合理,而我认为合理。

2、你认为评委“即使给不出任何理由”(即没有评分表,或不承认评分表上自己对“双方表现”的评定),也有权评判胜负,而我对此绝不接受!

[ 本帖最后由 岚星 于 2009-4-15 13:26 编辑 ]
发表于 2009-4-15 13:17:11 | 显示全部楼层
原帖由 yincantcook 于 2009-4-15 10:32 发表
请不同背景的评判虽有难度,但是对于一个相对较大的比赛,比如省赛,已经不是难事,再上一级的全辩国辩更加是小事一件。

而且评委的倾向性是引导辩风的主要手段,你想多注重逻辑什么的,多请些律师,工程教授就可以,矫枉必须过正嘛。这个手段远比什么so call设计完美的分表简单实在。

至少我个人就不相信请五个不同背景的评判会比请五个完美的评判难。


请五个不同背景,但是都不怎么懂“非政策型辩论赛”的评委,我也觉得很容易。

但我可不认为这样的评委有资格来评判比赛。

而且我不是想“多注重些逻辑”,而是要逻辑、表达、论据、风度、团队、现场压制力……全面平衡。yincancook你见过哪个评委可以在没有评分表的情况下如此冷静、全面、平衡的进行评判?

要真按你说的,请几个“不同背景的评委”就可以了,那请问“招投标的评标会上,为什么从来都是几位评标专家‘评分’而不是找一群‘不同背景的人’自由投票?”

[ 本帖最后由 岚星 于 2009-4-15 13:36 编辑 ]
发表于 2009-4-15 13:20:04 | 显示全部楼层
原帖由 yincantcook 于 2009-4-15 10:43 发表
最后回到我的问题,很显然岚星曲解了我的问题。
我要问的是每个评判对结果的影响是不是应该绝对相同


让你觉得“曲解”我很抱歉,我是真的“没理解”——你说的“对结果的影响绝对相同”是什么意思?你在34楼的解释太抽象,所以我问了个具体例子:

例二:
如果有一个招标项目,A、B两家公司竞标,甲方请来5位评标专家对其方案评分,其中比如“售后服务”的评分是:
A:3、3、4、4、4
B:5、5、3、3、3
那么,最后A公司得分18,B公司19,所以B公司在“售后服务”上胜出。

我希望你回答:在这个例子中,“每个评判对结果的影响是不是绝对相同”?

我不用你解释“为什么‘是’”或“为什么‘不是’”,我只要你回答“是”或“不是”。

如果你回答“是”,那请问这和辩论赛上评委评分有什么区别?

如果你回答“不是”,那我对你问题的回答就是“每个评判对结果的影响‘不必’绝对相同,只要和评标方法中的规则一样就可以了。”(这次该够明确了吧?)

[ 本帖最后由 岚星 于 2009-4-15 13:32 编辑 ]
 楼主| 发表于 2009-4-15 14:29:25 | 显示全部楼层
对于评委,我不认为需要懂得什么叫做政策辩论,或者什么叫做辩论。
评委的工作就是以一个中立者的身份判断谁说的有道理,至于说他做出某方更有道理的判断是被误导,被欺骗,还是识破了某方的误导跟欺骗,并不重要。
就是说,评判当然是根据你的表现来决定胜负,但根据你的什么表现,或者你的什么表现影响了评判的决定,这是评判自己的选择。

总之,输了就是你水平不够,不管是辩论技巧还是语言水平,反正你没让评判接受你的观点,你就活该要输。赖天赖地也不要赖评判。

另一方面,评判需要对逻辑,风度,文采作全面评估吗?
我的答案是,没有必要。依然是那句话,评判仅需要判断谁说的更有道理,什么叫做更有道理,这是评判的权力。

---------------------
归根结底,我们的定位并不一样。我要的是无知第三者,你要的是专家鉴定
 楼主| 发表于 2009-4-15 14:42:09 | 显示全部楼层
又及,你给出的五组分数分数,前二者的分差为2,后三者的分差为1。
简单而言,前两者对结果的影响是后三者的两倍。
也就是说,评判对结果的影响不一样。

再及,在现实情况下,老板不会简单的因为18:19而选择高分的那个。

又再及,专家建议恰是参考而非决定,这些案例都是典型的参考分表,老板拍板.
(是不是很像我的做法,哈)

现在的问题就是,如果你认为评判对结果的影响应该一样,那么就不能这么做。不然,请举出你的理由,凭什么某些评判的判决可以对结果产生更大的影响?

[ 本帖最后由 yincantcook 于 2009-4-15 14:56 编辑 ]
发表于 2009-4-15 20:39:57 | 显示全部楼层
原帖由 yincantcook 于 2009-4-15 14:29 发表



对于评委,我不认为需要懂得什么叫做政策辩论,或者什么叫做辩论。
评委的工作就是以一个中立者的身份判断谁说的有道理,至于说他做出某方更有道理的判断是被误导,被欺骗,还是识破了某方的误导跟欺骗,并不重要。
就是说,评判当然是根据你的表现来决定胜负,但根据你的什么表现,或者你的什么表现影响了评判的决定,这是评判自己的选择。

……

另一方面,评判需要对逻辑,风度,文采作全面评估吗?
我的答案是,没有必要。依然是那句话,评判仅需要判断谁说的更有道理,什么叫做更有道理,这是评判的权力

---------------------
归根结底,我们的定位并不一样。我要的是无知第三者,你要的是专家鉴定


OK,如果你要求辩论赛统一为“政策型辩论”,我赞同你的说法。但对“非政策型辩论”,我不同意。

针对你最后一句“什么叫做更有道理,这是评判的权力”,我要追问一句:凭什么他有权力决定谁更有道理?如果他是个“无知第三者”,他有什么资格来评判?难道大街上随便拉个阿猫阿狗也能来当评委啊?!

这就是为什么有那么多观众和辩手对评判结果表示不满——因为评委说不出来他凭什么把票投给正方!

如果一个游戏,评委的结果竟然得不到观众、选手的普遍认可,而这些“评委”竟然还能够继续“评委”下去,那不难想象最终的结局——你当评委,咱不玩可以吧?你们要玩,我不看可以吧?

从某种意义上讲,目前大陆辩论赛发展成这个破样,很大程度上就是这个原因。

如果不改变这一切,我不知道这个游戏还要怎么发展。

=============================

在这里,我觉得我们的分歧是:

你认为,“评委”的判决结果绝对权威,不受任何质疑——哪怕在评委只是“无知第三方”的时候。

而我认为:评委的评判结果要受到观众和选手的监督,如果不能“说出”自己“如此投票”的理由,则这样的投票形同废纸。

我这样认为的理由是:如果不这样,辩论赛的发展会受到极大的伤害。

[ 本帖最后由 岚星 于 2009-4-16 00:28 编辑 ]
发表于 2009-4-15 21:01:25 | 显示全部楼层
原帖由 yincantcook 于 2009-4-15 14:42 发表
又及,你给出的五组分数分数,前二者的分差为2,后三者的分差为1。
简单而言,前两者对结果的影响是后三者的两倍。
也就是说,评判对结果的影响不一样。

再及,在现实情况下,老板不会简单的因为18:19而选择高分的那个。

又再及,专家建议恰是参考而非决定,这些案例都是典型的参考分表,老板拍板.
(是不是很像我的做法,哈)

现在的问题就是,如果你认为评判对结果的影响应该一样,那么就不能这么做。不然,请举出你的理由,凭什么某些评判的判决可以对结果产生更大的影响?


呵呵~那是我故意设计的,就是因为这样的情况最能反映我们的分歧:

第一:
你犯了一个严重的错误:在一次合法的公开招投标过程中,老板如果敢对着18:19的结果,却让18分的那方中标,那他就等着吃官司吧——而且没有一丝赢的可能,除非存在司法腐败。

所以,你那句“这些案例都是典型的参考分表,老板拍板”,只能说明你对招投标这种“公开”而非“暗箱”的方式,一点儿也不懂……

给你补一课吧:
评标的方法有两种:低价中标法和综合评价法,除非所采购商品高度标准化,否则基本上都是用“综合评价法”(尤其是使用亚行、世行贷款的项目,强制必须使用这种方法)。

综合评价法又有两种:
1、评标专家分别打分,最后相加,取得分最高者中标;(也就是我说的“加权评分法”)
2、评标专家分别打分后,把票投给自己打分最高的那一方,最后哪家投标商得票最高就中标。(也就是“评分定票法”)

两种方法均被法律界和商界所承认,只要事先在招标文件中说明即可。实际商务里,基本上都是用前一种。也就是说,在我那个案例里,如果事先声明采用前一种方法评标,则B中标;声明后一种方法,则A中标。这都是合理的。


第二:
如果按你在41楼里说的程序来评标,那就是:

1、各评标专家根据自己的判断把票投给自己选定的投标商

2、根据得票数选定中标者

3、在不改变中标者的前提下,填写评分表

我不知道实际工作中有没有这么干的,但我肯定如果谁敢这么干,那他死定了。套用郭德纲的名言:“老子最恨的就是你们这种暗箱操作。”


现在,请你回答我:你是否认为这种世界通行,甚至被法律规定“必须如此”的评判体系,是根本不合理的?

[ 本帖最后由 岚星 于 2009-4-16 00:31 编辑 ]
发表于 2009-4-16 00:40:52 | 显示全部楼层
虽然我只能看懂讨论,不能还原关于分差的推理过程,不过显然在这个问题岚星师兄指望在分表中体现出来的东西太多了。

我觉得你们应该把问题集中在,评判手段应该在最低限度上从什么方面约束评判。

辩论是说服,不是数字证明,所以纵然一方完全符合某种隐含在分表里的“完美表现”的公式,评判也有权不把票投给他们。

关键问题不在于用实体性的尺度(比如诡辩到什么程度才叫做诡辩)来约束评判,而在于评判结果如何最能体现评判者的内心意愿。我一直认为,分表的价值在于给评判者提供一种可参考的操作方法,来把他自己对双方的判断具体化,以避免因为缺乏严谨的思考过程而做出不恰当的评判,而不是反过来强迫评判接受分表的标准。

岚星师兄对于分表的最终理想,似乎是能找到一种设计方法,使得无论多弱智(当然按照通常的说法是“具有一般常识”)的评判都可以做出“理想”的评判结果,从而可以忽略因评判个人认识、素质而导致的标准差异。但是这一点上我诚然同意yincantcook的观点——“理想”公式并不能代表“大众”的观点,因为“大众”的意见反而往往是充满瑕疵的,因此这种方法成本过大,收益过小。

更进一步而言,如果这种分表可能存在,那么评判辩论就变成做数学题了,大家拿公式一套,然后结果就出来了,嘿嘿。那么其实双方也不用打了,因为某些变量(比如立论)在一开始就决定了最终结果。双方立完论,准备好,然后自己一测,哎呀我输了“)

所以在二位继续讨论前,我建议你们把“要避免的到底是什么误差”先确定好。

另外,某个方法在某个领域被广泛采用,甚至被法律规定,不代表在别的领域也有必要这样去做。我记得岚星师兄一直拿这个作为“议会辩论、法庭辩论不能作为大学生辩论的参考模式”的论据。所以相应的,某种评分方法应当在大学生辩论的评判中使用,是一个仍需论证的问题。
发表于 2009-4-16 01:09:06 | 显示全部楼层
恩,正准备打几个字就发现有人把我要说的说了,万恶的登录...
我理想中的评分表只需两栏
1.胜负
2.简短说明判胜负的理由
完了

至于评判
1.无需懂得辩论、辩题相关的知识背景也不是必须,但必须是多年工作经验、有一定阅历的社会人士。必须不能是在校大学生,尤其不能是在校辩手
2.评判人数不少于5个,所在行业及背景足够分散

如果你认为评判不够资格,可以在赛前提出或是拒绝参赛,但只要参赛,就等于你默认评判的资质,则赛后辩手无权质疑评判的评决。
以“我觉得xx队应该赢”、“大部分观众觉得xx队应该赢”等无聊理由抗辩是弱者的表现,如果你觉得观众和利益相关人士的意见应该左右评决的话,那评判的公信力何在。
发表于 2009-4-16 01:26:04 | 显示全部楼层
以岚星同学设计的case为例
3 3 4 4 4 = 18
5 5 3 3 3  = 19

如果每个数字是每位评委的总分,那明显下组的头两位评委对胜负的影响力大于其他评委,当这个数字乘以20的时候,这个影响更大。(我想yincancook是这个意思)

如果18、19是单一评委的总分,也有问题,即
队A赢了3个项目,但输了总分;队B只赢了两个项目,但赢了总分;因此判B胜。
但这里有对裁判很不公平的一点——在于裁判对每个项目应占权重的看法是不同的
无论你认为这五项应该是立论、推演、证据、辩风、配合之类
或是你认为这五项应该是陈词、驳论、盘问、自由辩、总结之类
评判依其教育背景、专业方向、对辩论的认识等的不同对各项的权重都会有自己的理解
如果你为5个项目设立权重,那等于变相的强奸了裁判的判决,且若理工科强的浙大组织的比赛如果将推演、论据给与较高的权重,仍难免有作弊之嫌
如果不设立权重,那么裁判在打分的时候还要计算自己对各项施加的权重,以免一个按项目计胜负的裁判的小分竟然相反的尴尬结果

其实问题归根结底,还是你信不信任裁判的问题...

[ 本帖最后由 keon 于 2009-4-16 01:40 编辑 ]
发表于 2009-4-16 01:45:08 | 显示全部楼层
另外,我很好奇你们讨论这个的目的,是在寻找一套放之四海皆准的辩论赛评定胜负的标准吗?

如果是的话,那么一个理想的标准,对于同一场辩论赛,应是即使更换5位其他符合资格的评委,也有极大的几率是相同的胜负结果,这应该是辩论赛胜负公信力的来源

单以此来看,我相信投票结果相同(或直接胜负相同)的几率远高于算小分,以上
 楼主| 发表于 2009-4-16 10:15:03 | 显示全部楼层
说些题外话,评判我当过不少次,有时候也发生“说不出为什么投票给某方”
原因很复杂,比如
1.双方都太废了,废的程度是,我不敢再回忆品尝烂苹果的过程
2.隔壁的评判太废了,偏偏自以为是,抢着发表意见,俺不敢打击他良好的自我感觉(虽然我不否认能够说服废人也是一种本事)

其实大部分时候,评判是不愿说,而不是说不出。:)
 楼主| 发表于 2009-4-16 10:53:29 | 显示全部楼层
关于你的case,显然你在误导大家,欺负大家不熟悉商务。
评标都是专家给意见,并推荐若干候选人的,最后老板才有决定权的。
资料:
    评标委员会和评标方法暂行规定
          第四十五条 评标委员会推荐的中标候选人应当限定在一至三人,并标明排列顺序。

有本事你就把你说的等着吃官司的相关规定贴上来,哼

[ 本帖最后由 yincantcook 于 2009-4-16 12:22 编辑 ]
 楼主| 发表于 2009-4-16 11:41:06 | 显示全部楼层
从目前的例子来看,岚星没有弄清楚一点,评判跟主办方的关系,不同于评标专家跟老板的关系。
评判结果跟主办方没有利益联系,评判不需考虑主办方的意志。甚至乎,评判需要对抗主办方的意志。
而评标结果跟老板有明确的利益关联,专家必须考虑老板的意志。

而从结果来说,投标考虑的是功能的符合程度,而辩论考虑的是能被多方面的受众接受。

这样的不同目的,显然不应该用同样的方案。
 楼主| 发表于 2009-4-16 11:43:55 | 显示全部楼层
回到我的问题,作为一个评判,我为什么要接受别人的意见可以扭曲我对结果的影响?
发表于 2009-4-16 14:08:10 | 显示全部楼层
原帖由 herolandis 于 2009-4-16 00:40 发表
显然在这个问题岚星师兄指望在分表中体现出来的东西太多了。

我觉得你们应该把问题集中在,评判手段应该在最低限度上从什么方面约束评判。

辩论是说服, ...

“理想”公式并不能代表“大众”的观点,因为“大众”的意见反而往往是充满瑕疵的

那么评判辩论就变成做数学题了,大家拿公式一套,然后结果就出来了,嘿嘿。那么其实双方也不用打了,因为某些变量(比如立论)在一开始就决定了最终结果。双方立完论,准备好,然后自己一测,哎呀我输了“)

某个方法在某个领域被广泛采用,甚至被法律规定,不代表在别的领域也有必要这样去做。


依次说明:
1、我希望在评分表中体现的东西并不算多。
各环节只四项:逻辑、论据、表达、场面压制力;
整体分5项:团队、反应、对己方的论证力、对对方的反驳力、综合美感

说实话,我觉得,如果真是想认真讨论这个问题,至少去把我已经上传的评分表拿来看看——这样才能更好地理解我的意图。毕竟这里不是辩论赛。




2、我一直认为,“非政策型辩论赛”要的 不完全 是“说服”,而更多的是“展示”——就像两个老师,一个讲新古典经济学,另一个讲货币主义。评委不是看“哪方的理论更有说服力”,而是看“哪个老师讲课更好”。

再打个比方,让易中天和马一孚比讲课,易中天绝对应该是胜者——尽管他的学术水平比马老差了不是一个数量级。




3、我并不是想评委的意见“绝对意义上 代表”大众的观点,而是认为评委的意见要能得到大众的认可。




4、立论的逻辑性,的确在赛前准备就决定了。但“表达”“反应”“团队”“场面”,恐怕不比是不可能知道的。



5、我和yincancook的论战,目前只涉及“评分法能不能用”,而不是“是不是一定要用”。我的观点是“能用”,yincancook认为“不能用”(所以他提出“影响力相等原则”)。

如果yincancook承认“能用”,那我们就进一步来讨论“我提出的四种方法中,其他三种方法为什么不如第一种”。
发表于 2009-4-16 14:16:56 | 显示全部楼层
原帖由 keon 于 2009-4-16 01:09 发表
恩,正准备打几个字就发现有人把我要说的说了,万恶的登录...
我理想中的评分表只需两栏
1.胜负
2.简短说明判胜负的理由
完了


事实证明,实施这种方法的高校(除非是纯打政策型辩论的),评判结果往往引来巨大争议。连评委被学生骂哭的情况都在一些国内辩论水平绝对顶级的高校上演。

浙大在采用投票法之前也是这样,但从改用评分法以来,再也没有出现过。


如果你认为评判不够资格,可以在赛前提出或是拒绝参赛,但只要参赛,就等于你默认评判的资质,则赛后辩手无权质疑评判的评决。
以“我觉得xx队应该赢”、“大部分观众觉得xx队应该赢”等无聊理由抗辩是弱者的表现,如果你觉得观众和利益相关人士的意见应该左右评决的话,那评判的公信力何在。


你觉得评判如果不是对辩论赛没有深入了解,他的“公(众)信(任)力”在哪里?公众凭什么信任他?

你说得对,“认为评判不够资格,可以在赛前提出或是拒绝参赛”,所以现在很多大学不屑于参加辩论赛——如果不是学校一定要参加的话。
而观众的表现更明确——直接拒绝观看。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|华语辩论网 ( 粤ICP备20050268号-1 )

GMT+8, 2025-7-31 00:15 , Processed in 0.048381 second(s), 14 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表