【CS:GO】2022年HLTV Top 20选手排行榜预测①:规则解读

【CS】什么是rating:【CS:GO】赛事分级知多少:【CS】什么是战队排名:【CS】HLTV保姆级使用教程【上】:【CS】HLTV保姆级使用教程【下】:【CS:GO】科普:HLTV是如何评选TO

码字不易,希望各位读者朋友点点关注,多多交流。今后会继续更新更多深度内容,往期内容请见文集:caivar的CS:GO数据分析。 转载本文或摘编本文内容需经本人同意。 

一些值得回顾的文章:

【CS】什么是rating:https://www.bilibili.com/read/cv17386549

【CS:GO】赛事分级知多少:https://www.bilibili.com/read/cv17400536

【CS】什么是战队排名:https://www.bilibili.com/read/cv17456217

【CS】HLTV保姆级使用教程【上】:https://www.bilibili.com/read/cv17967780

【CS】HLTV保姆级使用教程【下】:https://www.bilibili.com/read/cv18212922

【CS:GO】科普:HLTV是如何评选TOP 20选手的?:https://www.bilibili.com/read/cv18659547

【本文约6700字】


2022年所有值得注意的CS:GO赛事已经告一段落,而年末的重头大戏自然是HLTV Top 20选手的殊荣会花落谁家。在接下来的一系列文章中,我将推出一份客观的Top 20选手排行榜预测:它不包括对选手的任何主观态度,只是单纯地模仿往年HLTV Top 20选手排行榜,预测时采用的所有准则均遵循HLTV的规则。

HLTV在今年还推出了预测Top 20选手排行榜的页面(https://www.hltv.org/top20/predictions/2022/1511882),可以让用户参与竞猜。我也特别希望各位读者朋友能在接下来的一系列文章中发表对Top 20选手排行榜预测的任何观点,高质量的讨论可以让我的大量准备工作更有价值。


1    HLTV采用的规则

在我们开始预测之前,最有必要了解的事情自然是HLTV在评选Top 20选手时的规则是什么。我在“科普:HLTV是如何评选TOP 20选手的?”一文(https://www.bilibili.com/read/cv18659547)中比较详尽地阐述了这些规则,不过我仍然有必要在这篇文章中重申一些基本准则。以2021年为例,HLTV Top 20选手排行榜有5条规则:统计数据、个人荣誉、样本量、稳定性和近因偏差。


1.1    统计数据

排名很大程度上基于数据,但只看一整年的rating并不能告诉你一切。数据的来源很重要,例如选手在哪些赛事中脱颖而出,以及他们是否在风险最高的big matches中表现出色。

很明显,统计数据是最值得信赖的评价选手的方式,因为它是量化的,孰高孰低一目了然,不会像一些主观的因素那样引起太多争议。HLTV在这条规则中提出了对统计数据的质量要求,即并非所有赛事的数据都会被HLTV考虑。在今年年初的HLTV年度颁奖典礼(https://www.youtube.com/watch?v=M-tM_fVQWq0)上,HLTV的运营主管Professeur提到HLTV在2021年Top 20选手排行榜中参考了27项赛事的数据。经过我的进一步确认,它们如下图所示。

2021年HLTV event filter

所以我们很容易明白为什么HLTV声称“选手在去年下半年的表现的重要性要大于上半年”,因为去年6项重要性最高的金牌赛事中只有IEM卡托维兹是上半年举行的线上赛事,其余5项赛事均为下半年举行的线下赛事(当然这种情况在线下赛事大范围恢复的今年已经不复存在)。而6项银牌赛事无一例外都是线上赛事。去年的铜牌赛事的构成比较有趣:cs_summit 7、Funspark欧洲区总决赛和V4电竞节是独立赛事,而其余5项赛事则是RMR。这与今年的情况不同,因为铜牌赛事是颁发MVP的非大型赛事,而今年的RMR已经成为隶属于Major的预选赛。去年的预选赛和小组赛包括BLAST春季/秋季小组赛/Showdown、IEM卡托维兹/科隆Play-In和Major挑战者组,这些赛事在今年大概率依旧会被纳入HLTV的考量范围。因此我们可以借助去年的结果来推测今年会有哪些赛事进入HLTV event filter,我个人的意见如下图所示。

预测2022年HLTV event filter

首先10项大型赛事是完全确定的,因而剩下3项颁发MVP的非大型赛事——Funspark总决赛、Pinnacle冠军杯和袋鼠杯就是铜牌赛事。第一个争议点出现在金牌赛事上:两届Major和IEM卡托维兹/科隆会毫无悬念地成为金牌赛事,因为自从HLTV提出精英赛事的概念以来它们一直都是精英赛事,在今年稍早的一期HLTV Confirmed播客中,这4项赛事也被称为今年最重大的4项赛事。问题是,BLAST世界总决赛是否会是金牌赛事?HLTV在不久前还质疑OG参赛损害了这项赛事的含金量,不过考虑到往年精英赛事的数量分别是5项、6项和6项,而且BLAST世界总决赛也是今年竞争力最高的赛事之一(你很难在其他赛事看到如此多的冠军战队从揭幕战开始就捉对厮杀),我还是认为BLAST世界总决赛会是金牌赛事,尽管它较小的规模、相对不卓著的名誉和“直邀战队争议”会让它成为重要性相对最低的金牌赛事。

在确定了5项金牌赛事之后,剩余的5项大型赛事就归于银牌赛事一类。它们是否有可能成为金牌赛事?我的意见是几乎不会,因为BLAST春季/秋季总决赛的规模较小且有来自美洲区Showdown的非顶尖战队,IEM达拉斯有一些顶尖战队缺席或未能全员出战,而EPL的赛制导致其充斥了太多小组赛的比赛,因而相对缺乏竞争力。

第二个争议点则是预选赛和小组赛:BLAST春季/秋季小组赛、IEM卡托维兹/科隆Play-In和两届Major的挑战者组自然会被HLTV考虑,但是其他的预选赛和小组赛在赛制上发生了变化。BLAST春季/秋季Showdown在今年分为欧洲区和美洲区,依旧是“鲨鱼塘”的欧洲区Showdown几乎一定会进入HLTV event filter,但美洲区Showdown则不然。春季美洲区Showdown的8支战队中,只有FURIA是当时的HLTV Top 10战队,有6支战队在Top 20开外。而秋季美洲区Showdown的8支战队中,排名最高的Complexity也只有第18名。所以我认为今年的BLAST春季/秋季美洲区Showdown不会被HLTV考虑。最棘手的问题自然是RMR,两届Major欧洲A/B区RMR也几乎一定是HLTV event filter的一部分,但注意到去年美洲区RMR不在HLTV event filter之中,而且今年美洲区RMR的竞争力依旧很弱。例如PGL安特卫普Major美洲区RMR的16支参赛战队中,只有1支是当时的Top 10战队,只有2支Top 20战队,Top 30战队也不过4支,也就是说有3/4的战队在前30名开外。不过我还是认为美洲区RMR被HLTV纳入考量范围的可能性较大,而且无论HLTV是否关注美洲区RMR,也只不过是对美洲区的选手的数据有微小的影响,不会从根本上动摇Top 20选手排行榜。

PGL安特卫普Major美洲区RMR的参赛战队名单

总结一下今年HLTV会考虑哪些赛事的数据:最主要的赛事是两届Major及其预选赛、IEM卡托维兹/科隆及其预选赛、BLAST世界总决赛、BLAST春季/秋季总决赛及其预选赛、两届EPL和IEM达拉斯,此外还有Funspark总决赛、Pinnacle冠军杯和袋鼠杯3项较小的赛事。其余赛事不入HLTV的法眼。

HLTV在规则中提到的big matches是对大型赛事淘汰赛的概念的完善,它是指大型赛事后半段(即交手的2支战队的名次都已经进入前50%)的比赛。所以Major和EPL的big matches就是淘汰赛,IEM卡托维兹/科隆/达拉斯的big matches是淘汰赛加上小组赛的胜者组/败者组决赛。而BLAST春季/秋季/世界总决赛的big matches只有半决赛和总决赛,不包括淘汰赛首轮的比赛。


1.2    个人荣誉

如果你关注往年的排名,你会知道MVP和EVP使选手与众不同。然而,并非所有个人荣誉都一样重要,因为大型赛事(例如Major)的EVP可能比更小的赛事的MVP更有价值。

在这里,HLTV的原文使用的单词是“Awards”,很明显这里的“奖项”指的是MVP和EVP等个人荣誉而非冠军/亚军/季军等团队荣誉。事实上HLTV根本没有提及团队荣誉对选手的排名有任何直接的影响,毕竟这是一份基于个人表现的排行榜。所以认为一位选手的团队成绩不佳会损害他在Top 20选手排行榜上的名次的观点是没有依据的。不过团队荣誉确实会间接地影响选手的名次:一是团队成绩糟糕的选手很难收获个人荣誉,在今年未打进淘汰赛但仍获得赛事EVP的选手只有ZywOo(而且是两次);二是在太多赛事中早早出局会限制选手的样本量,再出色的统计数据也会因为缺乏足够大的样本量而失去意义。

回到个人荣誉,这方面的比较其实比我们下意识里要复杂得多。MVP不见得比EVP更有价值,更多的个人荣誉不见得更有价值。一个最经典的案例就是我多次提及的2021年的NiKo与sh1ro的比较,在此我有必要拿这个宝贵的例子再做一次详细的分析。2021年NiKo的个人荣誉是9个EVP,而sh1ro是3个MVP和11个EVP,但如果你认为sh1ro的个人荣誉更有分量那就大错特错了。为什么?首先,sh1ro比NiKo参加了更多的赛事,收获更多的个人荣誉并不奇怪;其次,sh1ro有2个MVP和2个EVP来自铜牌赛事,而NiKo则有2个EVP来自铜牌赛事,这些个人荣誉对于精英选手而言是无意义的;最后,即使sh1ro的大型赛事个人荣誉仍然比NiKo多3个,他的个人荣誉的质量不及NiKo。HLTV指出了一条看起来有悖于常理的论据——sh1ro在IEM卡托维兹的MVP表现比前3名选手的最佳赛事表现略逊一筹,也就是说即使是金牌赛事的MVP也可能不如某些EVP更有含金量。我相信类似的情况在今年的评选过程中同样会出现,有兴趣的朋友可以关注一下今年有哪些选手的EVP表现并不逊色于哪些选手的MVP表现。

HLTV对sh1ro在2021年的表现的部分负面评价

总结一下个人荣誉的作用:个人荣誉的压倒性数量优势有时可以让一位选手脱颖而出,但在大多数情况下HLTV不仅关注个人荣誉的名次和数量,更关心其质量。或者说HLTV的目光还是聚焦在最本质的内容——选手的表现上。

最后需要补充的一点是,个人荣誉可能是HLTV考虑的因素中最主观的一种,但他仍然与数据紧密相关。理论上一位选手未打进总决赛也可以成为赛事MVP,只是目前还没有发生。我们可以把个人荣誉理解为单项赛事的Top 20选手评比,只不过此时团队成绩的影响会更大,毕竟单项赛事的样本量本身就有限,能否深入赛事的最后阶段对样本量的影响很大。归根结底,满足赛事筛选条件和样本量的保质保量的统计数据永远是重中之重,个人荣誉是相对次要的因素。


1.3    样本量

这是一个“最好中的最好”的排名。为了进入Top 20选手排行榜,选手必须经常在与最好的战队的比赛中展示自己的价值。如果他们没有在一线赛场停留足够长的时间,那么样本量就太小而无法判断(其水准)。

多大的样本量才能满足HLTV的要求?如果非得设定一条底线的话,我之前已经做过总结:最大值的1/3左右是可以接受的最低限度,但稍高于这个值的较小的样本量同样会成为减分项。至于上限自然是多多益善,样本量越大,统计数据就越经得起推敲。


1.4    稳定性

判断选手的一整年表现的因素之一是他们的稳定性,无论是从一场比赛到下一场比赛,还是从一项赛事到下一项赛事。尽管足够高的上限可以弥补稳定性的不足,但偶尔的失常——尤其是在关键时刻和最重大的赛事中——可能会使选手(的排名)下降一个档次。

虽然HLTV一直强调稳定性的重要性,但HLTV对部分选手为了追求更高的上限而牺牲稳定性的行为一直是睁一只眼闭一只眼,甚至有些推崇。不过这并不意味着稳定性不重要,如果要成为精英选手就必须具备相当高的稳定性。此外,HLTV所指的稳定性和我们肉眼观感的稳定性不能一概而论,一个是统计数据,另一个是主观感受。所以一些看起来不稳定的选手有可能在统计意义上很稳定,反之亦然。


1.5    近因偏差

虽然粉丝自然而然地会记住更多近期的情况,但我们在确定排名时会考虑一整年的表现。

这条规则在今年的重要性要高于去年,因为去年下半年确实举行了太多有分量的大型赛事,但今年秋冬赛季与春夏赛季相比赛事数量要少了许多。当你觉得一位选手在近期表现出色或糟糕时,尝试回忆一下10个月前他的表现如何。


1.6    可量化性

Top 20选手排行榜完全基于选手在服务器内可以被量化和记录的贡献,并且不会考虑任何可能影响选手表现的外部因素。

这一点在2021年的评选规则中没有具体写明,但在2017年至2020年的评选规则中以及HLTV年度颁奖典礼上被反复提及。HLTV是冷酷的,不会同情被生理或心理健康问题、变阵磨合、政治局势和签证问题等影响竞技状态或参赛资格的选手。以IGL的问题为例,虽然在实际情况中IGL的个人表现往往会因为发号施令而受到负面影响,但HLTV不会把他们的指挥身份视为加分项。FalleN、gla1ve和Jame成为Top 10选手只是因为他们出色的个人表现,与他们的IGL身份无关。Professeur在HLTV年度颁奖典礼上指出:“IGL的身份确实会影响选手的发挥,但我们不知道这种影响的程度有多大。不同的IGL对战队的贡献也不同,你甚至无法认定一位IGL的指令对战队的作用是正面的还是负面的。”


2    案例分析

空口无凭,以2021年HLTV Top 20选手排行榜为例,我们可以更好地理解上述规则在评选过程中起到了什么作用。去年的Top 20选手的统计数据如上图所示(我先前曾说明这些统计数据是会被HLTV考虑的指标),很容易发现一些指标重要性很高,比如rating、大型赛事rating、精英赛事rating、big matches rating和对阵Top 20/10/5战队rating等。而另一些指标,例如DPR、首杀成功率、每回合道具伤害、每回合闪光弹助攻数和每回合助攻数等,则和选手的名次几乎不相关。

另一个经常被我们忽视的细节是,样本量的重要性可能比我们印象中更高。精英选手(Top 1-7)都具备相当大的样本量,Tier 2的选手(Top 8-12)的样本量也明显大于Tier 3的选手(Top 13-20)。从两个实例能更清楚地体现这一点:首先,在大型赛事、精英赛事和big matches都有出色表现的KSCERATO止步第15名,最直接的原因就是他的样本量太小。HLTV指出他的图池数只有86张,参加赛事数量只有8项,均为榜上最低,他的big matches图池数同样只有18张。此外,统计数据并不突出的huNter-因为大样本量而进入Tier 2。HLTV指出他的179张图池数和82张对阵Top 10战队图池数远超过排名更低的选手。所以,一位选手未能参加单项赛事本身没有过多影响,但如果他在参加的赛事中同样早早出局或者错过了太多赛事,那么他的样本量会相当贫乏,因而成为严重的减分项。

HLTV对2021年Top 1-10选手的评语
HLTV对2021年Top 11-20选手的评语

再来看HLTV为这20位选手给出的评语,我相信这些评语应该能解决大部分人可能存在的困惑。但即便如此,仍然有一些选手的排名有很大的争议。在HLTV年度颁奖典礼上,Professeur和HLTV总编辑Striker解答了部分问题。

Q:为什么ropz的排名比过去下滑了这么多(他是2020年的Top 7选手)?

A:缺乏参与big matches(big matches图池数只有3张,在榜上垫底),所以只能根据预选赛和小组赛的表现来评价他。

Q:你们会关心选手的团队成绩吗?它们有多重要?

A:它们基本上不重要(They basically aren’t valued)。我们只关心选手的个人表现。

Q:为什么eletroNic的排名低于Ax1Le和HObbit?

A:人们可能无法理解为什么我们用这种方式来评价选手,但我们能参考的内容只有数据。看起来2021年下半年有许多线下大型赛事,但实际上一整年的线下赛事只有6项。2021年有长达8个月的线上时期,你不能忽略它们。electroNic在年初的缓慢起步显然没有达到他过去的水准,这是一大减分项。结果是electroNic与Ax1Le的数据实际上已经有不可忽略的差距。electroNic在线下时期的表现无疑是令人印象深刻的,但你不能因此忽视他在线上时期的表现。相反Ax1Le和HObbit在全年都有更稳定的表现,即使在线下时期他们的表现略有下滑。electroNic唯一的优势是更高的上限,在其他方面都处于下风。此外不是每个相邻的位置之间的差距都一样大,Top 5的Ax1Le和Top 7的electroNic的差距要远小于electroNic与Top 8的YEKINDAR的差距。

Q:哪些选手恰好错过了第20名?

A:他们是frozen、TeSeS和mir(按顺序排名)。frozen确实有出色的数据,他没有入选的原因与ropz排名较低的原因相同——缺乏参与big matches。frozen确实在Flashpoint 3获得了MVP,但这只是一届RMR,它没有太多价值。我们绝不能说“啊,这位选手是MVP,所以他的表现比EVP好五倍”。TeSeS的战队多次深入大型赛事淘汰赛,他面对的对手显然比frozen和mir要艰难得多,他的样本量也远大于frozen和mir。但在下半年的精英赛事中,他的表现有所下滑。mir的数据让他看起来甚至是一位Top 10选手,但他在这一年的大多数时候未能深入大型赛事淘汰赛,在IEM卡托维兹之后几乎“消失”了很长时间。此外在我们考虑到可能入选排行榜的选手当中,Spirit的选手对阵的对手的平均战队排名是最低的,所以mir打出1.17的rating并不令人感到意外。

Q:为什么ZywOo是Top 2,NiKo是Top 3?

A:我(Professeur)感到很惊讶有不少人认为NiKo会成为Top 2。NiKo在下半年特别是最后一个季度确实相当闪耀,但人们往往只记住最近发生的事情。总的来说,ZywOo有更稳定的全年表现。NiKo确实在下半年达到了s1mple与ZywOo的平均水准,但当你比较NiKo与两位巨人在上半年的表现时,一切都很清楚了。

Q:为什么NiKo是Top 3,sh1ro是Top 4?

A:如果只关注表象,很容易明白为什么有那么多人看好sh1ro取得更高的名次。许多最基础的因素都有利于sh1ro。

但重点是s1mple、ZywOo和NiKo这样的选手对团队胜利造成大量影响力,三人在获胜回合的数据遥遥领先于其他任何选手,虽然这些数据并未公开,而sh1ro在这方面与Ax1Le和HObbit相当。不仅是获胜回合,总体上NiKo的impact rating都远高于sh1ro。二人在精英赛事rating和对阵Top 5战队rating两方面也有不小的差距。特别值得注意的是精英赛事rating,这很好地说明了NiKo有更高的上限。即使是sh1ro的MVP表现也逊色于NiKo的Major EVP表现,后者无比接近s1mple的MVP表现。在某些时刻,我们甚至会认真地思考这一刻的NiKo和s1mple谁更出色。sh1ro只有20岁,他在新的一年里会非常可怕。如果他在未来的线下大型赛事淘汰赛中也有这样的高光表现,我们自然会将他与s1mple和ZywOo相提并论。此外sh1ro的rating在很大程度上来自他无法被击杀的生存能力,这并非不重要,只是不那么富有影响力。相比之下,NiKo产生的影响更加直白。

另一个HLTV没有回答但非常热门的问题可能是为什么b1t达到了第9名,在此我给出一些个人观点。在我看来2021年的b1t就像是“迷你electroNic”,在基础数据方面并不令人印象深刻,b1t的一些数据甚至在Top 20选手排行榜上垫底。但是b1t有三大优势让他来到Top 9的位置:首先是他作为NAVI的成员有极大的样本量,仅凭这一点,只要他上榜就大概率会来到Tier 2(不低于Top 12);其次是他有丰富的个人荣誉,IEM科隆、PGL斯德哥尔摩Major、BLAST秋季总决赛和BLAST世界总决赛的精英赛事EVP胜过了大多数竞争对手的个人荣誉;最后他在精英赛事展现出的高上限和1.21的精英赛事rating,加之1.11的big matches rating,都与他第9名的位置相称。

我们从b1t的例子可以认识到一点:当我们讨论团队荣誉对选手排名的影响时,实际上真正起作用的不是冠军奖杯,而是深入大型赛事淘汰赛带来的充足的样本量和获得个人荣誉的机会。以今年的G2为例,他们本会因为缺席IEM里约Major而损害精英赛事的样本量,但他们在BLAST世界总决赛走到最后,这极大扩充了他们的样本量,并为他们的明星选手带来个人荣誉。最后我们会发现,G2反而成为今年精英赛事样本量最大的战队之一,big matches的样本量也仅次于FaZe、NAVI和Liquid,他们的选手也因此受益(而非因冠军受益)。类似的事情其实在2019年就发生过,fnatic在这一年没有打进任何一届Major,但他们赢下了精英赛事DreamHack马尔默大师赛的冠军。所以fnatic的选手在精英赛事的数据仍然很有价值,最终KRIMZ和Brollan都入选了这一年的Top 20选手排行榜。由于越来越多的大型赛事出现在CS:GO赛场上,自2016年以降,Major在HLTV的心目中的重要性大不如前,在一整年的十余项大型赛事中缺席一届Major甚至是无关痛痒的。Major确实是名誉最卓著的赛事,但这并不意味着它的竞争力比IEM卡托维兹/科隆或BLAST世界总决赛更高。


88hash stake
88hash stake