从央视到谷歌：聊一聊竞价广告的机制设计

关于竞价广告，很多人有两个极端的看法——第一观点会认为竞价广告非常简单，不就是央视每年黄金广告位招标么，谁出价高广告位给谁；

第二个极端会认为竞价广告过于复杂，涉及到到博弈论、机制设计、拍卖理论、CTR 预估等普通人根本弄不明白高深理论，因此很多人对此望而却步………

然而真相到底是神马？哪一个观点是对的？一直致力于用简单语言剖析互联网商业底层逻辑的卫夕会告诉你：

真相就像《小马过河》的结局一样：河水既不像黄牛说的那么浅，也不像松鼠说的那么深——竞价广告的基本逻辑当然会涉及到很多复杂理论，但看完这篇文章大部分人可以轻松理解其核心原理的来龙去脉。

从央视标王到谷歌的竞价广告系统

关于竞价广告，很多人认为百度是国内推出第一个竞价广告的公司，事实上，从更广泛的意义上，央视的黄金广告竞标更早地向大家普及了 “竞价广告” 这个概念，早在 1994 年，央视就开始了以竞价的方式拍卖广告位，诞生了秦池、爱多 VCD 等知名标王。

一个典型的拍卖场景是这样的——拍卖师先标明广告位，同时表明底价，然后开始等待竞价者向上竞价，“100 万！”、“120 万！”、“200 万！”，“200 万一次，200 万两次，成交！”

这样的场景我们在众多影视作品中再熟悉不过，然而并非所有的拍卖都是以这种方式进行，这仅仅是众多拍卖机制中的一种，这种不断提升价格的拍卖方式被称之为 “英国式拍卖”。

和英国式拍卖类似，还有荷兰式拍卖，荷兰式拍卖的形式正好相反，拍卖师先出一个非常高的价格，然后不断往下试探，直到有竞拍者愿意接受这个成交价格。

那么问题来了——传统的广告可以通过这种方式竞价，那么在线的广告是不是也可以用同样的方法进行竞价呢？答案是否定的，原因在于在线广告的拍卖与传统广告拍卖有几点重要的区别，而这些区别会对竞价机制的设计产生重要影响——

第一，不管是英国式拍卖还是荷兰式拍卖，每个人的出价都是公开的，而在线广告主可能很多并不愿意公开自己的出价，因此公开竞价就变得不适合。

第二，央视的拍卖是单次行为，而在线广告是多次重复博弈，即这个广告位被抢了，广告主还可以抢下个广告位，广告主可以不断调整自己的出价。

第三，在线广告存在多个标的物（每一次广告请求可能都是多个竞价标的物）、海量实时计算的特征。

那么在线广告应该采取什么样的竞价机制呢？其实有很多选择，我们一个个来看：

第一个可能的选项是 “密封第一价格” 竞价，这其实也是我们熟悉的一种竞价方式，很多工程招标都采取这种方式，它的机制是每个竞价者不公布自己的出价，把它密封在信封里交给卖主，拍卖主让最高出价者赢得竞拍，并且支付最高出价者的出价。

有人说，这种方式看起来很完美啊，符合广告主不公开报价的需求，而且也被很多实践证明过，然而这种竞价方式广告主的出价策略取决于别人怎么出，反而和自己的真实估值关系不大，而这应用到在线广告拍卖就会存在问题。

在线广告一个特征就是重复博弈，神马意思呢？比如线下的工程招标是一次性的，竞拍者会更加倾向于谨慎对待自己的出价，因为他只有一次机会，然而在线广告是多次的，即广告主有多次机会不断试探别人的出价，从而实现自己的最优策略。

我举一个例子——谷歌的关键词 “跑步” 下面的广告位，耐克认为一次点击值 10 块钱，阿迪认为值 6 块钱，这时候如果他们采取 “密封第一价格” 拍卖，而谷歌广告系统给出的底价是 2 块，那么阿迪和耐克都会试探着出价。

阿迪从 2 块开始出，耐克出 2.1，阿迪出 2.2，耐克出 2.3，双方有一个不断加价的过程，一直加到 6 块的时候，阿迪停止出价了，因为它认为这个广告为最多值 6 块，阿迪退出了。

这时候只剩耐克了，耐克也不傻，既然没人和我竞争，那么我为啥要出 6 块呢，于是赶紧调到 2 块，这时候阿迪又会进场，周而复始的循环开始了。

细心的你会看到这种方式有一个明显的缺陷——不稳定，背后的根源在于这种拍卖方式从博弈论的角度不存在纳什均衡（这一点已被经济学家从数学的角度证明），即它永远存在一个你追我赶的状态，原因是这种拍卖方式出价取决于对手的出价。

同时从更深层次上，这种机制在重复博弈的机制下至少有两个缺陷：

第一，不符合帕累托最优，即一个好的拍卖机制应该是把标的物卖给对它估值最高的竞价者，在这个案例中，评价最高的是耐克，然而有一半的几率被阿迪所抢走了。

第二，它也不符合卖方利益的最大化，耐克阿迪评价都远超 2 块，但出价却从 2 块开始出。

由此可以看出这种竞价方式用在在线广告拍卖上不合理，那么有木有一种更好的竞价方式呢，答案是有！接下我们就一起来看一看：

获得诺贝尔奖的一次改动

经济学家威廉 · 维克里试图解决这个问题，他在 1961 年发表的《反投机、拍卖与竞争性密封投标》，这篇经典论文中系统性地论述了 “第二密封价格” 的拍卖方式。

▲ 威廉 · 维克里左一

它对 “第一密封价格” 做了一个小的改动，具体为——竞价者依然密封出价，依然是出价最高者赢得拍卖，但是胜出者只需要支付第二名出价的钱，即如果耐克出价 10 块，阿迪出价 6 块，依然是耐克胜出，但耐克只需要支付第二名阿迪的出价——6 块。

这是一个违反直觉的小小改动——第一名居然只需要支付第二名的出价，然而不要小看这个小小的改动，正是因为系统地论述了这个改动，让威廉 · 维克里获得了 1996 年的诺贝尔经济学奖，“密封第二价格” 拍卖在经济学里也因此被称之为 “维克里拍卖”，那么这个神奇的小改动到底隐藏着神马秘密呢？

答案是它正好系统地解决了 “第一密封价格” 存在的重大缺陷。有人立马会问：为什么这样改一下就能克服这个缺陷呢？

简单地说，在 “密封第二价格” 的竞价机制中，每个人都存在一个固定的最优策略——出价等于自己的估值，还是以上的价格策略，耐克估值为 10 块，阿迪的出价多少不知道，这时候耐克的最优策略是神马？答案是 10 块。为什么？

我们考虑两个种情况：

第一，阿迪出价如果超过 10 块，那么耐克无论如何也赢不了，因为耐克不可能出价高于自己的估值，高过自己就亏了。

第二，阿迪低于 10 块，那么耐克应该出到自己能出到的最大价格以增加自己的获胜概率，而这个最大价值就是 10 块，即耐克没有下调出价的动力，因为它没有最终支付价格的控制力。

神马意思？假如耐克出 8 块，这时候如果阿迪出 6 块，耐克赢得竞拍而且只需要支付 6 块，和它出 10 块没有区别，但如果阿迪出 9 块它就会失去竞价，因此耐克没有动力把出价调到 8 块这种有可能导致竞价失败的出价，唯一的最优策略就是出价 10 块。

用博弈论的话说，“密封第二价格” 存在一个唯一的纳什均衡，即每个人都出自己对于商品的真实估值是最优策略，因此该机制是一个鼓励竞拍者讲真话的机制，同时具有相当的稳定性，即广告主没有频繁调整自己出价的动力。

在这种机制下，永远是对广告位评价最高的广告主胜出，同时保证了平台的收入，没有广告主出价比自己评价更低的出价。事实上，谷歌、百度、新浪微博等广告平台都是采取这种竞价方式。

好，有人会说，这种竞价方式就是完美的竞价方式吗？其实不一定，“密封第二竞价” 机制至少存在一个缺陷，那就是它的反作弊特性不强，假如存在互相勾结的同谋，在这种竞价机制下，同谋更加容易实现。神马意思？

依然拿耐克阿迪来打比喻，耐克的心理出价是 10 块，阿迪是 6 块，这时候他们勾结，阿迪出 1 块，耐克出 10 块，最终耐克只需要花 1 块钱就能买走这个广告位，受伤的是广告平台。聪明的人立马会说——难道 “第一密封价格” 不会出现这种情况吗？比如耐克和阿迪商量好，耐克出 1 块，阿迪出 0.5 元，还是耐克以 1 块钱的价格买走这个广告位啊！

哈哈，这么说也没错，但 “第一密封价格” 更容易出现背叛同谋的情况，尽管商量好耐克出 1 块，阿迪出 0.5 毛，但阿迪是有动力去违反同谋的，只要阿迪出 2 块，它就能赢得拍卖，这时候耐克就傻眼了。

但在 “第二密封价格” 的情况下，耐克出 10 块，阿迪出 1 块，这个同盟的就非常有力，因为阿迪无论如何背叛，它也不可能赢得拍卖（它的出价不可能超过 6 块），因此它没有背叛的动力，因此同谋就更容易达成，作弊的概率就会变大。

好，既然有这个缺陷，那么现在在线广告谷歌、百度为什么还要使用它呢？一个重要的原因是，不同于线下的单一拍卖，在线广告是大规模重复博弈，大规模意味着参与竞价的广告主数量众多，客观上增加了勾结作弊的难度，从某种意义上掩盖了这种机制的缺陷。

VCG，一种多广告位的拍卖机制

以上我们讨论了竞价机制的基本原理，所有的例子都是一个广告位的情况，而在现实的广告系统中，一次请求的广告为往往是多个，比如搜索引擎就有多个广告位，我们应该如何设置竞价机制呢？

谷歌、百度就把 “密封第二价格” 拍卖进行了一个扩展，即如果有多个广告位，第一名按第二名加一个最小竞价单位扣费（如 0.01 元）、第二名按第三名扣费，第三按第四名扣费，以此类推，这种竞价方式被称作为 “广义第二价格拍卖”（Generalized Second Price auction），简称 GSP。

▲ GSP 广义第二价格拍卖

这种方式最大限度地保留了 “密封第二价格” 的优势，即它能形成稳定的均衡，但它也有一个缺点，它并非全体竞价者福利最大化的竞价方式。

于是，三位经济学家 Vickrey、Clarke、Groves 分别在三篇论文中提出了一个多物品的拍卖机制，简称 “VCG 拍卖”，这种复杂的竞价机制从整个竞价者的整体利益出发，它依然是价高者得，但扣费却是计算价高者参与给其他竞拍者带来的总损失，即先算出没有价高者参与时的总福利，然后算价高者参与之后的其他人的总福利，这个福利之差就是其他参与者的损失。

简而言之，你参与竞价，你因此给其他竞价者造成了损失，你需要为这个系统的整体福利的减小而付出成本，以保证整体福利的最大化。

这个竞价方式计算起来相对复杂，我用一个简单的例子来阐述——假如现在有两个广告位，即搜索 “跑步” 这个关键词的第一位和第二位，第一位能带来 20 个点击，第二位能带来 10 个点击。

有三个广告主来竞价，分别是耐克每点击付 6 块、阿迪的 4 块和锐步的 2 块。按照价高者得的原则，耐克赢得第一个广告位，阿迪赢得第二个广告位，锐步竞价失败。

这时候问题来了：应该扣耐克多少钱？按照 VCG 竞价法则：

先算出没有耐克参与竞价时候阿迪和锐步的收益，即阿迪赢得第一个广告位，锐步赢得第二个广告位，收益为 420+102=100。
然后算出有耐克参与竞价阿迪和锐步的收益，即阿迪赢得第二个广告位，锐步出局，收益为 410+20=40。
二者福利之差为 100-40=60。
那么耐克应该为每个点击付的钱为 60/20=3 块。

Facebook 广告系统采取的就是这种竞价方式，这种竞价方式最大化了竞价参与者的福利，但我们可以看到，拍卖方的利益并非是最大化的，上面的案例中耐克的扣费 3 块比 GSP 竞价规则下按第二位收取的 4 块要少，可以说，Facebook 是牺牲了短期利益，从更长远的角度进行考虑，因为竞价广告不是一个短期的行为，Facebook 相信保证广告主的总体利益而言符合自己的长远利益。

那么谷歌为什么不也采取同样的 VCG 竞价方式呢，一方面是因为尽管 VCG 可以最大化竞价者福利，但它非常难向广告主解释，会面临极大的教育成本；谷歌首席经济学家 Hal Varian 曾经就明确表示谷歌在 2002 年不愿意从 GSP 转到 VCG 其中一个原因就是用户教育成本太高。

另一方面也因为从 GSP 直接转向 VCG 会面临收入下滑的风险，经济学家们已经证明 VCG 的收入不会比 GSP 高。

这篇文章主要介绍了竞价广告机制设计中的来龙去脉，事实上，竞价机制选择只是竞价广告中的一个小的方面，关于竞价广告的其他方面，我会在后续的其他文章中陆续向大家介绍。

大家应该也注意到了，卫夕的文章一直致力于不仅仅告诉你 “是什么”，更重要的是告诉你 “为什么”，知识本身很重要，表达知识的方式也很重要，关注 “卫夕聊广告”，更轻松地理解互联网商业的底层逻辑。

题图来源：视觉中国