从央视到谷歌:聊一聊竞价广告的机制设计

公司

2018-07-05 19:30

关于竞价广告,很多人有两个极端的看法——第一观点会认为竞价广告非常简单,不就是央视每年黄金广告位招标么,谁出价高广告位给谁;

第二个极端会认为竞价广告过于复杂,涉及到到博弈论、机制设计、拍卖理论、CTR 预估等普通人根本弄不明白高深理论,因此很多人对此望而却步………

然而真相到底是神马?哪一个观点是对的?一直致力于用简单语言剖析互联网商业底层逻辑的卫夕会告诉你:

真相就像《小马过河》的结局一样:河水既不像黄牛说的那么浅,也不像松鼠说的那么深——竞价广告的基本逻辑当然会涉及到很多复杂理论,但看完这篇文章大部分人可以轻松理解其核心原理的来龙去脉。

从央视标王到谷歌的竞价广告系统

关于竞价广告,很多人认为百度是国内推出第一个竞价广告的公司,事实上,从更广泛的意义上,央视的黄金广告竞标更早地向大家普及了 “竞价广告” 这个概念,早在 1994 年,央视就开始了以竞价的方式拍卖广告位,诞生了秦池、爱多 VCD 等知名标王。

一个典型的拍卖场景是这样的——拍卖师先标明广告位,同时表明底价,然后开始等待竞价者向上竞价,“100 万!”、“120 万!”、“200 万!”,“200 万一次,200 万两次,成交!”

这样的场景我们在众多影视作品中再熟悉不过,然而并非所有的拍卖都是以这种方式进行,这仅仅是众多拍卖机制中的一种,这种不断提升价格的拍卖方式被称之为 “英国式拍卖”。

和英国式拍卖类似,还有荷兰式拍卖,荷兰式拍卖的形式正好相反,拍卖师先出一个非常高的价格,然后不断往下试探,直到有竞拍者愿意接受这个成交价格。

那么问题来了——传统的广告可以通过这种方式竞价,那么在线的广告是不是也可以用同样的方法进行竞价呢?答案是否定的,原因在于在线广告的拍卖与传统广告拍卖有几点重要的区别,而这些区别会对竞价机制的设计产生重要影响——

第一,不管是英国式拍卖还是荷兰式拍卖,每个人的出价都是公开的,而在线广告主可能很多并不愿意公开自己的出价,因此公开竞价就变得不适合。

第二,央视的拍卖是单次行为,而在线广告是多次重复博弈,即这个广告位被抢了,广告主还可以抢下个广告位,广告主可以不断调整自己的出价。

第三,在线广告存在多个标的物(每一次广告请求可能都是多个竞价标的物)、海量实时计算的特征。

那么在线广告应该采取什么样的竞价机制呢?其实有很多选择,我们一个个来看:

第一个可能的选项是 “密封第一价格” 竞价,这其实也是我们熟悉的一种竞价方式,很多工程招标都采取这种方式,它的机制是每个竞价者不公布自己的出价,把它密封在信封里交给卖主,拍卖主让最高出价者赢得竞拍,并且支付最高出价者的出价。

有人说,这种方式看起来很完美啊,符合广告主不公开报价的需求,而且也被很多实践证明过,然而这种竞价方式广告主的出价策略取决于别人怎么出,反而和自己的真实估值关系不大,而这应用到在线广告拍卖就会存在问题。

在线广告一个特征就是重复博弈,神马意思呢?比如线下的工程招标是一次性的,竞拍者会更加倾向于谨慎对待自己的出价,因为他只有一次机会,然而在线广告是多次的,即广告主有多次机会不断试探别人的出价,从而实现自己的最优策略。

我举一个例子——谷歌的关键词 “跑步” 下面的广告位,耐克认为一次点击值 10 块钱,阿迪认为值 6 块钱,这时候如果他们采取 “密封第一价格” 拍卖,而谷歌广告系统给出的底价是 2 块,那么阿迪和耐克都会试探着出价。

阿迪从 2 块开始出,耐克出 2.1,阿迪出 2.2,耐克出 2.3,双方有一个不断加价的过程,一直加到 6 块的时候,阿迪停止出价了,因为它认为这个广告为最多值 6 块,阿迪退出了。

这时候只剩耐克了,耐克也不傻,既然没人和我竞争,那么我为啥要出 6 块呢,于是赶紧调到 2 块,这时候阿迪又会进场,周而复始的循环开始了。

细心的你会看到这种方式有一个明显的缺陷——不稳定,背后的根源在于这种拍卖方式从博弈论的角度不存在纳什均衡(这一点已被经济学家从数学的角度证明),即它永远存在一个你追我赶的状态,原因是这种拍卖方式出价取决于对手的出价。

同时从更深层次上,这种机制在重复博弈的机制下至少有两个缺陷:

第一,不符合帕累托最优,即一个好的拍卖机制应该是把标的物卖给对它估值最高的竞价者,在这个案例中,评价最高的是耐克,然而有一半的几率被阿迪所抢走了。

第二,它也不符合卖方利益的最大化,耐克阿迪评价都远超 2 块,但出价却从 2 块开始出。

由此可以看出这种竞价方式用在在线广告拍卖上不合理,那么有木有一种更好的竞价方式呢,答案是有!接下我们就一起来看一看:

获得诺贝尔奖的一次改动

经济学家威廉 · 维克里试图解决这个问题,他在 1961 年发表的《反投机、拍卖与竞争性密封投标》,这篇经典论文中系统性地论述了 “第二密封价格” 的拍卖方式。

▲ 威廉 · 维克里左一

它对 “第一密封价格” 做了一个小的改动,具体为——竞价者依然密封出价,依然是出价最高者赢得拍卖,但是胜出者只需要支付第二名出价的钱,即如果耐克出价 10 块,阿迪出价 6 块,依然是耐克胜出,但耐克只需要支付第二名阿迪的出价——6 块。

这是一个违反直觉的小小改动——第一名居然只需要支付第二名的出价,然而不要小看这个小小的改动,正是因为系统地论述了这个改动,让威廉 · 维克里获得了 1996 年的诺贝尔经济学奖,“密封第二价格” 拍卖在经济学里也因此被称之为 “维克里拍卖”,那么这个神奇的小改动到底隐藏着神马秘密呢?

答案是它正好系统地解决了 “第一密封价格” 存在的重大缺陷。有人立马会问:为什么这样改一下就能克服这个缺陷呢?

简单地说,在 “密封第二价格” 的竞价机制中,每个人都存在一个固定的最优策略——出价等于自己的估值,还是以上的价格策略,耐克估值为 10 块,阿迪的出价多少不知道,这时候耐克的最优策略是神马?答案是 10 块。为什么?

我们考虑两个种情况:

第一,阿迪出价如果超过 10 块,那么耐克无论如何也赢不了,因为耐克不可能出价高于自己的估值,高过自己就亏了。

第二,阿迪低于 10 块,那么耐克应该出到自己能出到的最大价格以增加自己的获胜概率,而这个最大价值就是 10 块,即耐克没有下调出价的动力,因为它没有最终支付价格的控制力。

神马意思?假如耐克出 8 块,这时候如果阿迪出 6 块,耐克赢得竞拍而且只需要支付 6 块,和它出 10 块没有区别,但如果阿迪出 9 块它就会失去竞价,因此耐克没有动力把出价调到 8 块这种有可能导致竞价失败的出价,唯一的最优策略就是出价 10 块。

用博弈论的话说,“密封第二价格” 存在一个唯一的纳什均衡,即每个人都出自己对于商品的真实估值是最优策略,因此该机制是一个鼓励竞拍者讲真话的机制,同时具有相当的稳定性,即广告主没有频繁调整自己出价的动力。

在这种机制下,永远是对广告位评价最高的广告主胜出,同时保证了平台的收入,没有广告主出价比自己评价更低的出价。事实上,谷歌、百度、新浪微博等广告平台都是采取这种竞价方式。

好,有人会说,这种竞价方式就是完美的竞价方式吗?其实不一定,“密封第二竞价” 机制至少存在一个缺陷,那就是它的反作弊特性不强,假如存在互相勾结的同谋,在这种竞价机制下,同谋更加容易实现。神马意思?

依然拿耐克阿迪来打比喻,耐克的心理出价是 10 块,阿迪是 6 块,这时候他们勾结,阿迪出 1 块,耐克出 10 块,最终耐克只需要花 1 块钱就能买走这个广告位,受伤的是广告平台。聪明的人立马会说——难道 “第一密封价格” 不会出现这种情况吗?比如耐克和阿迪商量好,耐克出 1 块,阿迪出 0.5 元,还是耐克以 1 块钱的价格买走这个广告位啊!

哈哈,这么说也没错,但 “第一密封价格” 更容易出现背叛同谋的情况,尽管商量好耐克出 1 块,阿迪出 0.5 毛,但阿迪是有动力去违反同谋的,只要阿迪出 2 块,它就能赢得拍卖,这时候耐克就傻眼了。

但在 “第二密封价格” 的情况下,耐克出 10 块,阿迪出 1 块,这个同盟的就非常有力,因为阿迪无论如何背叛,它也不可能赢得拍卖(它的出价不可能超过 6 块),因此它没有背叛的动力,因此同谋就更容易达成,作弊的概率就会变大。

好,既然有这个缺陷,那么现在在线广告谷歌、百度为什么还要使用它呢?一个重要的原因是,不同于线下的单一拍卖,在线广告是大规模重复博弈,大规模意味着参与竞价的广告主数量众多,客观上增加了勾结作弊的难度,从某种意义上掩盖了这种机制的缺陷。

VCG,一种多广告位的拍卖机制

以上我们讨论了竞价机制的基本原理,所有的例子都是一个广告位的情况,而在现实的广告系统中,一次请求的广告为往往是多个,比如搜索引擎就有多个广告位,我们应该如何设置竞价机制呢?

谷歌、百度就把 “密封第二价格” 拍卖进行了一个扩展,即如果有多个广告位,第一名按第二名加一个最小竞价单位扣费(如 0.01 元)、第二名按第三名扣费,第三按第四名扣费,以此类推,这种竞价方式被称作为 “广义第二价格拍卖”(Generalized Second Price auction),简称 GSP。

▲ GSP 广义第二价格拍卖

这种方式最大限度地保留了 “密封第二价格” 的优势,即它能形成稳定的均衡,但它也有一个缺点,它并非全体竞价者福利最大化的竞价方式。

于是,三位经济学家 Vickrey、Clarke、Groves 分别在三篇论文中提出了一个多物品的拍卖机制,简称 “VCG 拍卖”,这种复杂的竞价机制从整个竞价者的整体利益出发,它依然是价高者得,但扣费却是计算价高者参与给其他竞拍者带来的总损失,即先算出没有价高者参与时的总福利,然后算价高者参与之后的其他人的总福利,这个福利之差就是其他参与者的损失。

简而言之,你参与竞价,你因此给其他竞价者造成了损失,你需要为这个系统的整体福利的减小而付出成本,以保证整体福利的最大化。

这个竞价方式计算起来相对复杂,我用一个简单的例子来阐述——假如现在有两个广告位,即搜索 “跑步” 这个关键词的第一位和第二位,第一位能带来 20 个点击,第二位能带来 10 个点击。

有三个广告主来竞价,分别是耐克每点击付 6 块、阿迪的 4 块和锐步的 2 块。按照价高者得的原则,耐克赢得第一个广告位,阿迪赢得第二个广告位,锐步竞价失败。

这时候问题来了:应该扣耐克多少钱?按照 VCG 竞价法则:

  • 先算出没有耐克参与竞价时候阿迪和锐步的收益,即阿迪赢得第一个广告位,锐步赢得第二个广告位,收益为 420+102=100。
  • 然后算出有耐克参与竞价阿迪和锐步的收益,即阿迪赢得第二个广告位,锐步出局,收益为 410+20=40。
  • 二者福利之差为 100-40=60。
  • 那么耐克应该为每个点击付的钱为 60/20=3 块。

Facebook 广告系统采取的就是这种竞价方式,这种竞价方式最大化了竞价参与者的福利,但我们可以看到,拍卖方的利益并非是最大化的,上面的案例中耐克的扣费 3 块比 GSP 竞价规则下按第二位收取的 4 块要少,可以说,Facebook 是牺牲了短期利益,从更长远的角度进行考虑,因为竞价广告不是一个短期的行为,Facebook 相信保证广告主的总体利益而言符合自己的长远利益。

那么谷歌为什么不也采取同样的 VCG 竞价方式呢,一方面是因为尽管 VCG 可以最大化竞价者福利,但它非常难向广告主解释,会面临极大的教育成本;谷歌首席经济学家 Hal Varian 曾经就明确表示谷歌在 2002 年不愿意从 GSP 转到 VCG 其中一个原因就是用户教育成本太高。

另一方面也因为从 GSP 直接转向 VCG 会面临收入下滑的风险,经济学家们已经证明 VCG 的收入不会比 GSP 高。

这篇文章主要介绍了竞价广告机制设计中的来龙去脉,事实上,竞价机制选择只是竞价广告中的一个小的方面,关于竞价广告的其他方面,我会在后续的其他文章中陆续向大家介绍。

大家应该也注意到了,卫夕的文章一直致力于不仅仅告诉你 “是什么”,更重要的是告诉你 “为什么”,知识本身很重要,表达知识的方式也很重要,关注 “卫夕聊广告”,更轻松地理解互联网商业的底层逻辑。

题图来源:视觉中国

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

“卫夕聊广告,不止聊广告”,每周一篇长文深度剖析互联网及广告相关的重要话题。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容