“一次被大数据改变的美国大选”带给我们什么启示？

就在美国总统奥巴马成功击败对手罗姆尼、再次赢得美国总统选举的当天，《时代》杂志撰写了一篇文章，描述了奥巴马总统获胜背后的秘密——数据挖掘。以竞选工作组发言人 Ben LaBolt 的话来形容：奥巴马团队拥有“核代码”，数据是能够击败罗姆尼的最根本优势！

的确，美国总统奥巴马的再次当选创造了奇迹：在他获胜前的 70 年时间里，没有一名美国总统能够在全国失业率高于 7.4% 的情况下连任成功；而他与对手罗姆尼的一系列“激战”也让整个竞选过程变得扑朔迷离！我们且不论谁在政治上更英明，但是说到如何获得更多选民支持以及如何让他们掏腰包，奥巴马团队绝对比罗姆尼团队更加聪明：奥巴马与罗姆尼均获得了近 10 亿美金筹款，而其网络筹款是罗姆尼的两倍；奥巴马在整个竞选过程中的花销不到 3 亿美金，而罗姆尼花了近 4 亿美金却仍然败选；奥巴马最终以 332 票赢得选举，高出罗姆尼近一百张投票，而在大选前一周的一项民调中显示，55% 的被调查选民都认为罗姆尼比奥巴马更具有未来视野！

这一串串的数字显然推翻了美国历史上总统选举的定律：谁筹的钱越多谁胜出可能性越大、谁花的钱越多谁就会赢。奥巴马团队能取得颠覆性的胜利，是因为他们做到了三个最根本的目标：让更多的人掏更多的钱，让更多的选民投票给奥巴马，让更多的人参与进来！这些都缘于他们对选民的认知达到了“微观”层面：每个选民最有可能被什么因素说服？每个选民在什么情况下最有可能掏腰包？什么样的广告投放渠道能够最高效获取目标选民？

通过这些分析，奥巴马团队制定了相应的策略，并赢得了大量草根阶层选民的支持和捐赠，一项民调显示， 80% 的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己。结果是，奥巴马团队筹得的第一个 1 亿美金中， 98% 来自于小于 250 美金的小额捐款，而罗姆尼团队在筹得相同数额捐款的情况下，这一比例仅为 31%。

让这一切“微观智能”成为可能的，是数据。正如竞选总指挥吉姆·梅西纳（Jim Messina）所说，在整个竞选活中，没有数据做支撑的假设很少存在。奥巴马团队运用数据挖掘技术在美国政坛政坛上取得的胜利，告诉了我们一个不争的事实：今天，我们已然进入了一个“微竞争”的时代，在激烈的市场竞争中，谁能够深入的了解他的每一个用户的个性化需求，谁就能在竞争中击败对手，获取胜利。

事实上，许多国际商业巨头早已悄悄的实践着“微竞争”：深入了解他们的每一个用户，并为他们提供个性化服务。他们在市场上获得巨大成功的原由，与今天出现在世界各大媒体的美国总统奥巴马获选同出一辙：数据挖掘。

了解用户要什么，你才能知道如何让他们打开钱包

为了筹到 10 亿美金的竞选款，奥巴马的数据挖掘团队在过去两年搜集、存储和分析了大量数据。今年春天晚些时候，他们注意到，影星乔治·克鲁尼（George Clooney）对美国西海岸 40 岁至 49 岁的女性具有非常大的吸引力：她们无疑是最有可能为了在好莱坞与克鲁尼和奥巴马共进晚餐而不惜自掏腰包的一个群体。克鲁尼在自家豪宅举办的筹款宴会上，为奥巴马筹集到数百万美元的竞选资金。

之后，当奥巴马团队决定在东海岸物色一位对于这个女性群体具有相同号召力的影星时，数据团队发现莎拉·杰西卡·帕克（Sarah Jessica Parker，《欲望都市》的女主角）的粉丝们也同样喜欢竞赛、小型宴会和名人，于是，一个与奥巴马共进晚餐的“竞争”便诞生了，那就是争夺在杰西卡·帕克的纽约 West Village 豪宅美餐的机会。“克鲁尼效应”被成功的复制到了东海岸。

通过对粉丝们的信息分析，奥巴马团队成功的满足了她们与钟爱的明星共进晚餐的愿望，也成功的让她们争先的打开钱包。同样，聪明的商家通过用户的购买历史记录分析来建立模型，为他们量身预测未来的购物清单，进而设计促销活动和个性服务，让他们源源不断的为之买单。

事情发生在今年初，一名男子闯入了他家附近的 Target 店铺（Target 是一家美国零售连锁超市）：“你们怎么能这样！”男人向店铺经理大吼到，“你们竟然给我 17 岁的女儿发婴儿尿片和童车的优惠券，她才 17 岁啊！”店铺经理不知道发生了什么，立刻向来者道歉，表明那肯定是个误会。然而，经理并没有意识到，公司正在运行一套数据挖掘系统。

一个月后，这个愤怒的父亲打来电话道歉，因为 Target 发来的婴儿用品促销广告并不是误发，他的女儿的确怀孕了。事实上，Target 创建了一套女性购买行为在怀孕期间产生变化的模型，不仅如此，如果用户从他们的店铺中购买了婴儿用品，Target 在接下来的几年中会根据婴儿的生长周期情况定期给这些顾客推送相关产品，使这些客户形成长期的购买习惯。

了解用户的行为，你可以花最少的钱办最大的事

在整个的竞选中，奥巴马团队的广告费用花了不到 3 亿美金，而罗姆尼团队则花了近 4 亿美金却落败，这是因为奥巴马的数据团队对于广告购买的决策，是经过缜密的数据分析之后才制定的。一名官员表示：“我们可以通过复杂的建模来找到目标选民。例如，如果迈阿密戴德郡的 35 岁以下女性是我们的目标，那么这里有如何覆盖她们的方式。”因此，奥巴马竞选团队在一些非传统节目中购买了广告，例如 4 月 23 日的电视剧《混乱之子》、《行尸走肉》和《23 号公寓的坏女孩》。芝加哥总部称，在电视平台上，2012 年的广告购买效率较 2008 年提升了 14%。

而在商业上，以数据分析为支撑的决策，也让商家获得了不少好处，Tesco 就是一个例子。作为全球利润第二大的零售商（仅次于沃尔玛），这家英国超级市场巨人从用户行为分析中获得了巨大的利益。从其会员卡的用户购买记录中，Tesco 可以了解一个用户是什么“类别”的客人，如速食者、单身、有上学孩子的家庭等等。这样的分类可以帮助 Tesco 设计个性化的服务，比如，通过邮件或信件寄给用户的促销可以变得十分个性化，店内的上架商品及促销也可以根据周围人群的喜好、消费的时段来更加有针对性，从而提高货品的流通。这样的做法为 Tesco 获得了丰厚的回报，仅在市场宣传一项，就能帮助 Tesco 每年节省 3.5 亿英镑的费用。

与用户进行个性化互动，赢得更多青睐

在本次竞选中，奥巴马团队的投票动员绝不是千篇一律的，对于不同的用户，他们动员的渠道及采取的互动方式都因人而异。今年 8 月，奥巴马决定在社交新闻网站 Reddit 上回答问题，当时多名总统高级助理并不清楚此事。一名官员表示：“我们为何将奥巴马放在 Reddit 上？因为我们发现很大一部分目标选民在 Reddit 上。”而在“摇摆州”的电话动员上，他们也发现，一个摇摆州志愿者打来的电话的效果要优于一个从非摇摆州（如加州）志愿者打来的电话。

此外，奥巴马团队还首次利用 Facebook 进行大规模的投票动员，这模仿了现场组织者挨家挨户敲门的方式。在竞选活动的最后几周，下载某一款应用的用户收到了多条消息，其中包含他们在“摇摆州”好友的照片。他们被告知，可以通过点击按钮，呼吁这些目标选民采取行动，例如进行投票注册、更早地投票，以及参与到投票中。奥巴马竞选团队发现，大约 1/5 收到 Facebook 请求的选民做出了响应，这在很大程度上是因为请求来自他们熟悉的人。

在零售业上，巨头沃尔玛也同样的重视与它的用户进行个性化互动。去年底，沃尔玛在 Facebook 上发布了一个名叫 ShoppyCat 的应用，这个应用的功能是帮助用户解除为朋友挑选生日礼物的烦恼。当用户将 ShoppyCat 加入她 / 他的 Facebook 中时，应用程序将访问这个用户所有朋友的信息，如用户信息、行为、状态、Likes、关系圈等等，通过对这些信息的分析挖掘，为每一个朋友的生日都推荐相应的礼物。

今天，许多企业的领导者或许都已经或多或少的看到了数据挖掘能够带来的价值；然而，在实践的应用当中，却只有极少数的企业朝向“数据掘金”工程迈开步伐。的确，数据挖掘技术给人们带来了一定的挑战，甚至有一些神秘：那些复杂的算法和代码实现，确实不像那些重视用户体验的 Apps 一样无需学习成本。而在实践过程中，90% 的数据挖掘技术和数学模型都并不神秘，甚至在很大程度上，都需要大量重复性的工作；但是，只有当这些技术和模型与每一个具体的业务实践相结合时，才能发挥它们的智慧。

因此，任何数据挖掘工作的执行，都需要做好三方面的准备：

首先，收集和整理数据是一个枯燥冗长的过程。奥巴马数据团队在竞选前两年就开始收集大量的信息，而他们做的第一件事情就是将民主党所有各自独立零散的选民数据库汇总在一起。同样，当企业的数据分散在各地的服务器、各种文件、各种数据库中时，将这些数据进行有效的集中存储和格式清理是根基；
其次，做到“精准”是一个与业务定制的过程，没有“一键安装式”的灵丹妙药。机器学习是数据挖掘中常用的方法，它的基本原理是让计算机从历史数据中“学习”其中的规律，并利用该规律对未来数据进行预测，这个过程也就是建模和预测的过程。因此，当用户数据因业务而异时，每一组数据中都会有自己独特的数据模型，这也就是与实际业务相定制的过程。比如，奥巴马的数据团队就会对每一个群体的选民都进行建模，进而预测他们的捐款行为方式（通过网络捐款，还是会汇款）。
另外，模型需要根据实际情况进行动态调整。用户因环境、喜好或其他因素常常会导致其行为规律发生一定的变化，使得其产生的数据也随之变化，这些变化将会影响模型的精准性，因而，我们需要随时动态的去调整模型。在奥巴马竞选的案例中，我们看到，在关键的“摇摆州”俄亥俄州，数据分析团队获得了约 2.9 万人的投票倾向数据。这是一个包含 1% 选民的巨大样本，使他们可以准确了解每一类人群和每一个地区选民在任何时刻的态度。当第一次电视辩论结束后，选民的投票倾向发生改变。而数据分析团队可以立即知道什么样的选民改变了态度，什么样的选民仍坚持原来的投票选择。

如今，我们正处于一个海量信息时代，当大量的数据从互联网、移动设备、等各个源头中产生，并以每年 50% 的速度增长时，它们早已悄悄为你建造了一座 21 世纪的数据金矿，等待着为你在“微竞争”中获胜而效力。你准备好用它们来击败你的罗姆尼了吗？

题图由爱范儿修改自 deviantart