Twitter 不止娱乐,也能造福健康事业
通常情况下,看一个人是否患心脏病,医生的判断标准是饮食、肥胖、吸烟等等。而在判定各地区心脏病分布状况时,传统机构数据也会考虑诸多元素。此前,美国宾夕法尼亚大学对此做了一项创新研究,通过 Twitter 用户关键词分析来判定心脏病各地分布状况,并收获了不错成效。
1 月 20 日《心理科学》杂志发表了这项研究数据:在 Twitter 内容中消极情绪词汇出现频率高的地区,心脏病罹患率更高;而积极情绪词汇出现频率高的地区,则罹患率更低。这项结论与美国疾病控制与预防中心(CDC)做的心脏病调查分析结果相近。
研究人员挑选了 2009 年 6 月至 2010 年 3 月期间年龄 31 岁的 Twitter 用户进行分析,这些用户分布在美国 1300 多个郡县,他们在此期间发布了大约 1.46 亿条带位置信息的推文。通过对推文进行关键词搜罗,再根据情绪状况词汇及其出现频率评级分类,从而得出对应结论。
在这项研究中,某地区对工作、健康和个人魅力表现出消极情绪的词汇出现频率高,则会被列入心脏病高发地区,而像 opportunities、overcome 以及 weekend 等词汇居多的地区则会被列入低发地区。这项研究表明,人们不光能了解到各地心脏病罹患率,更有益的是据此可以做出有效的疾病预测方案。
该研究作者认为比起个体研究而言,社区性综合心理特征研究更有益于整体疾病风险管控,能帮到更多人。该报告合著人 Margaret Kern 表示,“消极情绪会触发社会反应,你可能会因此而酗酒、绝食或者自闭,这些都可能引起心脏病。”
分析 Twitter 得来的数据,反而比传统方法来的更精确,这也让人看到大数据分析的优势。该团队目前仍在深化研究,打算建立一整套基于用户词汇信息分析的模型。这是对互联网的利用,不难想象,社交网络在改善健康方面将更加有用和廉价。
总之,不管是网络还是现实生活,人们积极参与社交活动总是好的。人们以更开放的心态对拥抱世界,也许每一次不经意的吐槽背后,都有一群研究者在收集信息,只为换来更好的生活。
Twitter 内容数据资源富足,此前已经在视频收视率和音乐等方面获得开采。此次研究证明了这些数据不止于娱乐,提供了一种新的思路。相比 Twitter 的资源反馈,国内用户数以亿计的微博、微信朋友圈则还未表现出优势来。怀抱大数据如何输出问题,着实需要开发者好好想想。
题图源自pchome