地又震了,人工智能预测地震了解一下!
本文来自公众号网易智能(ID:smartman163),原文作者 Ashley Smart,编译网易智能,爱范儿经授权发布。
去年5月,沉睡了13个月之后,华盛顿普吉特海湾(Puget Sound)下方的地面隆隆地苏醒过来。地震始于奥林匹克山下方20多英里处,在几周的时间里,向西北方向漂移,到达加拿大的温哥华。然后,它短暂地扭转了方向,又迁移回了美国边境。总的来说,这场持续一个月的「地震」释放了震级为6级的能量。到地震结束时,温哥华南端已经向太平洋推进了大约一厘米。
然而,由于地震在时间和空间上的分布如此之广、分散,很可能没有人感觉到它。
这类幽灵地震比常规的快速地震发生在地下更深的地方,被称为「慢地震(slow slips)」。它们大约每年在太平洋西北部发生一次,沿着断层,胡安·德富卡板块滑入北美板块下方。自2003年以来,该地区庞大的地震台站网络已经探测到了十几次慢地震。在过去一年半中,这些事件一直是地球物理学家保罗·约翰逊(Paul Johnson) 进行地震预报的关注重点。
Johnson的团队是少数几个使用机器学习的小组之一,他们试图揭开地震物理学的神秘面纱,并梳理出其中的地震预警信号。两年前,Johnson和他的合作者使用与图像和语音识别类似的模式发现算法,在一个模型实验室系统中成功地预测了地震。
现在,Johnson及其团队在发布于网站arxiv.org上的一篇论文中报告说,他们已经在太平洋西北部的慢地震上测试了其算法。该论文尚未经过同行评审,但外界专家称结果令人鼓舞。根据Johnson的说法,该算法可以在一场慢地震的开始的「几天前」对其进行预测。莱斯大学的地震学家马丁·德·霍普(Maarten de Hoop)表示,「我认为这是第一次,我们确实在迈向地震预测方面取得进展」。
斯坦福大学地球物理学家穆斯塔法·穆萨维(Mostafa Mousavi)称新结果「有趣且鼓舞人心」。但同时,他也强调机器学习在能够可靠地预测灾难性地震之前还有很长的路要走。尽管研究中还有很多困难要克服,在这样一个科学家深耕数十年几乎看不到希望的领域,机器学习可能会成为新的突破口。
灾害性地震和慢地震
已故的地震学家查尔斯·里希特(Charles Richter)(里氏震级以他的名字命名)在1977年指出,地震预测可以为「业余爱好者、怪人和彻头彻尾寻求宣传的造假者提供一个快乐的猎场」。雅典大学的地球物理学家Panayiotis Varotsos声称他可以通过测量「地震电信号」来探测即将发生的地震。美国矿务局的物理学家布莱恩·布雷迪(Brian Brady)于上世纪80年代初在秘鲁连续发出错误警报。这些事件的发生都基于一个脆弱的观念,即地下矿山中的岩爆是地震即将来临的明显迹象。
Johnson很清楚这段曲折的历史。「地震预测」这个词在很多地方都是禁忌。六名科学家在2012年因淡化意大利中部城镇拉奎拉附近发生地震的可能性而被判过失杀人罪(定罪后来被推翻),几天后,该地区遭到6.3级地震的破坏。一些著名的地震学家强烈地宣称「地震是无法预测的」。但Johnson认为地震是物理过程,就这个角度而言,地震与恒星坍塌或风向转变没有什么不同。尽管他强调其主要目标是更好地理解断层物理学,但他并没有回避预测问题。
▲(图:洛斯阿拉莫斯国家实验室的地球物理学家保罗·约翰逊(Paul Johnson)于2008年用一块丙烯酸塑料拍下了照片,这是他的团队用来模拟实验室中地震的材料之一。)
十多年前,Johnson开始研究「实验室地震」,这种地震是由薄层颗粒状物质隔开的滑动块构成的。他们记录下粘滑周期中发出的声学信号,发现每次滑行之前都会出现尖锐的峰值。这些前兆事件类似于地震前前震产生的地震波。但是,就像地震学家一直在努力将前震转化为对主震何时发生的预测一样,Johnson和他的同事们也无法弄清楚如何将前兆事件转化为实验室地震的可靠预测。「我们在某种程度上走进了死胡同,」Johnson回忆道。「我找不到任何进行下去的方法。」
几年前,在洛斯阿拉莫斯的一次会议上,Johnson描述并解释了他的困境,理论家建议他使用机器学习重新分析数据。于是科学家们共同制定了一个计划:在每次实验中记录下大约5分钟的音频,然后把它切成许多小段。对于每个片段,研究人员计算了80多个统计特征,包括平均信号,均值的变化,以及关于该片段是否包含前兆事件的信息。由于研究人员是事后分析数据,所以他们也知道每个声音片段和随后的实验室故障之间间隔多长时间。有了这些训练数据,他们使用 「随机森林(random forest)」机器学习算法系统地寻找与故障前剩余时间密切相关的特征组合。在查看了几分钟的实验数据后,算法可以开始仅基于声发射的特征来预测故障时间。
Johnson和他的同事选择采用随机森林算法来预测的部分原因是其相对易于解释(与神经网络和其他流行的机器学习算法相比)。该算法基本上像决策树一样工作,其中每个分支根据某种统计特征对数据集进行拆分。因此,树保留了用于进行预测的算法的特征的记录,以及每个特征在帮助算法得出这些预测的相对重要性方面的记录。
▲(图:在洛斯阿拉莫斯国家实验室进行的一项实验中,偏光透镜显示了模型构造板块沿断层线横向滑动时应力的积累。)
当洛斯阿拉莫斯大学的研究人员探究其算法的内部工作原理时,他们对发现的东西感到惊讶:算法最依赖其预测的统计特征与实验室地震之前的前兆事件无关。相反,有关的是方差,即信号如何围绕均值波动的一种度量,此外信号不单出现在发生故障之前的那一刻,方差开始时很小,然后在地震预备期间逐渐攀升。只要知道了这种变化,算法就可以做出合理的猜测。这一发现具有潜在的重大意义。几十年来,准地震预报员一直在研究前震和其他孤立的地震事件。而洛斯阿拉莫斯(Los Alamos)的结果表明,每个人都把目光投向了错误的地方——预测的关键在于两次大地震事件之间相对平静的时期内广播的更微妙的信息。为了证明机器学习可以预测真实的地震,Johnson需要对真实的断裂进行测试。还有什么地方比太平洋西北部更适合呢?
实验室外
俯冲带断层下游的慢地震将少量应力传递到上方的脆性地壳,随后该处会发生快速的灾难性地震。
但是,对于Johnson而言,关注慢地震还有另一个原因:它们会产生大量数据。
作为比较,在过去的12年中,普吉特海湾和温哥华之间的断裂带没有发生重大的灾害性地震。在同一时间跨度中,断层产生了十几个缓滑带,每个都记录在详细的地震目录中。该地震目录与Johnson实验室地震实验中的录音在现实世界中相对应。就像处理声音记录一样,Johnson和同事将地震数据切成小段,并通过一套统计功能来表征每个段。然后,他们将该训练数据以及过去的慢地震时间信息一起提供给机器。
在接受了2007年至2013年的数据训练后,算法能够基于每个事件发生前几个月记录的数据,对2013年至2018年之间发生的慢地震做出预测。关键特征是地震能量,在实验室中,该能量与声信号的方差密切相关。像方差一样,每次缓慢滑动之前,地震能量都以特征方式爬升。
卡斯卡迪亚的预报不如实验室地震那样准确。与新的结果相比,表征预测与观测吻合程度的相关系数比实验室研究中的要低得多。Johnson说,尽管如此,该算法仍能预测出发生在2013年至2018年之间的五个慢地震中的一个,几乎可以准确地预测出开始时间。
机器学习为我们提供了一个切入点,这是进入数据搜索以查找我们从未发现或从未见过的事物的入口。但人们还有很长一段路要走。
令人深省的事实
地震预测的目标从来都不是预测慢地震。相反,它是为了预测突然发生的、对生命和肢体构成危险的灾难性地震。对于机器学习的方法来说,这提出了一个矛盾:最大的地震,地震学家最希望能够预测的地震,同时也是最罕见的。机器学习算法如何获得足够的训练数据来预测它们?
洛斯阿拉莫斯小组押注,他们的算法实际上不需要对灾难性地震进行训练来预测它们。最近的研究表明,小地震之前的地震图象在统计上与大地震的地震图象相似,在任何一天,一个断层上都可能发生几十次小地震。一台针对数以千计的小地震进行训练的计算机可能具有足够的通用性来预测大地震。机器学习算法也可能在计算机模拟快速地震上进行训练,这些模拟有朝一日可以作为真实数据的替代品。
但即便如此,科学家仍将直面一个令人深省的事实:尽管将断层推向地震边缘的物理过程或许是可以预测的,但大多数科学家认为,地震的实际触发包含了一种随机性。假设是这样的话,无论机器训练得多么好,它们可能永远不能像科学家预测其他自然灾害那样预测地震。
在最好的情况下,对大地震的预测可能会有数周、数月或数年的时间限制。虽然这样的预测可能无法用于协调地震前夕的大规模疏散,但可以增加公众的准备期,帮助政府官员有针对性地改造不安全的建筑,并以其他方式减轻灾难性地震的危害。
Johnson认为这是一个值得努力的目标。但是,他知道这需要时间。他说:「我并不是说要在我有生之年预测地震,但是无论何种程度的探索,我们都在向前迈进。」