要在 5TB 的邮件里找证据?有公司能帮你
在互联网时代,信息纷繁复杂。利用计算机智能来分析和整理信息,已成为各行业共同的课题。法律行业也不例外。Wortzman Nickle 是加拿大第一家专注于电子证据发现(e-discovery)的公司。公司的联合创始人 Susan Wortzman 曾是一位诉讼律师。她发现,法律案件中的电子证据正在不断增多,但是对其分析和整理并不容易。
“我早就想成立自己的公司了,而且我感觉那将是一个飞速发展的领域,”Wortzman 对 Globeandmail 网站说,“律师们不一定精通技术,对于那些律师们来说,这个领域中有许多复杂的问题。”
在过去的六年里,公司的业务获得了快速的发展。当 Susan Wortzman 刚刚成立公司的时候,用户会要求处理上万封邮件,但是现在,他们会说,“我有 5TB 的数据,怎么处理?”
在科技的帮助下,电子证据的获取变得更加容易,成本也更低。
“如果一个客户打电话说,‘我有 40 万封邮件’,我会说,‘好,我让 60 位律师去检查下。这需要三个月,而且要花费 100 万美元,” Wortzman 说,“或者我这样说,‘把那个 40 万封邮件的硬盘给我,我们会用电子手段过滤出 25000 封邮件,然后我们让五个人去检查,一周内就能完成。”
他们发现电子证据的过程是这样的。首先,客户将大量的电子记录交过来,包括邮件、文档、表格、演示等等,然后这些记录通过电脑过滤,移除不相关的信息。当记录数量属于可控范围的时候,公司团队就开始了“科技帮助下的检查”阶段。
这也是计算机真正发挥智能的阶段。高级律师会找出一部分记录,判定那些记录是相关的,那些是不相关的。以此为基础,计算机开始确定一些规则,并且判断数据库中那些文件有相关性。然后,计算机会随机给出一些记录,让律师再次进行判断。第二次训练之后,计算机会相应调整自己的规则。
一般来说,让计算机做出正确判断,需要 1500 至 2000 份记录。当准确率达到 90% 的时候,计算机的规则就足够好,可以自行去处理记录了。为了保证准确率,律师们也会随机抽查其结果。
一开始的时候,公司的客户都是大型企业。如今,中型和小型企业也会找他们帮忙。由于社交媒体的发展,许多公司都开始使用 Twitter、Facebook、Instagram 等工具。他们在社交媒体上发布的信息,也可能成为电子证据。Wortzman Nickle 的一位主管 Chuck Rothman 认为,社交媒体将会公司业务的另一个增长点。不过,社交媒体上的取证并不容易,因为它们不是传统的文档。“Facebook 页面上有各种复杂的信息,各种各样的链接,还有评论、图片、Like。”
因此,公司必须不断提高自己的技术水平。Wortzman 说,他们并非一个典型的法律公司。对于技术的依赖,意味着他们必须了解技术,不断尝试新产品。“要满足客户的需要,我们必须处于科技的前沿,而且要一直如此。”