无法正确浏览此页面?清除浏览器缓存!

Paul Szynol摄

信息通信技术

2011年10月14日

问帕特里克·鲍尔五个问题

贡献:Rob古蒂

对于“你是做什么的”这个问题,帕特里克·鲍尔可能是为数不多的没有一个简洁的、在晚宴上准备好的答案的人之一。作为人道主义技术公司Benetech的首席科学家和副总裁,鲍尔有两份相关的工作:一份是在饱受战争蹂躏的地区收集数据,将涉嫌侵犯人权的图片拼凑起来。在他的另一份工作中,他构建技术赋予人权工作者权力。有了他的工具,人们可以安全地收集故事,收集数据,并告诉别人他们所在地区的进展和暴行。

他在这一领域工作了20年,收集了萨尔瓦多、埃塞俄比亚、海地、乍得、斯里兰卡、东帝汶、塞拉利昂、南非、科索沃、利比里亚和秘鲁的不法行为的肖像。他在刚果民主共和国的一个房间里用手机连接了互联网,我们通过Skype联系上了他。他在那里为联合国工作,他不能公开说太多。那是他在IEEE大会上发表主题演讲的前两周全球人道主义技术会议在华盛顿州的西雅图。,on Nov. 1, and we had many more than just five questions for him. We distilled the essence of the interview into what follows. These are five (-ish) questions with Patrick Ball.

开云体育官方E4C:那么,你在刚果民主共和国做什么?

PB我正在建立一个以文本为中心的数据库。

思考数据库对人权项目意味着什么是一个有趣的问题。一个重要的问题是,我们所说的有用信息是什么意思?联合国工作的很大一部分是了解情况。知道如何干预以保护平民。我们如何证实我们在街上听到的事情,并给出有用的背景?我们如何决定我们应该对什么做出反应?回答这些问题有[好的]和[坏的]两种方法。

开云体育官方E4C:关于人权数据分析,人们不知道或不理解的是什么?

PB:选择偏差!数据不是现实。我们不能简单地计算事物,并假设我们所看到的与真实的模式有任何必要的统计关系。你可以在Excel中输入任何你想要的数字,然后得到一个条形图。问题是,当我们从非代表性样本中获取数据并进行推断时,我们认为数据告诉了我们一些关于世界的事情,但事实可能并非如此。我们确定样本具有代表性的唯一方法是随机抽取样本。

“有多少人被杀?”这不是一个有用的问题。人们隐藏大规模暴力行为通常是出于既得利益。我们花了很多精力去观察,但观察的行为产生了更多的数据。只有你去寻找,你才会发现。

比如,你的数据显示,4月份的杀人事件比3月份多。我们怎么知道这个数字在上升?也许在4月份,我们只是更仔细地倾听,也许我们有更多的人在现场,或者人们更信任我们,或者我们修好了收音机。我们不知道。也许是因为有更多的暴力事件,这是有可能的,但是没有数学上的原因,为什么四月听到更多的暴力事件与实际发生的暴力事件有关。

偏见是个大问题。这是一件大事,因为产生可观测性的确切因素通常是我们想要测量的东西。所以(如果我们忽略偏见),我们可能会得到错误的报道。人权的底线是我们必须是正确的。我们必须是对的。

我有两个回答:让我们想想人权团体真正做得很好的是什么,让我们建立工具来帮助他们做得更好。他们擅长的一件事就是倾听受害者的意见。让我们开发一种技术,帮助我们更好地倾听。让我们试着用安全的技术来保护这些声音,放大这些声音,建立工具来将信息从收集点传递到世界其他地方。让我们使用机器学习和机器智能(比如好的搜索软件)来帮助分析师找出定性模式,而不是定量模式。

比如我们听说有很多针对小男孩的暴力,因为他们是下一代的士兵。当一个定性研究人员得出结论说有一种特定类型的暴力是针对小男孩的,我这么想是因为我有43个故事讲述了这种暴力,然后我们就在我们所知道的暴力模式中找到了一种主张。这与定量理论相反。

开云体育官方E4C:你认为今天在你的领域有什么很有前途的趋势?

PB科技领域有很多很酷的趋势。在统计分析中,这些趋势是长期的。移动平台上有很多很棒的技术。移动平台正在成为各种事情发生的地方。但另一方面,他们又非常非常没有安全感。这是一个至关重要的问题,我们如何确保移动平台上的数据安全?(这是Benetech正在研究的)。

我也对机器学习在海量定性信息中的应用感到兴奋。叙述。计算机如何帮助我们从大量的叙述中学习,而不将其简化为无意义的数字?

开云体育官方是什么让你夜不能寐,或者让你担心工作?

PB泄露敏感数据和出错一直让我担心。这一直困扰着我。但我错了。

开云体育官方例如?

PB1995年在海地,我为真相委员会.我们从海地各地的人们那里得到了成千上万的证词,然后一些同事从太子港大学医院的太平间收集了一组数据。我们查看了所有在停尸间发生的暴力死亡案例,并将其模式与报告给委员会的证词中的模式进行了比较。他们很相似。我们就像,啊哈!,that means that either both patterns are reflecting the true patterns in reality, or they share a bias. At the time, I thought it was unlikely that they would share the same bias. They were different kinds of data: People who talked to us versus bodies that showed up in the morgue. I argued that the fact that they were so closely correlated was evidence that they were true. That was awfully optimistic.

我不认为有理由拒绝共同偏见的观点。如果有一段时间,他们的策略是杀一儆百,所以他们把尸体扔到街上。那会产生很多口头报告和停尸房的尸体。如果他们改变策略,悄悄杀人,然后把尸开云体育体育赛事体扔进海里呢?这样就不会产生口头报告,太平间里也不会有尸体。在过去的16年里,我对这个结论想了很多,我想,哇,没有办法知道。这是困难的。这是困难的。

开云体育官方E4C:从现在起的五年内,你希望看到你和你的同事使用的技术有哪些改进?

PB智能手机是一台功能强大的电脑,但五年后它会变得多强大呢?我们如何利用这些额外的权力来保护人民,而不是让它成为电信公司强大的数据收集设备?电信公司总是知道你在哪里。这是一个很大的监控问题。专制政府过去不得不对持不同政见者亦步亦疲。现在他们只需要问电信公司他们去了哪里,和谁讲过话。我们如何平衡这种监控能力和手机为我们带来的其他好处?

标签:5个问题Benetech五个问题帕特里克球

Rob古蒂

请留下评论

登录置评。

    由工程师。
    适合所有人。

    开云体育官方开云体育KG彩票E4C会员是一种精心策划的体验!当您成为会员时,我们将根据您长期参与我们内容的方式为您量身定制独特的用户配置文件。您的行为和偏好将允许我们为您提供与您最相关的内容。此外,成为E4C会员,您将获得独家参与机会和E4C开云体育官方通讯。

    加入E4C开云体育官方,成为相信工程可以改变世界的全球社区的一员!开云全站app登录官网入口下载开云体育体育赛事

    成为会员
    Baidu
    map