如何調(diào)查擁有6000萬份文檔的公司
發(fā)布時間:2021/1/21 17:25:55瀏覽次數(shù):1367
想象一下,必須搜索一家大型跨國公司的所有文檔,電子郵件和消息。
Yousr Khalil不必想象。法務(wù)會計師是一個團(tuán)隊的一部分,該團(tuán)隊不得不在航空航天巨頭空中客車公司承認(rèn)通過中間人行賄后,提出了不當(dāng)行為的證據(jù)。
她說:“空中客車就像其中有900套公寓的高樓大廈。我們必須決定要研究哪些套間?!?br /> Khalil女士在FRA(法醫(yī)調(diào)查公司)工作,該公司為全球法律案件提供支持。
但這是一個例外,也是FRA有史以來最大的工作。
為了符合延期起訴協(xié)議(DPA)的要求,空客于2016年對其運(yùn)營進(jìn)行了嚴(yán)格的審查。
這項(xiàng)為期四年的根除腐敗行為的項(xiàng)目幫助空客與英國,美國和法國的監(jiān)管機(jī)構(gòu)達(dá)成協(xié)議,根據(jù)該協(xié)議,空中客車公司支付了36億歐元(30億英鎊)的罰款,以表彰其欺詐和賄賂行為。
Khalil女士和一支由70名員工組成的團(tuán)隊面對著遍布全球活動的大量文件,交易數(shù)據(jù)和電子郵件,其中大部分都是無害的。
那么他們?nèi)绾我?guī)劃課程呢?
人工智能(AI)和量身定制的計算機(jī)不同于您曾經(jīng)使用過的任何PC,在這一史詩般的數(shù)據(jù)拖網(wǎng)中發(fā)揮了重要作用。
5億個龐大的文檔和交易的艱巨收集工作必須減少。
隨著數(shù)據(jù)量呈指數(shù)增長,在此類調(diào)查中越來越頻繁地使用AI。
消除重復(fù)和其他不相關(guān)的材料后,調(diào)查人員將獲得6000萬份文檔進(jìn)行審查。AI搜尋了這些圖案并找到了不合適的片段,例如價值1億美元的體育贊助協(xié)議。
在所有這些過程中,空中客車與員工的關(guān)系如何?哈利勒女士說:“沒有一家公司真正為全面的法醫(yī)調(diào)查做好準(zhǔn)備,”但她來自空中客車公司的同事反應(yīng)迅速?!爱?dāng)監(jiān)管者對某件事進(jìn)行快速反應(yīng)時,他們就此采取行動?!?br /> 好像六千萬件物品還不足以構(gòu)成挑戰(zhàn),全球范圍內(nèi)有800名空客雇員被合法指派為這些文件的保管人。
“您可能將信息散布在筆記本電腦,存儲設(shè)備,USB驅(qū)動器等不同介質(zhì)上。我們必須確定誰是該數(shù)據(jù)的托管人,” Greg Mason表示,他是該公司數(shù)據(jù)分析的創(chuàng)始合伙人兼聯(lián)席主管FRA。
建立了七個安全的調(diào)查地點(diǎn)。這些允許對文檔進(jìn)行完全安全的檢查,這對空客而言至關(guān)重要。這是一個龐大的業(yè)務(wù),與歐洲主要的軍用飛機(jī)項(xiàng)目交織在一起。因此,調(diào)查必須設(shè)計出一種方法,以防止將全國范圍內(nèi)敏感的材料拒之門外。
專用軟件允許收集信息,而無需查看其來源的整個文檔,因此可以防止窺視他人的秘密防御信息。
此外,還使用了定制的價值100,000美元的計算機(jī),該計算機(jī)運(yùn)行多個磁盤并且沒有與Internet的連接。
這被稱為“氣隙”,它在敏感數(shù)據(jù)和Internet外部世界之間提供了明確的界限。
如果僅將數(shù)據(jù)視為數(shù)據(jù),則處理大量數(shù)據(jù)將變得更加輕松快捷。FRA提取了元數(shù)據(jù),即每個電子文檔背后的信息(定義了元數(shù)據(jù)),然后使用它對材料進(jìn)行索引,以便可以刪除不相關(guān)的文件。
AI構(gòu)成了此技術(shù)輔助審核(TAR)的基礎(chǔ)。
AI經(jīng)過訓(xùn)練可以搜索非結(jié)構(gòu)化數(shù)據(jù),例如電子郵件。與表單和列中包含的結(jié)構(gòu)化數(shù)據(jù)不同,這些元素很難掃描。
利用機(jī)器學(xué)習(xí)的原理,AI軟件可以看到特定類型消息的多個示例并開始發(fā)現(xiàn)它們屬于哪個類別,F(xiàn)RA能夠迅速提取相關(guān)文檔。梅森觀察到:“人工智能程序?qū)ふ蚁⒌纳舷挛?,上下文就是一切。?br /> 該軟件正在尋找通過代碼安排的賄賂,例如醫(yī)生開藥。通過運(yùn)行此類隱藏消息的示例,該軟件獲得了醫(yī)學(xué)概念,然后獲得了處方概念。這意味著它可能會涉足非結(jié)構(gòu)化數(shù)據(jù)并發(fā)現(xiàn)腐敗行為。
梅森先生說:“當(dāng)您發(fā)現(xiàn)越來越多的秘密支付實(shí)例時,人工智能便會實(shí)時學(xué)習(xí)。這就是人工智能的魅力所在?!?建立了評分系統(tǒng),為某些屬性添加了分?jǐn)?shù)。任何高于一定數(shù)字的分?jǐn)?shù)都被認(rèn)為值得進(jìn)一步調(diào)查。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,它變得越來越好。
梅森先生認(rèn)為,預(yù)留的文件中只有大約5%是由人檢查的,但仍然有300萬份文件?!叭斯ぶ悄懿皇侨f靈藥,但它的學(xué)習(xí)方式卻非同尋常。”
這位統(tǒng)計學(xué)家經(jīng)過培訓(xùn),對AI技術(shù)如何使大量短時間工作印象深刻?!凹词菇裉旌苄〉那闆r下,海量數(shù)據(jù)也隨之而來?!?br /> 他必須將TAR的新概念賣給英國嚴(yán)重欺詐辦公室(SFO)等監(jiān)管機(jī)構(gòu),并獲得批準(zhǔn),這不是傳統(tǒng)的調(diào)查方法?!斑@是我進(jìn)行過的最復(fù)雜的調(diào)查?!?br /> 四年的調(diào)查聽起來很累。但是,與AI助手一起揭露欺詐行為使團(tuán)隊獲得了很多個人滿意度。
他們的工作得到了合法的認(rèn)可印章。
英格蘭和威爾士最資深的民事法院法官之一維多利亞·夏普夫人(Victore Sharp)總結(jié)了這項(xiàng)調(diào)查的深遠(yuǎn)影響及其在人工智能方面的突出作用。
在為2020年1月在英國舉行的三國事件辯護(hù)時,她宣布空中客車公司“真正掏腰包,現(xiàn)在是一家發(fā)生過錯的公司”。
Yousr Khalil不必想象。法務(wù)會計師是一個團(tuán)隊的一部分,該團(tuán)隊不得不在航空航天巨頭空中客車公司承認(rèn)通過中間人行賄后,提出了不當(dāng)行為的證據(jù)。
她說:“空中客車就像其中有900套公寓的高樓大廈。我們必須決定要研究哪些套間?!?br /> Khalil女士在FRA(法醫(yī)調(diào)查公司)工作,該公司為全球法律案件提供支持。
但這是一個例外,也是FRA有史以來最大的工作。
為了符合延期起訴協(xié)議(DPA)的要求,空客于2016年對其運(yùn)營進(jìn)行了嚴(yán)格的審查。
這項(xiàng)為期四年的根除腐敗行為的項(xiàng)目幫助空客與英國,美國和法國的監(jiān)管機(jī)構(gòu)達(dá)成協(xié)議,根據(jù)該協(xié)議,空中客車公司支付了36億歐元(30億英鎊)的罰款,以表彰其欺詐和賄賂行為。
Khalil女士和一支由70名員工組成的團(tuán)隊面對著遍布全球活動的大量文件,交易數(shù)據(jù)和電子郵件,其中大部分都是無害的。
那么他們?nèi)绾我?guī)劃課程呢?
人工智能(AI)和量身定制的計算機(jī)不同于您曾經(jīng)使用過的任何PC,在這一史詩般的數(shù)據(jù)拖網(wǎng)中發(fā)揮了重要作用。
5億個龐大的文檔和交易的艱巨收集工作必須減少。
隨著數(shù)據(jù)量呈指數(shù)增長,在此類調(diào)查中越來越頻繁地使用AI。
消除重復(fù)和其他不相關(guān)的材料后,調(diào)查人員將獲得6000萬份文檔進(jìn)行審查。AI搜尋了這些圖案并找到了不合適的片段,例如價值1億美元的體育贊助協(xié)議。
在所有這些過程中,空中客車與員工的關(guān)系如何?哈利勒女士說:“沒有一家公司真正為全面的法醫(yī)調(diào)查做好準(zhǔn)備,”但她來自空中客車公司的同事反應(yīng)迅速?!爱?dāng)監(jiān)管者對某件事進(jìn)行快速反應(yīng)時,他們就此采取行動?!?br /> 好像六千萬件物品還不足以構(gòu)成挑戰(zhàn),全球范圍內(nèi)有800名空客雇員被合法指派為這些文件的保管人。
“您可能將信息散布在筆記本電腦,存儲設(shè)備,USB驅(qū)動器等不同介質(zhì)上。我們必須確定誰是該數(shù)據(jù)的托管人,” Greg Mason表示,他是該公司數(shù)據(jù)分析的創(chuàng)始合伙人兼聯(lián)席主管FRA。
建立了七個安全的調(diào)查地點(diǎn)。這些允許對文檔進(jìn)行完全安全的檢查,這對空客而言至關(guān)重要。這是一個龐大的業(yè)務(wù),與歐洲主要的軍用飛機(jī)項(xiàng)目交織在一起。因此,調(diào)查必須設(shè)計出一種方法,以防止將全國范圍內(nèi)敏感的材料拒之門外。
專用軟件允許收集信息,而無需查看其來源的整個文檔,因此可以防止窺視他人的秘密防御信息。
此外,還使用了定制的價值100,000美元的計算機(jī),該計算機(jī)運(yùn)行多個磁盤并且沒有與Internet的連接。
這被稱為“氣隙”,它在敏感數(shù)據(jù)和Internet外部世界之間提供了明確的界限。
如果僅將數(shù)據(jù)視為數(shù)據(jù),則處理大量數(shù)據(jù)將變得更加輕松快捷。FRA提取了元數(shù)據(jù),即每個電子文檔背后的信息(定義了元數(shù)據(jù)),然后使用它對材料進(jìn)行索引,以便可以刪除不相關(guān)的文件。
AI構(gòu)成了此技術(shù)輔助審核(TAR)的基礎(chǔ)。
AI經(jīng)過訓(xùn)練可以搜索非結(jié)構(gòu)化數(shù)據(jù),例如電子郵件。與表單和列中包含的結(jié)構(gòu)化數(shù)據(jù)不同,這些元素很難掃描。
利用機(jī)器學(xué)習(xí)的原理,AI軟件可以看到特定類型消息的多個示例并開始發(fā)現(xiàn)它們屬于哪個類別,F(xiàn)RA能夠迅速提取相關(guān)文檔。梅森觀察到:“人工智能程序?qū)ふ蚁⒌纳舷挛?,上下文就是一切。?br /> 該軟件正在尋找通過代碼安排的賄賂,例如醫(yī)生開藥。通過運(yùn)行此類隱藏消息的示例,該軟件獲得了醫(yī)學(xué)概念,然后獲得了處方概念。這意味著它可能會涉足非結(jié)構(gòu)化數(shù)據(jù)并發(fā)現(xiàn)腐敗行為。
梅森先生說:“當(dāng)您發(fā)現(xiàn)越來越多的秘密支付實(shí)例時,人工智能便會實(shí)時學(xué)習(xí)。這就是人工智能的魅力所在?!?建立了評分系統(tǒng),為某些屬性添加了分?jǐn)?shù)。任何高于一定數(shù)字的分?jǐn)?shù)都被認(rèn)為值得進(jìn)一步調(diào)查。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,它變得越來越好。
梅森先生認(rèn)為,預(yù)留的文件中只有大約5%是由人檢查的,但仍然有300萬份文件?!叭斯ぶ悄懿皇侨f靈藥,但它的學(xué)習(xí)方式卻非同尋常。”
這位統(tǒng)計學(xué)家經(jīng)過培訓(xùn),對AI技術(shù)如何使大量短時間工作印象深刻?!凹词菇裉旌苄〉那闆r下,海量數(shù)據(jù)也隨之而來?!?br /> 他必須將TAR的新概念賣給英國嚴(yán)重欺詐辦公室(SFO)等監(jiān)管機(jī)構(gòu),并獲得批準(zhǔn),這不是傳統(tǒng)的調(diào)查方法?!斑@是我進(jìn)行過的最復(fù)雜的調(diào)查?!?br /> 四年的調(diào)查聽起來很累。但是,與AI助手一起揭露欺詐行為使團(tuán)隊獲得了很多個人滿意度。
他們的工作得到了合法的認(rèn)可印章。
英格蘭和威爾士最資深的民事法院法官之一維多利亞·夏普夫人(Victore Sharp)總結(jié)了這項(xiàng)調(diào)查的深遠(yuǎn)影響及其在人工智能方面的突出作用。
在為2020年1月在英國舉行的三國事件辯護(hù)時,她宣布空中客車公司“真正掏腰包,現(xiàn)在是一家發(fā)生過錯的公司”。