近日,eBay的工作人員發(fā)布文章稱,eBay運(yùn)用新技術(shù)可識別出四成的信用卡欺詐。
在美國,信用卡欺詐比你想象的更常見。2014年的1760萬起身份盜竊案件中,86%的受害者報告了與現(xiàn)有信用卡或銀行賬戶有關(guān)的欺詐行為。事實(shí)上,美國聯(lián)邦貿(mào)易委員會表示,信用卡欺詐是美國最常見的身份盜用形式,每年報告的案件超過130,000起。

eBay人工智能可識別出四成的信用卡欺詐
eBay的人工智能可以識別出40%的信用卡欺詐
自動檢測可疑用卡模式的方法并不是什么新鮮事,但eBay的研究人員在Arxiv.org上發(fā)表的一篇新論文(《電子商務(wù)中的信用卡欺詐檢測:異常檢測方法》)中描述了一種尖端技術(shù)。他們使用了一種經(jīng)過訓(xùn)練的算法來識別與交易和支付有關(guān)的 良好行為 ,并標(biāo)記出異常行為。
研究人員寫道: 欺詐和垃圾郵件檢測等任務(wù)的挑戰(zhàn)通常在于缺乏培養(yǎng)合適的監(jiān)督學(xué)習(xí)模型所需的所有模式。如果這些模式還隨著時間而變化,問題就會更加突出……有限的數(shù)據(jù)和不斷變化的模式使得學(xué)習(xí)變得非常困難。我們假設(shè)良好行為不隨時間變化,表示良好行為的數(shù)據(jù)點(diǎn)在不同分組下具有一致性。
研究人員利用聚類方法——用于識別數(shù)據(jù)集中類似對象組的方法來使用不同的參數(shù)。在每次訓(xùn)練運(yùn)行中將每個數(shù)據(jù)點(diǎn)分配給一個集群,并對該集群產(chǎn)生數(shù)學(xué)表示(矢量),以構(gòu)成數(shù)據(jù)點(diǎn)的不同 指紋 ,組合成它的唯一簽名。
為了生成表示 良好行為 (即一致性)的簽名,團(tuán)隊將每個數(shù)據(jù)點(diǎn)向量組合在一起,并根據(jù)相應(yīng)集群的大小對其進(jìn)行加權(quán),得到0到1之間的一個分?jǐn)?shù)。低一致性——得分接近0——就對應(yīng)著異常行為。
與傳統(tǒng)人工智能欺詐檢測相比,這種方法有幾個優(yōu)點(diǎn)。它不需要事先了解異常值或內(nèi)點(diǎn);基礎(chǔ)算法都是高度可擴(kuò)展的并且是通用的;它幾乎可以應(yīng)用于任何聚類問題,包括醫(yī)學(xué)領(lǐng)域的問題。
該團(tuán)隊使用了數(shù)據(jù)科學(xué)平臺Kaggle公開的信用卡數(shù)據(jù)庫來測試他們的方法,這一數(shù)據(jù)集包含了2013年9月份歐洲信用卡持有人在兩天內(nèi)的交易數(shù)據(jù),總共有284,807筆交易樣本,其中有492個欺詐樣本。在運(yùn)行了十次之后,該算法能夠識別出40%的欺詐案例。結(jié)果并不完美,它誤判了29筆合法交易——但是考慮到數(shù)據(jù)點(diǎn)的數(shù)量巨大,這是一個 巨大的收獲 。
我們的技術(shù)非常有用, 我們可以再284,807個樣本中安全地排除139,220筆交易。 研究人員表示,它在電子商務(wù)平臺識別欺詐交易方面非常成功,但是由于數(shù)據(jù)集的保密性,報告中無法列出這些結(jié)果。
如果這中最新算法能夠完善普及,人們的信用卡交易就會變得更安全。