《ova耻辱的制服》动漫在线看_《爱的色放》无删减版在线观看_HD中文字幕在线播放,韩国动漫在线免费观看入口,玉女心经在线无删减在线播放,日本731部队电影

AI通過鍵盤聲就能識別密碼,準確率高達95%

瀏覽: 時間:2023-11-24

近日,來自英國杜倫大學等3所高校學者發表的一篇論文指出,最先進的人工智能模型,僅憑筆記本電腦的按鍵聲音,就可以還原用戶輸入的密碼和敏感信息。

微信圖片_20231120142922

《基于深度學習的鍵盤聲學側信道攻擊實用技術》


在這項研究中,研究人員用深度學習的方法首次提出了一個完全自動化的鍵盤聲學側信道攻擊流程,包括按鍵分割、通過mel頻譜圖進行特征提取、使用CoAtNet模型進行分類幾個大的部分。


過去研究側信道攻擊

側信道攻擊,也叫邊信道攻擊,其核心就是通過加密軟件或硬件在運行時產生的各種泄露信息來間接獲取密文信息。


過去,人們在研究聲學側信道攻擊時廣泛使用的是機器學習方法,常見的一種方法是利用隱馬爾可夫模型(HMM),即一種在文本語料庫中訓練出來的模型,主要用于預測序列中最有可能出現的單詞或字符。


比如,當分類器中輸出“Hwllo”時,HMM可用來推斷單詞中的“w”實際上是被錯誤分類的“e”。該方法盡管在很多文本處理類的場景中比較有效,但一個最大的缺點就是輸出了很強的獨立性假設,不能考慮上下文的特征,使得對真實情況的建模能力變弱了,尤其在面臨無序的密碼場景中比較受限,這也可能是HMM近來不受歡迎的原因之一。


來看看該研究的具體過程:


第一步,收集數據


在兩組不同模式(手機和Zoom)的實驗中,研究人員通過按壓筆記本電腦的36個按鍵(0-9、a-z)來進行;在用不同角度和力度對每個按鍵分別按壓25次后,一個記錄聲音的數據文件就產生了。


ps:在本次實驗中,研究人員選取了一臺配備16GB內存和蘋果M1 Pro處理器的MacBook Pro16英寸(2021年)筆記本電腦作為攻擊對象。該電腦的鍵盤開關設計與過去兩年的機型及未來可能推出的機型完全相同,且同期可用的型號很少,鍵盤也基本相同。

微信圖片_20231120153025

△ 手機距離目標17cm


第二步,擊鍵隔離


所有按鍵數據都被記錄后,研究人員就用當前信號分析的一種最基本方法——快速傅里葉變換(FFT),對按鍵聲音進行了提取,并對不同頻率的系數求和以獲取能量;之后再定義一個能量閾值,當信號超過閾值時則標記為按鍵。


值得注意的是,由于Zoom在錄音過程中存在噪聲抑制,很難設定能量閾值,研究人員采取了一種不斷調整閾值的循環方法來解決,直到找到正確的按鍵次數。

5648113

第三步,特征提取


這一步,研究人員采用了梅爾頻譜圖方法將聲音特征提取出來,讓每個按鍵的差異可識別。

2e7e65ecd689c053e9f29e7b0e09d0a2

△左圖為手機錄音的波形圖和相應的mel頻譜圖,右圖為Zoom錄音。


第四步,數據增強


為了促進模型的泛化,即提高機器學習模型對新的、未見過的數據的適應能力,避免過度擬合訓練數據,研究人員同時使用了屏蔽法進行數據增強,即通過隨機抽取時間軸和頻率軸的部分數據,并將這些范圍內的所有值設置為頻譜圖的平均值,從而“屏蔽”部分圖像。


第五步,建立模型


這也是本次實驗中最為關鍵的一步。


研究人員將mel頻譜圖作為聲音的視覺表示,以圖像的形式輸入到CoAtNet(一個圖形算法)中。CoAtNet包含卷積層(特征提取)和自注意力層(特征識別),可以高效學習特征并建模特征之間的全局關系。


并在CoAtNet的基礎上添加了平均池化層和全連接層,以得到最終的按鍵分類結果。


此外,研究人員還使用了交叉熵損失函數和Adam優化器訓練模型,訓練過程中,每5個epoch測試一次驗證集精度。通過調節學習率、epoch數量等超參數,解決了模型精度突降的問題。


這樣一來,CoAtNet的輸出結果就可以被縮減為與每個鍵相關的百分比。


總結來說,就是把前面收集到的鍵盤敲擊的聲音文件,進行頻譜圖像識別、提取、加強后,放到這個CoAtNet中,建立數據模型進行分析,比如敲擊字母F的頻譜圖像和字母D的頻譜圖像,具有不同的敲擊特征,那么模型就會分別對這兩個頻譜圖像進行分析,從而分辨出哪個是F,哪個是D。

微信圖片_20231120163314

手機和Zoom兩種錄音方式的結果僅差2%,也側面說明了錄音方式的改變不會對準確率產生顯著影響。


此外,值得一提的是,研究人員還發現大多數誤分類都是相鄰按鍵,錯誤具有一定規律性。

微信圖片_20231120170119

△ 手機錄制的MacBook按鍵分類器的混淆矩陣


最終,研究人員的實驗結果顯示:通過手機錄音的按鍵分類準確率達到了95%,而在Zoom錄制的數據集中,分類準確率則達到了93%。簡單來說,一個8位數的密碼可能其中7個都可以被正確識別,而剩下的那一個被錯誤識別的也被證明往往集中在正確按鍵周圍的位置!


既然如此,我們還有應對的辦法嗎?


答案是肯定的。比如硬件層面,使用能減少向外部傳遞信號的部件或者對信號制造干擾;軟件層面,升級安全防御軟件或定期更新;還有用戶層面,盡量使用復雜組合的密碼并且經常更換……


資料來源 | 科學大院-江邊、知乎-Blue