主頁(http://www.130131.com):云存儲加密數(shù)據(jù)檢索面臨的幾大挑戰(zhàn)(2) 這一種方法可以在給定多個(gè)可能相關(guān)文檔的情況下對加密文檔進(jìn)行排序,進(jìn)而把最可能相關(guān)的文檔返回給用戶。但這一種算法首先不適用于一個(gè)查詢包含多個(gè)查詢詞的情況,其次算法只利用了文檔中的詞頻信息,無法利用詞的逆文檔頻率,進(jìn)而向量空間模型無法直接應(yīng)用。解決前一種問題的一種方法是用加法同態(tài)加密算法對詞頻信息進(jìn)行加密處理。 3.一種基于全同態(tài)加密的檢索方法 在加密信息檢索研究中,結(jié)果的排序是衡量檢索算法性能的重要指標(biāo)之一。當(dāng)前隨著云計(jì)算技術(shù)的提倡和應(yīng)用,加密文檔必將呈爆炸式增加。排序的準(zhǔn)確性成為對檢索系統(tǒng)性能的客觀要求,其主要目的是提高檢索系統(tǒng)服務(wù)質(zhì)量和檢索效率。分析現(xiàn)有的加密信息檢索算法發(fā)現(xiàn),在保證查準(zhǔn)和查全兩方面性能的同時(shí),對排序問題以及準(zhǔn)確性方面考慮不夠。 針對該問題,本文提出了一種面向云存儲應(yīng)用中的全同態(tài)加密的檢索方法。全同態(tài)加密的檢索方法是采用信息檢索中的向量空間模型,計(jì)算檢索出的文檔與待查詢信息之間的相關(guān)度,對檢索詞詞頻和倒排文檔頻率進(jìn)行統(tǒng)計(jì),然后采用全同態(tài)方法對文檔進(jìn)行加密并建立索引方法。檢索后將加密文檔與索引項(xiàng)密文一起上傳到服務(wù)器端。 全同態(tài)加密檢索及排序過程如圖1所示。提交檢索之前,同樣先對檢索語句進(jìn)行分詞、詞干化,得到關(guān)鍵詞明文序列并對明文進(jìn)行加密。云端服務(wù)器對提交密文序列進(jìn)行檢索時(shí),提交加密后的檢索詞。 文檔由每個(gè)關(guān)鍵詞的權(quán)重向量表示,權(quán)重是詞頻與倒排文檔頻率對數(shù)的乘積的歸一化。對用全同態(tài)加密后的詞頻、倒排文檔頻率進(jìn)行操作可以得到權(quán)重。 對于檢索詞采用同樣方法來描述,取兩者的內(nèi)積即可得到兩者的相關(guān)度,然后根據(jù)大小進(jìn)行排序,將有效排序后的文檔返回給用戶。用戶得到加密文檔后,用私鑰對文檔解密得到原始文檔。 通過全同態(tài)加密算法加密的明文數(shù)據(jù)可以在不恢復(fù)明文信息的情況被有效檢索出來,即把最相關(guān)的文檔返回給用戶。既保護(hù)了用戶的數(shù)據(jù)安全,又提高了檢索的性能。 4.結(jié)束語 本文分析了加密檢索技術(shù)在云存儲應(yīng)用中的重要意義,綜合分析了當(dāng)前加密檢索和相關(guān)技術(shù)研究現(xiàn)狀和存在問題。在此基礎(chǔ)上,本文提出了全同態(tài)加密檢索方法并簡要介紹全同態(tài)加密檢索方法的基本原理。已有的實(shí)驗(yàn)數(shù)據(jù)表明,全同態(tài)加密檢索方法與其他加密檢索算法相比,能在一定程度上提高檢索效率。 (中國集群通信網(wǎng) | 責(zé)任編輯:陳曉亮) |




