避免從資料直接或間接推斷出有關個人不想揭露的資訊,是個人資料去識別化的目標,例如從電話號碼的區號,推斷出居住地,或是由身分證號碼推斷出其性別,甚至是由職業別推斷出興趣或薪資等,這些看似平常的資料,但經由蒐集、處理、比對、分析後,就可以變成有用的資訊。那該如何將個人資料去識別化呢?如果是使用[ Google 試算表 ]時,我們可以運用 REPLACE 這個函數來將個人資料去識別化,例如將姓名變成 O家豪,身分證號 OO23465789 等。
[ Google 試算表 ]如何將個人資料去識別化?
1.首先來看看 Google 對 REPLACE 函數的用法說明及示範。
2.假設有如下的資料,我們想將姓名及其出生年月日做去識別化,例如陳大明 > 陳O明,OOOO/8/5。
3.在 C2儲存格使用 REPLACE 函數 =replace(A2, 2, 1, "O") 並透過滑鼠拖曳儲存格右下角的自動填滿點,套用到其以下的儲存格。
replace(A2, 2, 1, "O")函數中所使用的四個參數,由左至右分別為
- 針對 A2儲存格內的資料做處理
- 表示從第 2個字元開始取代 (中文字對函數來說一個字算一個字元)
- 取代 1個字元
- :將字文取代為字串 O (字串須加雙引號)
4.根據以上的說明,我們便可以將出生年月日,使用 =replace(B2, 1, 4, "OOOO")來取代。
以上範例所使用的檔案,可以自行開啟試試