1. 跳轉至内容
  2. 跳轉至主選單
  3. 跳轉到更多DW網站

專訪:開源數據恐成為中國擴大影響力的利器

William Yang
2020年9月16日

多家媒體報導,深圳的振華數據公司有系統地蒐集上百萬各國人員的「數字麵包屑」。首先披露此事的學者鮑爾丁告訴德國之聲,振華可能透過資料庫去影響特定人員或機構。

https://p.dw.com/p/3iWwH
Symbolbild Apps Facebook und Google Anwendungen
深圳振華數據公司蒐集上百萬名各國人員開源數據的事件讓各界再次聚焦中國運用大數據擴大其全球影響力或是進行間諜行動的可能性。圖片來源: picture-alliance/dpa/S. Stache

(德國之聲中文網) 德國之聲:我們知道中國並不是唯一一個大規模蒐集開源數據的國家。許多西方政府與公司也都有進行類似的活動。從您的角度來看,一間中國公司大規模蒐集開源數據與一間西方公司做同樣的事情有何不同之處?

鮑爾丁:我們先做一個簡單的比較。臉書蒐集與用戶相關的資料往往是希望能賣商品給用戶。他們可能會向用戶展示一個寫著「按一下這個亞馬遜Prime的連結」或是「點一下這雙你前幾天看過的鞋子」的廣告。這是臉書對用戶進行大規模資料蒐集的主要原因。

然而,大部分深圳振華數據公司所取得的數據,應該都不是要用來賣東西給用戶。透過這間公司的公開簡介以及其他資訊,我們很清楚發現他們與中國安全部門與軍事情報部門有很深的連結。所以他們蒐集數據很明顯是為了別的用途。

此外,他們在蒐集開源數據的過程中,很可能已違反了許多法規。2016年時,一間叫「劍橋分析」(Cambridge Analytica) 的公司曾在臉書上大量蒐集用戶資料並用來操弄美國選舉,而深圳振華數據公司所做的事與「劍橋分析」所做的事其實很類似。

深圳振華數據公司在蒐集數據的過程中,應該違反了很多美國與歐洲的法律。我認為部分數據甚至並不是公開的數據。他們可能透過不同渠道,搜羅破解取得的丶非授權使用的或是竊取來的數據。由於這間公司的整個資料庫有多個來源,所以我認為他們在蒐集不同資料的過程中,一定有一些行為是超出平常法律准許的範圍的。我認為這也顯示為何谷歌與臉書等科技公司需要更強的機制來確保用戶數據的安全。

德國之聲:過去幾年,中國在大數據領域投入非常多的資源。您認為在中國不斷提升其大數據分析與應用技術的同時,這個趨勢會帶來什麼樣的潛在風險?

鮑爾丁:如果一個用戶在臉書或推特分享一張照片,這兩個平台的技術會自動標記照片的地點。即便用戶關閉了推特標示地點的功能,其他人仍然可以從後台去分析出你所在的地點。我在深圳振華數據公司的資料庫中發現,這間公司因擁有大量用戶的地點資訊,所以他們可以透過資料庫來輕鬆定位特定人的所在地。

此外,他們的資料庫中有大量的軍方人員,包含數千個基層的軍方人員。他們追蹤這些軍方人員的推特或臉書,並藉此來定位這些人員的所在地。當他們知道這些人員的所在地後,他們可以進一步去推測某一艘特定船艦的所在地,以及在該艘船艦上可能發生的事。

我認為這些現象都顯示深圳振華數據公司擁有從大量開源數據中,進一步找出真正有用的資訊。我認為這個現象很有趣,但很多人應該也會對此感到擔憂。

德國之聲:您認為各界應該從這次的深圳振華事件進行哪些反思?

鮑爾丁:我認為,如果因大部分數據都是開源數據,而將它們視為低價值或無價值的情報,這種思考邏輯是有根本上的錯誤的。因為事實上,大部分的開源數據對情報單位來說是非常有價值的。政府部門或是情報單位所使用的很多資料,其實都來自開源數據。

另一個應該受到關注的是,深圳振華數據公司很明顯的有針對特定的人或是機構進行分類,因為他們的資料庫中都是特定領域的人或機構的資料,而他們很顯然是透過某種原則去搜尋這些資料。他們主要鎖定政治人物丶學者或是其他領域的重要人物。

根據我的分析,這個資料庫中的數據似乎顯示,振華數據公司在建立某種特定的目錄或清單,而他們打算透過這個清單去取得特定的科技或是影響特定的機構。振華並非隨意蒐集一群人的資料。他們在建立這個資料庫時,是有特定目的。

德國之聲:西方公司應該怎麼做才能確保用戶的資訊安全不會受到威脅?

鮑爾丁:雖然在這個案例中,深圳振華數據公司是引發數據安全疑慮的源頭,但是對於全球各地的民主國家來說,他們保護數據安全與隱密性的能力仍然非常重要。我們能確信中國運用有趣的方式來分析開源數據,但是西方國家同樣有類似的情形出現。不少政治人物會在選戰中透過數據將廣告推送給特定族群。

Christopher Balding
在網上發現這個資料庫的美國學者鮑爾丁告訴德國之聲,各界通常將開源數據視為低價值或是無價值的情報,但是開源數據實際上常常是政府部門或情報單位的資訊來源。圖片來源: Privat

雖然我們必須認同科技為生活帶來的好處,我們同時也該明白科技所帶來的風險,並想一下我們該如何管理這些風險。在社群網站主宰的時代,一間公司擁有大量開源數據,卻不太需要為如何運用這些數據負責。這種趨勢是令人擔憂的。

我們應該思考一下,在社群網站时代,我們可能面臨的風險是什麼,並試圖找尋可以在不影響用戶分享內容自由的前提下,提升保護數據安全的作法。在我看來,思考如何更安全的運用數據是很重要的一件事。

同樣的,當民主國家面對極權政府試圖影響其國民丶政治人物或大學時,他們應該重新審視自己現有的資訊安全與資訊隱私相關的法規。

鮑爾丁 (Christopher Balding)目前是一名獨立學者。他曾在北京大學商學院任教近十年,之前也是越南富布賴特大學經濟系的副教授。

德國之聲致力於為您提供客觀中立的新聞報導,以及展現多種角度的評論分析。文中評論及分析僅代表作者或專家個人立場。

© 2020年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究