印度「大數據」選舉:一天 45,000 通針對年齡、種姓與信仰的電話調查

一個有 430 種變體的名字,和一名登記為 7982 歲的選民,都只是在北方邦關鍵競選政治工作眾多難關中的滄海一粟


印度·勒克瑙——自 2016 年 9 月後的每一天,印度北方邦首府勒克瑙(Lucknow)一座郊區大廈的地下室裡便一直傳來嗡嗡聲,數百名年輕女性對著耳機詢問、哄騙,偶爾懇求。

「拜託、拜託,」其中一名女子對著電話中不情願的村民說道,「我只需要 5 到 10 秒鐘。」

女性們在擁擠的桌前以不間斷的茶水提振精神,梳理著北方邦的投票人清單。北方邦是印度的一省,其人口之多足以成為世界上第六大國。

她們將答案仔細地填入表格中:「種姓」、「過去投票史」或者「偏好的部長人選」。這些細節會送上樓匯入表單,形成 7,500 萬投票人的資料庫,每天大約會有 4 萬 5,000 筆資料。

這就是印度風的「大數據」蒐集,以印度風的規模大刀闊斧。

2017 年 2 月初,北方邦的 1,400 萬名投票人中的第一波選民在印度最受矚目的地方選舉中,投下他們的選票。

在2014年的全國選舉中,納倫德拉·莫迪(Narendra Modi)贏得了壓倒性勝利,成為印度總理。他所屬的印度人民黨(Bharatiya Janata Party )在 2017 年再度勝選。這場選舉是莫迪吸票能力是否尚存的指標評估——而莫迪會在 2019 年再度親身面對選民。

連同目前執掌德里直轄區的新興政黨平民黨(Aam Aadmi),莫迪也是率先採用資料導向競選技術的政治人物,該技術也讓歐巴馬兩度入主白宮,同時也對唐納德‧川普(Donald Trump)的當選有所貢獻。

於當地執政的社會黨(Samajwadi Party)的競選副主任阿德瓦‧維寬‧辛格(Adwait Vikram Singh)表示,在勒克瑙郊區所進行的瘋狂電訪和極其複雜的演算,是目前印度政壇部署裡最繁複的資料操作。

「其他黨都不相信我們有這項技術。」這名 29 歲的副主席說道,一邊輕點著手機上已經發布給所有社會黨候選人的應用程式,上面顯示了投票人偏好、所屬投票站、種姓、性別和識字程度等。

有別於英美有像是劍橋分析(Cambridge Analytica)這樣利用臉書的簡短問答得到投票者詳細「心理圖像」(psychographic)的公司,北方邦——印度非常貧困、缺乏法治的省分——的資料蒐集仍然有賴於人力接觸。

「這裡沒有像臉書那樣的數位環境,至少還沒有深度扎根。在印度你必須要從頭開始土法煉鋼。」辛格說。

在省分裡更窮困的區域,不總是固定的電話號碼也是個問題。一個居無定所的勞工或農民可能得支付 20 盧比的話費,買一張全新的 SIM 預付卡能少花 5 盧比。

辛格和他的同事已經將田野團隊派遣至這個巨大省分所有 403 席地區。他表示,團隊帶回的不只是選民的詳細名單,同時還有與當地有力人士建立起的關係。與村長、郵務人員或老師保持良好關係有助於民情的回報——或者回報某人又換了新的電話號碼。

讓這個任務雪上加霜的是,在印度要取得公民的數位資訊遠比西方國家的政府或公司來得困難。

「在英美,因為有信用局,並且在 20 或 30 年前就開始數位化,他們已經制定出資料使用的法規,還有很多可供分析的資料。」以海德拉巴(Hyderabad)為據點的 Modak 資料研究公司分析總長米林德·契古帕克(Milind Chitgupakar)說道。

2013 年,該公司進行了一項比辛格的任務規模更大、但較為粗糙的調查,綜合了印度 8 億 1,000 萬選民的普查和選舉調查。「因為印度語言的演變及其所創造出的各種語音,那是項極大的挑戰。」他說。「我們發現『Srinivas』這個字有 430 種變體。」

「或者以納加夫戈(Najafgarh)地區來說,」他表示。「這個地方的拼法在全國抽樣調查中心、中央政府、投票意向調查的資料中都不一樣。如果是人類讀取這個資料,他會說,噢對,這些都是同一個地名,但是要訓練一台電腦學會這兩個名字是同一個……我們所做的許多分析都是為了解決這些小問題。」

最後的調查結果提供了許多冷知識——北方邦最常見的女性名字是蘇妮塔(Sunita);最老的投票人根據官方紀錄是 7982 歲——但這些也對大黨提供了有力的資料。

「這些資料顯示,登記投票人的年齡眾數為 27 歲,」契古帕克表示。但印度的人口年齡結構比這年輕得多。「所以我們知道,在 18 至 27 歲之間有大量人口並未登記投票。」

「我們完成了大範圍的調查,然後我們發現了這個年齡斷層,而由於該年齡段的人非常有理想抱負,是會投給某個我無法明言的政治領袖及其政黨的族群。」他礙於合約協議說道——雖然該人物顯然是莫迪。

「我們一得知這項資訊,該政黨便發起了一項大型投票登記的動員活動,試圖將那些年輕人拉進來。透過投票意向調查,我們發現無論是何種社經地位、年齡,甚至信仰,這名領袖在這組年輕族群中,都有超過 10% 的壓倒性優勢。」

「在 2014 年的北方邦選舉中,這樣的活動讓選民增加了 1,000 萬,其中 70% 的年齡都低於 35 歲。這都要歸功於資料分析。」他說。

海量資料挖掘可能將成為印度政治的新現象,但對於社會黨來說,古老的政治現象還是差點就讓海量資料挖掘的革新滅頂了。

就在資料蒐集於 2016 年 9 月開跑之際,一場艱難的世代戰役也在首席部長阿克西利許·亞達夫(Akhilesh Yadav)和他叔叔及父親之間公然展開,他們也都是政黨中的顯要人物。亞達夫失去了社會黨地方主席的位置,一時間失去了原本打算用來建立資料庫的政黨資金。

有了這套系統的建立和運作,辛格表示候選人得以針對年輕人、大學畢業生或穆斯林女性等不同人口族群,做出吸引他們的「微量調控目標」訊息。

而透過取得權限更高的詳細資訊,辛格和他的同事們幾乎可以追蹤大約 200 席位選民中的每一個家庭。

由於當時選舉尚未結束,他拒絕討論更詳細的情況,但他表示理論上他可以根據他們的研究結果,建議一名候選人打電話給村莊中一個具有影響力、但仍在候選人間舉棋不定的成員。「這是我的選舉動員中必不可少的部分。」

並非所有黨內大老都迷上這名哈佛畢業生「擾亂」他們做事方法的新企劃。「他們告訴我,『我們知道我們的人民想要什麼』。」他說。

「但是,自 1984 年以來,沒有任何一個政府在北方邦連任是有原因的。」

「你不知道人們想要什麼。如果你沒有得到很好的回饋,那就根本沒用。」

在這麼一個以流氓政治惡名昭彰的省分,犯罪指控纏身的候選人數量是前所未見地多,蒐集這些敏感資訊也可能造成安全的風險。辛格確保機密訊息絕不會傳遞給黨派人物,雖然「有時候」他們會分享電話通訊錄。

一般來說,印度「在隱私保護方面相當不安全」,科技律師阿帕·古普拓(Apar Gupta)說道。「缺乏法律保障,而憲法權利中的隱私權也備受質疑,甚至沒什麼人期待透過國家手段獲得隱私保障。」

北方邦仍公然實行種姓和宗教政治。當數據分析將印度政治運動引入 21 世紀,卻也有將種姓分隔政治捲入其中的風險。

但辛格說他不這麼想:隨著關於選民收入或識字率等新資訊的浪潮,政治運動會「超越種姓」。在快速變化的印度,「種姓的回報率是遞減的。」他說。

在尚未建置數位環境的區域,掌握選民資料的第一步仍是打通他們的電話。(Getty Images)

後記:莫迪的印度人民黨最終在北方邦勝選,時議認為莫迪的政黨給人打破種姓政治的形象,而辛格效力的社會黨則力有未逮。本文提及的劍橋分析則在近日捲入操縱美國選舉的重大醜聞,在此按下不表。

Previous ArticleNext Article