焦點發現

專題報導

最新網上累計支持度

計算網民針對參選人發表支持或不支持言論的數據

 資料最後更新日期:

曾俊華

0
0

林鄭月娥

0
0

葉劉淑儀

0
0

胡國興

0
0
了解我們的研究方法

Facebook專頁累計粉絲

關注量 
* 參選人按帖文及留言數量排序

最新走勢

參選人支持度

討論熱度

60k
40k
20k
14/2提名期開始
1/3提名期結束
26/3行政長官選舉舉行

網民說什麼

 

曾俊華

支持

    不支持

      林鄭月娥

      支持

        不支持

          胡國興

          支持

            不支持

              葉劉淑儀

              支持

                不支持

                  研究方法

                  本研究計劃以有設立Facebook專頁的網上媒體為目標,共選出76個網媒Facebook專頁 。媒體定義的四大原則包括:1. 擁有一手資料,非百分百分享平台;2. 擁有採訪或編輯團隊,非個人創作;3. 不會跟政黨或壓力團體百分百緊密;4. 不包括娛樂新聞專頁。

                  本計劃研究76專頁上所有跟特首參選人相關的帖文及留言,通過慧科大數據分析系統,以人工智能、自然語言處理技術和文本分析為基礎,辨認出針對各個參選人表達支持與不支持的內容,並提取當中的關鍵詞組。

                  作為一家本地公司,慧科在過去二十年,針對中文,尤其是廣東話的分析及處理,投入了大量資源,累積了豐富的自然語言處理技術和文本分析經驗。慧科大數據分析系統由人工智能團隊和語言學家團隊合力研發。人工智能團隊將語言學專家對廣東話的理解及對香港本地文化及議題的認識轉化為訓練數據,設計及訓練人工智能模型以學習辨認針對各參選人表達意見的中文、英文、廣東話詞組及本地網絡用語(如「高登」用語),並從大量數據中學習各種用語在不同語境中(例如否定句、程度副詞等)所表達的屬性及強度。舉例:「麒麟」本是瑞獸,但在是次特首選戰中,當它跟其中一位參選人配搭上,便成為表達「不支持」的詞組之一。對於同時提及多位參選人的文章,系統並能通過句子結構與上下文信息,分辨出針對不同參選人的不同意見。

                  針對是次特首戰,人工智能和語言學家團隊更聯同編輯團隊,每天分析、更新與選戰相關的最新文章內容、詞組及其屬性。系統得出結果後,編輯團隊會再按需要修正,以確保系統判斷的準繩度。

                  由2017年1月1 日開始,慧科大數據分析系統抓取出與參選人相關的帖文及留言。系統先從這些帖文與留言中,識別及總結出表達支持及不支持的內容,然後把支持量及不支持量,各自除以所有參選人支持及不支持帖文及留言的總數,得出「支持度」與「不支持度」。

                  除整體讀數外,本計劃並根據網媒專頁特性,將Facebook專頁歸類爲「年輕」、「知識份子」、「親建制」,未能歸類的列為「其他」;計劃並提供「支持」及「不支持」各參選人的留言者的性別分佈及組別分佈;此外,並分別按帖文留言量及獨立用戶量計算各參選人在整體及各個組別的「支持度」和「不支持度」,爲公衆提供更多分析維度參考。

                  系統識別的大數據包括各帖文所得的表情符號(emoji),但鑑於emoji表達的涵意時有混淆、未必清晰,例如單從「嬲嬲」圖案,難以分辨當事人是不滿帖文者,還是不滿帖文內容(及帖文那方面內容),所以,本系統識別的emoji數據,只用作參考(例如是衡量關注度的數據之一)。本研究選擇以能更深入反映留言取態的文本/詞組分析爲支持度基礎。

                  媒體及學術機構如有查詢,

                  請聯絡 contentsyn@wisers.com