清研智庫(kù):如何應(yīng)對(duì)AI帶來(lái)的虛假信息?
虛假信息的快速攻擊,目的是立即產(chǎn)生破壞性效果,是數(shù)字生態(tài)系統(tǒng)中最重大的挑戰(zhàn)之一。
信息泄露的風(fēng)險(xiǎn)
有些形式的虛假信息可以在幾小時(shí)甚至幾分鐘內(nèi)造成傷害。這類(lèi)虛假信息只要有足夠的時(shí)間就很容易被揭穿,但要想迅速揭穿以防止其造成損害卻極為困難。
選舉是許多領(lǐng)域中可能發(fā)生這種情況的一個(gè)例子。金融市場(chǎng)是另一個(gè)例子,它可能會(huì)受到短期操縱。外交事務(wù)可能會(huì)受到影響,因?yàn)橹{言通過(guò)數(shù)字平臺(tái)迅速傳播到世界各地。社會(huì)運(yùn)動(dòng)也可能成為目標(biāo),因?yàn)閭鞑ヌ摷傩畔⒌哪康氖菫榱舜碳つ稠?xiàng)事業(yè)的支持者或反對(duì)者采取行動(dòng)或作出反應(yīng)。
當(dāng)然,旨在造成短期影響的網(wǎng)上虛假信息所帶來(lái)的問(wèn)題并不新鮮。今天,AI可以作為一種力量倍增器進(jìn)行部署,讓一小部分人創(chuàng)造出更大群體的在線(xiàn)活動(dòng)水平。
檢測(cè)虛假信息
各種形式的虛假信息是社交媒體公司面臨的最棘手的挑戰(zhàn)之一。適用于許多其他領(lǐng)域的假陽(yáng)性假陰性的權(quán)衡同樣適用于虛假信息檢測(cè)。如果社交媒體公司對(duì)虛假信息的分類(lèi)過(guò)于寬泛,那么他們就有可能讓那些發(fā)布重要、及時(shí)的準(zhǔn)確信息的用戶(hù)沉默。如果公司的分類(lèi)范圍太窄,虛假信息攻擊就可能不被發(fā)現(xiàn)。
社交媒體公司深知這種權(quán)衡。對(duì)于旨在較長(zhǎng)時(shí)間內(nèi)采取行動(dòng)的虛假信息活動(dòng),在許多情況下,社交媒體公司的最佳做法是保守地封殺內(nèi)容;等待確認(rèn)信息的虛假性后再封殺的危害往往低于無(wú)意中封殺傳達(dá)準(zhǔn)確信息的合法用戶(hù)的帖子的危害。換句話(huà)說(shuō),對(duì)于會(huì)在較長(zhǎng)的時(shí)間范圍內(nèi)造成大部分傷害的虛假信息,社交媒體公司有足夠的時(shí)間來(lái)調(diào)查疑似虛假信息帖子的準(zhǔn)確性,同時(shí)還保留了在必要時(shí)盡早采取行動(dòng)的選擇,以預(yù)先阻止大部分傷害。
虛假信息的快速攻擊尤其難以應(yīng)對(duì),因?yàn)樗鼈儾粫?huì)給社交媒體公司留下時(shí)間。
對(duì)于不復(fù)雜的虛假信息活動(dòng),例如那些涉及到從新創(chuàng)建的只有少數(shù)追隨者的帳戶(hù)中復(fù)制和粘貼帖子的活動(dòng),檢測(cè)和迅速作出反應(yīng)是很簡(jiǎn)單的事情。然而,像上述復(fù)雜的攻擊,其行為和表現(xiàn)與合法賬戶(hù)活動(dòng)類(lèi)似。辨別真假、識(shí)別哪些賬戶(hù)是善意的,哪些不是,所需的時(shí)間遠(yuǎn)遠(yuǎn)大于虛假信息造成最嚴(yán)重?fù)p害的時(shí)間。
幸運(yùn)的是,打擊網(wǎng)絡(luò)虛假信息的必要性在學(xué)術(shù)研究人員、民間社會(huì)團(tuán)體和商業(yè)部門(mén),特別是在初創(chuàng)企業(yè)和成熟的技術(shù)公司中得到了越來(lái)越多的關(guān)注。這導(dǎo)致了越來(lái)越多的付費(fèi)產(chǎn)品和免費(fèi)在線(xiàn)資源來(lái)追蹤虛假信息。解決方案的一部分涉及機(jī)器人檢測(cè),因?yàn)闄C(jī)器人經(jīng)常被用來(lái)傳播虛假信息。但機(jī)器人也被用于許多其他目的,有些是邪惡的,有些是無(wú)害的;而且并非所有的虛假信息活動(dòng)都涉及機(jī)器人。越來(lái)越多的商業(yè)產(chǎn)品旨在檢測(cè)和管理機(jī)器人。
機(jī)器人僅僅只是問(wèn)題的一部分,因?yàn)椴⒎撬惺褂脵C(jī)器人的虛假信息活動(dòng)都會(huì)被機(jī)器人檢測(cè)軟件發(fā)現(xiàn)。因此,擁有能夠查看可疑內(nèi)容如何影響更廣泛的生態(tài)系統(tǒng)的工具也很重要。
數(shù)據(jù)標(biāo)簽的挑戰(zhàn)
以足夠快的時(shí)間應(yīng)對(duì)虛假信息的快速攻擊將需要AI。但是,AI并不是魔法;要想有效地應(yīng)對(duì)虛假信息,它需要獲得數(shù)據(jù)以及使其能夠評(píng)估數(shù)據(jù)準(zhǔn)確性的信息。為了進(jìn)一步探討這個(gè)問(wèn)題,首先考慮如何在沒(méi)有任何時(shí)間壓力的情況下,使用基于AI的方法來(lái)檢測(cè)虛假信息,然后解決因需要快速檢測(cè)而產(chǎn)生的額外復(fù)雜性,是很有幫助的。
當(dāng)有大量已被準(zhǔn)確標(biāo)記的訓(xùn)練數(shù)據(jù)集時(shí),虛假信息最容易被檢測(cè)出來(lái)。訓(xùn)練數(shù)據(jù)是用來(lái)讓AI系統(tǒng)學(xué)習(xí)的,這樣當(dāng)它看到訓(xùn)練集里沒(méi)有的新數(shù)據(jù)時(shí),它就知道如何對(duì)其進(jìn)行分類(lèi)。使用一個(gè)已經(jīng)就感興趣的屬性進(jìn)行過(guò)標(biāo)注的數(shù)據(jù)集進(jìn)行學(xué)習(xí)。一旦完成了訓(xùn)練過(guò)程,該算法將非常有效地快速將有關(guān)該藥物的新社交媒體帖子或新聞報(bào)道分類(lèi)為不準(zhǔn)確或準(zhǔn)確。
還有一類(lèi)基于無(wú)監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù),算法必須在沒(méi)有預(yù)先存在的標(biāo)簽的情況下學(xué)習(xí)識(shí)別數(shù)據(jù)中感興趣的類(lèi)別。
任何學(xué)習(xí)算法,無(wú)論是有監(jiān)督的還是無(wú)監(jiān)督的,一個(gè)障礙是獲得足夠大的訓(xùn)練數(shù)據(jù)集。適合用作訓(xùn)練數(shù)據(jù)的特定問(wèn)題的信息可能需要大量時(shí)間在社交媒體上積累。為了AI在系統(tǒng)中檢測(cè)虛假信息,數(shù)據(jù)在許多情況下至少需要在一開(kāi)始就進(jìn)行一定程度的人工編碼。但對(duì)于需要非常快速地部署虛假信息防御措施的情況來(lái)說(shuō),它的效果要差得多,在這種情況下,通常會(huì)有較少的數(shù)據(jù)量可以作為算法學(xué)習(xí)的基礎(chǔ)。
另一個(gè)問(wèn)題,無(wú)論是在快速還是在時(shí)間限制較少的識(shí)別虛假信息的嘗試,都是AI算法在學(xué)習(xí)過(guò)程中所依賴(lài)的數(shù)據(jù)標(biāo)簽的準(zhǔn)確性。標(biāo)簽不一定準(zhǔn)確是機(jī)器學(xué)習(xí)中一個(gè)眾所周知的問(wèn)題。
使用AI識(shí)別虛假信息的嘗試很可能需要面對(duì)嘈雜的數(shù)據(jù),原因很簡(jiǎn)單,這其中涉及到有意的欺騙。虛假信息攻擊會(huì)與一系列關(guān)于網(wǎng)上言論是否真實(shí)的矛盾說(shuō)法聯(lián)系在一起。在很短的時(shí)間內(nèi),算法或者一個(gè)人很難知道該相信哪個(gè)標(biāo)簽。因此,要快速回應(yīng)假消息,就必須解決有限的數(shù)據(jù)和不可靠的,在某些情況下故意錯(cuò)誤是數(shù)據(jù)標(biāo)簽的雙重障礙。
研究人員已經(jīng)認(rèn)識(shí)到這些問(wèn)題,并正在開(kāi)發(fā)新的方法,這些方法不依賴(lài)于大量的預(yù)先存在的訓(xùn)練數(shù)據(jù)集。在解決虛假信息的研究中,一個(gè)共同的主題是衡量在線(xiàn)來(lái)源的可信度。建立和利用可信度的方法對(duì)于在精心設(shè)計(jì)的虛假信息快速攻擊中快速識(shí)別真相至關(guān)重要。
同樣重要的是,要認(rèn)識(shí)到AI可完成的極限。期望在不久的將來(lái),任何AI解決方案都能夠快速、明確地識(shí)別虛假信息攻擊,那是不合理的。
政策考慮
公共政策將在應(yīng)對(duì)虛假信息快速攻擊的人力和技術(shù)方面發(fā)揮核心作用。政策考慮也將是人類(lèi)應(yīng)對(duì)的重要驅(qū)動(dòng)力。對(duì)于大多數(shù)主題和事件來(lái)說(shuō),根本沒(méi)有資源提供專(zhuān)門(mén)的人員來(lái)單獨(dú)監(jiān)測(cè)可能出現(xiàn)虛假信息的各種情況。特別是考慮到Facebook和Twitter等公司在全球范圍內(nèi)運(yùn)營(yíng),在近兩百個(gè)國(guó)家有數(shù)十億個(gè)賬戶(hù),有可能被用來(lái)傳播虛假信息。因此,對(duì)于絕大多數(shù)虛假信息,社交媒體公司的人工干預(yù)必然是在通過(guò)算法或人工報(bào)告渠道發(fā)現(xiàn)問(wèn)題后才進(jìn)行。
此外,還需要制定政策來(lái)處理AI系統(tǒng)做出確切錯(cuò)誤決定的情況。由于在虛假信息快速攻擊的早期階段,可用的數(shù)據(jù)有限,快速做出判斷可能會(huì)導(dǎo)致算法顛倒真假,得出虛假信息是準(zhǔn)確的結(jié)論,試圖揭穿虛假信息本身就是虛假信息攻擊。算法會(huì)受到確認(rèn)偏差效應(yīng)的影響,通過(guò)有選擇地給予支持該結(jié)論的輸入更大的權(quán)重,導(dǎo)致對(duì)錯(cuò)誤結(jié)論的信心增強(qiáng)。特別是考慮到虛假信息快速攻擊的時(shí)間很短,這可能會(huì)導(dǎo)致算法迅速趨向于一個(gè)錯(cuò)誤的結(jié)論,而這個(gè)結(jié)論需要人的干預(yù)來(lái)識(shí)別和扭轉(zhuǎn)。
簡(jiǎn)而言之,不斷增長(zhǎng)的社交媒體生態(tài)系統(tǒng)和越來(lái)越強(qiáng)大的內(nèi)容傳播AI工具的可用性相結(jié)合,意味著虛假信息快速攻擊將成為一個(gè)經(jīng)常性特征。應(yīng)對(duì)這些攻擊將需要AI的進(jìn)一步進(jìn)步,特別是在數(shù)據(jù)非常有限的情況下快速評(píng)估在線(xiàn)來(lái)源的可靠性的方法有關(guān)。還需要社交媒體公司內(nèi)部注意確保政策和資源到位,以利用虛假信息檢測(cè)技術(shù)的能力,輔以人工干預(yù),并最大限度地提高利用其平臺(tái)促進(jìn)而不是破壞獲取準(zhǔn)確信息的可能性。
作者John Villasenor,本文原載于布魯斯金學(xué)會(huì),清研智庫(kù)李梓涵編譯