GPT-4讓AI更加具有像人一樣的能力,AI生成的文本的流暢度也令人驚嘆,越來(lái)越難以辨識(shí)。在這一背景下,AI檢測(cè)文本工具可以通過(guò)對(duì)生成文本進(jìn)行追蹤和檢測(cè),來(lái)識(shí)別文本是否由AI生成,這也成為防止大型AI語(yǔ)言模型用于作弊等行為的利器。
(資料圖)
日前,復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室推出了一款用于AI生成文本檢測(cè)的測(cè)試軟件“諦聽(tīng)”(英文:Sniffer),基于黑盒假設(shè),無(wú)需大規(guī)模監(jiān)督訓(xùn)練,就能檢測(cè)AI生成的文本。據(jù)該軟件的英文版本介紹,對(duì)于ChatGPT生成文本的檢測(cè)率達(dá)到80%左右。
實(shí)驗(yàn)室負(fù)責(zé)人邱錫鵬教授3月16日晚間在微信朋友圈上表示:“后續(xù)將會(huì)在MOSS語(yǔ)言模型開(kāi)源后,將Sniffer與MOSS進(jìn)行聯(lián)動(dòng),構(gòu)成一對(duì)矛與盾,相互提升,繼續(xù)探索大模型的新技術(shù)。”
上個(gè)月,邱錫鵬告訴第一財(cái)經(jīng)記者,如果優(yōu)化順利,MOSS將于3月底開(kāi)源。團(tuán)隊(duì)表示,未來(lái)“諦聽(tīng)”軟件工具還將支持GPT-4等更多大模型等檢測(cè),并在檢測(cè)性能提升后整理公開(kāi)模型。
不過(guò)團(tuán)隊(duì)坦言,由于“諦聽(tīng)”的模型是建立在“黑盒假設(shè)”下,因此對(duì)于輸入文本的來(lái)源模型并不知曉,而且與監(jiān)督訓(xùn)練的分類(lèi)器相比 ,將僅使用少部分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練。
值得注意的是,測(cè)試集的檢測(cè)結(jié)果顯示,該模型中文檢測(cè)的準(zhǔn)確率低于英文,因此中文檢測(cè)結(jié)果還需要進(jìn)一步提升。
根據(jù)“諦聽(tīng)”的英文版介紹,在保留的測(cè)試集上檢測(cè)結(jié)果顯示,識(shí)別ChatGPT生成文本的成功率在80%左右,識(shí)別人類(lèi)書(shū)寫(xiě)文本或GPT-2生成文本的成功率高于90%;非常短的文本(50個(gè)單詞或更少)很難被檢測(cè)到。此外,英文人工編寫(xiě)的示例文本來(lái)自維基百科。
“諦聽(tīng)”英文檢測(cè)結(jié)果分為四類(lèi):來(lái)自人類(lèi); 來(lái)自人類(lèi)、但可能有大模型如GPT-3輔助;來(lái)自GPT-3模型;來(lái)自GPT-2模型。
“諦聽(tīng)”中文版的檢測(cè)結(jié)果分為三類(lèi):一是“文本是人寫(xiě)的”、二是“文本是人寫(xiě)的,但是也很可能包含AI參與”、三是“文本是出自于AI模型的”。
3月17日,邱錫鵬對(duì)第一財(cái)經(jīng)記者表示:“對(duì)ChatGPT級(jí)別的中文檢測(cè)準(zhǔn)確率目前只有約40%,不過(guò)對(duì)于小模型(3B左右的開(kāi)源GPT-2模型)生成的準(zhǔn)確率可以達(dá)到90%左右。”
他解釋稱(chēng),中文檢測(cè)的準(zhǔn)確率低于英文有幾個(gè)原因。“首先是英文采用的wikipedia數(shù)據(jù)集進(jìn)行特征提取,因此覆蓋面更廣,中文選擇的數(shù)據(jù)質(zhì)量差一些,這也是我們發(fā)布beta測(cè)試并且正在改進(jìn)的地方;第二個(gè)是中文大模型的tokenizer(分詞器)差異會(huì)大一些。”邱錫鵬說(shuō)道。
他還表示,關(guān)于生成文本檢測(cè),國(guó)外有一些已經(jīng)發(fā)布的產(chǎn)品,對(duì)比下來(lái),針對(duì)GPT-2級(jí)別的模型,準(zhǔn)確率比較高,針對(duì)GPT-3級(jí)別的模型,檢測(cè)結(jié)果還比較差。
“一方面是這些模型是黑盒,我們的掌握信息有限,另一方面是這些模型生成質(zhì)量很高,多樣性也很好,尤其是GPT-4出現(xiàn)以后,相比于GPT-3.5,檢測(cè)難度進(jìn)一步增加了。”邱錫鵬對(duì)第一財(cái)經(jīng)記者表示,“總而言之,在大模型時(shí)代,文本檢測(cè)的機(jī)器評(píng)測(cè)準(zhǔn)確率仍然較低,還需要進(jìn)一步的研究。”
目前的AI文本檢測(cè)方式大致可分為兩類(lèi):黑盒假設(shè)和白盒假設(shè)。所謂的“黑盒假設(shè)”對(duì)大型語(yǔ)言模型通常只有API級(jí)別的訪問(wèn)權(quán)限。因此,這類(lèi)方法依靠于收集人類(lèi)和機(jī)器的文本數(shù)據(jù)樣本來(lái)訓(xùn)練分類(lèi)模型;“白盒假設(shè)”擁有對(duì)大型語(yǔ)言模型的所有訪問(wèn)權(quán)限,并且可以通過(guò)控制模型的生成行為或者在生成文本中加入水印(watermark)來(lái)對(duì)生成文本進(jìn)行追蹤和檢測(cè)。
在實(shí)踐中,黑盒檢測(cè)器通常由第三方構(gòu)建,例如較為著名的GPTZero,而白盒檢測(cè)器通常由大型語(yǔ)言模型開(kāi)發(fā)人員構(gòu)建。不過(guò)由于“黑盒假設(shè)”在數(shù)據(jù)收集的過(guò)程中很容易引入偏見(jiàn)(biases),這些偏見(jiàn)常常會(huì)被黑盒分類(lèi)器作為分類(lèi)的主要特征。而隨著大型語(yǔ)言模型能力的提升,大型語(yǔ)言模型生成的文本和人類(lèi)的差距越來(lái)越小,這會(huì)導(dǎo)致黑盒模型的檢測(cè)準(zhǔn)確性越來(lái)越低
此外,對(duì)于黑盒檢測(cè),用戶(hù)可以微調(diào)他們的模型,改變模型輸出的風(fēng)格或者格式,從而導(dǎo)致黑盒檢測(cè)無(wú)法找到通用的檢測(cè)特征。
復(fù)旦大學(xué)的語(yǔ)言模型MOSS自上個(gè)月推出以來(lái)備受各界關(guān)注。邱錫鵬認(rèn)為,國(guó)外開(kāi)發(fā)者不太可能以中文為主去發(fā)展他們的模型,中國(guó)要想開(kāi)發(fā)一個(gè)大型語(yǔ)言模型的基座,用于國(guó)內(nèi)的信息處理,就必須建設(shè)一個(gè)中文能力非常強(qiáng)的大型語(yǔ)言模型。
除了復(fù)旦大學(xué)之外,包括百度、阿里巴巴在內(nèi)的中國(guó)互聯(lián)網(wǎng)巨頭以及初創(chuàng)公司也都在開(kāi)發(fā)基于AI的大模型技術(shù)。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com