freesexvideos性少妇欧美,httpwww色午夜com日本,久久精品成人免费国产,欧美贵妇videos办公室,国产成人精品一区二区三区免费

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>資訊 > 正文
每日快看:人類秒懂,AI崩潰:一個(gè)簡單測試,就讓GPT-5、Gemini等頂級(jí)模型集體“翻車”
2025-09-10 12:03:28 來源:量子位 編輯:

VYU團(tuán)隊(duì) 投稿


(資料圖片僅供參考)

量子位 | 公眾號(hào) QbitAI

人類一眼就能看懂的文字,AI居然全軍覆沒。

來自A*STAR、NUS、NTU、清華、南開等機(jī)構(gòu)的研究團(tuán)隊(duì),最近有個(gè)新發(fā)現(xiàn):

不管是OpenAI的GPT-5、GPT-4o,還是谷歌Gemini、Anthropic Claude,甚至國內(nèi)的Qwen、LLaVA,在面對(duì)一些“看得見但讀不懂”的文字時(shí),全都表現(xiàn)極差,直接“翻車”。

先切再疊,AI束手無策

VYU團(tuán)隊(duì)設(shè)計(jì)了兩個(gè)小實(shí)驗(yàn):

1、選取了100條四字成語,把每個(gè)漢字橫切、豎切、斜切,再把碎片重新拼接。

人類讀起來毫無壓力,AI卻幾乎全錯(cuò)。

2、挑選了100個(gè)八字母英文單詞,把前后兩半分別用紅色和綠色渲染,再疊加在一起。

對(duì)人類來說,這幾乎不構(gòu)成挑戰(zhàn)——因?yàn)槲覀兊囊曈X系統(tǒng)對(duì)紅/綠通道異常敏感,大腦能自動(dòng)分離顏色,然后拼出完整的單詞。

但對(duì)AI模型來說,結(jié)果卻完全不同:

即使是最新發(fā)布的大模型,在這些問題上也屢屢碰壁。

無論是Gemini 2.5 Pro:

還是Kimi 2(Switch to 1.5 for visual understanding) :

(PS:Kimi 2最終推測的答案是hardline)

又或者Qwen3-Max-Preview:

全都得不到正確的結(jié)果。

AI不懂符號(hào)分割與組合

對(duì)該現(xiàn)象進(jìn)行分析,VYU團(tuán)隊(duì)認(rèn)為,根本原因在于AI靠模式匹配,不懂文字結(jié)構(gòu)。

人類之所以能“讀懂”,是因?yàn)槲覀円蕾嚱Y(jié)構(gòu)先驗(yàn)——知道漢字由偏旁部首組成,知道英文是按字母組合的。

于是,只要文字稍作擾動(dòng)(但人類依舊能看懂),AI就會(huì)徹底崩潰。

這個(gè)問題之所以值得研究,是因?yàn)樗P(guān)系到AI落地的核心挑戰(zhàn):

  • 在歷史文獻(xiàn)與科學(xué)筆記整理中,AI無法像人類一樣從殘缺文字中恢復(fù)含義。

  • 在安全場景里,攻擊者甚至可以利用這種“盲點(diǎn)”繞過AI審查。

VYU團(tuán)隊(duì)認(rèn)為,要想讓AI擁有類似人類的韌性,必須重新思考VLMs如何整合視覺與文本——

關(guān)鍵詞: 崩潰 團(tuán)隊(duì) 模型 測試 Kimi Qwen 人類

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com