文/腦極體
作為一個(gè)AI垂直自媒體的作者,我工作中的很大一部分就是替AI“帶路”,然后告訴人類讀者們,你們的這項(xiàng)和那項(xiàng)工作都要被AI替代了。
一直以來(lái),人類似乎都站在一個(gè)毫無(wú)還手之力的弱勢(shì)地位,或許未來(lái)真的像一些悲觀者想象中那樣,我們有AI司機(jī)、AI售貨員、AI詩(shī)人,但人類自己卻成了可憐的乞討者。
直到,我***次發(fā)現(xiàn)有一項(xiàng)工作AI在一段時(shí)間以內(nèi)都無(wú)法超越人類,而這次勝利屬于二次元——不會(huì)被AI代替的工作,是漫畫(huà)家。
連漫畫(huà)都看不懂,談什么毀滅世界?
漫畫(huà)家不會(huì)AI代替的原因很簡(jiǎn)單,因?yàn)轳R里蘭大學(xué)的一位教授進(jìn)行了一項(xiàng)研究,**終發(fā)現(xiàn)AI根本看不懂漫畫(huà)。
以上是一則非常簡(jiǎn)單的四格漫畫(huà),對(duì)于人類來(lái)說(shuō)理解起來(lái)非常容易:小貓?jiān)谒伎紕?chuàng)作素材,然后發(fā)現(xiàn)了小狗,要求小狗講個(gè)笑話,小狗說(shuō)“你很漂亮”導(dǎo)致小貓非常憤怒。
實(shí)際上,在***一個(gè)畫(huà)面中,小狗沒(méi)有入鏡,而“你很漂亮”本來(lái)是表?yè)P(yáng),要和上一個(gè)畫(huà)面中的“笑話”連接起來(lái),才能解釋出小貓的情緒。
對(duì)于AI來(lái)說(shuō),要理解這些呈現(xiàn)在畫(huà)面之外的信息,簡(jiǎn)直太困難了。
在馬里蘭大學(xué)的實(shí)驗(yàn)中,研究者搭建了一個(gè)由120萬(wàn)張漫畫(huà)畫(huà)格組成的數(shù)據(jù)集,并提取出了每個(gè)畫(huà)格中的文本,利用LSTM模型,希望AI能對(duì)漫畫(huà)進(jìn)行一個(gè)連貫的了解。
關(guān)于LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))此前已經(jīng)介紹過(guò)很多,這一模型的特點(diǎn)就是加入了記憶的概念,可以處理和預(yù)測(cè)時(shí)間序列較長(zhǎng)元素。雖然在長(zhǎng)文本、機(jī)器翻譯等等方面表現(xiàn)的都不錯(cuò),但在看漫畫(huà)這件事上,LSTM徹底敗了。
在經(jīng)過(guò)大量訓(xùn)練后,研究人員給了AI一組以前沒(méi)見(jiàn)過(guò)的漫畫(huà),要求AI理解并預(yù)測(cè)下一個(gè)畫(huà)面中的文字信息或畫(huà)面內(nèi)容,結(jié)果AI的成績(jī)一塌糊涂。而人類的預(yù)測(cè)正確程度,通常能達(dá)到80%的正確率。
視覺(jué)敘事?何必強(qiáng)人工智能所難
嚴(yán)格來(lái)說(shuō),漫畫(huà)屬于“視覺(jué)敘事”——把信息隱藏于圖像之中。同樣是視覺(jué)敘事,AI理解電影就比理解漫畫(huà)容易的多,電影的主角是人,而人臉長(zhǎng)的都是一個(gè)樣子,想要訓(xùn)練AI讀出人臉表情、識(shí)別情緒是件很簡(jiǎn)單的事,更何況電影還會(huì)有詳細(xì)的劇本。
但漫畫(huà)大的特點(diǎn),就是視覺(jué)上不具有連貫性。就像上文的四格漫畫(huà)一樣,第三張圖小狗還在畫(huà)面中,第四張圖就不在了。人類可以很快的理解到,名為淡定狗的小狗扔下一句話就淡定的離開(kāi)??蓪?duì)于AI來(lái)說(shuō),讀出這種在畫(huà)面和文字之外的信息實(shí)在是強(qiáng)人工智能所難。
蘇州憶信捷信息技術(shù)有限公司為客戶提供軟件定制、app開(kāi)發(fā)、微信開(kāi)發(fā)等定制化軟件服務(wù)。網(wǎng)站: www.yixinjie.cc 聯(lián)系電話:0512-86660338 聯(lián)系地址:蘇州市工業(yè)園區(qū)仁愛(ài)路150號(hào) 南大研究生院A223/A327
真誠(chéng)歡迎大家前來(lái)咨詢,請(qǐng)撥打我們的服務(wù)熱線,謝謝您的瀏覽。