张钹: 硅基机器是否能产生意识?目前只有哲学上的争论
9月6日消息,在今日Baichuan2開(kāi)源大模型發(fā)布會(huì)上,中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院名譽(yù)院長(zhǎng)張鈸表示,硅基的機(jī)器是否能具有意識(shí),目前在科學(xué)上是沒(méi)有條件討論這個(gè)問(wèn)題的,只存在哲學(xué)上的爭(zhēng)論。
張鈸表示,到現(xiàn)在為止全世界對(duì)大模型的理論工作原理、所產(chǎn)生的現(xiàn)象都是一頭霧水,所有的結(jié)論都推導(dǎo)產(chǎn)生了“涌現(xiàn)現(xiàn)象”;而所謂涌現(xiàn)就是“給自己一個(gè)退路,解釋不清楚的情況下就說(shuō)它是涌現(xiàn)”,實(shí)際上這反映了我們對(duì)它一點(diǎn)不清楚。
在他看來(lái),大模型為什么能夠產(chǎn)生出來(lái)一個(gè)非常連貫的、多樣化的人類語(yǔ)言,主要靠三個(gè)措施;一個(gè)措施是文本的語(yǔ)義表示,也就是把文本里的詞包括句包括段落全變成向量,給構(gòu)造一個(gè)連續(xù)的拓?fù)淇臻g創(chuàng)造了條件;第二個(gè)措施是轉(zhuǎn)換器,注意機(jī)制,注意機(jī)制可以保證上下文的一致性;最后一個(gè),是下一個(gè)詞的預(yù)測(cè);在這三個(gè)條件訓(xùn)練下,就是在連續(xù)的拓?fù)淇臻g中構(gòu)造了非常光滑的流形,這個(gè)流形是局部度量空間,這個(gè)流形是代表詞在它的條件概率分布,所以在這個(gè)流形里采樣的時(shí)候出來(lái)的就是human like takes。
張鈸認(rèn)為,ChatGPT跟人類自然語(yǔ)言生成原理不一樣的地方,最根本之處是ChatGPT生成的語(yǔ)言是外部驅(qū)動(dòng)的,而人類是attention based推動(dòng)的,是在自己意圖的情況下驅(qū)動(dòng)的;所以GPT自己都不知道自己在干什么,內(nèi)容的正確性和合理性是不能保證的;如果想讓GPT語(yǔ)言達(dá)到人類自然語(yǔ)言一樣的語(yǔ)言,必須使計(jì)算機(jī)具有意識(shí),但“硅基的機(jī)器有沒(méi)有可能具有意識(shí)?目前來(lái)講科學(xué)上是沒(méi)有條件討論這個(gè)問(wèn)題的,現(xiàn)在只存在哲學(xué)上的爭(zhēng)論。”
以下是張鈸演講實(shí)錄:
今天我來(lái)參加百川這個(gè)7B、13B開(kāi)源模型的發(fā)布會(huì),首先表示祝賀,祝賀百川公司在成立短短幾個(gè)月里就能推出來(lái)高質(zhì)量的開(kāi)源大模型,3個(gè)月內(nèi)能下載量接近500萬(wàn)次,這是很大的成就。也為我國(guó)大模型產(chǎn)業(yè)作出貢獻(xiàn)。
但是我今天要講的不是這個(gè),我重點(diǎn)借這個(gè)機(jī)會(huì)表示公司把這個(gè)開(kāi)源模型定位在助力學(xué)術(shù)研究這點(diǎn)上,我要做講解,表示對(duì)這樣的工作的支持。
大家知道,到現(xiàn)在為止我們國(guó)家已經(jīng)推出很多從幾十億到幾百億不同規(guī)模幾十種的大模型,這些大模型主要集中在垂直領(lǐng)域的應(yīng)用上,很少,至少現(xiàn)在沒(méi)看到定位在助力學(xué)術(shù)研究上。我認(rèn)為這個(gè)學(xué)術(shù)研究非常重要,這個(gè)學(xué)術(shù)研究研究什么,主要研究大模型本身。為什么有這個(gè)需要?這個(gè)工作非常迫切,非常重要。因?yàn)榈浆F(xiàn)在為止全世界對(duì)大模型的理論工作原理、所產(chǎn)生的現(xiàn)象都是一頭霧水,所有的結(jié)論都推導(dǎo)產(chǎn)生了“涌現(xiàn)現(xiàn)象”,所謂涌現(xiàn)就是給自己一個(gè)退路,解釋不清楚的情況下就說(shuō)它是涌現(xiàn)。實(shí)際上這反映了我們對(duì)它一點(diǎn)不清楚。所以我認(rèn)為這個(gè)問(wèn)題必須要把它搞清楚,我們才有可能發(fā)展出來(lái)中國(guó)特有的有中國(guó)特色的大模型。
在這個(gè)問(wèn)題上我主要講幾個(gè)問(wèn)題,一個(gè)問(wèn)題,我們必須回答這樣一個(gè)大的模型為什么能夠產(chǎn)生出來(lái)一個(gè)非常連貫的、多樣化的人類語(yǔ)言,說(shuō)的全是人話,OpenAI為什么能夠說(shuō)出來(lái)Human like takes,說(shuō)的全是人話,并不是我們知道它說(shuō)的是什么,這個(gè)實(shí)際上是非常surprise的,大家不要認(rèn)為一定是這樣。所以O(shè)penAI在做這個(gè)事情的時(shí)候是冒著很大的風(fēng)險(xiǎn),其實(shí)它不清楚這么大規(guī)模的文本去訓(xùn)練它,究竟能不能收斂,收斂完以后究竟收斂到哪兒去。所以后來(lái)就出現(xiàn)了,雖然有好多質(zhì)量不高,但是它覺(jué)得能成為Humnan like takes,這個(gè)是非常驚奇的事情。
我們?cè)趺唇鉀Q它,認(rèn)識(shí)它,我的看法是這樣,這里主要靠三個(gè)措施。一個(gè)措施是文本的語(yǔ)義表示,也就是說(shuō)我們把文本里的詞包括句包括段落全變成向量,不只是詞變成向量,它經(jīng)過(guò)抽象以后,上面各個(gè)都變成向量,這就給構(gòu)造一個(gè)連續(xù)的拓?fù)淇臻g創(chuàng)造了條件。如果原來(lái)是離散的,這個(gè)空間絕對(duì)不會(huì)有。第二個(gè)轉(zhuǎn)換器,注意機(jī)制,注意機(jī)制可以保證上下文的一致性。最后一個(gè)下一個(gè)詞的預(yù)測(cè)。我們可以看一下,在這三個(gè)條件訓(xùn)練下面它最后訓(xùn)練出來(lái)的是什么個(gè)什么東西,是在個(gè)緊的連續(xù)的拓?fù)淇臻g中間構(gòu)造了一個(gè)流形,這個(gè)流形是局部度量空間,這個(gè)數(shù)學(xué)性質(zhì)非常之好的,直觀地講,就是它形成了一個(gè)非常光滑的流形,而且這個(gè)流形是代表詞在它的條件概率分布,而且它的條件前面是整個(gè)文章,所以你在這個(gè)流形里頭采樣的時(shí)候它出來(lái)的一定是human like takes,不可能出來(lái)別的東西,因?yàn)樗浇亩际钦Z(yǔ)義相近的,即使偏一點(diǎn)語(yǔ)義也是相近的。這個(gè)問(wèn)題我們需要研究,如果掌握了這個(gè)問(wèn)題我認(rèn)為我們今后不需要這么多的數(shù)據(jù)。因?yàn)榇蠹液髞?lái)也做了一些工作,當(dāng)然它有一個(gè)門檻,你超過(guò)這個(gè)門檻以后這個(gè)流形才能形成,如果這個(gè)流形不形成的話,你這個(gè)數(shù)量沒(méi)有到那么大的程度,但是這個(gè)數(shù)量究竟是多少,是不是我們現(xiàn)在需要的那樣,這個(gè)是需要我們研究的問(wèn)題。
第二個(gè)問(wèn)幻覺(jué)。它為會(huì)產(chǎn)生幻覺(jué)?這個(gè)問(wèn)題就涉及到ChatGPT跟人類自然語(yǔ)言生成原理不一樣的地方。不一樣的地方在什么地方,最根本的是,ChatGPT生成的語(yǔ)言是外部驅(qū)動(dòng)的,而人類是attention based推動(dòng)的,是在自己意圖的情況下驅(qū)動(dòng)的,所以它的生成是在意圖控制下生成的,我們是在外部驅(qū)動(dòng)下生成的,它自己都不知道自己在干嘛,所以它內(nèi)容的正確性和合理性是不能保證的。所以因此在沒(méi)有對(duì)齊之前,它基本上能達(dá)到60%,大量的是不合理的,不正確的,因?yàn)榍懊婺欠N辦法,構(gòu)成流形的辦法不能保證它內(nèi)容是正確是合理的。所以只有經(jīng)過(guò)ALignment才能解決這個(gè)問(wèn)題,現(xiàn)在我覺(jué)得ALignment國(guó)內(nèi)做的工作太少,不如國(guó)外的,大家想一下它之所以能從GPT3.5到GPT4,幾個(gè)月的時(shí)間有那么多的變化,這主要就是ALignment的功勞,所以ALignment這方面我們是有點(diǎn)輕視的,我們覺(jué)得隨便找?guī)讉€(gè)人來(lái)標(biāo)注就可以了,其實(shí)完全不對(duì)的,他們是世界上最優(yōu)秀的團(tuán)隊(duì)來(lái)做這個(gè)事情。大家知道OpenAI干這個(gè)事的有80幾個(gè)人,10個(gè)人是大陸過(guò)去的,中間骨干有3個(gè)人都在我們團(tuán)隊(duì)里面干過(guò),是非常優(yōu)秀的。所以這點(diǎn)我們國(guó)家可能不夠重視。
這里頭就涉及到治理和開(kāi)放的問(wèn)題,因?yàn)閷?shí)際上我們做ALignment是做治理,希望它不產(chǎn)生(問(wèn)題),但是大家一定要知道治理以后它的質(zhì)量、多樣性肯定下降,也就是說(shuō)治理的越多,它的質(zhì)量肯定受影響,所以這里頭有一個(gè)非常重大的問(wèn)題,我們?nèi)绾稳テ胶膺@二者的關(guān)系,開(kāi)放和治理。剛才說(shuō)了產(chǎn)生這樣的結(jié)果是必然的,如果要問(wèn)ChatGPT最大的特點(diǎn)是什么,生成結(jié)果的多樣化,這是它的靈魂,因?yàn)橛辛硕鄻踊院蟛庞锌赡苡袆?chuàng)造性,你如果追求多樣化的話必然會(huì)產(chǎn)生錯(cuò)誤,所以這兩個(gè)是一個(gè)問(wèn)題的兩個(gè)方面,所以我們?cè)谥卫淼臅r(shí)候必須要跟質(zhì)量一起做一個(gè)平衡。所以這個(gè)問(wèn)題我覺(jué)得我們應(yīng)該進(jìn)一步研究。
我把這個(gè)語(yǔ)言暫時(shí)叫做GPT語(yǔ)言,我們?cè)贑hatGPT里頭又生成一個(gè)我們從來(lái)沒(méi)有見(jiàn)過(guò)的語(yǔ)言叫GPT語(yǔ)言,跟人類的自然語(yǔ)言我認(rèn)為不一樣,所以這里第五個(gè)問(wèn)題,我們將來(lái)努力的方向是什么,我們是不是想把GPT語(yǔ)言把它完全對(duì)齊到人類的自然語(yǔ)言?我們看看它的可能性和必要性,我認(rèn)為這個(gè)可能性不大,因?yàn)槟阋袵PT語(yǔ)言完全跟人類的自然語(yǔ)言一樣,你必須解決一個(gè)問(wèn)題--讓GPT有自我意識(shí)。剛才我們說(shuō)過(guò)GPT跟人類語(yǔ)言不一樣的地方,它是外部驅(qū)動(dòng)的,人類的自然語(yǔ)言是內(nèi)部驅(qū)動(dòng)的,是自我意識(shí)驅(qū)動(dòng)的,intention based,你如果想使GPT語(yǔ)言達(dá)到人類自然語(yǔ)言一樣的語(yǔ)言,你必須使計(jì)算機(jī)具有意識(shí)。一個(gè)硅基的機(jī)器有沒(méi)有可能具有意識(shí),目前來(lái)講科學(xué)上是沒(méi)有條件討論這個(gè)問(wèn)題的,現(xiàn)在只存在哲學(xué)上的爭(zhēng)論。從哲學(xué)的爭(zhēng)論來(lái)講,現(xiàn)在有兩條路按照唯物主義行為主義的觀點(diǎn)來(lái)講我們只要追求行為主義上的相似形,而不是追求內(nèi)在機(jī)制的一致性,人工智能就有這一派,我們叫做唯物主義學(xué)派或者行為主義學(xué)派,現(xiàn)在人工智能絕大多數(shù)走的是這條道路,是人工智能的主流。
人工智能還有一個(gè)少數(shù)派是唯芯主義,他認(rèn)為唯有內(nèi)在系統(tǒng)達(dá)到跟人類一樣才有可能達(dá)到真正的智能,這個(gè)我們認(rèn)為很難做到或者做不到,因?yàn)楣杌臋C(jī)器是不是會(huì)做成跟人類碳基的智能一樣,這個(gè)在哲學(xué)上有點(diǎn)說(shuō)不通,更不用說(shuō)科學(xué)上,更說(shuō)不通。
最后要講它的一個(gè)必要性。其實(shí)人工智能追求什么,追求機(jī)器的智能,希望這個(gè)智能跟人類的智能不一樣,它某些方面比人類有優(yōu)勢(shì),某些方面比人類優(yōu)缺點(diǎn),這是我們追求的目標(biāo),因?yàn)橹挥性谶@個(gè)目標(biāo)情況下我們才能夠得到人類和機(jī)器的和平共處。其實(shí)人工智能絕對(duì)不是去追求做一個(gè)機(jī)器跟人類一樣,這個(gè)必要性絕對(duì)不需要。我們?yōu)槭裁匆龀鲆粋€(gè)跟人類一樣的機(jī)器?如果需要的話,我們多生幾個(gè)人不就完了嗎,干嘛非去造一個(gè)跟人類一樣的機(jī)器呢,所以從必要性來(lái)講沒(méi)有必要,所以我覺(jué)得大家在這個(gè)上面爭(zhēng)論,我認(rèn)為意義不大。所以我覺(jué)得目前來(lái)講最重要的,我們要研究、了解GPT語(yǔ)言,只有我們徹底了解了它,我們才能更好地發(fā)展它,使用它,或者說(shuō)從產(chǎn)業(yè)的角度來(lái)講才可以發(fā)展出更健康的人工智能產(chǎn)業(yè)。我希望百川智能公司能在這方面起引領(lǐng)作用,謝謝大家。
總結(jié)
以上是生活随笔為你收集整理的张钹: 硅基机器是否能产生意识?目前只有哲学上的争论的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Java 8 Friday:使用Stre
- 下一篇: 如何用Excel制作一份简历电脑如何制作