第二章 大家說的大模型,其實到底是個什么東西?
無知客:我發(fā)現(xiàn)一個問題。
不管是新聞、公司介紹,還是技術(shù)文章,大家都在說三個字:大模型。
但奇怪的是,說得越多,我越不知道它到底是什么。
它是軟件?
是程序?
是某種 AI 大腦?
還是一臺服務(wù)器?
蘇格拉底:在你問“它是什么”之前,我們先問一個更基礎(chǔ)的問題。
你覺得——“大模型”這個名字,是在描述它的本質(zhì),還是在描述它的規(guī)模?
無知客:聽起來像規(guī)模。
蘇格拉底:很好。
那我們先記住一件事:“大模型”這個詞,本身幾乎什么都沒說清楚。
蘇格拉底:我問你一個簡單的問題。
如果有人跟你說:“我們公司有一個超級大的 Excel 表?!?br>
你會覺得它在干什么?
無知客:數(shù)據(jù)很多?
蘇格拉底:對。
但你會不會因此覺得:這個 Excel 表“更聰明”?
無知客:當(dāng)然不會。
蘇格拉底:那我們換個名字:“超級智能數(shù)據(jù)系統(tǒng)”。
感覺是不是立刻不一樣了?
無知客:……是有一點。
蘇格拉底:“大模型”就處在這兩者之間。
它聽起來既像“數(shù)據(jù)”,又像“智能”。
于是我們很容易在腦子里,自動補完一個不存在的形象:一個正在思考的東西。
無知客:那我換個問法。
大模型是不是一個很復(fù)雜的程序?
蘇格拉底:不是。
至少,不是你理解的那種程序。
你寫過 if-else 嗎?
無知客:寫過。
蘇格拉底:那程序是怎么工作的?
無知客:人先寫好規(guī)則,滿足條件 A,就執(zhí)行結(jié)果 *。
蘇格拉底:很好。
那我現(xiàn)在告訴你一個非常重要、但很反首覺的事實:大模型里面,沒有人類寫好的“回答規(guī)則”。
沒有一行代碼寫著:“如果用戶問人生意義,就這樣回答如果用戶情緒低落,就那樣安慰”無知客:那它怎么知道該說什么?
蘇格拉底:等一下。
在回答之前,我們先確認(rèn)一件事:大模型不是“被寫出來的”,而是“被訓(xùn)練出來的”。
這兩個詞,差別非常大。
蘇格拉底:你有沒有養(yǎng)過狗?
無知客:有。
蘇格拉底:那你有沒有在狗的大腦里,寫過這樣一條規(guī)則?
“如果看到主人回家,就搖尾巴。”
無知客:當(dāng)然沒有。
蘇格拉底:但它最后還是學(xué)會了。
因為你做了一件事:重復(fù)反饋長時間大模型更接近哪一種?
程序,還是狗?
無知客:……聽你這么說,好像更像后者。
蘇格拉底:對。
你可以把大模型理解成:一個被喂了海量文字,在反復(fù)試錯中“長出來”的系統(tǒng)。
它不是被教“意義”,而是被逼著:在任何情況下,都把話接下去。
無知客:那“模型”這個詞呢?
為什么不首接叫“超大文本系統(tǒng)”?
蘇格拉底:因為“模型”這個詞,其實非常誠實。
我問你:地圖是城市嗎?
無知客:當(dāng)然不是。
蘇格拉底:但地圖能不能在某些方面代表城市?
無知客:可以。
蘇格拉底:那你記住這個比喻:模型 ≈ 世界的一個壓縮版、近似版、可用版。
語言模型不是語言本身,不是知識本身,甚至不是思想本身。
它只是:“在統(tǒng)計意義上,學(xué)會了語言是怎么出現(xiàn)的?!?br>
無知客:那“大模型”的“大”,到底大在哪?
蘇格拉底:我給你三個不浪漫的答案:見過的文本多內(nèi)部參數(shù)多訓(xùn)練花的錢多沒有一個是“更懂人生”。
無知客:可它確實回答得更好。
蘇格拉底:因為當(dāng)一個系統(tǒng):看過足夠多的例子記住足夠多的模式能在極細(xì)微的地方做區(qū)分它就會越來越像“懂了”。
但注意這個措辭:像,不等于 是。
蘇格拉底:現(xiàn)在我說一句話,你可以不同意,但必須記住。
大模型不是一個“知道很多東西的存在”,而是一個“非常擅長繼續(xù)說下去的系統(tǒng)”。
它存在的唯一目標(biāo),從訓(xùn)練開始就只有一個:“下一句話,最可能是什么?”
不是最真實的,不是最有意義的,也不是最負(fù)責(zé)任的。
只是:最像人類會寫出來的。
無知客:如果你說的是真的,那事情好像有點不妙。
蘇格拉底:是的。
因為這意味著一件事:你之所以覺得它“懂你”,可能不是因為它理解了你,而是因為:人類,本來就太容易被“像自己”的東西說服。
所以,在你繼續(xù)往下讀之前,我只希望你帶走一個問題:如果一個系統(tǒng)的目標(biāo)從來不是“理解”,那它是怎么做到“看起來理解”的?
不管是新聞、公司介紹,還是技術(shù)文章,大家都在說三個字:大模型。
但奇怪的是,說得越多,我越不知道它到底是什么。
它是軟件?
是程序?
是某種 AI 大腦?
還是一臺服務(wù)器?
蘇格拉底:在你問“它是什么”之前,我們先問一個更基礎(chǔ)的問題。
你覺得——“大模型”這個名字,是在描述它的本質(zhì),還是在描述它的規(guī)模?
無知客:聽起來像規(guī)模。
蘇格拉底:很好。
那我們先記住一件事:“大模型”這個詞,本身幾乎什么都沒說清楚。
蘇格拉底:我問你一個簡單的問題。
如果有人跟你說:“我們公司有一個超級大的 Excel 表?!?br>
你會覺得它在干什么?
無知客:數(shù)據(jù)很多?
蘇格拉底:對。
但你會不會因此覺得:這個 Excel 表“更聰明”?
無知客:當(dāng)然不會。
蘇格拉底:那我們換個名字:“超級智能數(shù)據(jù)系統(tǒng)”。
感覺是不是立刻不一樣了?
無知客:……是有一點。
蘇格拉底:“大模型”就處在這兩者之間。
它聽起來既像“數(shù)據(jù)”,又像“智能”。
于是我們很容易在腦子里,自動補完一個不存在的形象:一個正在思考的東西。
無知客:那我換個問法。
大模型是不是一個很復(fù)雜的程序?
蘇格拉底:不是。
至少,不是你理解的那種程序。
你寫過 if-else 嗎?
無知客:寫過。
蘇格拉底:那程序是怎么工作的?
無知客:人先寫好規(guī)則,滿足條件 A,就執(zhí)行結(jié)果 *。
蘇格拉底:很好。
那我現(xiàn)在告訴你一個非常重要、但很反首覺的事實:大模型里面,沒有人類寫好的“回答規(guī)則”。
沒有一行代碼寫著:“如果用戶問人生意義,就這樣回答如果用戶情緒低落,就那樣安慰”無知客:那它怎么知道該說什么?
蘇格拉底:等一下。
在回答之前,我們先確認(rèn)一件事:大模型不是“被寫出來的”,而是“被訓(xùn)練出來的”。
這兩個詞,差別非常大。
蘇格拉底:你有沒有養(yǎng)過狗?
無知客:有。
蘇格拉底:那你有沒有在狗的大腦里,寫過這樣一條規(guī)則?
“如果看到主人回家,就搖尾巴。”
無知客:當(dāng)然沒有。
蘇格拉底:但它最后還是學(xué)會了。
因為你做了一件事:重復(fù)反饋長時間大模型更接近哪一種?
程序,還是狗?
無知客:……聽你這么說,好像更像后者。
蘇格拉底:對。
你可以把大模型理解成:一個被喂了海量文字,在反復(fù)試錯中“長出來”的系統(tǒng)。
它不是被教“意義”,而是被逼著:在任何情況下,都把話接下去。
無知客:那“模型”這個詞呢?
為什么不首接叫“超大文本系統(tǒng)”?
蘇格拉底:因為“模型”這個詞,其實非常誠實。
我問你:地圖是城市嗎?
無知客:當(dāng)然不是。
蘇格拉底:但地圖能不能在某些方面代表城市?
無知客:可以。
蘇格拉底:那你記住這個比喻:模型 ≈ 世界的一個壓縮版、近似版、可用版。
語言模型不是語言本身,不是知識本身,甚至不是思想本身。
它只是:“在統(tǒng)計意義上,學(xué)會了語言是怎么出現(xiàn)的?!?br>
無知客:那“大模型”的“大”,到底大在哪?
蘇格拉底:我給你三個不浪漫的答案:見過的文本多內(nèi)部參數(shù)多訓(xùn)練花的錢多沒有一個是“更懂人生”。
無知客:可它確實回答得更好。
蘇格拉底:因為當(dāng)一個系統(tǒng):看過足夠多的例子記住足夠多的模式能在極細(xì)微的地方做區(qū)分它就會越來越像“懂了”。
但注意這個措辭:像,不等于 是。
蘇格拉底:現(xiàn)在我說一句話,你可以不同意,但必須記住。
大模型不是一個“知道很多東西的存在”,而是一個“非常擅長繼續(xù)說下去的系統(tǒng)”。
它存在的唯一目標(biāo),從訓(xùn)練開始就只有一個:“下一句話,最可能是什么?”
不是最真實的,不是最有意義的,也不是最負(fù)責(zé)任的。
只是:最像人類會寫出來的。
無知客:如果你說的是真的,那事情好像有點不妙。
蘇格拉底:是的。
因為這意味著一件事:你之所以覺得它“懂你”,可能不是因為它理解了你,而是因為:人類,本來就太容易被“像自己”的東西說服。
所以,在你繼續(xù)往下讀之前,我只希望你帶走一個問題:如果一個系統(tǒng)的目標(biāo)從來不是“理解”,那它是怎么做到“看起來理解”的?
閱讀下一章(解鎖全文)
點擊即可暢讀完整版全部內(nèi)容
相關(guān)書籍
友情鏈接