2023年3月14-15日,2023年“首屆TopAIGC+Web3創新大會”在北京召開,本文為葦草智酷創始合伙人、信息社會50人論壇執行主席段永朝在大會開幕式上的演講。
AIGC(智能生產內容)與20年前的另一個概念遙相呼應,那個概念叫UGC。20年前,美國創新公司林登實驗室推出的“第二人生”,率先使用了這一概念。2006年,《時代》周刊把年度封面人物,破天荒地授予了一個全新的群體:全體網民。
直到今天,UGC演化為PGC、數字人、元宇宙和AIGC。所不同的是,UGC是一場波瀾壯闊的草根運動,而AIGC則完全來自于人工智能的一個古老分支NLP(自然語言處理)領域的技術創新,并悄然將內容生產的主體,從“人”轉移到“智能算法”。
這些創新技術包括:貝葉斯模型、深度學習、循環神經網絡RNN、深度神經網絡DNN、生成對抗網絡GAN、人工強化的反饋深度學習RLHF,以及注意力模型AM等等。
即將宣布的GPT4,據說有100萬億個參數?;鸨贿^2年的百億、千億參數的大模型,即將被提升1000倍,進入超大模型時代。這不禁讓人再次回想起,OpenAI創始人兼CEO Sam Altman兩年前提出的一個響亮口號:萬物摩爾定律,即每十八個月全球智能資源數量翻倍,而衣食住行等生活物資的供給成本減半。
可以預期的是,巨量的智能體將呼嘯而至,迅速占領內容生產的各個角落,并侵蝕傳統白領、專家的專屬領域。這個萬物摩爾定律,今天已經通過AIGC的方式,在過去的幾個月里席卷全球。
不過,一周前,95歲高齡的著名美國語言學家、句法理論創始人諾姆·喬姆斯基(Avram Noam Chomsky),與劍橋大學語言學教授羅伯茨(Ian Roberts)、科技公司人工智能主管瓦圖穆爾(Jeffrey Watmull)在《紐約時報》上撰寫的文章《ChatGPT的虛假承諾》指出,人工智能和人類在思考方式、學習語言與生成解釋的能力,以及道德思考方面有著極大的差異,并提醒讀者如果ChatGPT式機器學習程序繼續主導人工智能領域,那么人類的科學水平以及道德標準都可能因此降低。
喬姆斯基的觀點,讓很多從事自然語言理解的科學家和技術工程師們感到費解。在他們看來,喬姆斯基應該是AIGC的思想鼻祖之一。對他們來說,計算語言學和形式語言學的努力方向,就是用良好定義的形式語法和規則,構建不同的語言模型,從而在句法分析、機器翻譯、詞性標注、語音識別、手寫體識別等領域,利用計算機強大的數據處理能力,獲得自然語言的理解、處理和應用。
OpenAI的方法論,無非是將傳統自然語言處理中的“手動編碼規則+字典查找”的兩階段模式,轉化為深度學習的生成式規則,不再糾結于人類語言的不同語法結構,而是直截了當地運用大規模、超大規模數據集展開訓練和預處理,并加入了模仿人的認知注意力的所謂注意力機制。
但是今天我們看到的AIGC,雖然號稱深化和拓展了“自然語言理解(NLP)”,其實它既不“自然”、也不“語言”、更不“理解”。
按照主流語言學家的看法,所謂自然語言首先是針對語音、口語的,書面語只是口語的某種載體;AIGC所說的“語言”,其實背后只是某種語言的處理機制,即算法。至于理解,就更談不上。甚至ChatGPT,也不是Chating,它并不“聊天”,它只是“typing”(敲鍵盤)。
AIGC所聲稱的基于形式語言的語言模型,其思想可以追溯到數學的希爾伯特綱領(1920)、羅素和懷特海的《數學原理》(1910)、卡爾納普的《世界的邏輯結構》(1928)《語言的邏輯句法》(1934)、圖林的有限自動機(1936)、喬姆斯基的《語言理論的邏輯結構》(1955)等。這些思想中一個重要的共同點,就是假設純粹的形式演算可以表征世界。
那么問題來了,既然ChatGPT等眾多的語言模型中有喬姆斯基創設的句法理論,喬姆斯基反對的到底是什么呢?在我看來,喬姆斯基反對的是那種不分青紅皂白的、大肆的數據處理,特別是采用大量只顧計算、但無法解釋的概率統計方法。
在一周前發表的那篇文章里,喬姆斯基等指出:“人腦不像ChatGPT及其同類產品那樣,是一個笨重的模式匹配統計引擎,狼吞虎咽地處理數百兆兆字節的數據,并推斷出最為可能的對話回應,或為科學問題提供最可能的答案。相反,人類的大腦是一個極為高效甚至優雅的系統,只需要少量的信息即可運作;它尋求的不是推斷數據點之間的粗暴關聯(brute correlations),而是創造解釋?!?/span>
雖然“蠻力計算”是人工智能領域久已有之的傳統,但像這樣完全撇開中間層次、輕視語法與句法分析、完全屏蔽語義理解的蠻力計算方式,讓內心偏愛語言的優雅、詩性和隱喻的學者們心生厭惡,并感到被冒犯。但今天看來,這種反對意見似乎難以抵抗在蠻力計算中獲得豐厚回報的人工智能技術專家們,心中那種難以掩飾的興奮與躁動。
隱藏在新一波人工智能浪潮背后的信仰,是大規模數據處理竟然能夠讓技術專家們輕易繞過復雜的理論建構,直截了當地利用計算和存儲成本急劇下降的技術優勢,實現所謂“端到端”的語言處理,并且看上去漂亮地預測“下一個詞語”、“下一個句子”,乃至生成一篇看上去辭藻華麗、書卷氣十足的文章,甚至包含音視頻合成的作品。他們不再理會語言對情感和思想的依托,不再理會人類對話背后蘊含的對情感紐帶、因果聯系、存在意義和解釋性的要求,只要能給出想要的結果,一切都是好的。
喬姆斯基的批評,在高奏凱歌的創新者看來已經無足輕重,每天數以千萬計的對話、聊天在各種智能算法中流入流出,人們熱情期待未來機器人創作詩歌小說、寫作公文論文、編碼游戲設計、娛樂大眾的場景。
但是,對中國人來說,特別對中國語言學界、人工智能界來說,喬姆斯基的批評卻有著重要的啟示。
毋庸贅言,AIGC背后的技術原理中,有兩個值得關注的傾向:一個是算法建立在主要針對英文的句法分析理論的基礎上;另一個是符號形式與語義之間的分離。如果這兩個傾向在中文語境下不能得到深度的分析和理解,那么中文版本的AIGC不光是鸚鵡學舌的產物,更重要的是與這一強悍的現象級應用,所宣揚、彰顯的文化屬性有關。直白地說,與語言的民族性有關。
語言學家薩丕爾和他的學生沃爾夫在大約100年前,就提出語言、思維、文化之間相互關聯、相互影響的假說,被稱作薩丕爾-沃爾夫假說。這個假說認為:真實世界很大程度上是建立在群體的語言習慣之上。薩丕爾指出,“語言與我們的思維習慣不可分解地交織在一起,換言之,它們是一回事?!?/span>
使用主謂結構來分析中文語言,始自400年前明代科學家李之藻,在葡萄牙耶穌會傳教士傅泛際的協助下翻譯的亞里士多德的邏輯著作選集,中文名稱為《名理探》,將subject和predicate分別翻譯為“主”和“謂”。1898年出版的《馬氏文通》,借鑒主謂結構分析中文語法現象。這一做法,長期以來漸漸成為漢語語言學分析的主流方法之余,一直以來也不乏中國語言學家的質疑。
近現代中國語言學家趙元任、王力、呂叔湘、朱德熙等的研究表明,漢藏語系與印歐語系的結構有很大的不同,這個不同不是表面的,而是深層次的。主要體現在印歐語系的主謂結構、名詞-動詞分類法,并不適用于中文。
中國哲學家、政論家張東蓀在1936年撰文指出,主謂結構是西方文化的基石。在古希臘思想中,邏輯與語法是同源的。一部西方哲學史其實就是主謂關系的思辨史。
當代語言學家、社科院學部委員沈家煊先生,在4年前出版的《超越主謂結構》中指出,在漢語表達中,無主句、流水句、對句比比皆是,這是中文語言保持鮮活生命力的力證。
沈家煊指出,印歐語系的主謂結構,注重詞語完形,注重細致分析主語謂語之間的依附關系,從而形成大量圍繞詞性、句法、語形的語言理論。形式語言學之后流行起來的生成語法,其中心原則就是強調謂語必須有一個主語;功能語法學派雖然不注重主謂語的分別,但強調主謂語的功用。
在今天看來,過去100年來這一批中國的語言學家,在風云激蕩的時代變遷面前,依然堅持漢語不存在主謂語結構,或者說中文的主謂語結構只不過是一種比附的見解,依然意義重大。這里面蘊含的深刻思想,在今天面臨AIGC大爆炸的年代,值得我們重新理解內容、重新理解語言。
在1916年瑞士語言學家索緒爾出版《普通語言學教程》之后,所指、能指,語言、言語,歷時性、共時性等概念,成為重新看待語言的思想指南。但是,這一思想指南不可避免地帶有印歐語系的本質特征,這就是“所指和能指的分離”。
所指和能指的分離,表明印歐語系的語言學研究,從此進入了一條完全不同的路線。這條路線就是語形和語義的分離。從100多年前西方學術思想的發展歷程看,這條路線又有其自身的合理性。這一合理性從19世紀到20世紀的數學思想中得到充分的體現。
1872年,德國數學家菲利克斯·克萊因發表的埃爾朗根綱領,其用意在于用群論和對稱性的思想,統一歐幾里得幾何、射影幾何、拓撲幾何和非歐幾何。埃爾朗根綱領在50年后被他的思想弟子希爾伯特以公理化的方式發揚光大。希爾伯特在1920年提出數學的形式主義綱領,繼承康托爾的集合論思想和數學公理化思想,徹底斬斷符號和意義之間的紐帶,從而開啟了現代數學形式主義的新篇章。
可以說,希爾伯特的公理化主張影響了幾乎所有的學科。英國語言學家萊昂斯,在40年前回顧英美語言學發展的過程中指出,英美語言學一直受制于唯理智論者的偏見,以為語言只是或基本上是表達命題思維的工具。
將語言看作表達命題思維的工具,是印歐語系主謂結構的必然,也是語形與語義剝離的必然。從此以后,一個口號在過去的20年里就遍布天下,這個口號叫做“一切皆計算”。
在這種歐陸形式科學、公理化數學、抽象化符號學的影響下,在英美語言哲學的支配下,計算機學科、人工智能學科可謂中毒頗深。大數據、GPU、DNN、深度學習等紛紛聚焦相關關系,熱衷于海量數據的符號演算、概率計算,以至于圖靈獎獲得者、貝葉斯網絡的先驅朱迪亞·珀爾,在5年前出版的新著《為什么:關于因果關系的新科學》中大聲呼吁,AI需要從這種計算崇拜、相關分析崇拜中解放出來,重新回到因果關系的軌道上來。
過去100年來,一部分中國語言學家如趙元任、王力、呂叔湘、朱德熙、沈家煊等,在風云變幻的時代動蕩中,也始終堅持這樣一個信念,就是漢藏語系與印歐語系有著本質的不同。沈家煊教授將其命名為“對言格式”,漢語以對為本,比如四字格、上下句、互文回文、對仗排比、重言疊詞、頂真續麻、起承轉合等等。在這些豐富的對言格式下,中文表現為“音形義用”四位一體的“大語法”。
這里舉一個例子:“對”這個字,在英文中就很難翻譯,沒有單一的對應詞?!冬F代漢語詞典》中列舉了15種釋義,包括對話、對答;相對、對于;對待;對比、對照、核對;正確、對頭、正常;對稱、對應等等。
“對牛彈琴”、“隆中對”、“對不住”、“對不上”,“對點兒開水”、“說的對”、“配對兒”,這里都沒有單一的英文詞語相對應。
在中文里,right并非簡單的對錯之“對”,而是對應之“對”。內容要對、形式要對、寓意要對、語氣要對、語境要對,都要對得上,才能說Right。
《說文解字》里,“對”的解釋是“譍無方也”。什么意思?就是“對”無一定之規?!对娊洝ご笱拧どH帷防镆舱f:聽言則對,頌言如醉。
所以說,對東方人來說,語言本身就是對話,是人與人、人與自然之間親密無間、旨趣盎然的對話。中國的語言是鮮活的,充滿生活氣息的。對言,是時時處處傳情達意的對話過程,并不是將意義抽離場景的過程。其實,任何口語都有這樣一個共同的特征,只不過形式語言學、計算語言學,因為秉持符號表征與意義剝離的思想,走到了一條不歸路上。
需要看到的是,索緒爾之后的語言學家中,也有很多不滿語印歐語系主謂語結構的學者,多方求索。比如法國羅蘭·巴特的結構主義、德里達的解構主義、俄羅斯學者巴赫金的對話理論、法國學者克里斯蒂娃的互文性理論等,但這些理論流派多興盛于社會學、心理學、語言學、傳播學、哲學等的專業圈子里,在計算理論中并沒有看到更多的反響(這一點需要深入研究為什么),這是一件很奇怪的事情。難怪美國語言學家布龍菲爾德,在100多年前就斷言:對語言主語、謂語的性質,語言學家根本沒有講清楚。
回過頭來說,漢語其實是音形義用一體、傳情達意具足的鮮活語言,把這種鮮活的語言,硬塞進貝葉斯算法、循環神經網絡、注意力模型中去,不管三七二十一,讓機器胡吃海塞、狼吞虎咽,耗費巨大的算力,就為了讓機器照葫蘆畫瓢地超越人腦的有限算力,這是智能呢,還是大肆禍害數據資源呢?這是個值得深省的問題。
最后,說幾句與π有關的話。今天是π日,據說最先進的超算已經可以計算到π的十萬億位,這一計算過程不可能結束。2000多年前中國古代數學家就知道粗略地說“周三徑一”;準確的計算在東漢劉徽發明割圓術之后,用3072邊形算出π=3.1416,但是,認識到π是一個無理數、超越數,則是一個漫長的過程。1761年,瑞士數學家約翰·朗伯證明π是無理數,1882年德國數學家林德曼和威爾斯特拉斯證明π是超越數。
這件事說明什么?說明就算再強大的計算過程,它也只是給出更多的π的計算位數,但無法洞察到π是無理數、超越數這一思想本質。
AIGC是一個充滿激情的事業,但需要更多的思想家、企業家和領域專家,回到鮮活的語言本身,回到充滿詩意的、生活化的語言,特別是認真研究漢藏語系、研究中文的語言魅力。只有這樣,生機勃勃的AIGC才會迎來真正的春天。