軟文推廣的網(wǎng)站

核心要點

圖片

清華大學(xué)計算機系副教授劉知遠小學(xué)時寫應(yīng)用題,面壁們老會卡殼。智能知遠他總會過度思考,創(chuàng)始加拿大28如何玩從一個題目里讀出多重含義。人劉到了高中,該把個工寫英語閱讀理解時,看作這種感受更強烈了。面壁們

劉知遠從未懷疑過出題人,智能知遠反而懷疑是創(chuàng)始不是自己太笨了,“理解不了題目”。人劉多年后深入學(xué)習(xí)語言哲學(xué)之后,該把個工加拿大28如何玩他才漸漸意識到這其實是看作種天賦,“我就比較善于抓住語言里面那個不確定的面壁們地方”。

自然語言處理的智能知遠本質(zhì)就是消除這種不確定,讓機器能夠精確無誤地理解人類的創(chuàng)始語言。劉知遠前半生正是與這種不確定性纏斗的二十年。

特別是過去兩年,搭上ChatGPT的便車,自然語言處理坐上了時光機,“從2023年到2024年所經(jīng)歷的這些新事情,比過去20年經(jīng)歷的總和還要多得多”。

回望中國大模型史,年屆四十的劉知遠是個繞不過去的人物。他參與締造中國第一個大模型,又躬身參與了這一輪大模型創(chuàng)業(yè)。2022年8月,在ChatGPT發(fā)布的三個月前,劉知遠發(fā)起成立了一家大模型公司——面壁智能。

這家公司最為出圈的一件事是,2023年6月3日,斯坦福大學(xué)一個學(xué)生團隊發(fā)布的一個模型被發(fā)現(xiàn)是抄襲了面壁智能的模型。

面壁智能的辦公室位于北京中關(guān)村東路1號院6號樓3 層,辦公室的白墻上隨處可見那句《三體》的經(jīng)典臺詞,“這是面壁計劃的一部分”。

圖片由農(nóng)健使用AI工具生成

GPT前傳

1984年,劉知遠出生在山東泰安新泰市一個普通工薪家庭,小學(xué)偶爾逃課去游戲廳玩,家里也沒期待過他能上清華。他父親在郵電局上班,還建議放棄初中直接讀中專,方便以后接他的班。

沒想到十幾年后,劉知遠以山東省前三十名的成績,如愿進入清華大學(xué)。

當時正是互聯(lián)網(wǎng)泡沫破滅之時,最熱門的方向是建筑和生物醫(yī)學(xué),計算機專業(yè)并不是高分專業(yè)。劉知遠報了建筑、生物工程和電子系,招生組反饋這些專業(yè)的名額已經(jīng)被分數(shù)更高的同學(xué)占了,無奈選了計算機專業(yè),“算是一個機緣巧合吧”。

讀博時也是如此,報考生物信息學(xué)方向也是招滿了,他陰差陽錯進入了自然語言實驗室,“我覺得非常幸運,因為五年之后生物信息學(xué)的導(dǎo)師自己都放棄了這個方向。”自然語言處理正好開始了高歌猛進的二十年。

劉知遠清楚記得,讀博期間,實驗室有個大師兄做文本分類,“給你一篇文章,看能不能把它分到相關(guān)的類別里面,比如這篇新聞是社會新聞,還是國際新聞、軍事新聞,或是別的新聞?”他的博士論文就是關(guān)鍵詞提取,“通過統(tǒng)計的方法識別出文檔到底哪個詞,能代表文章主題的關(guān)鍵詞。”

2012年成為一個分水嶺,深度學(xué)習(xí)在大洋彼岸叩響了發(fā)令槍。當年10月,Geoffrey Hinton和他的兩名學(xué)生——Alex Krizhevskyr,以及ChatGPT 的靈魂人物 Ilya Sutskeve,獲得ImageNet圖像識別比賽的冠軍,并且發(fā)表論文介紹了第一個深度卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet。ImageNet是斯坦福大學(xué)教授李飛飛創(chuàng)辦的人工智能領(lǐng)域一個重要賽事,通過對機器算法識別圖像,從而促進最先進算法的開發(fā)。

在處理圖像識別、語音識別方面,深度學(xué)習(xí)的能力得到了廣泛認可。在老師孫茂松的帶領(lǐng)下,劉知遠花了兩個月尋找答案。可自然語言處理方向的大多數(shù)人的意見是,深度學(xué)習(xí)不能幫助自然語言處理。

最終劉知遠得出一個結(jié)論:基于統(tǒng)計學(xué)習(xí)用符號去表示語言知識的這種傳統(tǒng)路線,已經(jīng)沒有太多突破的可能,深度學(xué)習(xí)是個非常值得探索的新技術(shù)路線。正是基于這樣的判斷,“我們實驗室應(yīng)該是國內(nèi)最早擁抱深度學(xué)習(xí)的團隊”。

2017