在5月28日舉行的2023中關村論壇上,創新工場董事長兼首席執行官李開復發表了主題為“AI1.0到AI2.0的新機遇”的演講。他表示,在所有APP里面,AI first(人工智能優先)將是最重要的應用,過去,移動互聯網是Mobile first(移動優先),今天要在人工智能領域創業或投資,那一定要做非有人工智能不可的APP。
【資料圖】
“大模型真的不只是一個問答引擎,它改變了所有APP的生態,它會讓我們今天用的每一個生態通通改寫一次”,李開復坦言,要允許今天的大模型一本正經地“胡說八道”,如果把它胡說八道的能力全部降至零,它也就不具備推理能力了。李開復認為,一直以來都是人類學習計算機的語言,大模型時代將是計算機學習人類的語言。未來,用戶只需要向AI描述目的就會達到期待。
李開復還就“大模型公司太多”“只有頭部公司才有機會”等論調談了自己的看法,他指出,國內外的文化習慣、法律法規都不一樣,拿海外訓練出來的大模型在國內做微調是非常危險的,在大模型領域,大家都還有機會,應該鼓勵各種不同的模式去探索。
以下為李開復在“人工智能大模型發展論壇”的演講內容,經新黃河記者整理:
近年來,看到整個AI2.0和大模型的啟動,創新工廠的投資團隊、科技團隊都在研究這個領域,為此也到美國去了解一些新態勢。今天我介紹的不是創新工場投資的公司或者業務,而是對于最近關于AI2.0和大模型做一個比較通俗的分享,希望對大家有幫助。
AI1.0時代每個應用都是一個孤島
AI 1.0是AlphaGo(阿爾法圍棋)之后發生的深度學習,也就是在八九年前開始,進入各行各業,這是我們都熟悉的。到一兩年前碰到了一些瓶頸,而這些瓶頸,正好是AI2.0和大模型能夠解決的。AI1.0遇到的瓶頸是什么呢?當時還沒有大模型,我們要做一個領域的AI應用,要到該領域去收集、清洗、標注數據,再拿去調整模型,這個過程成本是非常昂貴的,對于互聯網巨頭來說沒有問題,因為他們收集的數據實在太多,用來賺錢的機會也很多,但是如果一家工廠想讓AI應用落地,就會面臨著非常昂貴的成本。
大模型是人類智慧的累積,有一個很大的特點,就是我們可以一次性訓練一個大模型,當要應用的時候可以做一個遷移學習或者微調,也就是說之前AI1.0時代,每個應用都是一個孤島,有大模型之后,用海量的數據一次性訓練一個基礎大模型,那么再以這個模型作為基礎去做微調,就具備非常大的威力。比如,像音響類似的產品,過去跟它講話的時候,一旦跳出了它懂的領域就蒙了,做不了很多事情。當放一個類似ChatGPT的東西進去,它的知識就會被激活,只要調整對話,它就會成為一個非常好用的機器人,如果需要它在另外的領域完成其他事情,我們可以把這個大模型再微調,使其進入對應的應用場景。
有些領域可以容忍大模型的不完美
今天的大模型還會一本正經地“胡說八道”,這個問題非常難解決,因為它的推理能力,也來自于同樣的理由。如果把它的胡說八道全部降到了接近零,那它的推理能力幾乎也沒有了,所以那些讓它聰明的理由也是讓它胡說八道的理由,但是我們未來還是可以解決的。
我們要先接受大模型是非完美的、會胡說八道的,即便一個非完美的大模型還是有相當大的商業價值。例如,不管記者用AI來寫作,或者律師用AI來寫訴訟,最后負責的還是人類,律師或者記者會很清晰地知道AI可能會犯錯,我們不是把它拿來做一個終極的應用。在娛樂領域的應用,是可以允許AI犯一些錯誤,比如游戲里面的英雄胡子長了一點短了一點,這都無傷大雅。此外,還有很多領域是可以容忍大模型的不完美,基于這個事實,今天大模型的商機已經存在。
當然我們還要繼續努力,讓它降低胡說八道的習慣。比如,從預訓練的數據到訓練對齊,再到之后的后處理,還有一些預警和快速修正的方法,這些需要結合在一起,提高大模型的處理能力。需要重視的是,有些領域是非常關鍵和嚴肅的,比如說新聞、政府網站、醫療、教育,這些就不容易做,未來需要化解這些問題。
AI大模型能帶來應用的爆發
大模型的價值絕對不只是有一個很聰明的AI引擎,而是能帶來應用的爆發。
用AI寫稿子、寫訴訟、畫圖、摳圖等都是應用層的,還存在一個中間層,中間層包括兩部分,第一個部分是從模型里面往外提供功能,比如說模型做得很大,針對某一個領域,能否把一個大模型變成一個小模型,這是從模型往上的。另一個部分是從應用往下的,用大模型做的很多產品需要去中間化。比如,過去由平面設計師來設計圖,以后市場總監用語言就能直接把圖做出來。當然這個過程不是一天兩天能實現的,但長期來看,相對重復性的工作是可以被技術取代的,同時會產生非常大的經濟價值,這樣的情況之下才能讓應用的數量變多,形成應用帶來更多用戶,用戶帶來更多應用的良性循環。
AI.2.0平臺和應用將顛覆許多行業。簡單舉個例子,比如制造游戲的時候,所有角色、背景、道具、衣服、故事的產生,甚至所有的代碼最終都會用AI來寫。很可能以后一些小朋友會把他想玩的游戲寫出來,大家彼此用文字做一個游戲介紹,幾秒鐘以后就可以玩了,這跟今天的游戲制作就有巨大的差別。所以,大模型真的不只是一個問答引擎,它改變了所有APP的生態,它會讓我們今天用的每一個生態通通改寫一次。
從Mobile first到AI first
在所有的應用里面AI first(人工智能優先)將是最重要的應用,什么叫AI first?就是說這個應用沒有AI就不成立。過去移動互聯網是Mobile first(移動優先),比如,在PC時代打車軟件滴滴是沒有用的,因為你隨時可能在不同的地方,當年如果要選擇在移動互聯網創業或者投資,那一定要選那些非有移動不可的APP,所以今天要在人工智能領域創業或投資,那一定要做非有人工智能不可的APP。簡單地說,當我們把大模型抽掉,這個應用就完全癱瘓,那這個應用就特別需要做而且應該做。當然,這個過程中,我們還有很多的挑戰,需要監管和技術同時發揮作用去解決。
最近有幾個比較大的聲音,如“使用海外的開源大模型就可以做出中國版的openAI”“大模型耗錢且耗人,只有巨頭才有入場券”“大模型公司太多了”“不用開發大模型,開發小模型就夠用了”等說法。
開源是非常非常重要的,高校和創業者沒有開源很難得到啟動力量,但“使用海外的開源大模型就可以做出中國版的openAI”的說法是絕對錯誤的。開源模型本身有一定局限性,如果直接使用海外的開源大模型,你的天花板決定了永遠做不出達到或者超越ChatGPT4.0。很多人做開源大模型訓練的時候用ChatGPT4.0來訓練,真的不敢保證ChatGPT4.0會讓人人都能拿去使用,從商業的角度也沒有理由讓你占這個便宜,再就是它對有些國家可能也會限制。拿海外訓練出來的大模型,在國內來做微調是非常危險的,國內外的文化習慣、法律法規都不一樣,每個國家處理方法都不一樣,自主創新做大模型是有必要的。
當然,未來不可能有50家大模型公司存在,會收斂到一個小的數字上。比如,美國的搜索引擎,剛開始的時候有十來家,最后變成五六家。不過,在大模型這個領域,大家都還有機會,我們還在追趕,應該鼓勵各種不同的模式去做。
中國公司急需趕超全球一線公司
大語言模型分三步演進,第一步是中等規模的大型語言模型,第二步是跨越“涌現”(備注:涌現在大模型領域指的是當模型突破某個規模時性能顯著提升)門檻,成為主流大型語言模型,第三步是領先的大型語言模型。目前ChatGPT和谷歌的大語言模型PaLM處于第三階段。中國有些公司當然有野心,也可能自認為接近了,但是我覺得主要還是在一個比較中等規模的水平,基本可以工作,但是它可能“涌現”不一定特別強大。這不是說中國公司做得不好,而是起步時間較短,再就是中文的數據質量還不足夠。
大模型訓練質量跟數量都重要,但是相比來說質量是不可犧牲的。我覺得有國家力量來推動收集更多更高質量的數據非常重要,要不然的話追趕會比較難。中國這個階段的經濟發展,并沒有足夠多的人為了公益來把很多好的內容匯集起來,中美以后的差距可能就體現在數據上面。
多年來,人類需要學習計算機的語言,現在倒過來,計算機學習人類的語言,這會大大把人類解放出來。我們只要把想要做一件事情的目的告訴未來的AI,它就會幫我們完成,不用告訴它如何一步一步去解決。比如我跟未來的智能助手說,明天是我太太的生日,需要鮮花、蛋糕、禮物,它就通通幫我搞定,這就節省大量的時間,現在還沒有這樣的智能助手,我可能要花幾個小時搜索,再逐個下單。
未來最偉大的應用是必須要有AI大模型,拿掉大模型它就不工作。大模型就是委派式的,用戶描述目的就可以達到期望,當然要解決隱私的問題,不能把我們每一個要求都傳到云端。最終這天到來的時候,商業模式也會發生變化,當我跟AI說幫我買蛋糕、鮮花、禮物的時候,它會直接把電商當做倉庫一樣地去幫我搭配。當然,這方面的應用可能還比較長遠,需要學術界跟產業的合作。
AI大模型是中國絕對不能錯過的歷史機遇,這是有史以來最大的一個平臺革命。它會讓每個應用都改寫,重構人類的工作,讓我們的聰明才智被放大10倍或更多。在人才方面,可能頂級的一些人才還在美國,但中國有非常巨大的人才優勢,數量非常多,而且很多年輕的科學家都非常厲害。
最后我想提一句話,來自硅谷頂級投資人對這個領域的預測:這個市場的潛在規模難以把握 ——它將介于所有軟件和所有人類的努力之間。
新黃河記者:王立奎整理報道
編輯:常萌

相關文章
精彩導讀
熱門資訊