中國的DeepSeek推出的AI模型R1,在美國科技巨頭間,引起一陣騷動,Meta內部據說接近恐慌,因為DeepSeek R1不但結果比擬ChatGPT的o1,而且據說用很少的GPU運算。更誇張的是,聽說只靠一個工程師,就搞出這個巨作。全世界科技巨頭幾百億美元的投資,僱用了全世界最好的腦袋,怎麼一下就被中國的小資本創作給追上?
網路上一大堆試用DeepSeek的使用者,除了在言論審查上有問題外,其它試用的結果相當好。DeepSeek R1也像Llama一樣,開源open source。一時之間,看起來比OpenAI還更像Open AI,既開源,又便宜。
Marc Andreessen推了一段讓人思考的話,「這週也許是這十年最重要的一個禮拜,出於兩個完全不一樣的理由」。他指的是川普的上任和DeepSeek的R1上市。川普的回任當然很重要,但怎麼DeepSeek的突破,也這麼重要?我不知道Andreessen所謂何來,但我覺得矽谷的確被「幻方量化」的這個「業餘計劃」給嚇到了。
Ben Thompson和Tyler Cowen之前都有提到,美國對GPU的禁運令,很可能讓中國在晶片受限制的情況下,發展出獨特的科技,現在DeepSeek的成功,正在認證這點。如果中國的科技公司不能拿到輝達的晶片,因而不能像美國公司一樣,任意用計算資源來訓練模型,那也許中國的公司,反而會發展出不需要巨大的計算能力,就可以運作的模型,照DeepSeek的說法,訓練R1才用了五百多萬美元的算力。前天美國宣佈的AI大計劃,金額高達五千億美元。如果五百多萬就可以有這種結果,為什麼要花到五千億?這是讓矽谷驚嚇的一大原因。
Thompson和Cowen的言下之意,在質疑晶片禁運的效果。但我覺得結論下的太快了,這些美國人,就算飽讀詩書,也還是不懂中國人。中國人,幹他媽的最厲害的就是吹牛了。DeepSeek有一萬個理由吹牛、造假,這點別人可以不懂,台灣人一定懂。首先,把DeepSeek的片面之詞當真,就是會有這些有用的白痴幫忙說禁運沒用。只要美國鬆手不管輝達、台積電,你再來看,誰會買最多的GPU。他們造假,就是要騙你鬆手不管。
Scale AI的Alexandr Wang今天就上電視說,DeepSeek騙人,他們至少有五萬顆非法弄來的H100。R1絕對不是DeepSeek說的那麼容易訓練。
DeepSeek造假也許還有其它的理由,也許是要搶錢,本業的股市操作也許做得不順,需要業外的收入也不一定。也許是要和百度、騰訊這些大廠拚搶資金、人材也不一定。但把中國人的話,打折來聽,是個不會錯的真理。
Open source開源本身,對很多科技人來說,像是個信仰一樣,是不能改變的真理,所以DeepSeek的開源動作,打動了許多美國的科技人,也許是這一點,加上中國可能的「跳蛙式」發展,讓憂心美國領先地位的科技鉅子擔心了。
我倒是不這麼認為,我認為只要繼續晶片禁運下去,中國永遠都趕不上美國的發展。而我這麼有信心的理由,其實還是來自對共產黨的了解。極權主義本身並不喜歡科技發展,他們喜歡的科技,是可以讓他們使用的科技,但科技發展,通常會有意料不到的結果,這些意料不到的結果,在自由的社會裡,會開花結果成新的產品,創造財富,造福人群,但在共產國家,這些意料不到的結果,會變成共產黨掌權的缺口,所以不准發展。馬雲的演講痛批政府限制金融發展,嚇壞了共產黨,因為國產的科技龍頭阿里巴巴怎麼就變成挑戰政府權力的要角?所以馬雲非下台不可,沒弄死他已經算不錯了。
如果一個行動支付的企業,就可以讓北京高官徹夜難眠,你認為劃時代的AI科技,全世界都張大眼睛在看的新科技,會巨幅改變人類命運,但誰都不知道方向的科技,中國共產黨會隨便讓它發展?中國就算要回到石器時代,共產黨也不會把控制科技的手鬆開,所以Relax,「中國AI」這幾個字,本身就自我矛盾了。
原文出處 陳家煜