AI週報|商湯新模型發佈後股價大漲; 月之暗面否認創始人套現數千萬美元

商湯發佈日日新5.0:對標GPT-4 Turbo

4月24日,商湯科技股價大漲超過30%後緊急暫停交易。 就在4月23日,商湯舉辦技術交流日活動,推出了6000億參數大模型日日新5.0,官方發文表示這是“中國首個GPT-4 Turbo級別的大模型”,日日新5.0大模型具備更强的知識、數學、推理及程式碼能力,綜合效能全面對標GPT-4 Turbo,並在主流客觀評測上達到或超越GPT-4 Turbo。

在實際使用中,商湯表示該模型在自然語言能力方面,創意寫作、推理以及總結能力均大幅提升,文生圖能力也有較大提升,商湯提到其多模態大模型的圖文感知能力達到全球領先水準。

點評:本次更新主要聚集增强了知識、數學、推理及程式碼能力。 日日新5.0模型能力提升一方面得益於採用混合專家架構(MoE),啟動少量參數就能完成推理,且推理時上下文視窗達200K左右,其次模型基於超過10TB tokens訓練、覆蓋了數千億量級的邏輯型合成思維鏈數據,此外也得益於商湯AI大裝置SenseCore算力設施與算灋設計的聯合調优。 近期Anthropic、Meta等海外企業發佈最新模型,一些基準測試得分超過GPT-4,頗有超車OpenAI的意思,國內終於也有了商湯日日新5.0。 與此同時,競爭可能要進入新階段,GPT-5可能今年夏天要推出,OpenAI已放出GPT-5效能遠超GPT-4的訊號。

英偉達再出手收購以色列公司

當地時間4月24日,英偉達宣佈,已與以色列公司Run:ai簽訂最終收購協定,英偉達認為,這能够幫助客戶更有效地利用其AI計算資源。 Run:ai成立於2018年,是一家基於開源容器編排平臺Kubernetes的工作負載管理和編排軟件提供商,公司產品可提高GPU集羣的資源利用率。 有消息稱,英偉達收購Run:ai的交易金額為7億美元。 英偉達近期還收購了另一家以色列初創公司Deci,這是一家成立於2019年,提供高效的生成式AI和電腦視覺模型的公司,其解決方案可通過調整AI模型大小使模型在AI晶片上更便宜地運行。

點評:英偉達對以色列初創公司多有青睞,2019年,英偉達還擊敗英特爾、微軟等潜在投資者,以總價約70億美元收購以色列網路技術供應商Mellanox,這是英偉達佈局高速網絡的一筆重要收購。 從這兩筆新收購可以看出,英偉達正在佈局GPU集羣資源高效利用並助力客戶降低使用AI的成本。 現時AI大模型算力成本高企有目共睹,大模型訓練一次可能需要上千萬美元,其背後是AI晶片能效難以提升和功耗難以下降。 在晶片制程之外,英偉達正在尋求更多解決方案,推動AI平民化實現。

蘋果收購巴黎人工智慧初創公司Datakalab

據法國媒體報導,蘋果收購了專注於“人工智慧壓縮演算法和電腦視覺科技”的巴黎初創企業Datakalab。 這筆收購已經於去年12月完成,兩家公司本月向歐盟委員會報告了這筆交易。

Datakalab是一家總部位於法國巴黎的AI初創公司,專注於人工智慧壓縮和電腦視覺科技。 Datakalab將自己描述為“低功耗、運行時高效和深度學習算灋方面的專家”,系統可以在設備端運行。 這家公司曾經在2020年5月與法國政府合作,將AI工具部署到巴黎的公共交通系統,來檢查乘客們是否佩戴口罩。

點評:市場認為,此次收購是蘋果更廣泛AI戰畧的一部分,旨在將更複雜的AI科技引入其設備,例如即將推出的iOS 18機型和未來的Apple Vision Pro。 在今年2月的財報電話會議上,蘋果CEO庫克曾透露,蘋果(在AI方面)有一些令他們感到非常激動的事情,將在今年晚些時候討論。 蘋果在大模型領域走得不算快,是要自研還是通過收購補全AI能力,抑或終端設備直接搭載外部大模型公司的產品,外界還在等蘋果作出決策。

OpenAI CEO投資能源初創公司Exowatt

據外媒報導,近日能源初創公司Exowatt獲得了來自OpenAI CEO奧爾特曼(Sam Altman)以及矽谷知名創投公司安德森·霍洛維茨(Andreessen Horowitz)等投資者2000萬美元(約合1.45億元人民幣)的種子輪投資。

Exowatt於2023年成立,旨在用太陽能解决大型資料中心對清潔能源的需求。 據悉,與將太陽光直接轉化為電能的傳統太陽能電池板不同,Exowatt使用一種獨特的方法,涉及儲存熱量而不是電力,它將太陽能存儲在熱電池中。 該公司開發了一款專為資料中心供電的三合一模組化能源系統,將集熱器、熱電池,以及能够提供可調度電力和熱量的熱機進行結合。

點評:這並非奧爾特曼第一次投資能源公司,在此之前,他曾投資Helion Energy和Oklo,這兩家分別是專門從事可控核聚變和核裂變發電的能源公司。 AI的盡頭是能源,一份研究顯示,ChatGPT一天可能耗電50萬千瓦時,是美國家庭平均每天用電量的1.7萬多倍。 在此前舉辦的達沃斯世界經濟論壇上,奧爾特曼表示,未來人工智慧需要能源方面的突破,因為人工智慧消耗的電力將遠遠超過人們的預期。 投資能源企業,意味著OpenAI可能寄希望於能源領域的變革為AI算力提供支撐。

AI蒐索初創公司Perplexity AI獲新一輪6300萬美元融資

4月24日,AI搜尋引擎初創公司Perplexity AI在社交平臺宣佈,獲得6270萬美元融資,估值10.4億美元。 本次由Daniel Gross領投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy等跟投。

Perplexity AI提供生成式AI搜尋引擎服務,支持用戶通過自然語言蒐索任何資訊,可以把Perplexity AI看成搜尋引擎版的“ChatGPT”。

資料顯示,Perplexity AI創立於2022年8月,同年9月獲得310萬美元種子輪融資,12月發佈問答引擎“Ask”,隨後其業務實現飛速增長,4個月後月活用戶便突破200萬成為生成式AI搜尋引擎領域的黑馬,這也是能獲得微軟、穀歌、GitHub等投資的重要原因之一。

點評:Perplexity AI表示,像ChatGPT這種問答模式徹底顛覆了應用的互動模式,簡化了大量手動業務,使人們獲取資訊的管道更加便捷、廣闊。 同時這也為Perplexity AI提供了機會,通過智慧技術創新向傳統搜尋引擎發起挑戰。 海外對初創公司的大筆融資仍在進行中,可以看出AI搜尋引擎仍是一個重要方向。

愛詩科技完成A2輪超億元融資,螞蟻集團領投

4月23日,光源資本官方發文表示,愛詩科技完成A2輪超億元融資,由螞蟻集團領投,光源資本擔任獨家財務顧問。 至此,愛詩科技一年內累計獲得融資超2億人民幣,成為中國視頻大模型領域融資規模最大的創業公司。 據悉,本輪融資將用於進一步反覆運算自研視頻生成大模型,並陞級團隊,加快實現AI視頻生成科技的行業應用。

點評:愛詩科技成立於2023年4月,創始人兼CEO王長虎曾任位元組跳動視覺技術負責人。 愛詩科技於2024年1月正式發佈文生視頻產品PixVerse,官方表示現時月訪問量超百萬,視頻生成量累計超千萬,被創作者廣泛應用於影視、廣告、動漫等內容製作中。 創始人王長虎表示,希望未來AI原生視頻能够融入內容行業的生產和消費連結,為AIGC領域帶來持續的活力。 Sora推出後,國內視頻生成賽道也火熱起來,生數科技已拿出Vidu大模型,愛詩科技接下來的動作備受期待。

視頻大模型Vidu發佈

在2024中關村論壇年會未來人工智慧先鋒論壇上,清華大學聯合生數科技發佈中國首個長時長、高一致性、高動態性視頻大模型Vidu。 該模型採用團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辯率高達1080P的高清視頻內容。 Vidu能够根據提供的文字描述直接生成長達16秒的高品質視頻。

點評:據清華大學教授、生數科技首席科學家朱軍介紹,Vidu採用的是“一步到位”的生成管道。 與Sora一樣,文字到視頻的轉換是直接且連續的,在底層算灋實現上是基於單一模型完全端到端生成,不涉及中間的插幀和其他多步驟的處理。 今年2月Sora發佈後,團隊基於對U-ViT架構的理解及長期積累經驗,在兩個月中進一步突破長視頻表示與處理關鍵技術,推出該模型。 從發佈的視頻看,Vidu畫面較真實,但已放出的視頻還是幾秒的視頻,動作銜接還有不流暢之處,後續應還有較大改進空間。

“AIGC第一股”出門問問上市首日破發

4月24日,頂著“AIGC第一股”的名號,出門問問(02438.HK)正式登入港交所,上市即破發,其發行價為3.8港元/股,開盤下跌21.58%至2.98港元/股,截至當日收盤出門問問股價為3.68港元/股,下跌3.16%,市值為54.89億港元。

據出門問問提交的招股書,該公司2021年—2023年的收入分別為3.98億元、5億元和5.07億元。 2021年—2023年出門問問歸屬於公司權益股東的年內全面虧損總額累計超過20億元,扣除可贖回優先股和普通股的賬面值變動、以股份為基礎的薪酬和上市開支後,該公司2021年的經調整淨虧損為0.73億元人民幣,2022年和2023年的經調整淨利潤分別為1.09億元人民幣和0.18億元人民幣。

點評:出門問問成立於2012年,是穀歌前科學家李志飛創辦的AI公司,以生成式AI與語音互動科技為覈心業務,擁有自研大模型“序列猴子”,為內容創作者、企業和消費者等用戶提供AIGC(AI生成內容)解決方案、AI企業解決方案、智慧設備和配件等服務。 出門問問提供的資料顯示,該公司現時在全球擁有超過1000萬名AIGC解決方案用戶,其中約84萬名是付費用戶。 上市首日破發,或意味著資本市場對相關AIGC產品的商業化能力仍有顧慮。

騰訊三成程式碼由AI程式碼助手生成

騰訊雲近日發佈消息稱,騰訊有三成程式碼是騰訊雲AI程式碼助手寫的。 騰訊研發人員比例超74%,騰訊基於混元大模型推出了該AI程式碼助手,每天有一半的騰訊員工使用AI程式碼助手,程式碼生成率超30%。 該助手或“AI程式師”可智慧補全程式碼資訊、高效完成編碼工作、修復錯誤代碼、解釋既有程式碼、進行人工智慧科技對話。 騰訊雲AI程式碼助手還準備進入金融等更多行業。

點評:越來越多“AI程式師”進入科技大廠工作了。 有意思的是,不久前百度透露其每天新增程式碼中有27%是由智慧程式碼助手Comate生成的,比例也接近三成。 這或許意味著,現階段AI能替代人類程式師做的工作比例大約是30%,更多可能就不現實了。 不久前,Cognition Labs的AI程式設計產品Devin被質疑程式設計能力存在一定欺騙性,有問題很多是Devin“自導自演”修復的。 將AI作為人類程式師的幫手而不是替代程式師,是現時比較現實的路徑。 值得期待的是,這些大廠除了自己用程式碼助手外,後續還會開放給什麼行業、帶來什麼變化。

SK海力士計畫投資超1000億元擴產

有消息稱,SK海力士計畫斥資約20萬億韓元(約146億美元)在韓國建新的存儲晶片產能,進行產能陞級,以滿足快速增長的AI開發需求。 這家韓國公司將初步撥出5.3萬億韓元,於4月底左右開始建設一家新工廠或晶圓廠,計畫在2025年11月完工。

點評:SK海力士是主要的DRAM(動態隨機存取記憶體)廠商之一,現時因AI需求火爆,由多顆DRAM堆疊而成的HBM(高頻寬記憶體)供不應求,SK海力士是英偉達HBM的主要供應商。 除了SK海力士,三星也在努力擠進英偉達供應鏈。 因HBM需求拉升,DRAM廠商之間的競爭儼然變成HBM之爭。 除了技術領先性之外,誰能更快速新增產能並快速量產,誰就在AI時代有更多機會。

月之暗面否認創始人楊植麟套現數千萬美元

有消息稱人工智慧初創公司月之暗面創始人楊植麟通過售出個人持股已套現數千萬美金,創始人及相關人員套現金額在4000萬美金。 還有市場傳言稱,曾參與投資過楊植麟首個創業項目“迴圈智慧”的前金沙江創投管理合夥人張予彤已從金沙江創投離職,將加入月之暗面。 對於以上市場傳言,月之暗面相關負責人回應稱,創始人套現消息不實,月之暗面此前已公佈員工激勵計畫,張予彤並未入職月之暗面。

點評:從既往融資看,月之暗面確實“很有錢”。 公司已完成三輪融資,今年2月以15億美金投前估值完成超10億美元B輪,阿裡領投,礪思資本、小紅書跟投,投後估值約25億美元,是國內最主要的大模型獨角獸之一。 月之暗面此前因長文字的聊天應用kimi受到市場關注,在資本市場甚至帶起一眾“kimi概念股”。 不過,高漲的熱度下,外界更期待月之暗面能拿出商用更成功的產品,證明自身具有持續造血的能力。

OpenAI CEO稱GPT-5效能遠超GPT-4

4月25日,OpenAI聯合創始人兼首席執行官薩姆·奧爾特曼(Sam Altman)在斯坦福大學發表演講。 在一段流出的視頻中,奧爾特曼表示,GPT-5會更加智慧,這將是歷史上最令人矚目的事件之一,GPT-6則將比GPT-5智慧很多,而我們遠未觸及極限。 對於OpenAI產品反覆運算,奧爾特曼認為儘早且頻繁推出AI產品,保持反覆運算部署非常重要,即便現在看來ChatGPT還有點令人尷尬,GPT-4還顯得愚蠢。 要讓社會為技術進步做好準備,依賴於反覆運算部署。

點評:隨著多個競爭對手發佈更新、更强的大模型,外界期待OpenAI會拿出什麼樣的產品應對。 奧爾特曼透露GPT-5效能遠超GPT-4,更增强了人們的期待。 近期關於OpenAI下一代大模型的消息頻繁傳出,中信證券近期研報稱,GPT-5正處於紅隊測試階段,預計最快今年夏天問世,GPT-5預計繼續採用MoE(混合專家模型)架構,有望在多模態理解、長文字輸入等方面取得新里程碑。 看來,GPT-5將很快到來。

阿裡、百度、騰訊雲搶食Llama 3算力

Meta發佈Llama 3系列兩個開源大模型之後,百度、阿裡、騰訊等雲廠商迅速搶食Llama 3的算力部署需求。 4月22日,阿裡雲宣佈百煉大模型服務平臺推出針對Llama 3系列的限時免費訓練、部署、推理服務。 騰訊雲同日宣佈騰訊雲TI平臺成為國內首批支持Llama 3全系列模型的平臺之一。 4月19日,百度智慧雲千帆大模型平臺則宣佈成為國內首家推出針對Llama 3全系列版本訓練推理方案的雲廠商。

點評:相比推理訓練更具中心化特點的閉源模型,諸多雲廠商都有機會拼搶算力分散的開源模型部署需求。 Llama 3已開源版本的基準測試數據亮眼,指令微調的Llama 3 8B在五項基準上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三項基準超過Gemini Pro 1.5和Claude 3 Sonnet。 隨著Grok-1、Llama 3等相繼突破開源模型參數上限,潜在算力需求攀升,如果Llama 3參數量超4000億版本效能媲美GPT-4,部署該模型的需求攀升,接入Llama 3的雲廠商能吃到的潜在算力紅利不會少。

清華大學成立人工智慧學院

清華大學成立人工智慧學院,聚焦“人工智慧覈心基礎理論與架構”和“人工智慧+X”兩個重點方向,為實現高水准科技自立自强提供有力支撐。 圖靈獎得主、中國科學院院士姚期智擔任清華大學人工智慧學院首任院長。

點評:清華大學是國內最早開展人工智慧教學和科研的組織之一。 清華大學1978年建立“人工智慧與智慧控制”教研組,1985年成立國內第一個智慧型機器人實驗室,1990年建成全國首個以“智慧”命名的國家重點實驗室。 此後,清華還相繼成立腦與智慧實驗室、未來實驗室、人工智慧研究院、人工智慧國際治理研究院、智慧產業研究院。 如今一批人工智慧創業團隊有清華背景,包括智譜AI、面壁智慧、月之暗面、生數科技等,“清華系”已星光熠熠。 此次專門成立人工智慧學院並選定重點方向,清華大學有望在人工智慧賽道增强引領能力。