DeepSeek推手不到30歲 小米祭千萬挖角

https:reurl.ccmR2lGA新崛起的中國AI新創公司DeepSeek引發熱議,最新推出的開源大型語言模型(LLM)不僅訓練效率大幅提升,訓練成本更是低於其他AI競爭對手,其後面推手也引起大家好奇。

據悉,DeepSeek-V2的關鍵開發者之一是一名未滿30歲的天才少女「羅福莉」,她還被小米創始人高薪挖角。

DeepSeek於2024年年底、2025年初推出的開源大型語言模型(LLM)「DeepSeek-V3」與「DeepSeek-R1」引發話題,其中,訓練的低成本也讓DeepSeek-V3有「AI界拼多多」的稱號。

而開源大模型DeepSeek-V2的關鍵開發者之一,是一名叫做羅福莉的天才少女,陸媒介紹,羅福莉出生在四川,雖然大學在北京師範大學主修電腦專業,但是一開始她因為基礎太差,常常跟不上課業,不過後來學出興趣,天賦和努力加持下成績快速進步,最後保送進入北京大學的計算語言學研究所。

讀研究所期間,羅福莉發表的人工智能相關的論文就受到大眾的關注,碩士畢業後羅福莉就進入加入阿里達摩院機器智能實驗室,主導開發多語言預訓練模型VECO。

2022年,她加入幻方量化從事深度學習相關策略建模和演算法研究,後來正式加入DeepSeek擔任深度學習研究員,成為研發大模型DeepSeek-V2的參與者之一。

就在DeepSeek推出模型吸引市場之際,小米創始人雷軍用人民幣千萬元(約新台幣4518萬元)年薪挖角羅福莉,要她到小米帶領新的AI實驗室大模型團隊。

而DeepSeek因為用低成本訓練出大規模模型,在AI屆成功崛起,也吸引了美國矽谷的注意,Meta一名工程師甚至透露Meta設立了四個專案部門,專門研究DeepSeek的技術。

https:news.tvbs.com.twworld2763307#派出我們天才AI大臣!

2025-01-28 00:00
6