8月5日,北京深勢科技有限公司(下稱“深勢科技”)宣布完成數(shù)千萬美元A輪融資,由高瓴資本和經緯中國投資,老股東元璟資本跟投。值得一提的是,這是這家資本市場炙手可熱的公司在近一年內連續(xù)完成的第三輪融資。
此前的2020年7月,該公司完成了由百度風投領投,唯獵資本和盛景嘉成跟投的天使輪融資。隨后的2021年3月,深勢科技完成了由元璟資本領投,清流資本跟投的Pre-A輪融資。
公司官網介紹,深勢科技成立于2019年,致力于以新一代分子模擬技術解決微觀尺度工業(yè)設計難題,以打造切實服務于藥企、材料商和科研機構的模擬研發(fā)平臺為主要業(yè)務方向。深勢科技稱,公司具有強大的科研與產業(yè)落地能力。其新一代分子模擬算法在保持量子力學精度的基礎上,將分子動力學的計算速度提升了至少五個數(shù)量級,且對算力的需求與體系的原子數(shù)量呈線性依賴;結合高性能計算,能夠對數(shù)十億原子規(guī)模的體系進行量子力學精度的計算模擬。
令人關注的是,深勢科技核心團隊由中國科學院院士鄂維南(同時也是深勢科技董事及首席科學顧問)等人領銜,主要來自北京大學、普林斯頓大學、約翰霍普金斯大學、復旦大學、中科院上海藥物研究所、阿里、百度等世界一流高校、科研機構和企業(yè),科研隊伍由物理建模、數(shù)值算法、機器學習、高性能計算及藥物和材料計算等多個領域的數(shù)十名優(yōu)秀青年科學家構成。
該公司聯(lián)合創(chuàng)始人兼首席科學家為張林峰博士。張林峰由北京大學元培學院交叉學科培養(yǎng),在普林斯頓大學博士期間師從應用數(shù)學和化學系兩位院士,主要研究方向包括統(tǒng)計物理、分子模擬和機器學習,及其在化學、生物、材料等方向的應用。他通過結合機器學習、多尺度建模方法、高性能計算,有效解決了計算化學、分子動力學模擬等方向中的一系列關鍵問題,跨過了很多傳統(tǒng)思路和單一科研視角的局限。
2019年11月19日,美國計算機協(xié)會ACM公布2020年戈登貝爾獎的頒獎結果,深勢科技團隊的核心成員即獲得該獎項,相關工作也當選2020年中國十大科技進展。戈登貝爾獎素有超算界諾貝爾獎的美譽。研究團隊通過機器學習將分子動力學極限從基線提升到了1億原子的驚人數(shù)量,同時仍保證了從頭算的高精度,效率是之前人類基線水平的1000 倍。
據(jù)介紹,深勢科技致力于解決的微尺度工業(yè)設計,是指通過在電子、原子、分子尺度進行組分與結構設計,從而實現(xiàn)特定物理、化學性質的工業(yè)設計。很多微觀性質預測的本質需求是精確求解原子間相互作用,描述原子間相互作用的關鍵物理量是原子間的勢能面。
對此,長期以來人們面臨著精度和效率不可兼得的困局:基于經驗立場的方法快而不準,基于量子力學的方法準而不快。且傳統(tǒng)的量子力學模型盡管模擬精度高,但會隨著模擬規(guī)模的指數(shù)級增加而陷入“維數(shù)災難”,僅能實現(xiàn)幾十到幾百個原子體系的建模,難以支撐藥物、材料研究所需的數(shù)萬乃至數(shù)百萬級原子規(guī)模體系的模擬。
深勢科技首創(chuàng)革命性的“多尺度建模+機器學習+高性能計算”新范式,突破性地實現(xiàn)了多尺度分子模擬中精度與效率的統(tǒng)一,最具代表性的DeePMD方法在保持量子力學精度的基礎上,將分子動力學的計算速度提升了令人驚嘆的至少五個數(shù)量級。簡單來說,就是相比于傳統(tǒng)的量子力學計算工具,在相同精度前提下,極大地提升了物理方程的求解效率,從而極大地拓展了人類使用計算機模擬客觀物理世界的能力。
實際上,在今年7月的2021世界人工智能大會全體會議期間,鄂維南在演講中也闡述過相關工作。他表示,“我認為重要的不是Gordon-Bell Prize(戈登貝爾獎),而是說我們第一次看到把機器學習、科學計算和高性能計算這三大最主要的工具結合在一起,我們有多么大的空間可以實現(xiàn)。”
鄂維南提到,用計算方法來解決問題已經成了一個很重要的工具,可以說是現(xiàn)代工業(yè)和技術賴以生存的基礎。但同時強調,我們仍然有很多問題沒有得到解決,“比方說材料的性質與設計,分子、藥物的分子與設計,這些遠遠沒有得到解決,基于基本原理的控制方法也沒得到解決。”造成的結果則是,“做理論的人、做實驗的人和做實際場景這三個團體差得非常遠,理論化學、實驗室的化學和實際工業(yè)應用的化學,這些場景差距很遠。”
這些問題困難在哪里?鄂維南總結它們都有一個共同的根源,就是所謂的“維數(shù)災難”,也就是它依賴的變量太多了。“維數(shù)災難是什么意思?就是隨著變量的個數(shù)或者維數(shù)的增加,計算復雜度是指數(shù)增加的。從數(shù)學上來講,它也有一個基本的困難,也就是多項式在高維不是一個有效的工具。”
鄂維南提出,能解開這一困局的或許正是深度學習。他在現(xiàn)場通過最簡單的圖像識別以及公眾熟知的AlphaGo舉例稱,神經網絡可以幫助我們來有效地表示或者是逼近高維空間的函數(shù),多項式不行,而深度神經網絡是一個有效的替代品。“所以說在最基本的層面,我們有了一個全新的非常有效的工具,它帶來的影響是巨大的。”
他當時總結稱,從科學的角度來說,機器學習在科學和科學計算領域的應用,可以帶來新的計算方法,新的科學模型,新的實驗方法,新的產業(yè)業(yè)態(tài)。
記者 賀梨萍
責任編輯:Rex_01