國內高校最大規模異構智算平臺正式上線
CFFF平臺正式上線
近日,國內高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復旦大學正式上線。據了解,平臺由復旦大學、阿里云等共同打造,以公共云模式提供超千卡并行智能計算,支持千億參數的大模型訓練,具有大規模、高能級的特點。
業內人士指出,平臺的上線對于進一步加強學術研究支撐算力,推動具有世界級影響力的科學大模型具有重要意義,而算力水平的提升有望成為激活數據要素潛能、驅動經濟社會數字化轉型的新引擎。
新范式帶來科研新要求
“當下,很多研究都依賴于計算,但很多國際知名高校還停留在用大型機或者個人PC做研究的階段。”中國工程院院士、阿里云創始人王堅表示,“這不是選擇什么云計算部署方式的問題,而是關系到對計算的認識。”
復旦大學校長、中國科學院院士金力表示,在過去一段時間內,隨著大數據資源的不斷增長以及需要求解的科學問題日益復雜,引發了對于科學研究“第五范式”的探索,即在數據范式的基礎上,引入智能技術,強調人的決策機制與數據分析的融合,將數據科學和計算智能有效結合起來,也就是常說的“AI時代的來臨”。
復旦大學化學系教授、中國科學院院士趙東元也提到,“科研范式已經到了研究復雜體系的新階段。我們現在越來越多的是在復雜體系下研究科學,需要借助更多的工具、不同的交叉學科融合來共同推進科研進展,AI就是一個很好的工具。現在,技術創新和科學創新結合得非常緊密,科學的發展會促進技術的變化,而技術為人類提供視野、工具,也會促進科學的發展。”
“在新范式的背景下,高校需要發揮更多作用。”金力強調,“‘單打獨斗’已不適應大科學時代的科技創新,需要借助范式變革推進科研組織模式的迭代更新。我們現在常提到‘有組織科研’,其最大的優勢就在于通過布局建設大平臺。同時,需要通過學科的交叉研究激發創新突破,以加速科技創新與產業變革深度融合,推動產業轉型升級。從AI的角度來看,需要拓寬應用場景,持續推進‘AI時代’的應用普及和覆蓋群體。”
公共云計算平臺支撐科學開放發展
在大模型技術爆發背景下,以微軟為首的美國科技公司在全球掀起了智能算力的競賽。值得關注的是,算力包括通用算力、智能算力和超級算力,目前全球算力產業智能算力占比逐漸擴張,通用算力占比下降。
公開資料顯示,智能計算較通用計算的投入成本、技術門檻更高,各環節投資規模合計可能高達數百億元,非公共云的模式正變得難以持續。
王堅強調了云計算的普惠價值。“為什么云計算很重要?因為云計算希望每個人在計算面前都是平等的,每個人都可以用計算來創造他應該創造的價值。CFFF平臺在公共云上部署,對于高校建設科研計算平臺是一個重要的轉折點和里程碑,學校能擁有和企業一樣的算力基礎設施,公共云是非常重要的保證。”
據介紹,CFFF平臺由面向多學科融合創新的智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。借助阿里云全球領先的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,連成了一臺真正意義上的“超級計算機”。
其中,阿里云烏蘭察布數據中心以公共云模式為復旦校內多學院的多個科研項目提供超千卡并行智能計算,支持千億參數的大模型訓練。千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。
金力表示,CFFF智能計算平臺和以往的大科學裝置或其他典型的科研基礎設施相比有其特殊性。“CFFF智能計算平臺具有大規模、高能級的特點。它是全國高校第一的超算集群,同時也是算力第一的異構智算集群。CFFF平臺可以實現超1000卡并行智能計算,支持超1000億參數的大模型訓練,在國內高校中尚屬首例。與其他大平臺提供科學實驗儀器設備不同,算力、算法、數據是人工智能領域發展的最基本保障,CFFF平臺運行的速度將極大地影響科研效率、科研成本、平臺的服務效能以及未來算法的產業化落地可能性。”
從平臺的具體運用來看,資料顯示,“切問一號”計算集群面向復旦大學提供高性能科學與工程計算服務,利用人工智能推動基礎學科及多學科交叉領域開展前沿研究,為重點領域提供大規模計算和存儲資源,如AI+生物醫藥、AI+材料科學、AI+數學、AI+分子動力學、AI+氣象、AI+社會科學等相關學科。而“近思一號”專用高性能計算機群可滿足學校多學科對于高性能計算的需求,提升各學科領域對于大規模數據處理的能力,如計算物理學、新能源新材料科學、大氣海洋科學、地球科學、生物信息、醫學健康、微電子、航空航天科學等學科。
“兩者共同為全校高性能計算提供強大的計算資源,支持AI賦能科學研究的新范式發展,促進基礎學科及交叉學科建設。”金力說,“我們希望CFFF能夠為復旦的基礎科學研究提供更強大、更穩定、更靈活高效、更低成本的算力支持,利用人工智能新技術解放科學生產力,加速發現新的科學原理和技術突破。同時,我們還希望基于CFFF平臺能夠建成一批具有世界級影響力的科學大模型,例如生命科學大模型、大氣科學大模型、材料科學大模型、集成電路大模型等。”
產學研創新帶動發展新動力
在CFFF成功落地的背后,是產學研合作進一步創新的成功。
“對于CFFF這樣的大型智算平臺,其工程實現和日常運營離不開專業工程團隊的支持。此次平臺的設計,需要將技術提供者和使用者在垂直領域緊密捆綁在一起,也是一次典型的企業為高校賦能,阿里云的支持和運維對于平臺推動真正的科學發現具有重要意義。”金力指出。
“此次復旦大學和阿里云的合作很讓人激動,這種合作反映出企業和學校的合作可以誕生新學科、新領域,甚至一個新類型的學校。CFFF的成功上線,不僅是一個屬于復旦的計算平臺,更是‘計算,因為在復旦而創造了未來’。這是中國也是全球第一次讓高校擁有了和科技巨頭一樣的研究計算平臺,讓研究真正進入了計算驅動的時代。”王堅飽含熱情地說。
王堅表示,復旦大學和阿里云的合作是產學研協同的創新。“IBM和哥倫比亞大學的合作,誕生了計算機專業。阿里云跟復旦大學的合作甚至可以像當年MIT跟貝爾實驗室合作的那樣,正是因為當時兩者的合作,今天的大學工學院才有了通信專業,以產學研的合作創造出一個新領域、一個新機會。”
金力則進一步提到,產教融合有助于更好地培養人才。“這種產教融合不是一個單純的技術轉移關系,它包含兩個方面:一是創新方面的密切互動和合作;二是人才培養方面的密切互動和合作。”
“在創新層面,通過產教融合,我們試圖解決創新主體的責任,也就是通過企業和高校的密切合作,進行共同創新。在當下,只有擁有極強創新能力的企業才能夠在國際競爭當中具備獨立發展乃至引領的能力。因此,創新不是簡單的為企業解決技術問題,而是在更高層面的校企聯合。”金力說。
站在學生培養的角度,金力表示,“希望企業能夠更多地看到社會的需求,為人才培養提供更清晰的方向,幫助高校在人才培養方面樹立更明確的目標。同時,我們也希望學生可以通過在高校的學習,在與企業合作的過程中,盡快、盡早、更有效地為社會和經濟發展服務。企業和高校的合作關系,是在創新和人才培養上雙向賦能的關系,也是未來產教融合要達到的新境界。”(記者 袁小康)
CFFF平臺正式上線
近日,國內高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復旦大學正式上線。據了解,平臺由復旦大學、阿里云等共同打造,以公共云模式提供超千卡并行智能計算,支持千億參數的大模型訓練,具有大規模、高能級的特點。
業內人士指出,平臺的上線對于進一步加強學術研究支撐算力,推動具有世界級影響力的科學大模型具有重要意義,而算力水平的提升有望成為激活數據要素潛能、驅動經濟社會數字化轉型的新引擎。
新范式帶來科研新要求
“當下,很多研究都依賴于計算,但很多國際知名高校還停留在用大型機或者個人PC做研究的階段。”中國工程院院士、阿里云創始人王堅表示,“這不是選擇什么云計算部署方式的問題,而是關系到對計算的認識。”
復旦大學校長、中國科學院院士金力表示,在過去一段時間內,隨著大數據資源的不斷增長以及需要求解的科學問題日益復雜,引發了對于科學研究“第五范式”的探索,即在數據范式的基礎上,引入智能技術,強調人的決策機制與數據分析的融合,將數據科學和計算智能有效結合起來,也就是常說的“AI時代的來臨”。
復旦大學化學系教授、中國科學院院士趙東元也提到,“科研范式已經到了研究復雜體系的新階段。我們現在越來越多的是在復雜體系下研究科學,需要借助更多的工具、不同的交叉學科融合來共同推進科研進展,AI就是一個很好的工具。現在,技術創新和科學創新結合得非常緊密,科學的發展會促進技術的變化,而技術為人類提供視野、工具,也會促進科學的發展。”
“在新范式的背景下,高校需要發揮更多作用。”金力強調,“‘單打獨斗’已不適應大科學時代的科技創新,需要借助范式變革推進科研組織模式的迭代更新。我們現在常提到‘有組織科研’,其最大的優勢就在于通過布局建設大平臺。同時,需要通過學科的交叉研究激發創新突破,以加速科技創新與產業變革深度融合,推動產業轉型升級。從AI的角度來看,需要拓寬應用場景,持續推進‘AI時代’的應用普及和覆蓋群體。”
公共云計算平臺支撐科學開放發展
在大模型技術爆發背景下,以微軟為首的美國科技公司在全球掀起了智能算力的競賽。值得關注的是,算力包括通用算力、智能算力和超級算力,目前全球算力產業智能算力占比逐漸擴張,通用算力占比下降。
公開資料顯示,智能計算較通用計算的投入成本、技術門檻更高,各環節投資規模合計可能高達數百億元,非公共云的模式正變得難以持續。
王堅強調了云計算的普惠價值。“為什么云計算很重要?因為云計算希望每個人在計算面前都是平等的,每個人都可以用計算來創造他應該創造的價值。CFFF平臺在公共云上部署,對于高校建設科研計算平臺是一個重要的轉折點和里程碑,學校能擁有和企業一樣的算力基礎設施,公共云是非常重要的保證。”
據介紹,CFFF平臺由面向多學科融合創新的智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。借助阿里云全球領先的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,連成了一臺真正意義上的“超級計算機”。
其中,阿里云烏蘭察布數據中心以公共云模式為復旦校內多學院的多個科研項目提供超千卡并行智能計算,支持千億參數的大模型訓練。千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。
金力表示,CFFF智能計算平臺和以往的大科學裝置或其他典型的科研基礎設施相比有其特殊性。“CFFF智能計算平臺具有大規模、高能級的特點。它是全國高校第一的超算集群,同時也是算力第一的異構智算集群。CFFF平臺可以實現超1000卡并行智能計算,支持超1000億參數的大模型訓練,在國內高校中尚屬首例。與其他大平臺提供科學實驗儀器設備不同,算力、算法、數據是人工智能領域發展的最基本保障,CFFF平臺運行的速度將極大地影響科研效率、科研成本、平臺的服務效能以及未來算法的產業化落地可能性。”
從平臺的具體運用來看,資料顯示,“切問一號”計算集群面向復旦大學提供高性能科學與工程計算服務,利用人工智能推動基礎學科及多學科交叉領域開展前沿研究,為重點領域提供大規模計算和存儲資源,如AI+生物醫藥、AI+材料科學、AI+數學、AI+分子動力學、AI+氣象、AI+社會科學等相關學科。而“近思一號”專用高性能計算機群可滿足學校多學科對于高性能計算的需求,提升各學科領域對于大規模數據處理的能力,如計算物理學、新能源新材料科學、大氣海洋科學、地球科學、生物信息、醫學健康、微電子、航空航天科學等學科。
“兩者共同為全校高性能計算提供強大的計算資源,支持AI賦能科學研究的新范式發展,促進基礎學科及交叉學科建設。”金力說,“我們希望CFFF能夠為復旦的基礎科學研究提供更強大、更穩定、更靈活高效、更低成本的算力支持,利用人工智能新技術解放科學生產力,加速發現新的科學原理和技術突破。同時,我們還希望基于CFFF平臺能夠建成一批具有世界級影響力的科學大模型,例如生命科學大模型、大氣科學大模型、材料科學大模型、集成電路大模型等。”
產學研創新帶動發展新動力
在CFFF成功落地的背后,是產學研合作進一步創新的成功。
“對于CFFF這樣的大型智算平臺,其工程實現和日常運營離不開專業工程團隊的支持。此次平臺的設計,需要將技術提供者和使用者在垂直領域緊密捆綁在一起,也是一次典型的企業為高校賦能,阿里云的支持和運維對于平臺推動真正的科學發現具有重要意義。”金力指出。
“此次復旦大學和阿里云的合作很讓人激動,這種合作反映出企業和學校的合作可以誕生新學科、新領域,甚至一個新類型的學校。CFFF的成功上線,不僅是一個屬于復旦的計算平臺,更是‘計算,因為在復旦而創造了未來’。這是中國也是全球第一次讓高校擁有了和科技巨頭一樣的研究計算平臺,讓研究真正進入了計算驅動的時代。”王堅飽含熱情地說。
王堅表示,復旦大學和阿里云的合作是產學研協同的創新。“IBM和哥倫比亞大學的合作,誕生了計算機專業。阿里云跟復旦大學的合作甚至可以像當年MIT跟貝爾實驗室合作的那樣,正是因為當時兩者的合作,今天的大學工學院才有了通信專業,以產學研的合作創造出一個新領域、一個新機會。”
金力則進一步提到,產教融合有助于更好地培養人才。“這種產教融合不是一個單純的技術轉移關系,它包含兩個方面:一是創新方面的密切互動和合作;二是人才培養方面的密切互動和合作。”
“在創新層面,通過產教融合,我們試圖解決創新主體的責任,也就是通過企業和高校的密切合作,進行共同創新。在當下,只有擁有極強創新能力的企業才能夠在國際競爭當中具備獨立發展乃至引領的能力。因此,創新不是簡單的為企業解決技術問題,而是在更高層面的校企聯合。”金力說。
站在學生培養的角度,金力表示,“希望企業能夠更多地看到社會的需求,為人才培養提供更清晰的方向,幫助高校在人才培養方面樹立更明確的目標。同時,我們也希望學生可以通過在高校的學習,在與企業合作的過程中,盡快、盡早、更有效地為社會和經濟發展服務。企業和高校的合作關系,是在創新和人才培養上雙向賦能的關系,也是未來產教融合要達到的新境界。”(記者 袁小康)