競速大模型:一手創新策源,一手落地應用
新華社上海6月9日電 題:競速大模型:一手創新策源,一手落地應用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現,2023年至今,大模型帶火的通用人工智能賽道,出現了眾多玩家。科技部新一代人工智能發展研究中心等機構發布的數據顯示,中國10億參數規模以上的大模型已發布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進創新策源,一手服務實體經濟?在從業者看來,這場競速賽才剛剛開始。
大模型探索大應用
在位于上海臨港新片區的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現場感受發現,作為千億級參數的自然語言處理模型“商量”,它不僅可以進行多輪對話、人機共創童話故事,還可以自動生成簡單代碼、進行“文生圖”等。例如,在輸入了20張“港風”照片后,生成式AI就可以自動生成一張類似風格的“氛圍感”圖片。
“無論是讓大模型寫出一首質量過關的古詩,還是根據描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經過多輪對話的訓練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規律。”商湯科技首席科學家王曉剛說。
語言類大模型不是唯一形態,多種通用大模型正在持續拓展應用場景。科技部新一代人工智能發展研究中心等機構發布的《中國人工智能大模型地圖研究報告》顯示,中國研發的大模型數量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫療、教育、設計等行業加速滲透;另一方面,一些垂直專業類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發揮縱深優勢。
4月初,上海人工智能實驗室聯合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發布全球中期天氣預報大模型“風烏”,30秒生成未來10天全球氣象高精度預報結果。
在氣象氣候預報任務中,全球中期天氣預報是重要預測任務之一,它以預測未來14天內的大氣系統狀態為目標。“風烏”在預報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領軍科學家歐陽萬里說:“‘風烏’取名自秦漢時期的‘相風銅烏’,是世界上最早的測風設備。天氣預報大模型‘風烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務科學領域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創新策源“鋪路”。
5月30日,北京發布《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023—2025年)》《北京市促進通用人工智能創新發展的若干措施》等方案;深圳發布關于加快推動人工智能高質量發展高水平應用行動方案;上海市經信委表示,超大規模預訓練模型是人工智能從專業智能走向通用智能的關鍵技術,未來將加快研究打造大模型生態集聚和創新應用高地,推進算力資源統一調度。
算力是研發大模型必不可少的基礎設施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應用大爆發,推動了算力需求激增。很多企業在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區管委會高科處處長陸瑜說,這也是臨港發力構建更為完善的算力產業生態、搭建公共平臺的初衷。
瞄準產業痛點,智能算力更需要一體化調度、經濟化使用。專家認為,“東數西算”工程的全面實施,將一手促進東部數字經濟產業鏈向西部延伸拓展,一手讓算力資源精準配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區共同合作建設新的產業園區,來打造滬黔科技創新成果的轉化中心。”貴陽市市長馬寧宇說,貴安正在規劃建設全國規模最大,存算能力一流的高安全、高可靠、高可用的數據中心集群,為大數據、大算力、大模型的技術發展和應用提供廣闊空間。
“東西合作有更多想象空間。”優刻得科技股份有限公司副總裁劉杰認為,“東數西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業內其實也在探索“東數西訓”,把非實時計算的AI訓練過程放在西部進行,涉及需要實時運算的推理過程則在東部直接完成,更好地調度算力、節約成本。
設規則促進“好模型”
既為創新“加油”,也為發展“立規”。專家認為,目前大模型總體人才不足,不少應用領域還未有成熟開發,數據治理也有待提升,這既需要政府部門為創新的落地搭平臺、找場景,也需要為其安全探索設置好邊界。
今年4月,國家網信辦發布《生成式人工智能服務管理辦法(征求意見稿)》,對用于生成式人工智能產品的預訓練、優化訓練數據提出明確要求。從治理原則到倫理規范,近年來我國一直加強對人工智能行業“立規”。
“大模型推動人工智能實現一次歷史性跨越,中國經濟社會高質量發展為大模型創新提供豐富場景和數據基礎。”中國科學技術信息研究所所長、科技部新一代人工智能發展研究中心主任趙志耘認為,未來需要在四個方面著力:加強資源和研發力量統籌,促進產學研合作與開源開放;加強大模型技術研發,提升學術和開源影響力;強化大模型發展中的場景牽引作用,打造大模型標桿項目;強化政策支持和配套服務,加快推動大模型應用落地。
從更深層次看,助力大模型走深走透,還需要更高質量的數據庫。“未來對數據的高質量和多維度要求都會更高。”中國人工智能開源軟件發展聯盟副理事長王健宗說,比如以前標注一張圖,只需要說這是“一個公園”;但現在標注就需要詳細描述為“母親和小孩在公園里散步”,標注難度和工作數量級呈指數上升。
“數據變成必要的生產要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數據的質量要求、使用門檻都會越來越高,需要規則的提前制定。”趙志耘說。
新華社上海6月9日電 題:競速大模型:一手創新策源,一手落地應用
新華社記者周琳、楊有宗、潘德鑫
百花齊放、競相涌現,2023年至今,大模型帶火的通用人工智能賽道,出現了眾多玩家。科技部新一代人工智能發展研究中心等機構發布的數據顯示,中國10億參數規模以上的大模型已發布79個。這一席卷科技界的AI革命,將如何改變世界?大模型又將如何一手促進創新策源,一手服務實體經濟?在從業者看來,這場競速賽才剛剛開始。
大模型探索大應用
在位于上海臨港新片區的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
記者在現場感受發現,作為千億級參數的自然語言處理模型“商量”,它不僅可以進行多輪對話、人機共創童話故事,還可以自動生成簡單代碼、進行“文生圖”等。例如,在輸入了20張“港風”照片后,生成式AI就可以自動生成一張類似風格的“氛圍感”圖片。
“無論是讓大模型寫出一首質量過關的古詩,還是根據描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經過多輪對話的訓練,包括輔助語料的投喂,才能逐漸讓模型理解漢語的規律。”商湯科技首席科學家王曉剛說。
語言類大模型不是唯一形態,多種通用大模型正在持續拓展應用場景。科技部新一代人工智能發展研究中心等機構發布的《中國人工智能大模型地圖研究報告》顯示,中國研發的大模型數量排名全球第二,僅次于美國。
一方面大模型從辦公、生活、娛樂向醫療、教育、設計等行業加速滲透;另一方面,一些垂直專業類大模型不斷深化落地,生物制藥、遙感、氣象等大模型正在發揮縱深優勢。
4月初,上海人工智能實驗室聯合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發布全球中期天氣預報大模型“風烏”,30秒生成未來10天全球氣象高精度預報結果。
在氣象氣候預報任務中,全球中期天氣預報是重要預測任務之一,它以預測未來14天內的大氣系統狀態為目標。“風烏”在預報精度上降低了誤差,在時效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
上海人工智能實驗室領軍科學家歐陽萬里說:“‘風烏’取名自秦漢時期的‘相風銅烏’,是世界上最早的測風設備。天氣預報大模型‘風烏’承載中國古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務科學領域不懈探索。”
大算力搭建新“底座”
出臺支持舉措、整合創新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創新策源“鋪路”。
5月30日,北京發布《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023—2025年)》《北京市促進通用人工智能創新發展的若干措施》等方案;深圳發布關于加快推動人工智能高質量發展高水平應用行動方案;上海市經信委表示,超大規模預訓練模型是人工智能從專業智能走向通用智能的關鍵技術,未來將加快研究打造大模型生態集聚和創新應用高地,推進算力資源統一調度。
算力是研發大模型必不可少的基礎設施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應用大爆發,推動了算力需求激增。很多企業在落戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區管委會高科處處長陸瑜說,這也是臨港發力構建更為完善的算力產業生態、搭建公共平臺的初衷。
瞄準產業痛點,智能算力更需要一體化調度、經濟化使用。專家認為,“東數西算”工程的全面實施,將一手促進東部數字經濟產業鏈向西部延伸拓展,一手讓算力資源精準配置和按需獲取,有效降低能源消耗。
“我們將在貴安新區共同合作建設新的產業園區,來打造滬黔科技創新成果的轉化中心。”貴陽市市長馬寧宇說,貴安正在規劃建設全國規模最大,存算能力一流的高安全、高可靠、高可用的數據中心集群,為大數據、大算力、大模型的技術發展和應用提供廣闊空間。
“東西合作有更多想象空間。”優刻得科技股份有限公司副總裁劉杰認為,“東數西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。業內其實也在探索“東數西訓”,把非實時計算的AI訓練過程放在西部進行,涉及需要實時運算的推理過程則在東部直接完成,更好地調度算力、節約成本。
設規則促進“好模型”
既為創新“加油”,也為發展“立規”。專家認為,目前大模型總體人才不足,不少應用領域還未有成熟開發,數據治理也有待提升,這既需要政府部門為創新的落地搭平臺、找場景,也需要為其安全探索設置好邊界。
今年4月,國家網信辦發布《生成式人工智能服務管理辦法(征求意見稿)》,對用于生成式人工智能產品的預訓練、優化訓練數據提出明確要求。從治理原則到倫理規范,近年來我國一直加強對人工智能行業“立規”。
“大模型推動人工智能實現一次歷史性跨越,中國經濟社會高質量發展為大模型創新提供豐富場景和數據基礎。”中國科學技術信息研究所所長、科技部新一代人工智能發展研究中心主任趙志耘認為,未來需要在四個方面著力:加強資源和研發力量統籌,促進產學研合作與開源開放;加強大模型技術研發,提升學術和開源影響力;強化大模型發展中的場景牽引作用,打造大模型標桿項目;強化政策支持和配套服務,加快推動大模型應用落地。
從更深層次看,助力大模型走深走透,還需要更高質量的數據庫。“未來對數據的高質量和多維度要求都會更高。”中國人工智能開源軟件發展聯盟副理事長王健宗說,比如以前標注一張圖,只需要說這是“一個公園”;但現在標注就需要詳細描述為“母親和小孩在公園里散步”,標注難度和工作數量級呈指數上升。
“數據變成必要的生產要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數據的質量要求、使用門檻都會越來越高,需要規則的提前制定。”趙志耘說。