5月6日,訊飛星火認(rèn)知大模型面世。無論是文本生成、語言理解,還是知識問答、邏輯推理,亦或是數(shù)學(xué)能力等,星火大模型都表現(xiàn)出色。
科大訊飛董事長劉慶峰表示,認(rèn)知大模型成為通用人工智能的曙光,科大訊飛有信心實現(xiàn)“智能涌現(xiàn)”。當(dāng)前,訊飛星火認(rèn)知大模型已經(jīng)在文本生成、知識問答、數(shù)學(xué)能力三大能力上已超ChatGPT。后續(xù)將聯(lián)合開發(fā)者推動大模型應(yīng)用落地,共建人工智能“星火”生態(tài)。
加速趕超有科學(xué)的方法和體系
劉慶峰表示,從ChatGPT關(guān)注的48個主要任務(wù)方向和訊飛開放平臺上400多萬開發(fā)者團(tuán)隊的需求分析,通用人工智能應(yīng)當(dāng)具備七大維度能力,包括文本生成、語言理解,知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等。
認(rèn)知大模型的“智能涌現(xiàn)”也將帶來解決人類社會剛需的全新機(jī)遇。比如,改變信息分發(fā)獲取模式,革新內(nèi)容生產(chǎn)模式,全自然交互完成任務(wù),實現(xiàn)專家級的虛擬助手,顛覆傳統(tǒng)手工編程方式以及成為科研工作的加速器等。
面向全新的人工智能時代機(jī)遇,科大訊飛已為認(rèn)知大模型的“智能涌現(xiàn)”做好了源頭核心技術(shù)的儲備。2011年科大訊飛便承建了語音及語言信息處理國家工程實驗室;2014年科大訊飛推出“訊飛超腦計劃”,提出讓機(jī)器像人一樣能理解會思考;2022年升級為“訊飛超腦2030計劃”,提出讓懂知識、善學(xué)習(xí)、能進(jìn)化的通用人工智能技術(shù)成為每個人未來發(fā)展的重要機(jī)會,讓機(jī)器人走進(jìn)家庭。
劉慶峰表示,“在國家平臺和訊飛超腦計劃的支撐下,過去幾年我們在認(rèn)知智能領(lǐng)域取得了一系列全球領(lǐng)先的成果。”2017年,科大訊飛承建認(rèn)知智能國家重點實驗室,也就是從這一年起,科大訊飛不僅讓機(jī)器在全球首次通過了國家職業(yè)醫(yī)師資格考試、超過了96.3%參加考試的醫(yī)生,并且在SQuAD機(jī)器閱讀理解中全球首次超過人類平均水平,剛剛過去的2022年在OpenBookQA 科學(xué)知識推理中,單模型也超過人類平均水平。
“可以說多年來,科大訊飛已在認(rèn)知智能領(lǐng)域有了豐富的儲備和積累。”劉慶峰表示,在2022年12月15日,科大訊飛正式啟動“1+N”認(rèn)知大模型專項攻關(guān),其中“1”就是指通用認(rèn)知智能大模型,“N”就是大模型在教育、辦公、汽車、人機(jī)交互等各個領(lǐng)域的落地。
劉慶峰表示:“我們要向OpenAI學(xué)習(xí),同時也要快速追趕并努力超越,而這需要一套科學(xué)系統(tǒng)的評測體系。”科大訊飛通過認(rèn)知智能全國重點實驗室牽頭設(shè)計了通用認(rèn)知大模型評測體系,并與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個細(xì)分任務(wù)類型。在科學(xué)的評測體系中,推動訊飛星火大模型的發(fā)展。
劉慶峰強(qiáng)調(diào),“今天要看一個大模型系統(tǒng)到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試。”
大模型迸發(fā)“智慧”的火花
科大訊飛圍繞訊飛星火認(rèn)知大模型的七大核心能力,即多風(fēng)格多任務(wù)長文本生成、多層次跨語種語言理解、泛領(lǐng)域開放式知識問答、情景式思維鏈邏輯推理、多題型步驟級數(shù)學(xué)能力、多功能多語言代碼能力、多模態(tài)輸入和表達(dá)能力,展開現(xiàn)場實測。大模型更是在文本生成、語言理解、數(shù)學(xué)能力上迸發(fā)“智慧”火花。
此外,它還能寫郵件、做方案、寫新聞通稿等,它還能生成英文宣傳,修改英語語法錯誤,展現(xiàn)作為AI助手的多才多藝。劉慶峰表示,在長文本生成上,訊飛星火大模型在國內(nèi)明顯領(lǐng)先,并且在中文方面超過了Chat GPT,并且在持續(xù)進(jìn)步中。
大模型都很好的理解了特定的句子和場景含義,隨著問題的變化,靈活調(diào)整自己的答案。精彩的回答也讓現(xiàn)場觀眾報以熱烈掌聲。此外還展示了“情感分析”能力,展現(xiàn)出跟人類共情的潛力。劉慶峰表示,訊飛星火的語言能理解能力相比ChatGPT還略有差距,但是已超越國內(nèi)同類產(chǎn)品。
在數(shù)學(xué)能力中,訊飛星火大模型展現(xiàn)出“學(xué)霸”氣質(zhì)。除了常規(guī)計算、幾何、情景應(yīng)用等,研究院院長劉聰拋出了復(fù)雜的計算題,星火大模型很快準(zhǔn)確給出了答案,并給出了解題步驟。劉慶峰表示,數(shù)理能力一定程度代表了大模型的聰明程度。訊飛星火大模型不僅在國內(nèi)系統(tǒng)中遙遙領(lǐng)先,也超過了ChatGPT。
此外,劉聰還展示了大模型面向泛領(lǐng)域開放式知識問答,它具備很好的通識知識,能夠?qū)ι畛WR、科學(xué)知識、工作技巧,以及醫(yī)學(xué)知識等應(yīng)對自如,該能力也已超過ChatGPT。此外,星火大模型也具備邏輯推理能力與代碼能力,還將進(jìn)一步升級多模態(tài)輸入和表達(dá)能力,不斷實現(xiàn)自身迭代進(jìn)化。
劉慶峰公布了今年大模型技術(shù)持續(xù)升級的三個關(guān)鍵里程碑節(jié)點:6月9日,將突破開放式問答、多輪對話能力明顯提升、數(shù)學(xué)能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升,希望能幫助到更多的合作伙伴及開發(fā)者團(tuán)隊;10月24日,將實現(xiàn)通用模型對標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。
開放共建人工智能生態(tài)
“人工智能的發(fā)展絕不是單個企業(yè)和單個科研機(jī)構(gòu)的事情,而是需要大家合作共贏的。”劉慶峰說。
訊飛開放平臺新增星火認(rèn)知大模型,將賦能開發(fā)者打造更具價值的AI應(yīng)用。目前,訊飛開放平臺已經(jīng)開放了560項AI能力,并聚集了超過500萬生態(tài)合作伙伴。
在新時代的機(jī)遇下,科大訊飛將通過能力開放、插件開放、行業(yè)共創(chuàng),與千行百業(yè)共建生態(tài)。
據(jù)了解,首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型,聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài)。
科大訊飛啟動“2023 科大訊飛AI星火營生態(tài)計劃”,面向千行百業(yè)的開發(fā)者,提供技術(shù)賦能、方案打造、賽事運營、商業(yè)運作、創(chuàng)業(yè)扶持等多維度資源,推動大模型的應(yīng)用落地。劉慶峰表示,“蘇州、武漢、青島、太原四座城市將會率先啟動星火營計劃,我們期待與開發(fā)者一起用星火燎原產(chǎn)業(yè)生態(tài)。”
劉慶峰透露,科大訊飛在算力方面將與華為合作。劉慶峰表示,未來認(rèn)知大模型的持續(xù)進(jìn)化,將在自主可控的平臺上不斷地提升。
未來訊飛星火如何發(fā)展呢?劉慶峰表示,“我們秉持源頭創(chuàng)新、自主可控、信息安全、人文倫理的原則,在保護(hù)倫理和安全的前提下健康發(fā)展。”(鄭大海)