- 時(shí)間:2024-02-09
- 點(diǎn)擊:0
- 來源:人民日?qǐng)?bào)海外版
當(dāng)今時(shí)代,數(shù)據(jù)已成為重要的創(chuàng)新要素。人工智能大模型、新材料創(chuàng)制、生物育種、基礎(chǔ)科學(xué)研究等都離不開數(shù)據(jù)的支撐。
國(guó)家數(shù)據(jù)局等17部門近日印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》,明確開展“數(shù)據(jù)要素×科技創(chuàng)新”行動(dòng),從推動(dòng)科學(xué)數(shù)據(jù)有序開放共享、強(qiáng)化高質(zhì)量科學(xué)數(shù)據(jù)資源建設(shè)和場(chǎng)景應(yīng)用、以科學(xué)數(shù)據(jù)助力前沿研究、以科學(xué)數(shù)據(jù)支撐技術(shù)創(chuàng)新、以科學(xué)數(shù)據(jù)支持大模型開發(fā)、探索科研新范式等方面闡述了數(shù)據(jù)要素與科技創(chuàng)新相結(jié)合的著力點(diǎn)。
從支持基礎(chǔ)研究,到助力前沿技術(shù)如人工智能的發(fā)展,再到推動(dòng)科研方法的變革,借著“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃的“東風(fēng)”,中國(guó)的科技創(chuàng)新正在“乘”數(shù)直上。
建好“軟硬件”
推動(dòng)科學(xué)數(shù)據(jù)有序開放共享,促進(jìn)重大科技基礎(chǔ)設(shè)施、科技重大項(xiàng)目等產(chǎn)生的各類科學(xué)數(shù)據(jù)互聯(lián)互通,支持和培育具有國(guó)際影響力的科學(xué)數(shù)據(jù)庫建設(shè),依托國(guó)家科學(xué)數(shù)據(jù)中心等平臺(tái)強(qiáng)化高質(zhì)量科學(xué)數(shù)據(jù)資源建設(shè)和場(chǎng)景應(yīng)用,是“數(shù)據(jù)要素×科技創(chuàng)新”行動(dòng)的重要目標(biāo)之一。
建好相關(guān)“軟硬件”,各地正在積極布局。
2024年,北京將推動(dòng)算力中心、數(shù)據(jù)訓(xùn)練基地、國(guó)家區(qū)塊鏈樞紐節(jié)點(diǎn)等一批重大項(xiàng)目落地。
江蘇將體系化推進(jìn)5G、千兆光網(wǎng)規(guī)模部署,支持蘇州國(guó)家級(jí)互聯(lián)網(wǎng)骨干直聯(lián)點(diǎn)建設(shè),加快智能算力、邊緣計(jì)算等算力設(shè)施布局。
四川提出適度超前建設(shè)數(shù)字信息基礎(chǔ)設(shè)施,加快建設(shè)“東數(shù)西算”工程國(guó)家樞紐節(jié)點(diǎn),建設(shè)全省算力調(diào)度服務(wù)平臺(tái),構(gòu)建算力、存力、運(yùn)力一體化算網(wǎng)融合發(fā)展體系。
山東提出部署高性能智能計(jì)算中心,統(tǒng)籌布局通用和垂直大模型算力,累計(jì)建成5A級(jí)省級(jí)新型數(shù)據(jù)中心25個(gè)以上,智能算力比例達(dá)到30%,建成“山東算網(wǎng)”。支持濟(jì)寧建設(shè)魯南算力中心。深入實(shí)施“雙千兆”網(wǎng)絡(luò)系統(tǒng)工程,打造典型應(yīng)用項(xiàng)目500個(gè)以上,新開通5G基站4萬個(gè)。
“硬件”設(shè)施加強(qiáng),“軟件”設(shè)施也需要提升。
“互聯(lián)網(wǎng)是數(shù)據(jù)流通、匯聚的平臺(tái),是數(shù)字經(jīng)濟(jì)時(shí)代基礎(chǔ)設(shè)施的關(guān)鍵。”中國(guó)科學(xué)院院士梅宏表示,需要加快構(gòu)建數(shù)聯(lián)網(wǎng)和數(shù)據(jù)空間等新基礎(chǔ)設(shè)施。
2021年,中國(guó)科學(xué)院發(fā)布了一款具有國(guó)際化服務(wù)能力的開放的通用型科學(xué)數(shù)據(jù)存儲(chǔ)與發(fā)布平臺(tái)——科學(xué)數(shù)據(jù)銀行(ScienceDB)。
科學(xué)數(shù)據(jù)銀行由中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心自主研發(fā),是一個(gè)論文關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)平臺(tái),能夠?yàn)檎撐年P(guān)聯(lián)數(shù)據(jù)的匯聚、管理、開放、共享提供高效的解決方案,為落實(shí)科研誠(chéng)信、培育共享文化、加快數(shù)據(jù)流轉(zhuǎn)和促進(jìn)國(guó)際合作提供平臺(tái)和服務(wù)保障。
科研人員可以把各自收集整理的科學(xué)數(shù)據(jù)在科學(xué)數(shù)據(jù)銀行里進(jìn)行儲(chǔ)存和出版,而科學(xué)數(shù)據(jù)銀行通過吸納“數(shù)據(jù)存款”,“變小錢為大錢,變死錢為活錢”,把分散在個(gè)人和集體中的數(shù)據(jù)資源集中起來,使其更容易被發(fā)現(xiàn)、訪問、互操作和重用。同時(shí),學(xué)術(shù)論文投稿前,科研人員也可以將論文數(shù)據(jù)上傳到科學(xué)數(shù)據(jù)銀行。
截至今年2月2日,科學(xué)數(shù)據(jù)銀行共收集了開放數(shù)據(jù)集820多萬個(gè),平臺(tái)訪問量超過7億次。
開發(fā)大模型
開發(fā)人工智能大模型是“數(shù)據(jù)要素×科技創(chuàng)新”行動(dòng)的另一個(gè)重要目標(biāo)。
《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》中提出,以科學(xué)數(shù)據(jù)支持大模型開發(fā),深入挖掘各類科學(xué)數(shù)據(jù)和科技文獻(xiàn),通過細(xì)粒度知識(shí)抽取和多來源知識(shí)融合,構(gòu)建科學(xué)知識(shí)資源底座,建設(shè)高質(zhì)量語料庫和基礎(chǔ)科學(xué)數(shù)據(jù)集,支持開展人工智能大模型開發(fā)和訓(xùn)練。
近年來,中國(guó)在大模型領(lǐng)域擁有良好的算力基礎(chǔ)和廣闊的市場(chǎng),國(guó)產(chǎn)大模型頻頻亮相、加速迭代。工業(yè)和信息化部賽迪研究院數(shù)據(jù)顯示,目前,中國(guó)已有超過19個(gè)大語言模型研發(fā)廠商,其中,15家廠商的模型產(chǎn)品已經(jīng)通過備案。
憑借語言理解、邏輯推理、知識(shí)問答、文本生成等通用能力,這些大語言模型產(chǎn)品一經(jīng)推出,便受到用戶的歡迎。
“科技創(chuàng)新實(shí)現(xiàn)新突破。訊飛星火認(rèn)知大模型處于全國(guó)領(lǐng)先水平。”這是寫進(jìn)今年安徽省《政府工作報(bào)告》中的一句話。
訊飛星火是科大訊飛公司在2023年5月正式發(fā)布的新一代認(rèn)知大模型,從發(fā)布至今歷經(jīng)多次迭代,不斷升級(jí)核心能力的技術(shù)底座,持續(xù)賦能各行各業(yè)。目前,訊飛星火在國(guó)務(wù)院發(fā)展研究中心國(guó)研經(jīng)濟(jì)研究院、新華社研究院中國(guó)企業(yè)發(fā)展研究中心等機(jī)構(gòu)的多次評(píng)測(cè)中獲得肯定,被譽(yù)為中國(guó)優(yōu)質(zhì)的國(guó)產(chǎn)大模型。
“只有把大模型建立在完全自主可控的平臺(tái)上,我們才能把通用人工智能時(shí)代的發(fā)展主動(dòng)權(quán)牢牢掌握在自己手里?!笨拼笥嶏w研究院院長(zhǎng)劉聰對(duì)本報(bào)記者說。2023年10月,在科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛宣布聯(lián)合華為打造國(guó)產(chǎn)大模型算力底座“飛星一號(hào)”平臺(tái),在此基礎(chǔ)上,訊飛星火大模型開啟了更大規(guī)模的訓(xùn)練。
目前,基于“飛星一號(hào)”的訊飛星火V3.5已完成訓(xùn)練,并于1月30日發(fā)布。升級(jí)后的訊飛星火V3.5在邏輯推理、語言理解、文本生成、數(shù)學(xué)答題、多模態(tài)等方面的能力均顯著提升。同時(shí),訊飛還發(fā)布了星火語音大模型和開源大模型。
“大模型帶來了語音技術(shù)發(fā)展的全新機(jī)會(huì)。”劉聰說。讓機(jī)器具備學(xué)習(xí)、推理和決策的能力,就是認(rèn)知大模型要干的主要工作。
“我們認(rèn)為,未來人工智能大模型的發(fā)展可能會(huì)有以下四個(gè)趨勢(shì)?!眲⒙敻嬖V本報(bào)記者,“第一是多模態(tài)和多語言。站在未來通用人工智能發(fā)展的角度,認(rèn)知智能大模型是核心基礎(chǔ),基于此,語音、圖像、視頻等其他數(shù)據(jù)可以對(duì)齊到統(tǒng)一語義空間中,結(jié)合插件工具實(shí)現(xiàn)多模態(tài)系統(tǒng)呈現(xiàn)。第二是可信可解釋。這就需要保證海量數(shù)據(jù)的源頭質(zhì)量、大模型本身能力及系統(tǒng)方案的不斷優(yōu)化迭代,加上國(guó)家出臺(tái)的監(jiān)管政策和法律法規(guī)護(hù)航。第三是向系統(tǒng)性創(chuàng)新方向發(fā)展?;趩吸c(diǎn)技術(shù)組合的軟硬一體化創(chuàng)新在AI(人工智能)領(lǐng)域已有產(chǎn)品、應(yīng)用的先例,在大模型能力支持下,我們需要聯(lián)合多種優(yōu)勢(shì)技術(shù)進(jìn)行系統(tǒng)性創(chuàng)新,并關(guān)注其所帶來的護(hù)城河效應(yīng)。第四是軟硬件一體全國(guó)產(chǎn)化發(fā)展。目前,訊飛投入并深度參與到國(guó)產(chǎn)AI芯片軟件生態(tài)建設(shè)中,在訓(xùn)練側(cè)和推理側(cè)已有一定的收獲和進(jìn)展?!?/p>
推進(jìn)數(shù)智融合
智能檢索、關(guān)鍵詞篩選、最新醫(yī)訊獲取……依靠大數(shù)據(jù)與人工智能帶來的便捷功能,用戶只需動(dòng)動(dòng)手指,就可輕松體驗(yàn)這些服務(wù)。2023年10月,江蘇省泰州市大健康產(chǎn)業(yè)鏈標(biāo)準(zhǔn)云享站正式上線,以百萬量級(jí)標(biāo)準(zhǔn)數(shù)據(jù)為企業(yè)提供正版現(xiàn)行、實(shí)時(shí)更新、用戶體驗(yàn)更加友好的信息服務(wù)支撐。
這是泰州推動(dòng)數(shù)字化、智能化技術(shù)與標(biāo)準(zhǔn)深度融合的創(chuàng)新實(shí)踐??v觀泰州醫(yī)藥健康產(chǎn)業(yè),從線上到線下,從“實(shí)驗(yàn)室”到“車間”,“智改數(shù)轉(zhuǎn)(智能化改造、數(shù)字化轉(zhuǎn)型)”的成果紛紛走向“生產(chǎn)線”。
走進(jìn)泰州醫(yī)藥高新區(qū)(高港區(qū))的江蘇大同盟制藥有限公司小容量注射劑生產(chǎn)車間,全自動(dòng)生產(chǎn)線有序作業(yè),藥品生產(chǎn)高效、精準(zhǔn)、穩(wěn)定;揚(yáng)子江藥業(yè)集團(tuán)旗下生產(chǎn)工廠通過“機(jī)器換人”和信息系統(tǒng)集成管理等一系列“智改數(shù)轉(zhuǎn)”措施,使全流程生產(chǎn)更加智能化、數(shù)字化;江蘇龍鳳堂中藥有限公司形成了一整套從中藥材前期處理到提取的現(xiàn)代化解決方案,在中藥流程智能制造標(biāo)準(zhǔn)化建設(shè)領(lǐng)域打造了“智改數(shù)轉(zhuǎn)”的樣板。
泰州的實(shí)踐說明,當(dāng)前,數(shù)據(jù)已成為醫(yī)藥健康產(chǎn)業(yè)的重要要素,數(shù)字技術(shù)也已成為生物醫(yī)藥創(chuàng)新發(fā)展的必要工具。數(shù)智融合,對(duì)賦能醫(yī)藥健康產(chǎn)業(yè)創(chuàng)新發(fā)展的作用不可或缺。
在“數(shù)據(jù)要素×科技創(chuàng)新”行動(dòng)中,推進(jìn)數(shù)智融合也是重要舉措之一?!丁皵?shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》提出,以科學(xué)數(shù)據(jù)支撐技術(shù)創(chuàng)新,聚焦生物育種、新材料創(chuàng)制、藥物研發(fā)等領(lǐng)域,以數(shù)智融合加速技術(shù)創(chuàng)新和產(chǎn)業(yè)升級(jí)。
近年來,人工智能、區(qū)塊鏈、深度學(xué)習(xí)、物聯(lián)網(wǎng)等新一代數(shù)智技術(shù)的集成迭代與擴(kuò)散,已滲透到研發(fā)設(shè)計(jì)、生產(chǎn)制造、客戶服務(wù)等各個(gè)環(huán)節(jié),對(duì)生產(chǎn)技術(shù)、生產(chǎn)方式帶來全角度、全方位、全鏈條的改造,全面提升產(chǎn)業(yè)的自動(dòng)化、數(shù)字化和智能化水平,為推動(dòng)數(shù)智融合應(yīng)用、加快形成新質(zhì)生產(chǎn)力提供了關(guān)鍵驅(qū)動(dòng)力。
西北大學(xué)經(jīng)濟(jì)管理學(xué)院教授鈔小靜認(rèn)為,數(shù)據(jù)要素作為數(shù)字經(jīng)濟(jì)時(shí)代以非物質(zhì)形態(tài)被計(jì)算機(jī)設(shè)備存儲(chǔ)和處理的新型關(guān)鍵生產(chǎn)要素,具有非競(jìng)爭(zhēng)性、低復(fù)制成本、非排他性、強(qiáng)外部性等技術(shù)和經(jīng)濟(jì)特征,可以被不同主體重復(fù)利用,通過解構(gòu)重組、匯聚融合等方式產(chǎn)生“數(shù)據(jù)+算法+算力”融合價(jià)值,為夯實(shí)數(shù)智融合內(nèi)在形態(tài)、加快形成新質(zhì)生產(chǎn)力提供了基礎(chǔ)性重要資源。
“一方面,數(shù)據(jù)要素與傳統(tǒng)生產(chǎn)要素的有機(jī)融合應(yīng)用,豐富了數(shù)智融合的表現(xiàn)形態(tài),將數(shù)智融合的方式由地理空間轉(zhuǎn)向?yàn)閿?shù)字空間?!扁n小靜說,“另一方面,數(shù)據(jù)要素在傳統(tǒng)生產(chǎn)要素的再配置、再組合中發(fā)揮‘媒介’作用,產(chǎn)生了新的要素加工模式,催生了數(shù)智融合新形態(tài)。”