http://bfqmb.cn 2025-02-14 14:54 來源:CAICT上海工創(chuàng)中心
2025年1月13-24日,國際電信聯(lián)盟電信標(biāo)準(zhǔn)分局第二十一研究組(ITU-T SG21)于瑞士日內(nèi)瓦召開全體會議。由中國信息通信研究院(簡稱“中國信通院”)牽頭的10個結(jié)項項目、5個新立項項目和1個文稿更新項目順利通過。
其中,結(jié)項標(biāo)準(zhǔn)圍繞數(shù)據(jù)標(biāo)注、云平臺建設(shè)、模型測評等多個大模型產(chǎn)業(yè)化環(huán)節(jié)展開,聚焦智能體感知評估、機器人流程自動化、代碼生成、駕駛員行為檢測等應(yīng)用領(lǐng)域,標(biāo)志著中國在大模型國際標(biāo)準(zhǔn)領(lǐng)域取得了突破性進(jìn)展,推動了人工智能及相關(guān)技術(shù)標(biāo)準(zhǔn)的實現(xiàn)。
結(jié)合中國信通院與ITU官網(wǎng)發(fā)布內(nèi)容,中國信通院上海工創(chuàng)中心對10項結(jié)項標(biāo)準(zhǔn)的已公開內(nèi)容進(jìn)行了梳理匯總。
01 Technical specification forartificial intelligence cloudplatform:Data annotation
人工智能云平臺技術(shù)規(guī)范:數(shù)據(jù)標(biāo)注
標(biāo)準(zhǔn)從人工智能數(shù)據(jù)標(biāo)注全流程的角度出發(fā),共分為數(shù)據(jù)接入、數(shù)據(jù)標(biāo)注、智能標(biāo)注、數(shù)據(jù)交付和生產(chǎn)管理五個部分。
簡介 / INTRODUCTION
由于數(shù)據(jù)標(biāo)注在改進(jìn)人工智能算法模型訓(xùn)練中的作用,其重要性正日益受到關(guān)注。因此,評估數(shù)據(jù)標(biāo)注的能力非常重要。本提案概述了人工智能云平臺數(shù)據(jù)標(biāo)注能力的一般要求,這些要求有助于行業(yè)參與者分析和優(yōu)化其產(chǎn)品,同時也幫助用戶構(gòu)建和選擇符合這些要求的產(chǎn)品。
02 Technical requirements andevaluation methods of AI-baseddriver behaviour detectionapplication
駕駛員行為檢測應(yīng)用的技術(shù)要求與評估方法
標(biāo)準(zhǔn)以駕駛員行為檢測為核心,明確行為檢測應(yīng)用通用框架,涵蓋數(shù)據(jù)輸入、數(shù)據(jù)預(yù)處理、計算與決策及輸入等模塊,規(guī)范其可檢測的行為狀態(tài)及通用檢測方法和檢測流程。
概要 / SUMMARY
駕駛員行為檢測是車輛駕駛安全助手系統(tǒng)中最重要的部分之一。它有助于防止人類引起的安全風(fēng)險,并大大減少嚴(yán)重事故的發(fā)生。因此,如何實現(xiàn)成熟的駕駛員行為檢測應(yīng)用程序引起了公眾的關(guān)注。需要考慮駕駛員,汽車和環(huán)境之間的信息和連接,以在現(xiàn)實的駕駛場景中充分了解駕駛員行為。該項目主要關(guān)注使用車輛中的計算機視覺的駕駛員行為應(yīng)用程序。該建議旨在為駕駛員行為檢測應(yīng)用提供一種一般框架,要求和評估方法,并幫助公司和行業(yè)增強對多媒體應(yīng)用程序上駕駛員行為檢測的開發(fā)。
03 Framework andrequirements for the foundationmodel platform
基礎(chǔ)模型平臺框架與要求
標(biāo)準(zhǔn)圍繞大模型的數(shù)據(jù)工程、模型預(yù)訓(xùn)練模型調(diào)優(yōu)、模型交付、模型運營、平臺能力和監(jiān)控七個維度,構(gòu)建了面向大模型全生命周期的功能要求框架,以及各維度的能力要求。
概要 / SUMMARY
多媒體中的基礎(chǔ)模型平臺旨在解決應(yīng)用程序障礙,資源和計算能力需求以及復(fù)雜的內(nèi)容生產(chǎn)過程。它為多媒體應(yīng)用提供了AI功能。該基礎(chǔ)模型平臺框架的表述填充了多媒體領(lǐng)域中基礎(chǔ)模型的平臺標(biāo)準(zhǔn)的真空,幫助生產(chǎn)者企業(yè)指導(dǎo)產(chǎn)品研究并標(biāo)準(zhǔn)化其基礎(chǔ)模型平臺的構(gòu)建,并為企業(yè)用戶選擇基礎(chǔ)模型平臺產(chǎn)品提供參考。
04 Assessment criteria for foundation models:Benchmark
基礎(chǔ)模型的評估標(biāo)準(zhǔn):
基準(zhǔn)測試標(biāo)準(zhǔn)提供了大模型基準(zhǔn)評測的參考架構(gòu)、技術(shù)要求和評估方法,包括測試能力、測試數(shù)據(jù)集、測試方法以及測試工具四個部分。概要 / SUMMARY該建議著重于基礎(chǔ)模型的要求和評估方法。它涵蓋了基礎(chǔ)模型基準(zhǔn)的概述,并確定了基礎(chǔ)模型的要求和評估方法。這對于確保不同基礎(chǔ)模型的一致性,透明度和可比性,實現(xiàn)公平評估并明智的決策很重要。它可以幫助行業(yè)參與者分析和優(yōu)化基礎(chǔ)模型,并幫助用戶構(gòu)建和選擇與這些要求保持一致的產(chǎn)品。
05Technical requirements and evaluation methods of Al based codegeneration in multimedia applications
多媒體應(yīng)用中基于AI的代碼生成技術(shù)要求及評價方法
標(biāo)準(zhǔn)圍繞代碼大模型相關(guān)的通用能力、專用場景能力和應(yīng)用成熟度,從輸入多樣性、任務(wù)多樣性、語言完備度、結(jié)果可接受性、結(jié)果準(zhǔn)確度等維度,提出了全棧技術(shù)要求和評估方法。
概要 / SUMMARY
該建議制定基于基礎(chǔ)模型的代碼生成技術(shù)要求和評估方法。它旨在指導(dǎo)代碼生成能力構(gòu)建,并提供一般用戶指南。
06 Requirements and evaluation methods of artificial intelligence agents based on large scale pre-trained model
基于大模型的智能體能力要求與評估方法
標(biāo)準(zhǔn)主要涉及評估智能體感知和認(rèn)知、規(guī)劃、記憶和執(zhí)行的功能和性能能力。從智能體實際應(yīng)用出發(fā),部分涉及智能體與智能體群、智能體與外部環(huán)境間的交互能力。
概要 / SUMMARY
該建議旨在為基于預(yù)訓(xùn)練的智能體提供要求和評估方法的框架。它試圖幫助企業(yè)和用戶了解智能體,并幫助他們更快,更準(zhǔn)確地構(gòu)建和實施產(chǎn)品和應(yīng)用程序。此外,該建議旨在促進(jìn)行業(yè)的健康發(fā)展。
07 Functional capabilities for artifigial intelligence development within the Al cloud platform: Automated machine learning
人工智能云平臺中面向人工智能開發(fā)的功能能力:
自動機器學(xué)習(xí)標(biāo)準(zhǔn)包括數(shù)據(jù)處理、模型開發(fā)、模型部署以及管理和維護四部分,關(guān)注人工智能多媒體應(yīng)用開發(fā)過程中各環(huán)節(jié)所應(yīng)具備的自動機器學(xué)習(xí)技術(shù)和算法,以及平臺底層支撐能力。
概要 / SUMMARY
該建議草案側(cè)重于AI云平臺內(nèi)人工智能開發(fā)的自動化機器學(xué)習(xí)(AUTOML)功能,涵蓋了術(shù)語,功能和參考設(shè)計,以實現(xiàn)面向業(yè)務(wù)的智能多媒體應(yīng)用開發(fā)。
08 Requirements and evaluation methods for retrieval augmented generation of large scale pre-trained model
大模型檢索增強生成技術(shù)要求與評估方法
標(biāo)準(zhǔn)從檢索增強生成流程出發(fā),劃分為數(shù)據(jù)庫建設(shè)、信息檢索、答案生成和應(yīng)用生態(tài)四個階段,分別明確了關(guān)鍵能力點,并構(gòu)建了統(tǒng)一的評估方法
概要 / SUMMARY
標(biāo)準(zhǔn)建立了基于大規(guī)模預(yù)訓(xùn)練模型的檢索增強生成技術(shù)要求和評估方法的框架,將為用戶更好地了解檢索增強生成技術(shù),并幫助他們更快,適當(dāng)?shù)卦O(shè)置檢索增強應(yīng)用程序。
09 The technical requirements and evaluation methods of robotic process automation system
機器人流程自動化系統(tǒng)技術(shù)要求與評估方法
標(biāo)準(zhǔn)從RPA系統(tǒng)功能評估的角度出發(fā),劃分為管理監(jiān)控、開發(fā)測試、流程運行和 AI增強四個模塊,涵蓋了系統(tǒng)部署與監(jiān)控、機器人開發(fā)與優(yōu)化、任務(wù)執(zhí)行與數(shù)據(jù)收集,以及能力融合的功能要求。
概要 / SUMMARY
該建議提供了機器人流程自動化系統(tǒng)的技術(shù)要求和評估方法,設(shè)置了一些評估機器人流程自動化系統(tǒng)功能的關(guān)鍵指標(biāo)。
10 Technical requlrements and assessment methods of generative artificial intelligence enabled multimedia applications
生成式人工智能對多媒體應(yīng)用服務(wù)的技術(shù)要求和評估方法(凍結(jié))
標(biāo)準(zhǔn)從技術(shù)能力、產(chǎn)品能力、基礎(chǔ)能力、交互能力等多角度,全方位構(gòu)建了對于生成式人工智能應(yīng)用的評價體系。此外,針對以下在研標(biāo)準(zhǔn),中國信通院現(xiàn)面向產(chǎn)、學(xué)、研、用各界啟動標(biāo)準(zhǔn)參編征集工作;針對上述結(jié)項標(biāo)準(zhǔn),將依托人工智能關(guān)鍵技術(shù)和應(yīng)用評測工業(yè)和信息化部重點實驗室“可信AI評測”體系啟動國際標(biāo)準(zhǔn)符合性驗證工作。中國信通院希望攜手各方,持續(xù)推進(jìn)大模型等關(guān)鍵領(lǐng)域的國際標(biāo)準(zhǔn)研究制定和實施推廣,促進(jìn)國際標(biāo)準(zhǔn)研制應(yīng)用形成有效閉環(huán)。