国产成人超清在线视频,国产高清永久免费,国产最新超碰97上传无码,超碰国产人人草人人爽

模型選型專題系列 | 業(yè)界首個(gè)!元景MaaS平臺(tái)上線《大模型選型說(shuō)明書(shū)》

模型
  • 網(wǎng)絡(luò)
  • 2025-09-05 18:13

當(dāng)前業(yè)內(nèi)有很多語(yǔ)言模型,我們?nèi)绾卧趯?shí)際應(yīng)用中去選擇最合適的一款呢?雖然有模型性能的評(píng)測(cè)基準(zhǔn),但主要關(guān)注多語(yǔ)言理解(MMLU)、寫(xiě)作(WritingBench)、邏輯推理(AutoLogi)、數(shù)學(xué)(AIME)、代碼(LiveCodeBench)等方面的通用能力,通常與實(shí)際應(yīng)用場(chǎng)景不匹配。

在實(shí)體經(jīng)濟(jì)應(yīng)用場(chǎng)景中,性能最好的模型并非總是最合適的,還需綜合考慮推理成本等因素,以實(shí)現(xiàn)最高性價(jià)比,避免“用大炮打蚊子”。例如,開(kāi)發(fā)短信反詐服務(wù)、辦公助手、手機(jī)操控智能體時(shí),分別選擇什么樣的模型才能兼顧性能和成本?業(yè)界還沒(méi)有通用的方法論,通常會(huì)經(jīng)歷反復(fù)試錯(cuò)。

針對(duì)以上痛點(diǎn),中國(guó)聯(lián)通數(shù)據(jù)科學(xué)與人工智能研究院以“能力-場(chǎng)景”雙向驅(qū)動(dòng),在自研的模型能力邊界量化基礎(chǔ)上,梳理大模型常見(jiàn)應(yīng)用場(chǎng)景,構(gòu)建“典型模型-能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”映射圖譜,形成《大模型選型說(shuō)明書(shū)》。為開(kāi)發(fā)者提供權(quán)威、透明、便捷的選型指導(dǎo),已助力多場(chǎng)景應(yīng)用落地,現(xiàn)已在元景MaaS平臺(tái)發(fā)布,將經(jīng)驗(yàn)與業(yè)界共享。

LT2025090517571169.001.jpg

《大模型選型說(shuō)明書(shū)》界面預(yù)覽

能力和場(chǎng)景精準(zhǔn)匹配

首先,調(diào)研業(yè)界主流大模型評(píng)測(cè)基準(zhǔn)中的能力分類方法,剖析現(xiàn)有能力評(píng)估與實(shí)際應(yīng)用需求之間的鴻溝。其次,依托深厚的落地實(shí)踐積淀,梳理出105個(gè)典型的大模型應(yīng)用場(chǎng)景。結(jié)合典型應(yīng)用場(chǎng)景,提出一種新的大模型能力分類方法,歸納為5大類、27小類;并將每類能力劃分為三個(gè)等級(jí),包含初級(jí)、中級(jí)和高級(jí)。最后,通過(guò)分析模型的能力類別、能力等級(jí)與應(yīng)用場(chǎng)景之間的依賴關(guān)系,構(gòu)建了大模型“能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”關(guān)系映射圖,如下所示。

LT2025090517571169.002.jpg

語(yǔ)言大模型“能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”關(guān)系映射圖

典型模型能力等級(jí)評(píng)定

針對(duì)5大類、27小類模型能力,構(gòu)建了豐富的評(píng)測(cè)樣本集,對(duì)業(yè)界超30款主流模型進(jìn)行測(cè)試、打分、統(tǒng)計(jì)和分析,給出模型在每個(gè)能力類別上的得分,評(píng)定模型能力等級(jí)。詳細(xì)評(píng)測(cè)結(jié)果已上線元景MaaS平臺(tái),其中部分結(jié)果如下圖所示。

LT2025090517571169.003.jpg

典型模型能力評(píng)測(cè)結(jié)果展示

選型使用說(shuō)明書(shū)構(gòu)建

基于模型能力等級(jí)評(píng)定結(jié)果,結(jié)合“能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”關(guān)系圖譜,建立超30款典型模型與105個(gè)典型應(yīng)用場(chǎng)景間的匹配關(guān)系,形成“典型模型-能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”關(guān)系圖譜,作為《大模型選型說(shuō)明書(shū)》,部分內(nèi)容如下所示。

LT2025090517571169.004.jpg

“典型模型-能力類別-能力等級(jí)-應(yīng)用場(chǎng)景”關(guān)系圖譜

應(yīng)用賦能和迭代更新

《大模型選型說(shuō)明書(shū)》作為業(yè)界首個(gè)語(yǔ)言大模型選型經(jīng)驗(yàn)指南,一方面可以幫助開(kāi)發(fā)者根據(jù)應(yīng)用場(chǎng)景找到兼顧性能和成本的高性價(jià)比模型,另一方面提供了每個(gè)模型能勝任的典型應(yīng)用場(chǎng)景,為模型選型決策提供經(jīng)驗(yàn)參考,極大降低大模型開(kāi)發(fā)應(yīng)用技術(shù)門檻。

目前,已賦能電信反詐、智能工單、客服助手、手機(jī)自動(dòng)駕駛、深度研究等超20個(gè)應(yīng)用場(chǎng)景落地。未來(lái),中國(guó)聯(lián)通數(shù)據(jù)科學(xué)與人工智能研究院將持續(xù)擴(kuò)充評(píng)測(cè)模型庫(kù)和典型應(yīng)用場(chǎng)景,動(dòng)態(tài)更新《大模型選型說(shuō)明書(shū)》,確保其始終反映技術(shù)前沿與市場(chǎng)變化。

聯(lián)通元景大模型將繼續(xù)秉承“多模共生、普惠速成、場(chǎng)景深耕、數(shù)智融合、安全自主”五大特性,構(gòu)建多模共生的模型家族,打造普惠速成的MaaS平臺(tái),開(kāi)發(fā)場(chǎng)景深耕的智能體應(yīng)用,助力千行百業(yè)實(shí)現(xiàn)智能化升級(jí),加速人工智能+的推廣應(yīng)用,讓人工智能更簡(jiǎn)單。

來(lái)源:網(wǎng)絡(luò)

作者:

編輯:leilei

圖片來(lái)源:

本文鏈接: http://givenhand.cn/article/20250905/1906.html

免責(zé)聲明:本網(wǎng)站出于傳播商業(yè)信息之目的進(jìn)行轉(zhuǎn)載發(fā)布,不代表 AIUST.Com 立場(chǎng)。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責(zé)任歸提供方所有和承擔(dān)。本網(wǎng)站對(duì)文中的圖文等所有信息的真實(shí)性不作任何保證或承諾,請(qǐng)讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。本網(wǎng)站的任何內(nèi)容僅供參考,不能做為投資、采購(gòu)或行為決策依據(jù),據(jù)此操作者風(fēng)險(xiǎn)自擔(dān)。

相關(guān)文章

資訊

原創(chuàng)

薦讀

  • 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢(shì) 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢(shì)

    2021世界制造業(yè)大會(huì)于11月22日在合肥落下帷幕。為期四天的大會(huì)中,作為向世界展示智能制造全面能力的窗口,聯(lián)想展示了一系列讓人驚喜的創(chuàng)新產(chǎn)品?,F(xiàn)場(chǎng)展示的ThinkPad X1 Fold整體重量?jī)H有1公斤,折疊起來(lái)之后的厚度大約為24毫米。當(dāng)保持半開(kāi)狀態(tài)時(shí),可以像拿本書(shū)一樣握住,并且能同時(shí)運(yùn)行兩個(gè)應(yīng)用程序。使用固定在中間的鍵盤之后,瞬間變...

  • 智能手機(jī)競(jìng)爭(zhēng)中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱 智能手機(jī)競(jìng)爭(zhēng)中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱

    據(jù)外媒報(bào)道,在制造帶有數(shù)字聯(lián)網(wǎng)服務(wù)的汽車的競(jìng)爭(zhēng)中,豐田汽車和日產(chǎn)汽車面臨著被本土市場(chǎng)拖累的風(fēng)險(xiǎn)。與美國(guó)和歐洲的汽車消費(fèi)者不同的是,日本消費(fèi)者不愿意為這些聯(lián)網(wǎng)功能和服務(wù)買單。結(jié)果就是:日本只有10%的汽車...

  • 2020年河南省將推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人 2020年河南省將推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人

    到2020年,推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人,建設(shè)1000條智能生產(chǎn)線、300個(gè)智能車間、150個(gè)智能工廠……4月16日,在2018兩岸智能裝備制造鄭州論壇上,河南省工信委發(fā)布了《2017年河南省智能制造白皮書(shū)》,河南智能制造的2020...

熱門標(biāo)簽