今年11月初,華為云盤(pán)古大模型的機(jī)場(chǎng)廣告在首都機(jī)場(chǎng)和深圳寶安機(jī)場(chǎng)亮相,主打“行業(yè)AI開(kāi)發(fā)應(yīng)用優(yōu)選”的定位。
如今,大模型不僅成為眾多AI行業(yè)峰會(huì)中被高頻討論的熱詞,在AI行業(yè)之外的影響力也日漸擴(kuò)大。這些都表明,AI大模型正在加速走出實(shí)驗(yàn)室,成為賦能各行各業(yè)的通用AI基礎(chǔ)設(shè)施。
自2020年OpenAI推出NLP大模型GPT3至今,全球范圍內(nèi)AI大模型迎來(lái)大爆發(fā),參與企業(yè)越來(lái)越多,參數(shù)級(jí)別越來(lái)越大,成為新一輪AI競(jìng)賽的賽場(chǎng)。目前,大模型吸引了谷歌、微軟、英偉達(dá)、華為、智源研究院、百度、阿里、商湯、浪潮、中科院自動(dòng)化所等科技巨頭和科研機(jī)構(gòu)參與其中,各家大模型的參數(shù)量級(jí)也從千億、萬(wàn)億,迅速躍遷到了10萬(wàn)億級(jí)別。
大模型百家爭(zhēng)鳴的格局背后,AI行業(yè)更需要冷思考。
AI大模型應(yīng)該為應(yīng)用而生
為什么眾多科技巨頭扎堆推出大模型?
這要回歸到AI落地的核心挑戰(zhàn)。國(guó)際歐亞科學(xué)院院士、華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow田奇認(rèn)為,AI進(jìn)入千行百業(yè)面臨很多挑戰(zhàn),其中最重要有三點(diǎn):第一,AI場(chǎng)景碎片化使得AI技術(shù)難以大規(guī)模復(fù)制。傳統(tǒng)的定制化、作坊式的模型開(kāi)發(fā)方式是“一個(gè)場(chǎng)景一個(gè)模型”,無(wú)法復(fù)用和積累,導(dǎo)致AI開(kāi)發(fā)的高門(mén)檻、高成本。第二,如何將行業(yè)知識(shí)與AI技術(shù)相結(jié)合,跨越行業(yè)know how與AI技術(shù)之間的鴻溝。第三,AI技術(shù)一直面臨攻擊、隱私、安全以及可解釋性方面的難題。
AI大模型擁有超大規(guī)模參數(shù)、巨量訓(xùn)練數(shù)據(jù),通過(guò)模型的巨量化可以提高人工智能的通用屬性,并降低人工智能的應(yīng)用門(mén)檻。正因?yàn)橹睋鬉I落地的挑戰(zhàn),大模型成為很多AI企業(yè)的共識(shí)。
那么,AI大模型能帶來(lái)科學(xué)計(jì)算的范式革命嗎?目前還存在哪些局限?10月底,華為云AI院長(zhǎng)峰會(huì)匯聚了AI產(chǎn)學(xué)研各界的大腦,來(lái)自華為的AI科學(xué)家與來(lái)自中國(guó)科學(xué)院、中國(guó)工程院以及國(guó)內(nèi)30余所高校的數(shù)十名院長(zhǎng)、教授關(guān)于AI大模型的現(xiàn)狀和前景進(jìn)行了專(zhuān)業(yè)的探討。各界大咖普遍認(rèn)為,目前AI大模型最大挑戰(zhàn)在應(yīng)用落地,如何讓更多行業(yè)和場(chǎng)景真正用起來(lái)。
首先,不是所有場(chǎng)景都需要大模型。大模型在醫(yī)藥研發(fā)、衛(wèi)星遙感、災(zāi)害評(píng)估、自然生態(tài)監(jiān)測(cè)等場(chǎng)景有巨大價(jià)值,但一些數(shù)據(jù)量小、任務(wù)并不復(fù)雜的場(chǎng)景,并不適合使用大模型,相當(dāng)于“大炮打蚊子”。
其次,大模型不是參數(shù)數(shù)量越大越好,如何廣泛應(yīng)用才是最大價(jià)值和難點(diǎn)。大模型應(yīng)用價(jià)值取決于其泛化能力,能否快速適配不同場(chǎng)景。
一位AI領(lǐng)域教授認(rèn)為:“大模型不在于大,而在于能不能解決應(yīng)用的問(wèn)題,是不是來(lái)自真正的需求。怎么樣能夠在更廣泛的應(yīng)用場(chǎng)景中用起來(lái),這是目前大模型非常大的挑戰(zhàn)。”
“大模型應(yīng)該是AI走向下一個(gè)時(shí)代的跳板。大模型的大一定是體現(xiàn)它能夠去掌握、組織更大量的數(shù)據(jù),而不是模型的參數(shù)量大?!币晃蝗A為云高級(jí)研究員也持同樣的觀點(diǎn)。
第三,大模型不是萬(wàn)能的,不應(yīng)該希望一個(gè)大模型能解決所有問(wèn)題。
“如果大模型想要實(shí)際用的比較好,一定要有配套的工作流。如果把下游的工作流程給搭建起來(lái),大模型在很多場(chǎng)景上能夠得到比較好的應(yīng)用?!痹摳呒?jí)研究員表示。
深入AI落地的無(wú)人區(qū)
如果說(shuō)參數(shù)的直觀對(duì)比類(lèi)似外行看熱鬧,那么,落地能力才是大模型實(shí)力的真正較量。
目前,大模型在落地層面還處在探索的初期,各大科技巨頭都在摸索嘗試。其中華為云盤(pán)古大模型在行業(yè)應(yīng)用方面走得更遠(yuǎn),已經(jīng)在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等行業(yè)的100多個(gè)場(chǎng)景實(shí)際應(yīng)用, 讓企業(yè)的AI應(yīng)用開(kāi)發(fā)效率平均提升了90%。
今年4月華為云發(fā)布的盤(pán)古系列預(yù)訓(xùn)練大模型具有超大規(guī)模參數(shù)、超高精度的特質(zhì),還提供模型預(yù)訓(xùn)練、微調(diào)、部署和迭代的功能,以減少行業(yè)側(cè)的數(shù)據(jù)標(biāo)注依賴,從而降低人工智能開(kāi)發(fā)的門(mén)檻和成本。
華為云盤(pán)古系列大模型包括NLP(中文語(yǔ)言)大模型、CV(視覺(jué))大模型、多模態(tài)大模型和科學(xué)計(jì)算大模型。盤(pán)古大模型家族還在不斷壯大,今年9月華為云新推出盤(pán)古藥物分子大模型,其研究了17億個(gè)小分子的化學(xué)結(jié)構(gòu),可以高效生成藥物新分子,計(jì)算蛋白質(zhì)靶點(diǎn)匹配,預(yù)測(cè)新分子生化屬性,并對(duì)篩選后的先導(dǎo)藥進(jìn)行定向優(yōu)化,實(shí)現(xiàn)全流程的AI輔助藥物設(shè)計(jì)。
在眾多行業(yè)場(chǎng)景中,還存在著大量AI尚未落地的無(wú)人區(qū)。其中很多場(chǎng)景都有這樣的特征:樣本復(fù)雜多樣且不均衡,如果使用傳統(tǒng)AI模型標(biāo)注成本高、效率低、準(zhǔn)確率也有待提升。這些場(chǎng)景正是盤(pán)古AI大模型的典型應(yīng)用場(chǎng)景之一。
在電力行業(yè),國(guó)網(wǎng)重慶永川公司在智能電力巡檢場(chǎng)景用無(wú)人機(jī)代替人工進(jìn)行缺陷檢測(cè),但面臨海量數(shù)據(jù)標(biāo)注工作量大和缺陷種類(lèi)繁多等問(wèn)題。盤(pán)古 CV 大模型利用海量無(wú)標(biāo)注電力數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并結(jié)合少量標(biāo)注樣本微調(diào)的高效開(kāi)發(fā)模式,提出了針對(duì)電力行業(yè)的預(yù)訓(xùn)練模型。應(yīng)用之后,樣本篩選效率提升約 30 倍,篩選質(zhì)量提升約 5 倍,以永川每天采集 5 萬(wàn)張高清圖片為例,可節(jié)省人工標(biāo)注時(shí)間 170 人天。
同時(shí),結(jié)合華為云盤(pán)古大模型搭載的自動(dòng)數(shù)據(jù)增廣以及類(lèi)別自適應(yīng)損失函數(shù)優(yōu)化策略,可以做到一個(gè)模型適配上百種缺陷,一個(gè)模型就可以替代永川原先的 20 多個(gè)小模型,極大地減少了模型維護(hù)成本,平均精度提升 18.4%,模型開(kāi)發(fā)成本降低 90%。
在生態(tài)監(jiān)測(cè)方面,華為云盤(pán)古科學(xué)計(jì)算大模型實(shí)現(xiàn)了對(duì)全球海浪浪高的實(shí)時(shí)預(yù)測(cè),在精度和覆蓋范圍與傳統(tǒng)科學(xué)計(jì)算相當(dāng)?shù)幕A(chǔ)上,將預(yù)測(cè)速度提升到了原來(lái)的10,000倍。
在時(shí)尚產(chǎn)業(yè),華為云盤(pán)古多模態(tài)大模型強(qiáng)大的跨模態(tài)檢索、跨模態(tài)生成能力,不斷延伸AI的創(chuàng)造力。通過(guò)以文搜圖和以圖搜文能力,可以實(shí)現(xiàn)趨勢(shì)預(yù)測(cè)。通過(guò)以文生圖和以圖生圖能力,盤(pán)古多模態(tài)大模型可以通過(guò)文本控制來(lái)快速生成服裝圖片,供人類(lèi)設(shè)計(jì)師參考。
優(yōu)秀的泛化能力是如何煉成的?
當(dāng)大模型普遍受困于落地難題,為什么盤(pán)古大模型率先做到了廣泛應(yīng)用?這離不開(kāi)其開(kāi)發(fā)過(guò)程中首次采用的眾多技術(shù)。
比如,盤(pán)古大模型首次在對(duì)比度自監(jiān)督學(xué)習(xí)中引入了樣本相似性,使得小樣本學(xué)習(xí)的能力獲得了顯著提升。盤(pán)古 CV 大模型是判別與生成聯(lián)合預(yù)訓(xùn)練的模型,其小樣本學(xué)習(xí)性能在 10% 的標(biāo)簽分類(lèi)上精度達(dá)到了業(yè)界第一。盤(pán)古大模型首創(chuàng)采用“階段式訓(xùn)練”和“動(dòng)態(tài)冰化”策略,顯著提升大模型訓(xùn)練的穩(wěn)定性和效率;在下游應(yīng)用中,僅需少量樣本和學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配等等。
作為盤(pán)古大模型的“設(shè)計(jì)師”,田奇此前曾表示,盤(pán)古大模型設(shè)計(jì)之初秉持了三個(gè)核心原則:“第一,網(wǎng)絡(luò)規(guī)模要大;第二,模型大但不能臃腫,有強(qiáng)壯的網(wǎng)絡(luò)架構(gòu),希望它是百米冠軍,綜合性能提升10%以上;第三,希望它有優(yōu)秀的泛化能力,也就是場(chǎng)景覆蓋率要高。”
之所以堅(jiān)持這樣的技術(shù)路線,源自盤(pán)古大模型的初衷:讓AI開(kāi)發(fā)由作坊式向工業(yè)式轉(zhuǎn)變,降低行業(yè)AI開(kāi)發(fā)應(yīng)用門(mén)檻,讓大模型真正走進(jìn)千行百業(yè),不再只是大資本和大實(shí)驗(yàn)室的專(zhuān)屬。在AI走向千行百業(yè)過(guò)程中,華為云盤(pán)古大模型在行業(yè)落地方面快人一步,能夠幫助行業(yè)專(zhuān)家快速掌握AI技能。
“華為云AI的目標(biāo)就是持續(xù)創(chuàng)新,打造人工智能黑土地,使能大規(guī)模、可復(fù)制的AI行業(yè)應(yīng)用?!碧锲姹硎?。(東方網(wǎng))
聲明:本文為廣告信息,不代表本站觀點(diǎn)。如有違規(guī)或侵權(quán),請(qǐng)聯(lián)系我們。