8x国产精品视频_亚洲国产视频a在线观看_亚洲女人自熨在线视频_中文字幕巨大的乳专区

    <ul id="dwri5"></ul>
    <menu id="dwri5"></menu>
    <ul id="dwri5"><td id="dwri5"></td></ul>
  • 深圳信息港

    全球快看點(diǎn)丨“訊飛星火”認(rèn)知大模型即將發(fā)布,科大訊飛(002230.SZ)或進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期

    2023-04-27 16:21:18 來(lái)源:格隆匯

    在ChatGPT的熱潮下,大模型五花八門(mén),層出不窮,讓人目不暇接。

    近日,科大訊飛也宣布即將在5月6日發(fā)布訊飛星火認(rèn)知大模型。盡管大家可能已經(jīng)審美疲勞,但科大訊飛的大模型,依然是有值得注意、顯而易見(jiàn)、卻常常被人們忽視的特別之處——


    (相關(guān)資料圖)

    盡管各行各業(yè)、各個(gè)大廠(chǎng)都在推出類(lèi)ChatGPT大模型(或是通用的,或是垂直的),但作為榜樣的ChatGPT本身是OpenAI在網(wǎng)頁(yè)上推出NLP的模型。NLP,全稱(chēng)Natural Language Processing,也就是自然語(yǔ)言處理。在這一技術(shù)上,科大訊飛無(wú)疑是該領(lǐng)域的領(lǐng)跑者。

    “百模大戰(zhàn)”中難免泥沙俱下,但有一點(diǎn)是比較肯定的——從大模型的發(fā)展特點(diǎn)來(lái)看,新選手想要突圍十分不易。

    大模型并非空中樓閣

    想要打造一個(gè)中國(guó)版ChatGPT,必須是建立在大模型的基礎(chǔ)上。ChatGPT證明了在某種程度上,大模型擁有比小模型更優(yōu)的效果。

    過(guò)去AI公司囿于種種條件制約,基本都以小模型為主。如今這些公司確實(shí)要紛紛從小模型遷移大模型,但這不是一個(gè)從零開(kāi)始的過(guò)程。

    與小模型類(lèi)似,AI大模型的核心要素在于數(shù)據(jù)、算法和算力,因此從小模型到大模型很多東西是通用的。

    在數(shù)據(jù)領(lǐng)域,以ChatGPT為例,數(shù)據(jù)來(lái)源主要是互聯(lián)網(wǎng)上的大量文本數(shù)據(jù),以及各種知識(shí)庫(kù)和語(yǔ)料庫(kù)。一個(gè)優(yōu)秀的中文NLP模型在獲取數(shù)據(jù)的難度上還要超過(guò)ChatGPT,因?yàn)橹形臄?shù)據(jù)在互聯(lián)網(wǎng)的開(kāi)源程度較低,高質(zhì)量無(wú)監(jiān)督語(yǔ)料嚴(yán)重不足。而類(lèi)ChatGPT大模型本質(zhì)是基于有限語(yǔ)料范圍的概率歸納模型,語(yǔ)料質(zhì)量不高可能會(huì)導(dǎo)致大模型頻繁“失靈”。

    但幸運(yùn)的是,小模型的數(shù)據(jù)集可以完全遷移至大模型使用,這使得在AI 1.0時(shí)代積累起來(lái)的數(shù)據(jù)優(yōu)勢(shì)可以延續(xù)??拼笥嶏w近日接受機(jī)構(gòu)調(diào)研時(shí)表示,在嚴(yán)格遵守適用法律法規(guī)前提下,訊飛在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中積累了超過(guò)50TB的行業(yè)語(yǔ)料和每天超10億人次用戶(hù)交互的活躍應(yīng)用??拼笥嶏w在語(yǔ)音方面的主流市場(chǎng)占有六七成的市場(chǎng)份額,這無(wú)疑形成了訊飛大模型的優(yōu)勢(shì)。除了擁有海量的中文數(shù)據(jù),科大訊飛通過(guò)深耕垂直領(lǐng)域還掌握了醫(yī)療、教育等專(zhuān)業(yè)數(shù)據(jù)端口的數(shù)據(jù)。

    在算法領(lǐng)域,大模型和小模型也不是完全割裂的。不僅是大模型可以通過(guò)量化、剪枝、知識(shí)蒸餾等模型壓縮方法生成小模型,優(yōu)秀的小模型可以“反向蒸餾”、有效引導(dǎo)大模型的生成。這比從0開(kāi)始構(gòu)建大模型的可操作性強(qiáng)得多。

    算力優(yōu)勢(shì)能遷移到大模型之上,這一點(diǎn)相信十分容易理解。以科大訊飛為例,公司于2009年開(kāi)始算力基礎(chǔ)設(shè)施建設(shè),在總部自建有業(yè)界一流的數(shù)據(jù)中心,目前已建成4城7中心深度學(xué)習(xí)計(jì)算平臺(tái),在自用以外還面向平臺(tái)數(shù)百萬(wàn)開(kāi)發(fā)者和其他行業(yè)伙伴開(kāi)放。尤其在當(dāng)前美國(guó)卡脖子AI芯片的重要關(guān)口,這個(gè)優(yōu)勢(shì)在中國(guó)市場(chǎng)更凸顯了重要性。尤其值得注意的是,超級(jí)算力中心建設(shè)資金門(mén)檻在ChatGPT出現(xiàn)后,已經(jīng)推向百億之上(在微軟的支持下),而運(yùn)營(yíng)與維護(hù)成本更是天文數(shù)字?;趦?yōu)質(zhì)數(shù)據(jù)卡位,算法能力和商業(yè)化策略,科大訊飛在算力維度可以通過(guò)推動(dòng)企業(yè)間的分布式計(jì)算協(xié)作,提升算力的效率、降低成本。

    這些都是后來(lái)者遠(yuǎn)難以彎道超車(chē)趕上的。正如科大訊飛管理層在業(yè)績(jī)會(huì)上說(shuō):“(這)是吃第十個(gè)包子,厚積薄發(fā)的一個(gè)事情?!?/p>

    但NLP大模型卻又并非新瓶裝舊酒。過(guò)去的NLP領(lǐng)域有著非常顯著的技術(shù)瓶頸,引用科大訊飛管理層的原話(huà)“瓶頸不在語(yǔ)音轉(zhuǎn)文字,而在語(yǔ)義理解。”不同于機(jī)器視覺(jué)識(shí)別技術(shù)已經(jīng)相當(dāng)成熟甚至進(jìn)入紅海階段,“語(yǔ)義理解”一直是全球AI難以翻越的一座大山,直到ChatGPT翻越了這座大山。

    盡管我們要承認(rèn)中國(guó)人工智能在這個(gè)領(lǐng)域稍許落后,但也要看到機(jī)會(huì)。就像某新財(cái)富分析師曾提到,就像特斯拉車(chē)沒(méi)出來(lái)之前,蔚來(lái)和小鵬這些東西都沒(méi)搞出來(lái),但特斯拉車(chē)搞出來(lái)后,我們國(guó)家大量的新能源車(chē)廠(chǎng)像雨后春筍一樣出現(xiàn)。

    科大訊飛管理層表示,現(xiàn)在機(jī)會(huì)真正來(lái)了,技術(shù)會(huì)突破臨界點(diǎn),到達(dá)一個(gè)真正能商業(yè)化落地應(yīng)用的階段。

    進(jìn)入規(guī)?;?/b>新階段

    在一片流血上市的人工智能公司里,科大訊飛的盈利能力獨(dú)樹(shù)一幟,恐怕已是人工智能公司之最,在整個(gè)A股市場(chǎng)中也擔(dān)當(dāng)?shù)闷稹俺砷L(zhǎng)長(zhǎng)青”這四個(gè)字??拼笥嶏w是過(guò)去10年來(lái)唯一連續(xù)10年?duì)I收年增長(zhǎng)率均超25%的A股上市公司。

    盡管如此,我們卻依然能常??吹剿挠芰κ艿皆嵅 _@與科技公司的屬性有關(guān),由于高研發(fā)投入和定制化成本,所以在滲透率不足、規(guī)模化速度不高的情況下,盈利能力會(huì)承壓。尤其在2022年科大訊飛在加大投入的同時(shí),疫情導(dǎo)致項(xiàng)目收入確認(rèn)延期,國(guó)際環(huán)境使得供應(yīng)鏈調(diào)整進(jìn)一步延遲項(xiàng)目。三重因素疊加,科大訊飛超30億的合同延期到2023年,因此收入和支出形成“剪刀差”,短期的賬面盈利能力向下。

    但進(jìn)入2023年第二季度,除了業(yè)務(wù)進(jìn)度恢復(fù)常態(tài),規(guī)?;瘞?lái)的盈利彈性更值得期待??拼笥嶏w在業(yè)績(jī)會(huì)表示,從2023年開(kāi)始,要開(kāi)啟年利潤(rùn)增長(zhǎng)30%的新階段。

    由于小模型的通用性較低,導(dǎo)致定制化屬性較強(qiáng)。但大模型通過(guò)"大規(guī)模預(yù)訓(xùn)練+微調(diào)"的新范式,擁有了較強(qiáng)的通用性,這使得快速規(guī)?;涞爻蔀榭赡堋4竽P妥鳛榻鉀QAI應(yīng)用碎片化的新開(kāi)發(fā)范式,將帶來(lái)了比傳統(tǒng)AI更高的ROI。

    事實(shí)上,過(guò)去傳統(tǒng)AI時(shí)代的有效供給不充足制約了滲透速度,但事實(shí)上整體智能語(yǔ)音市場(chǎng)的需求很旺盛。從科大訊飛的財(cái)報(bào)也能看到這點(diǎn)。盡管受宏觀(guān)因素影響,2022年公司可持續(xù)型“根據(jù)地業(yè)務(wù)”在2022年仍實(shí)現(xiàn)23%的增長(zhǎng),抵消了大項(xiàng)目延期所產(chǎn)生的影響,并推動(dòng)公司的整體營(yíng)收逆勢(shì)中保持穩(wěn)中有升。

    具體地看,“根據(jù)地業(yè)務(wù)”中多個(gè)應(yīng)用場(chǎng)景的前景十分明朗。2022年,科大訊飛的教育考試業(yè)務(wù)新增12個(gè)地市中考和2個(gè)省市高考,個(gè)性化學(xué)習(xí)手冊(cè)新增300所運(yùn)營(yíng)校,學(xué)習(xí)機(jī)流水型線(xiàn)下門(mén)店新增769家,“雙減”校內(nèi)課后服務(wù)合作平臺(tái)新增130個(gè)市區(qū)縣,智慧醫(yī)療新開(kāi)拓96個(gè)區(qū)縣,智慧汽車(chē)新增合作車(chē)型110個(gè)。根據(jù)財(cái)報(bào),以上業(yè)務(wù)拓展將在2023年才開(kāi)始產(chǎn)生持續(xù)型收入。

    大模型有望成為科大訊飛加速深耕這些應(yīng)用場(chǎng)景的發(fā)動(dòng)機(jī),科大訊飛于2022年12月啟動(dòng)生成式預(yù)訓(xùn)練大模型“1+N”任務(wù)攻關(guān),其中“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺(tái),“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公等多個(gè)領(lǐng)域的專(zhuān)用大模型版本,例如,通過(guò)學(xué)習(xí)海量醫(yī)學(xué)教材、論文和病例,實(shí)現(xiàn)專(zhuān)業(yè)的醫(yī)療領(lǐng)域?qū)υ?huà)式AI系統(tǒng),打造“每個(gè)醫(yī)生的AI診療助理,每個(gè)人的AI健康助手”。“1+N”模式使得低成本、高效率的規(guī)模化成為可能。科大訊飛管理層在業(yè)績(jī)會(huì)披露了未來(lái)目標(biāo),包括運(yùn)營(yíng)型的根據(jù)地業(yè)務(wù)和可持續(xù)流水型業(yè)務(wù),5年內(nèi)占比要超過(guò)80%;三年內(nèi)人均效益能翻番,現(xiàn)金流要匹配利潤(rùn)增長(zhǎng),最終實(shí)現(xiàn)同步良性增長(zhǎng)。

    像科大訊飛這般在中國(guó)既能服務(wù)企業(yè)又能服務(wù)用戶(hù)的科技公司屈指可數(shù)。隨著開(kāi)啟AI開(kāi)發(fā)新模式,科大訊飛有望進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期,在B端和C端走出新天地。

    關(guān)鍵詞:

    熱門(mén)推薦