<blockquote id="y1r4z"></blockquote>
      • <blockquote id="y1r4z"><progress id="y1r4z"></progress></blockquote>
            1. 日韩成人无码毛片,中文字幕一区二区三区擦澡,jizz免费,www.com黄色,多p在线观看,69国产,探花无码,上海集散中心旅游官网订票
              歡迎訪(fǎng)問(wèn)深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

              創(chuàng)新談丨大模型既要“吃得飽”更要“吃得好”

              2025-03-03 來(lái)源:科技日?qǐng)?bào)
              2729

              關(guān)鍵詞: 大模型 數(shù)據(jù)質(zhì)量 模型性能 數(shù)據(jù)治理 多模態(tài)融合

              前段時(shí)間,網(wǎng)絡(luò)上流傳著一些由大模型生成的“異次元篇章”。比如,有人讓大模型續(xù)寫(xiě)《紅樓夢(mèng)》情節(jié)時(shí),竟得出一幕“賈寶玉倒拔垂楊柳”的奇景,令人啼笑皆非。之所以會(huì)出現(xiàn)這種“混搭”和“幻覺(jué)”,是因?yàn)榇竽P筒粌H學(xué)習(xí)了原著,還“廣納博采”了不少錯(cuò)誤信息。

              這些人工智能(AI)生成的“胡言亂語(yǔ)”雖是網(wǎng)友們茶余飯后的笑談,但提醒我們要清醒認(rèn)識(shí)到其背后折射出的問(wèn)題:數(shù)據(jù)質(zhì)量是大模型應(yīng)用成敗的關(guān)鍵。以個(gè)性化推薦AI系統(tǒng)為例,一些企業(yè)在開(kāi)發(fā)過(guò)程中,雖然收集了大量的用戶(hù)行為數(shù)據(jù),但數(shù)據(jù)中充斥著錯(cuò)誤的標(biāo)注、重復(fù)的數(shù)據(jù)以及相互矛盾的信息,數(shù)據(jù)的量增加了,但系統(tǒng)推薦的準(zhǔn)確性并沒(méi)有顯著提升。《自然》雜志(Nature)刊登的一篇有關(guān)大模型可靠性研究的文章指出,一個(gè)西班牙研究團(tuán)隊(duì)發(fā)現(xiàn),包括OpenAI公司的GPT在內(nèi)的幾個(gè)大模型升級(jí)后,雖然參數(shù)量更大了,誤答情況卻更嚴(yán)重了。因此,大模型長(zhǎng)得壯不壯,不僅取決于“食量”(即數(shù)據(jù)的數(shù)量),更在于食物的“質(zhì)量”(即數(shù)據(jù)的質(zhì)量)——吃得飽并不等同于吃得好。

              數(shù)據(jù)是大模型的基石,在數(shù)據(jù)質(zhì)量不高、可靠性缺失的情況下,一味追求大模型參數(shù)量的增加,不僅無(wú)法提升模型性能,反而會(huì)放大偏差和謬誤,產(chǎn)生更多不可信數(shù)據(jù)。如此一來(lái),勢(shì)必造成計(jì)算與存儲(chǔ)資源的浪費(fèi),增加開(kāi)發(fā)和維護(hù)成本,降低用戶(hù)信任度。更為嚴(yán)重的是,這種“大模型幻覺(jué)”和“災(zāi)難性遺忘”現(xiàn)象如果發(fā)生在精確性要求極高的工業(yè)生產(chǎn)領(lǐng)域中,還可能引發(fā)不可預(yù)測(cè)的風(fēng)險(xiǎn)和隱患。以油氣勘探為例,基于大模型給出的錯(cuò)誤預(yù)測(cè)進(jìn)行開(kāi)采可能導(dǎo)致數(shù)億元的資金損失,并對(duì)自然環(huán)境造成不可逆轉(zhuǎn)的破壞。

              提升大模型性能,關(guān)鍵是處理好數(shù)據(jù)“質(zhì)”和“量”的關(guān)系,構(gòu)建大規(guī)模、高質(zhì)量的數(shù)據(jù)集。應(yīng)建立完善的數(shù)據(jù)收集、清洗、驗(yàn)證和存儲(chǔ)機(jī)制,加強(qiáng)對(duì)數(shù)據(jù)質(zhì)量的監(jiān)控和評(píng)估,確保數(shù)據(jù)的準(zhǔn)確性、完整性和一致性。此外,還應(yīng)注重跨領(lǐng)域合作,引入數(shù)據(jù)科學(xué)家、AI算法工程師等多方力量,開(kāi)展大模型算法合作、制定數(shù)據(jù)共享和隱私安全保密協(xié)議,推動(dòng)大模型產(chǎn)學(xué)研用生態(tài)建設(shè)。

              如今,大模型的發(fā)展已邁入多模態(tài)融合階段。通過(guò)加強(qiáng)數(shù)據(jù)治理,優(yōu)化人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“基礎(chǔ)食材”,端上大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集的“豐盛大餐”,必將助力大模型能力的提升,讓人工智能更好地賦能千行百業(yè)、造福人類(lèi)社會(huì)。

              (作者系中國(guó)工程院院士、中國(guó)石油勘探開(kāi)發(fā)研究院教授級(jí)高級(jí)工程師)




              主站蜘蛛池模板: 蜜桃视频网站| 久久久久亚洲精品系列色欲| 日韩AV无码电影| 国产成人久久精品一区二区| 久久人妻少妇嫩草av无码专区| 国产熟女在线| 日韩中文字幕一区二区| 亚洲欧美电影在线一区二区| 亚洲亚洲人成无码网WWW| 扒开双腿被两个男人玩弄视频| 大地影院免费高清电视剧大全| 人妻系列无码专区久久五月天| 国产AV一二三| 永久免费观看美女裸体的网站| 熟女网址| 欧洲精品成人免费视频在线观看 | 精品国产午夜肉伦伦影院| 熟妇人妻系列av无码一区二区| 合阳县| 欧美乱人伦人妻中文字幕| 多p在线观看| 国产精品一卡二卡三卡| 人妻中文在线| 一区二区在线欧美日韩中文| 亚洲国产成人久久77| 亚洲精品v欧洲精品v日韩精品| 精品亚洲无人区一区二区| 中文字幕丝袜一区二区| 在线aⅴ亚洲中文字幕| 黑人VA| 农民人伦一区二区三区| 亚洲制服丝袜无码| 国产又爽又黄又刺激的视频| 亚洲最大成人在线| 中文字幕精品久久久久人妻红杏Ⅰ| 国产91人妻人伦a8198v久| 国产精品毛片一区视频播| 潮喷失禁大喷水aⅴ无码| 色伦专区97中文字幕| 性刺激的大陆三级视频| 免费裸体美女网站|