国产偷国产偷在线高清,性爱免费精品观看,欧美精品人爱a欧美精品,国产精品人妖系列

              人民網(wǎng)
              人民網(wǎng)>>傳媒>>人民網(wǎng)研究院>>研究前沿

              人工智能時(shí)代創(chuàng )新開(kāi)發(fā)媒資庫的探索與建議

              人民網(wǎng)研究院研究員 廖燦亮
              2024年05月14日17:20 | 來(lái)源:人民網(wǎng)研究院
              小字號

              摘要:數據是人工智能的基礎,優(yōu)質(zhì)、豐富、稀缺的媒資庫數據將成為人工智能時(shí)代媒體融合發(fā)展的關(guān)鍵抓手。主流媒體對媒資庫創(chuàng )新開(kāi)發(fā)要搶抓機遇、超前布局、創(chuàng )新實(shí)踐,賦能建立“新聞+政務(wù)服務(wù)商務(wù)”運營(yíng)模式,推動(dòng)智能化轉型和媒體融合向縱深發(fā)展。

              關(guān)鍵詞:人工智能;媒資庫;數據;媒體融合發(fā)展

              媒資庫,即媒體資產(chǎn)倉庫,涉及媒體在內容采集、生產(chǎn)、分發(fā)以及經(jīng)營(yíng)過(guò)程中積累的一切成品和素材。當前,人工智能(AI)技術(shù)正融合千行百業(yè),驅動(dòng)新一輪科技革命和產(chǎn)業(yè)變革,也將重塑媒體格局、傳播方式與輿論生態(tài)。主流媒體正積極探索將AI運用于新聞采集、生產(chǎn)、分發(fā)、接收、反饋之中,以打造智媒體新生態(tài),鞏固壯大奮進(jìn)新時(shí)代的主流思想輿論。

              媒資庫是人工智能時(shí)代媒體融合發(fā)展的關(guān)鍵抓手

              當前,各大媒體機構對媒資庫建設與開(kāi)發(fā)存在投入不足的現象。許多媒資庫建設僅停留在將歷史文字報道電子化階段,圖片、音視頻入庫數字化進(jìn)程緩慢,創(chuàng )新開(kāi)發(fā)媒資庫賦能媒體融合發(fā)展也還停留在初級階段。建設、開(kāi)發(fā)媒資庫需要大量資金、技術(shù)與人才投入,且無(wú)法直接帶來(lái)可觀(guān)的經(jīng)濟效益。

              隨著(zhù)AI技術(shù)的發(fā)展,這種低投入的局面有望徹底打破。數據是AI的燃料,是智能發(fā)展的基石。主流媒體在新聞報道與融合發(fā)展過(guò)程中沉淀積累了海量的內容成品和素材數據,匯集大量政務(wù)數據、服務(wù)數據、商務(wù)數據,這些數據能有效支撐AI學(xué)習和訓練,提高其智能水平。

              知名AI研究機構EpochAI的一項研究預計,隨著(zhù)AI技術(shù)發(fā)展,到2026年,高質(zhì)量的數據將變得稀缺,2030—2050年低質(zhì)量數據也將消耗殆盡。在國外,《紐約時(shí)報》等多家媒體起訴生成式AI應用ChatGPT的開(kāi)發(fā)公司OpenAI“未經(jīng)授權,使用已發(fā)表的新聞作品訓練生成式人工智能應用”。美國有線(xiàn)電視新聞網(wǎng)(CNN)、美聯(lián)社、?怂(Fox)、《時(shí)代》雜志(Time)也與OpenAI就內容授權訓練AI應用事宜進(jìn)行了多次談判[1]。這從一個(gè)側面說(shuō)明,媒體數據優(yōu)質(zhì)、豐富、稀缺,而且應用場(chǎng)景與市場(chǎng)十分廣闊。以這些數據為基礎建立的媒資庫,不僅是媒體機構重要的資產(chǎn),更是媒體機構抓住AI發(fā)展機遇,賦能建立“新聞+政務(wù)服務(wù)商務(wù)”運營(yíng)模式,推動(dòng)媒體融合向縱深發(fā)展的關(guān)鍵抓手。

              隨著(zhù)AI與媒體融合進(jìn)一步加深,媒資庫對主流媒體融合發(fā)展而言,或將從“有點(diǎn)關(guān)系”變成“性命攸關(guān)”。

              (一)媒資庫是智能生產(chǎn)和傳播的基礎

              媒資庫將全面賦能媒體智能生產(chǎn)和智能傳播,推動(dòng)媒體智能化進(jìn)入快速發(fā)展階段。當前,以ChatGPT為代表的AIGC(人工智能生成內容)應用平臺發(fā)展迅猛。行業(yè)普遍認為AIGC將成為繼專(zhuān)業(yè)生產(chǎn)內容(PGC)、用戶(hù)生產(chǎn)內容(UGC)之后新的內容生產(chǎn)模式,廣泛應用在內容生產(chǎn)的各個(gè)領(lǐng)域并且替代了部分人工創(chuàng )作。媒資庫是媒體AIGC的基礎,AI新聞寫(xiě)作、AI繪畫(huà)、AI視頻生成、AI虛擬場(chǎng)景生成等AIGC應用均離不開(kāi)AI對媒資庫數據的學(xué)習和訓練;AI審核、媒體報道精準傳播、傳播效果精準評估等也離不開(kāi)AI對媒資庫數據的數據挖掘和預測分析。

              (二)媒資庫數據決定媒體智能服務(wù)

              隨著(zhù)AI技術(shù)融合千行百業(yè),媒資庫里面擁有的數據類(lèi)型和數量,將決定主流媒體提供智能服務(wù)的類(lèi)型與水平。AI時(shí)代,沒(méi)有數據,主流媒體就很難有智能服務(wù),影響力和競爭力也會(huì )打折扣。例如,當前不少主流媒體針對政務(wù)服務(wù)建立了網(wǎng)絡(luò )問(wèn)政互動(dòng)及訴求反映平臺,包括人民網(wǎng)“領(lǐng)導留言板”、新疆日報“石榴云12345問(wèn)政”、四川日報“問(wèn)政四川”、河北新聞網(wǎng)“陽(yáng)光理政”、華龍網(wǎng)“重慶網(wǎng)絡(luò )問(wèn)政平臺”等,這些平臺所積累的政務(wù)數據和運營(yíng)經(jīng)驗,將造就主流媒體面向政務(wù)服務(wù)的AI能力。

              媒資庫在人工智能領(lǐng)域的應用探索

              AIGC平臺的迅猛發(fā)展為創(chuàng )新開(kāi)發(fā)媒資庫提供了方向指引。當前,主流媒體在A(yíng)I領(lǐng)域探索開(kāi)發(fā)媒資庫主要包括以下幾個(gè)方向。

              (一)主流價(jià)值語(yǔ)料庫

              AI平臺有立場(chǎng),AI生成的內容有導向,其導向本質(zhì)上是由AI學(xué)習的數據語(yǔ)料和算法決定的。例如,ChatGPT被指“充滿(mǎn)西方意識形態(tài)和美式政治正確”,根源是美國硅谷和科技界本來(lái)就是美國價(jià)值觀(guān)的大本營(yíng),ChatGPT訓練與學(xué)習的數據大多來(lái)源于西方的數據,產(chǎn)品當然自帶西方意識形態(tài)。

              在推進(jìn)媒體融合過(guò)程中,主流媒體不能一味采用、入駐商業(yè)企業(yè)的AIGC平臺,而是要特別關(guān)注喂養AI的語(yǔ)料數據和模型算法本身的導向。人民數據發(fā)布的《AI大模型綜合能力測評報告》顯示,國內主流大模型在內容生態(tài)方面的表現仍有一定提升空間,一些大模型對敏感話(huà)題做出了不同程度的規避,部分回答內容情感色彩較重[2]。這從一個(gè)側面上反映出,當前市場(chǎng)上主流價(jià)值語(yǔ)料庫稀缺,無(wú)法為大模型學(xué)習訓練提供支持。主流媒體作為鞏固壯大主流思想輿論、擴大主流價(jià)值影響力的主力軍,需要創(chuàng )新媒資庫、建立主流價(jià)值語(yǔ)料庫,進(jìn)一步發(fā)揮在A(yíng)I時(shí)代守護意識形態(tài)安全的價(jià)值。

              例如,針對大模型普遍回答不了、回答不好的重大、敏感、疑難問(wèn)題,人民網(wǎng)動(dòng)員全體員工、匯集各方資源,建設包括基礎語(yǔ)料、重點(diǎn)領(lǐng)域語(yǔ)料、敏感問(wèn)答語(yǔ)料在內的“主流價(jià)值語(yǔ)料庫”,目前已完成12萬(wàn)道題的問(wèn)答語(yǔ)料庫、16個(gè)重點(diǎn)領(lǐng)域語(yǔ)料庫、超300億字的基礎語(yǔ)料庫的建設,實(shí)現與多個(gè)國產(chǎn)主流大模型的集成對接,大幅提升了其安全水平。

              (二)行業(yè)應用大模型

              媒體創(chuàng )新融合發(fā)展路徑可以從三個(gè)層面展開(kāi):一是媒體內部的融合,也就是傳統媒體與新興媒體的融合;二是媒體與媒體之間的行業(yè)融合;三是媒體與一切行業(yè)、產(chǎn)業(yè)的融合,讓媒體在與各個(gè)行業(yè)的深度融合中壯大。主流媒體通過(guò)行業(yè)報道以及行業(yè)內容運營(yíng)業(yè)務(wù)積累了大量高質(zhì)量行業(yè)數據,可以轉化為行業(yè)垂直大模型訓練的優(yōu)質(zhì)語(yǔ)料庫數據,能為開(kāi)發(fā)行業(yè)垂直大模型、推動(dòng)產(chǎn)業(yè)融合提供數據與技術(shù)支撐,為下一步推進(jìn)行業(yè)、產(chǎn)業(yè)的融合打下基礎。

              例如,人民網(wǎng)研發(fā)的“人民智媒大模型”為國家地震局提供地震知識科普問(wèn)答應用。該應用基于地震科普類(lèi)圖書(shū)和相關(guān)規范標準文件的學(xué)習,有效提升在地震基礎知識、地震災害防御、地震應急救援和地震預警及應對等方面的知識科普效率。

              (三)內容風(fēng)控應用

              AI時(shí)代,信息無(wú)處不在、無(wú)所不及、無(wú)人不用,智能內容風(fēng)控擁有廣闊的應用場(chǎng)景。媒資庫的報道成品內容,一定程度上是主流媒體內容審核把關(guān)能力與經(jīng)驗的體現。通過(guò)AI技術(shù)學(xué)習和訓練這些數據,可以研發(fā)內容風(fēng)控應用,全面延伸主流媒體意識形態(tài)把關(guān)能力。

              例如,人民網(wǎng)推出的涉政內容智能審核平臺“人民審!,以人民日報媒資庫為核心數據,基于人民網(wǎng)獨家資源和資深編輯的內容把關(guān)經(jīng)驗,構建涉政知識數據庫,具備涉政文本審核、視覺(jué)內容檢測等智能風(fēng)控模塊,可以實(shí)現在線(xiàn)檢測、文本審校、圖片審校、視頻審校、自定義詞庫等多功能。目前,“人民審!币褳300多家客戶(hù)提供內容把關(guān)和巡查服務(wù)。隨著(zhù)AI大模型的進(jìn)一步發(fā)展,“人民審!睂⒅徍薃I訓練的數據語(yǔ)料、生成內容、線(xiàn)上課程等內容。

              (四)智能文稿創(chuàng )作應用

              媒資庫里海量的政務(wù)數據,例如時(shí)政新聞報道、領(lǐng)導講話(huà)稿、政策文件、官方報告等內容,奠定了主流媒體在黨政文稿方面的智能創(chuàng )作能力。在開(kāi)發(fā)智能文稿創(chuàng )作應用方面,媒資庫擁有兩大不可替代的優(yōu)勢:一是數據來(lái)源于主流媒體報道,確保了AIGC的政治方向、價(jià)值取向和輿論導向;二是原始數據的寫(xiě)作邏輯、語(yǔ)句語(yǔ)序等契合黨政機關(guān)、事業(yè)單位及國有企業(yè)的應用場(chǎng)景。

              例如,人民日報社主管、依托人民網(wǎng)建設的傳播內容認知國家重點(diǎn)實(shí)驗室推出的人工智能寫(xiě)稿秘書(shū)“寫(xiě)易”創(chuàng )作引擎,通過(guò)AI訓練學(xué)習符合我國主流價(jià)值觀(guān)的數據集和媒體語(yǔ)料庫,內容涵蓋政治、經(jīng)濟、文化、社會(huì )、生態(tài)、黨建、國防、外交等重點(diǎn)領(lǐng)域,保障生成內容安全,著(zhù)重為黨政機關(guān)、事業(yè)單位、國有企業(yè)提供優(yōu)質(zhì)安全的智能創(chuàng )作服務(wù)。目前,“寫(xiě)易”已為多個(gè)黨政機關(guān)和大型國企提供應用服務(wù)。

              (五)人工智能檢測

              隨著(zhù)AI技術(shù)進(jìn)一步與內容行業(yè)融合,AIGC迎來(lái)發(fā)展新階段。與之伴隨的內容侵權、網(wǎng)絡(luò )釣魚(yú)、深度偽造、虛假信息等風(fēng)險挑戰引發(fā)廣泛關(guān)注。媒體報道是AI內容生成平臺數據訓練學(xué)習的重要來(lái)源。通過(guò)AI技術(shù)學(xué)習訓練相關(guān)數據,推出針對性的智能檢測產(chǎn)品,可以起到保護版權、維護內容安全的作用,在內容安全、版權保護方面有廣闊的市場(chǎng)應用前景。

              例如,人民日報社主管、依托人民網(wǎng)建設的傳播內容認知國家重點(diǎn)實(shí)驗室推出的“AIGC-X”應用,可快速區分機器生成內容與人工創(chuàng )作內容,對中文文本檢測的準確率已超過(guò)90%。下一步,AIGC-X將擴展為對AI生成文本、圖像乃至視頻的通用智能識別模型,為統籌AI安全與發(fā)展貢獻力量。

              進(jìn)一步創(chuàng )新開(kāi)發(fā)媒資庫

              AI與媒體深度融合,重塑媒體格局和輿論生態(tài)已是大勢所趨。主流媒體對媒資庫開(kāi)發(fā)要超前布局、創(chuàng )新實(shí)踐,抓住AI發(fā)展的機遇,賦能媒體智能化轉型,推動(dòng)媒體融合向縱深發(fā)展。

              (一)積極豐富媒資庫數據

              媒資庫優(yōu)質(zhì)數據的廣度決定了在A(yíng)I領(lǐng)域創(chuàng )新開(kāi)發(fā)的深度。除了傳統媒體歷史報道與素材數據之外,以下數據可以重點(diǎn)考慮。一是AI數據。當前,AI與媒體融合進(jìn)一步加深,主流媒體內容生產(chǎn)效率與質(zhì)量得到大幅提升。未來(lái),由AI生成的數據呈現爆發(fā)態(tài)勢,許多媒體內容將來(lái)源于A(yíng)I。因此,可以將海量AI生成數據補充到媒資庫中。二是行業(yè)數據。主流媒體在探索建立“新聞+政務(wù)服務(wù)商業(yè)”經(jīng)營(yíng)模式的過(guò)程中,要留意對行業(yè)數據的積累、挖掘,形成各類(lèi)行業(yè)數據庫,提升媒資庫的深度和廣度。三是互聯(lián)網(wǎng)數據。通過(guò)開(kāi)放合作,主流媒體可以定向采集互聯(lián)網(wǎng)相關(guān)數據,拓展媒資庫的數據量。

              (二)推進(jìn)智能媒體資源庫建設

              媒資庫建設不能僅停留在文字報道電子化階段。要將文字、圖表、圖片、音視頻報道和素材數字化、智能標簽化,實(shí)現海量數據數字化存儲、多模態(tài)搜索與精準管理。同時(shí),建議對各類(lèi)數據進(jìn)行清洗、提煉與分類(lèi),形成各類(lèi)專(zhuān)業(yè)數據庫,為媒資庫創(chuàng )新開(kāi)發(fā)做好準備。

              (三)加速媒資庫在人工智能領(lǐng)域的創(chuàng )新開(kāi)發(fā)

              媒資庫是媒體機構優(yōu)質(zhì)、稀缺的數據資產(chǎn),但如不創(chuàng )新開(kāi)發(fā)使用,仍然只是“歷史檔案”,無(wú)法體現其數據價(jià)值。因此,建議主流媒體積極創(chuàng )新開(kāi)發(fā)媒資庫,通過(guò)技術(shù)的引入,持續賦能媒體內容生產(chǎn)、智能傳播及經(jīng)營(yíng)運營(yíng)分析。此外,還可以通過(guò)對外尋求合作,共享和開(kāi)放媒資庫,暢通數據資源大循環(huán)。要超前布局,先行先試,在使用中積累數據和經(jīng)驗,在使用中完善媒資庫,為媒體智能化轉型與融合發(fā)展提供支撐。

              【參考文獻】

              [1]財聯(lián)社.OpenAI與CNN、?怂购蜁r(shí)代雜志洽談內容授權事宜[EB/OL].(2024-01-12).https://www.cls.cn/detail/1568645.

              [2]人民數據.重磅!人民數據發(fā)布《AI大模型綜合能力測評報告》[EB/OL].(2023-07-07).https://www.peopledata.com.cn/html/NEWS/Dynamics/3225.html.

              (本文刊發(fā)于《全媒體探索》2024年4月號)

              (責編:王媛媛、唐勝宏)

              分享讓更多人看到

              傳媒推薦
              • @媒體人,新聞報道別任性
              • 網(wǎng)站運營(yíng)者 這些"紅線(xiàn)"不能踩!
              • 一圖縱覽中國網(wǎng)絡(luò )視聽(tīng)行業(yè)
              返回頂部