關(guān)于發(fā)展生成式人工智能 加強出版業(yè)前沿技術(shù)應(yīng)用的提案

發(fā)布時間: 2024-02-27
【字體:

  生成式人工智能技術(shù)在知識生產(chǎn)、信息獲取和人機交互方面取得了劃時代的突破,正在引發(fā)新一輪的科技革命和產(chǎn)業(yè)變革,不斷催生新產(chǎn)業(yè)、新業(yè)態(tài)和新商業(yè)模式,培育經(jīng)濟發(fā)展新動能。生成式人工智能技術(shù)同時也給傳統(tǒng)出版業(yè)帶來了挑戰(zhàn)和發(fā)展機遇。2022年4月,中共中央宣傳部印發(fā)《關(guān)于推動出版深度融合發(fā)展的實施意見》,指出要加強前沿技術(shù)探索應(yīng)用,“緊盯技術(shù)發(fā)展前沿,用好信息技術(shù)革命成果,強化大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用”。但是,生成式人工智能與出版業(yè)的融合發(fā)展仍面臨諸多現(xiàn)實問題:

  一是技術(shù)開發(fā)與落地應(yīng)用存在困難。生成式人工智能大模型的三要素是數(shù)據(jù)、算力與算法。出版業(yè)普遍具有較高質(zhì)量的數(shù)據(jù)積累,根據(jù)國家新聞出版署發(fā)布的《2021年新聞出版產(chǎn)業(yè)分析報告》,2021年全國共出版圖書、期刊、報紙、音像制品和電子出版物426.65億冊(份、盒、張)。但是,出版業(yè)在算力方面存在嚴(yán)重不足,算法技術(shù)相對落后。人工智能大模型使用具有一定的門檻,如需要一定的基礎(chǔ)設(shè)施投入等,而出版業(yè)的單位體量通常較小,在一定程度上制約生成式人工智能的應(yīng)用。

  二是生成內(nèi)容質(zhì)量不高,存在安全隱患。生成式人工智能基于概率產(chǎn)生內(nèi)容,經(jīng)常存在知識記憶錯誤、信息時效性不足、邏輯推理錯亂、專業(yè)知識缺乏等問題。如果對大模型的訓(xùn)練數(shù)據(jù)管控不嚴(yán),很容易暴露敏感信息,甚至生成不符合社會主義核心價值觀的不當(dāng)內(nèi)容。

  三是生成訓(xùn)練語料存在合規(guī)性問題。生成式人工智能大模型訓(xùn)練需要海量高質(zhì)量語料數(shù)據(jù),但出版業(yè)缺少新聞出版數(shù)據(jù)應(yīng)用到大模型中的政策指導(dǎo)。大模型技術(shù)廠商有強烈的數(shù)據(jù)需求,希望利用新聞出版機構(gòu)的高質(zhì)量數(shù)據(jù)訓(xùn)練生成式人工智能大模型,但是,新聞出版機構(gòu)由于缺乏定價標(biāo)準(zhǔn)和收益分配規(guī)則,且擔(dān)心數(shù)據(jù)安全問題,不敢與大模型技術(shù)廠商合作,導(dǎo)致出版機構(gòu)的高質(zhì)量語料數(shù)據(jù)難以高效流通,發(fā)揮數(shù)據(jù)要素價值。

  為此,建議:

  一是加強政策引導(dǎo)和扶持。加快推進生成式人工智能在出版業(yè)的落地應(yīng)用,助力出版業(yè)向知識服務(wù)業(yè)轉(zhuǎn)型。充分考慮出版業(yè)發(fā)展特點,遵循生成式人工智能服務(wù)管理相關(guān)文件要求,制定并完善適用于出版業(yè)的管理辦法,規(guī)范、促進出版業(yè)人工智能大模型的訓(xùn)練和應(yīng)用。加強政策扶持,鼓勵創(chuàng)新探索,培育生態(tài)體系,營造良好政策環(huán)境,促進出版業(yè)與人工智能融合發(fā)展。支持行業(yè)組織、企業(yè)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險防范等方面開展協(xié)作。設(shè)立扶持計劃或項目,推動出版業(yè)生成式人工智能基礎(chǔ)設(shè)施和平臺建設(shè),促進算力等資源協(xié)同共享。

  二是建立行業(yè)準(zhǔn)入機制。為保障生成式人工智能技術(shù)的有序發(fā)展及相關(guān)出版融媒體產(chǎn)品堅持正確政治方向、輿論導(dǎo)向、價值取向,建議加快制定出版業(yè)的人工智能大模型認(rèn)證準(zhǔn)入相關(guān)政策,從國家、行業(yè)層面制定人工智能相關(guān)技術(shù)產(chǎn)品的準(zhǔn)入門檻,包括相應(yīng)的認(rèn)證、備案、監(jiān)管等細(xì)則。同時,為確保大模型訓(xùn)練結(jié)果的準(zhǔn)確性和可信度,建議制定相關(guān)工作指南,以確保訓(xùn)練過程的高效和結(jié)果的可靠性、安全性。

  三是建立訓(xùn)練語料付酬標(biāo)準(zhǔn)。面對大模型訓(xùn)練數(shù)據(jù)中可能涉及的侵權(quán)問題,除了規(guī)范數(shù)據(jù)合規(guī)使用外,監(jiān)管部門還應(yīng)著力推動制定生成式人工智能訓(xùn)練語料的權(quán)益分配辦法,充分考慮多元利益相關(guān)主體的不同訴求,既激勵人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展,又能夠保障高質(zhì)量數(shù)據(jù)生產(chǎn)者的合法權(quán)益。

作者:
責(zé)任編輯: 邵飛
>