民進(jìn)中央:關(guān)于啟動中華古籍?dāng)?shù)字化國家工程的提案
古籍?dāng)?shù)字化給研究者和讀者隨時(shí)隨地閱讀帶來很大便利,隨著云存儲、移動互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能新技術(shù)發(fā)展,古籍?dāng)?shù)字資源將煥發(fā)新生命。近幾年國學(xué)研究、中華傳統(tǒng)文化受到大中專院校、學(xué)術(shù)機(jī)構(gòu)及教育機(jī)構(gòu)的重視,加之中央文化資產(chǎn)管理辦公室對數(shù)字化轉(zhuǎn)型升級給予支持,大大推動了古籍?dāng)?shù)字化實(shí)施。但由于沒有統(tǒng)一規(guī)劃與調(diào)控,在古籍?dāng)?shù)字化中出現(xiàn)一些亟待引起重視的問題:
一是內(nèi)容審核把關(guān)缺失,不利于中華優(yōu)秀傳統(tǒng)文化傳播
中華古籍在歷代統(tǒng)治者整理中被進(jìn)行了不同程度修改,只有古籍整理專家才能辨別。一些古籍?dāng)?shù)字化的公司,缺少這方面專家,只是迎合市場需要。由于對數(shù)據(jù)庫出版的審核把關(guān)管理不是很嚴(yán),數(shù)據(jù)庫開發(fā)完后,通過銷售直接就到了互聯(lián)網(wǎng)或圖書館,一些消極負(fù)面的內(nèi)容很容易得以傳播,給用戶尤其是青少年帶來不利影響。
二是重復(fù)開發(fā)、同質(zhì)化產(chǎn)品競爭加劇,一些稀缺古籍資源無人問津
由于古籍?dāng)?shù)字化蘊(yùn)含巨大商機(jī),一些熱門古籍如唐詩、宋詞、史記、漢書、四庫全書、二十五史等,各家出版社皆蜂擁而上。一些小規(guī)模帶有普及性的電子書重復(fù)制作,一些大型數(shù)字化工程也不同程度存在重復(fù)建設(shè)。既浪費(fèi)了人力財(cái)力,提高了開發(fā)成本,也相應(yīng)減少了對其他可開發(fā)項(xiàng)目投入。長此以往,隨著古籍整理研究者高齡化,有些稀缺古籍可能很難有機(jī)會被整理出版直至數(shù)字化。
造成重復(fù)的原因,一是有些文獻(xiàn)本身就屬于基本典籍,制作單位需要利用它們吸引基本用戶采購,二是學(xué)術(shù)整理能力和專業(yè)人員素質(zhì)、技術(shù)手段參差不齊,往往是投入成本低、定價(jià)低的產(chǎn)品市場份額大。有的數(shù)字制作機(jī)構(gòu)甚至通過盜版、侵權(quán)、獲取競爭者的電子版本,進(jìn)行格式轉(zhuǎn)換后,投入市場。這些采取傾銷手段進(jìn)入市場的低價(jià)數(shù)據(jù)庫產(chǎn)品,質(zhì)量難有保障。
三是針對古籍?dāng)?shù)字化的法律規(guī)章及相關(guān)標(biāo)準(zhǔn)、管理規(guī)范缺失
近幾年,古籍?dāng)?shù)字化侵權(quán)案例多發(fā)。由于有的古籍版本雷同,加之“分段、標(biāo)點(diǎn)、??薄毕嗨贫瘸^50%;同時(shí),古籍?dāng)?shù)據(jù)庫市場競爭日益加劇,同行間互相剽竊、盜版現(xiàn)象確實(shí)存在。單憑《著作權(quán)法》相關(guān)條文,已很難適應(yīng)古籍整理的發(fā)展階段。又缺乏一個國家級的古籍?dāng)?shù)字產(chǎn)品和網(wǎng)絡(luò)管理機(jī)構(gòu)進(jìn)行政策性指導(dǎo),即便對簿公堂,也難辨是非。
作為提供文獻(xiàn)的公共圖書館、博物館對掃描拍攝本館珍藏的古籍文獻(xiàn)漫天要價(jià),加大制作者的成本。有的則以保護(hù)典藏為名,不予使用,也不提供原版影像,致使一些傳統(tǒng)典籍難以進(jìn)一步傳播。
四是缺乏統(tǒng)一、開放、兼容的古籍?dāng)?shù)字化標(biāo)準(zhǔn)
目前,數(shù)字化古籍的文件格式很多,除常見的txt、doc、html格式外,還有exe、pdf、wdl、pdg、ebk、edb等,不同的格式就需要不同的瀏覽器閱讀。隨著新技術(shù)的發(fā)展進(jìn)步,這些格式由于不能實(shí)現(xiàn)結(jié)構(gòu)化檢索、大數(shù)據(jù)分析,也逐漸過時(shí)。
另外,由于中華字體的多次演變,各公司需要自己開發(fā)古籍字,格式也完全不同,還有OCR識別軟件、校對軟件、標(biāo)引軟件、檢索軟件、研究支持軟件多為公司獨(dú)立開發(fā),自成一統(tǒng),給用戶閱讀、檢索和研究帶來不便。
為此建議,盡快啟動中華古籍?dāng)?shù)字化國家工程:
一是健全組織,制定總體規(guī)劃,分級分工分步安排
中華古籍?dāng)?shù)字化國家工程應(yīng)由圖書館界、歷史考古界、出版界以及數(shù)字出版技術(shù)商和軟件開發(fā)商共同參與,建設(shè)一個真正滿足人們公共文化服務(wù)、有利于中華傳統(tǒng)文化傳播的古籍?dāng)?shù)字資源平臺。對國家古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組進(jìn)行改組充實(shí),組織全國各級公共圖書館以及專家對古籍原本進(jìn)行鑒別和統(tǒng)一著錄,審核、完善現(xiàn)有古籍書目數(shù)據(jù)庫,按步驟實(shí)施現(xiàn)存古籍目錄索引和工具書的數(shù)字化。根據(jù)用戶使用目的進(jìn)行分類,可分為學(xué)校教學(xué)、知識普及、專業(yè)研究等,分級分類免費(fèi)開放。
對現(xiàn)售古籍?dāng)?shù)據(jù)庫產(chǎn)品進(jìn)行內(nèi)容審定、把關(guān)。對一些負(fù)面的古籍糟粕,應(yīng)在公共圖書館和互聯(lián)網(wǎng)上停止公開發(fā)行。
通過各種合作渠道,將收藏中國古籍的美國國會圖書館、哈佛大學(xué)圖書館、英國國家圖書館和國立巴黎圖書館中的一些數(shù)字資源引入平臺,對國內(nèi)研究者開放。
二是制定法律法規(guī)及技術(shù)標(biāo)準(zhǔn)、建庫標(biāo)準(zhǔn)和相關(guān)管理規(guī)范
統(tǒng)一使用一系列開放、兼容、通用的OCR、校對、標(biāo)引、檢索、研究支持等軟件標(biāo)準(zhǔn)。對古籍?dāng)?shù)字化的版權(quán)所有者和制作加工者進(jìn)行責(zé)任確權(quán),清晰侵權(quán)邊界,細(xì)化和制定規(guī)范的著錄條例、數(shù)據(jù)庫格式、編目軟件使用字庫,對計(jì)算機(jī)古籍整理通用系統(tǒng)軟件的甄別、升級乃至研制開發(fā)。
組織各級圖書館提供館藏文獻(xiàn)的掃描影像,既保護(hù)文物古籍,避免反復(fù)被拍照、掃描,又?jǐn)U大文獻(xiàn)的傳播和交流。
三是政府搭臺,給予企業(yè)政策和資金支持
建議國家相關(guān)部門有計(jì)劃指導(dǎo)出版單位參與到稀缺古籍資源的數(shù)字化開發(fā)中,并鼓勵更多出版單位、技術(shù)公司參與到中華古籍?dāng)?shù)字化工程。政府審核通過后,上傳到開放資源平臺,招標(biāo)企業(yè)運(yùn)營維護(hù)平臺。對一些已開發(fā)成熟的基本古籍?dāng)?shù)據(jù)庫國家可出資購買,委托相關(guān)技術(shù)公司加以完善,統(tǒng)一標(biāo)準(zhǔn)格式,共享到古籍?dāng)?shù)字化平臺。
鼓勵古籍整理者和古籍研究者進(jìn)行基于古籍內(nèi)容的學(xué)術(shù)研究,鼓勵古籍類出版單位出版最新學(xué)術(shù)成果,或根據(jù)平臺上的文獻(xiàn)實(shí)現(xiàn)二次出版、主題化出版,擴(kuò)大中華古籍的傳播和研究成果。