民進中央:關(guān)于啟動中華古籍?dāng)?shù)字化國家工程的提案
古籍?dāng)?shù)字化給研究者和讀者隨時隨地閱讀帶來很大便利,隨著云存儲、移動互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能新技術(shù)發(fā)展,古籍?dāng)?shù)字資源將煥發(fā)新生命。近幾年國學(xué)研究、中華傳統(tǒng)文化受到大中專院校、學(xué)術(shù)機構(gòu)及教育機構(gòu)的重視,加之中央文化資產(chǎn)管理辦公室對數(shù)字化轉(zhuǎn)型升級給予支持,大大推動了古籍?dāng)?shù)字化實施。但由于沒有統(tǒng)一規(guī)劃與調(diào)控,在古籍?dāng)?shù)字化中出現(xiàn)一些亟待引起重視的問題:
一是內(nèi)容審核把關(guān)缺失,不利于中華優(yōu)秀傳統(tǒng)文化傳播
中華古籍在歷代統(tǒng)治者整理中被進行了不同程度修改,只有古籍整理專家才能辨別。一些古籍?dāng)?shù)字化的公司,缺少這方面專家,只是迎合市場需要。由于對數(shù)據(jù)庫出版的審核把關(guān)管理不是很嚴,數(shù)據(jù)庫開發(fā)完后,通過銷售直接就到了互聯(lián)網(wǎng)或圖書館,一些消極負面的內(nèi)容很容易得以傳播,給用戶尤其是青少年帶來不利影響。
二是重復(fù)開發(fā)、同質(zhì)化產(chǎn)品競爭加劇,一些稀缺古籍資源無人問津
由于古籍?dāng)?shù)字化蘊含巨大商機,一些熱門古籍如唐詩、宋詞、史記、漢書、四庫全書、二十五史等,各家出版社皆蜂擁而上。一些小規(guī)模帶有普及性的電子書重復(fù)制作,一些大型數(shù)字化工程也不同程度存在重復(fù)建設(shè)。既浪費了人力財力,提高了開發(fā)成本,也相應(yīng)減少了對其他可開發(fā)項目投入。長此以往,隨著古籍整理研究者高齡化,有些稀缺古籍可能很難有機會被整理出版直至數(shù)字化。
造成重復(fù)的原因,一是有些文獻本身就屬于基本典籍,制作單位需要利用它們吸引基本用戶采購,二是學(xué)術(shù)整理能力和專業(yè)人員素質(zhì)、技術(shù)手段參差不齊,往往是投入成本低、定價低的產(chǎn)品市場份額大。有的數(shù)字制作機構(gòu)甚至通過盜版、侵權(quán)、獲取競爭者的電子版本,進行格式轉(zhuǎn)換后,投入市場。這些采取傾銷手段進入市場的低價數(shù)據(jù)庫產(chǎn)品,質(zhì)量難有保障。
三是針對古籍?dāng)?shù)字化的法律規(guī)章及相關(guān)標(biāo)準(zhǔn)、管理規(guī)范缺失
近幾年,古籍?dāng)?shù)字化侵權(quán)案例多發(fā)。由于有的古籍版本雷同,加之“分段、標(biāo)點、??薄毕嗨贫瘸^50%;同時,古籍?dāng)?shù)據(jù)庫市場競爭日益加劇,同行間互相剽竊、盜版現(xiàn)象確實存在。單憑《著作權(quán)法》相關(guān)條文,已很難適應(yīng)古籍整理的發(fā)展階段。又缺乏一個國家級的古籍?dāng)?shù)字產(chǎn)品和網(wǎng)絡(luò)管理機構(gòu)進行政策性指導(dǎo),即便對簿公堂,也難辨是非。
作為提供文獻的公共圖書館、博物館對掃描拍攝本館珍藏的古籍文獻漫天要價,加大制作者的成本。有的則以保護典藏為名,不予使用,也不提供原版影像,致使一些傳統(tǒng)典籍難以進一步傳播。
四是缺乏統(tǒng)一、開放、兼容的古籍?dāng)?shù)字化標(biāo)準(zhǔn)
目前,數(shù)字化古籍的文件格式很多,除常見的txt、doc、html格式外,還有exe、pdf、wdl、pdg、ebk、edb等,不同的格式就需要不同的瀏覽器閱讀。隨著新技術(shù)的發(fā)展進步,這些格式由于不能實現(xiàn)結(jié)構(gòu)化檢索、大數(shù)據(jù)分析,也逐漸過時。
另外,由于中華字體的多次演變,各公司需要自己開發(fā)古籍字,格式也完全不同,還有OCR識別軟件、校對軟件、標(biāo)引軟件、檢索軟件、研究支持軟件多為公司獨立開發(fā),自成一統(tǒng),給用戶閱讀、檢索和研究帶來不便。
為此建議,盡快啟動中華古籍?dāng)?shù)字化國家工程:
一是健全組織,制定總體規(guī)劃,分級分工分步安排
中華古籍?dāng)?shù)字化國家工程應(yīng)由圖書館界、歷史考古界、出版界以及數(shù)字出版技術(shù)商和軟件開發(fā)商共同參與,建設(shè)一個真正滿足人們公共文化服務(wù)、有利于中華傳統(tǒng)文化傳播的古籍?dāng)?shù)字資源平臺。對國家古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組進行改組充實,組織全國各級公共圖書館以及專家對古籍原本進行鑒別和統(tǒng)一著錄,審核、完善現(xiàn)有古籍書目數(shù)據(jù)庫,按步驟實施現(xiàn)存古籍目錄索引和工具書的數(shù)字化。根據(jù)用戶使用目的進行分類,可分為學(xué)校教學(xué)、知識普及、專業(yè)研究等,分級分類免費開放。
對現(xiàn)售古籍?dāng)?shù)據(jù)庫產(chǎn)品進行內(nèi)容審定、把關(guān)。對一些負面的古籍糟粕,應(yīng)在公共圖書館和互聯(lián)網(wǎng)上停止公開發(fā)行。
通過各種合作渠道,將收藏中國古籍的美國國會圖書館、哈佛大學(xué)圖書館、英國國家圖書館和國立巴黎圖書館中的一些數(shù)字資源引入平臺,對國內(nèi)研究者開放。
二是制定法律法規(guī)及技術(shù)標(biāo)準(zhǔn)、建庫標(biāo)準(zhǔn)和相關(guān)管理規(guī)范
統(tǒng)一使用一系列開放、兼容、通用的OCR、校對、標(biāo)引、檢索、研究支持等軟件標(biāo)準(zhǔn)。對古籍?dāng)?shù)字化的版權(quán)所有者和制作加工者進行責(zé)任確權(quán),清晰侵權(quán)邊界,細化和制定規(guī)范的著錄條例、數(shù)據(jù)庫格式、編目軟件使用字庫,對計算機古籍整理通用系統(tǒng)軟件的甄別、升級乃至研制開發(fā)。
組織各級圖書館提供館藏文獻的掃描影像,既保護文物古籍,避免反復(fù)被拍照、掃描,又擴大文獻的傳播和交流。
三是政府搭臺,給予企業(yè)政策和資金支持
建議國家相關(guān)部門有計劃指導(dǎo)出版單位參與到稀缺古籍資源的數(shù)字化開發(fā)中,并鼓勵更多出版單位、技術(shù)公司參與到中華古籍?dāng)?shù)字化工程。政府審核通過后,上傳到開放資源平臺,招標(biāo)企業(yè)運營維護平臺。對一些已開發(fā)成熟的基本古籍?dāng)?shù)據(jù)庫國家可出資購買,委托相關(guān)技術(shù)公司加以完善,統(tǒng)一標(biāo)準(zhǔn)格式,共享到古籍?dāng)?shù)字化平臺。
鼓勵古籍整理者和古籍研究者進行基于古籍內(nèi)容的學(xué)術(shù)研究,鼓勵古籍類出版單位出版最新學(xué)術(shù)成果,或根據(jù)平臺上的文獻實現(xiàn)二次出版、主題化出版,擴大中華古籍的傳播和研究成果。