開放獲取 (Open Access, OA) 運動的發(fā)展, 使得越來越多的學(xué)術(shù)資源可以免費獲取。隨著開放資源類型的多樣化和數(shù)量的快速增長, 開放資源的學(xué)術(shù)價值也逐漸提高, 已經(jīng)成為圖書館內(nèi)除商業(yè)資源采購以外的重要館藏資源[1]。開放資源獲取的主要途徑有“開放獲取期刊”和“自我存檔”, 其中“自我存檔”即開放獲取倉儲 (Open Access Repositories, OAR) , 是對數(shù)字信息資源的免費存儲文檔庫, 其不僅內(nèi)容免費, 而且對使用者沒有任何限制, 在過去十多年, 大部分學(xué)研機構(gòu)、研究中心、政府機構(gòu)、數(shù)據(jù)中心或圖書館建立了OAR。OAR收集大量不同類型開放學(xué)術(shù)信息資源, 包括期刊論文、學(xué)位論文、圖書、會議論文等[2]。學(xué)科知識庫專門收集特定學(xué)科主題的研究資源, 較具有代表性的OAR有高能物理領(lǐng)域的ar Xiv.org、醫(yī)學(xué)領(lǐng)域的Pub Med Central、地球科學(xué)領(lǐng)域的Earth-Prints Repository等[3]。學(xué)者們通過對OAR的相關(guān)研究, 不同程度地揭示了科研人員進(jìn)行自存檔的態(tài)度和行為[4]、機構(gòu)知識庫引起的圖書館員角色轉(zhuǎn)變[5]、機構(gòu)知識庫的基礎(chǔ)理論以及機構(gòu)知識庫的建設(shè)策略[6]等。
開放獲取倉儲目錄 (Directory of Open Access Repositories, Open DOA R) 由英國諾丁漢大學(xué)和瑞典倫德大學(xué)圖書館于2005年12月聯(lián)合建立, 是全球范圍內(nèi)首家對OAR進(jìn)行搜集、描述和組織的電子目錄, 登記數(shù)量由建立初期的128個[7], 發(fā)展為3 408個 (截至2017年8月) , 該目錄具有一定的重要性和權(quán)威性。Pinfield等基于2005—2012年的Open DOAR數(shù)據(jù), 揭示了世界范圍內(nèi)OAR的快速增長, 并概括了OAR的總體特征:以機構(gòu)知識庫為主, 多數(shù)是跨學(xué)科領(lǐng)域, 網(wǎng)站登記資源多以英語為主, 存在少量OAR登記大量資源和大量OAR登記少量資源現(xiàn)象[7]。此外, 還有學(xué)者研究OAR的數(shù)量增長、發(fā)展趨勢及關(guān)鍵特征, 分析OAR在促進(jìn)學(xué)術(shù)交流中的潛在作用, 探討了機構(gòu)知識庫發(fā)展和建設(shè)中存在的問題和挑戰(zhàn)。一部分學(xué)者以地域為基礎(chǔ)集中分析OA R的特征, 如加拿大[8]、印度[9]和中國[10]等;還有一部分學(xué)者重點從學(xué)科角度集中分析OAR, 如從醫(yī)學(xué)領(lǐng)域[11]、計算機科學(xué)領(lǐng)域[12]等。
目前還沒有學(xué)者對資源環(huán)境領(lǐng)域OAR展開相關(guān)研究, 本文將面向資源環(huán)境領(lǐng)域開放學(xué)術(shù)資源的組織利用, 從基本情況和資源特征兩方面對在Open DOAR中登記的OAR進(jìn)行分析。
資源環(huán)境領(lǐng)域?qū)W科范圍廣, 有多學(xué)科交叉性質(zhì), 涉及生態(tài)學(xué)、環(huán)境科學(xué)、地球化學(xué)與地球物理學(xué)、水資源學(xué)等[13]。在資源環(huán)境學(xué)科信息門戶研究與建設(shè)中學(xué)科范圍以資源與環(huán)境科學(xué)、地球科學(xué)為核心[14], 由此, 本文選取Open DOAR中與資源環(huán)境領(lǐng)域密切相關(guān)的地球和行星科學(xué) (共88個OAR) 以及生態(tài)和環(huán)境學(xué)科 (共150個OAR) 分類下的OAR, 去重后得到195個資源環(huán)境領(lǐng)域相關(guān)的OAR作為分析樣本, 樣本的元數(shù)據(jù)信息獲取時間為2017年5月1—31日。本文從國家分布、類型分布、語言分布以及使用軟件四個方面揭示該領(lǐng)域OAR的基本情況。
經(jīng)統(tǒng)計, Open DOAR資源環(huán)境領(lǐng)域195個OAR分布于55個國家, 其中美國、英國、法國等17個發(fā)達(dá)國家的OAR數(shù)量共99個, 占總量的一半略強, 因此, 從總體來看, 發(fā)達(dá)國家和發(fā)展中國家OAR的數(shù)量相對均衡。Pinf ield等研究也表明, OAR發(fā)展初期, 發(fā)達(dá)國家數(shù)量增長較快, 而2010年以后, 東亞、南美洲、東歐等地, 尤其是巴西、波蘭等國的OAR數(shù)量開始呈現(xiàn)較快的增長速度[7]。
本文將資源環(huán)境領(lǐng)域OAR的類型分為機構(gòu)知識庫、學(xué)科知識庫、集成倉儲和政府倉儲四種, 其中機構(gòu)知識庫收集、存放由某個機構(gòu)或多個學(xué)術(shù)機構(gòu)的研究人員產(chǎn)生的學(xué)術(shù)成果, 學(xué)科知識庫專門收集某一特定學(xué)科或主題的研究資源, 政府倉儲由政府或政府資助機構(gòu)管理, 集成倉儲從其他來源收集資源。此外, Nicholas等還補充了OAR的一種類型, 即包含特定類型文件的格式存儲庫, 如學(xué)位論文、電子期刊、數(shù)據(jù)集或?qū)W習(xí)對象[15]??傮w來看, 以機構(gòu)知識庫 (共151個) 和學(xué)科知識庫 (共32個) 為主, 占比93.8%;集成倉儲和政府倉儲各有6個, 這兩種占該領(lǐng)域所有OAR數(shù)量的6.2%, 這與OAR總體特征[7]相符。調(diào)查表明, 全球出版物產(chǎn)出較多的機構(gòu), 大部分都建立了機構(gòu)知識庫, 用以收集、保存和傳播自身機構(gòu)的學(xué)術(shù)產(chǎn)出[16]。
在機構(gòu)知識庫方面, 國外資源環(huán)境領(lǐng)域具有代表性的機構(gòu)知識庫有佐治亞大學(xué)機構(gòu)知識庫[17]、匹茲堡大學(xué)機構(gòu)知識庫[18]、愛爾蘭海洋研究所機構(gòu)知識庫[19]、海洋生物實驗室和伍茲霍爾海洋學(xué)研究所機構(gòu)知識庫[20]等。國內(nèi)該領(lǐng)域建設(shè)機構(gòu)知識庫的相關(guān)機構(gòu)主要集中在中國科學(xué)院, 包括中國科學(xué)院所屬的成都生物研究所、地球環(huán)境研究所、地理科學(xué)與資源研究所、生態(tài)環(huán)境研究中心、南海海洋研究所、新疆生態(tài)與地理研究所、煙臺海岸帶研究所等;此外, 北京大學(xué)機構(gòu)知識庫也存儲了資源環(huán)境領(lǐng)域開放學(xué)術(shù)資源。在學(xué)科知識庫方面, Dryad[21]、CEDA Repository[22]、PANGAEA[23]等以存儲科學(xué)數(shù)據(jù)為主, 其中PANGAEA專門保存、發(fā)布和分發(fā)來自地球研究系統(tǒng)的地理參考數(shù)據(jù);此外, e ERL[24]、OMA[25]及Earth-prints Repository[26]等學(xué)科知識庫都登記和存儲了資源環(huán)境領(lǐng)域相關(guān)的開放學(xué)術(shù)資源。
資源環(huán)境領(lǐng)域的OAR存儲了24種語言的開放資源, 以多種語言建立OAR, 滿足不同國家、不同用戶的語言需求。總體來看, 以英語存儲學(xué)術(shù)資源的OAR有159個, 占比81.5%, 數(shù)量最多, 這與Pinfield等的結(jié)論相符;其次是西班牙語、法語和中文;登記芬蘭語、僧伽羅語等9種語言開放資源的OAR分別有1個。Open DOAR中, 2008年以來登記非英語語種開放資源的OAR比例增加[7], 在資源環(huán)境領(lǐng)域, 登記除英語外其他語種開放資源的OAR占18.5%。
軟件是OAR建設(shè)的重要組成部分, 資源環(huán)境領(lǐng)域OA R建設(shè)過程中使用的開源或商業(yè)軟件共有27種 (見表1) , 其中前11種軟件有不少于2個OAR使用, 而使用Socionet、pan FMP等其他16種軟件的OA R分別各有1個, 另外還有19個OAR所使用的軟件在Open DOAR元數(shù)據(jù)中記錄為“Not specified”, 故未統(tǒng)計在上述軟件之列。90個OAR使用最流行的DSpace軟件, 31個OAR使用EPrints軟件, 使用這兩種開源軟件的OAR數(shù)量超過一半 (占比62.1%) 。其他OAR使用的軟件如d Libra、OPUS等由于語言限制, 僅適用特定國家, d Libra僅波蘭的OAR使用, OPUS僅德國的OAR使用。
總體來說, 資源環(huán)境領(lǐng)域OAR, 美國數(shù)量最多, 發(fā)達(dá)國家和其他國家的資源數(shù)量相對均衡, 以機構(gòu)知識庫和學(xué)科知識庫為主, 登記的資源有多種語言但主要以英語為主, 大部分倉儲使用較為通用的DSpace和EPrints軟件。分析表明, 資源環(huán)境領(lǐng)域大多數(shù)國家的科研機構(gòu)都積極建設(shè)OAR, 在語言和軟件上均體現(xiàn)出明顯的多樣化特征。我國在該領(lǐng)域建設(shè)OAR的機構(gòu)多數(shù)集中在中國科學(xué)院的相關(guān)院所, 且都是機構(gòu)知識庫, 我國沒有建設(shè)專門的資源環(huán)境領(lǐng)域?qū)W科知識庫, 相比之下資源環(huán)境領(lǐng)域建設(shè)OAR最多的美國在該領(lǐng)域有6個相關(guān)的學(xué)科知識庫。
表1 資源環(huán)境領(lǐng)域OAR使用軟件 下載原表
本文統(tǒng)計分析的195個資源環(huán)境領(lǐng)域OAR共登記約490萬條開放資源, 包括期刊論文、學(xué)位論文、圖書、會議論文等各種類型的學(xué)術(shù)資源, 分析OAR登記的學(xué)術(shù)資源的數(shù)量、類型、互操作性以及更新情況, 對資源環(huán)境領(lǐng)域OAR的開放資源再利用具有實踐指導(dǎo)意義。
資源環(huán)境領(lǐng)域OA R的資源數(shù)量范圍分布情況如下:登記資源數(shù)量小于0.1萬的OAR有30個, 占比15.4%;登記資源量在0.1萬—0.5萬的OAR有70個, 占比35.9%;登記資源量在0.5萬—1萬以及1萬—5萬的OAR均有37個, 各占19.0%;登記資源數(shù)量大于5萬的OAR有17個, 占比8.7%;另外, 有4個OAR的Open DOAR元數(shù)據(jù)信息中資源數(shù)量為空白, 因此沒有統(tǒng)計在上述資源數(shù)量范圍之列。對比Loan對Open DOAR中醫(yī)學(xué)領(lǐng)域OAR的分析[14], 醫(yī)學(xué)領(lǐng)域登記資源量大于5萬的OAR有11個, 占該領(lǐng)域OAR (共254個) 的4.3%, 對比發(fā)現(xiàn), 資源環(huán)境領(lǐng)域登記大量資源的OAR相對較多。
資源環(huán)境領(lǐng)域OAR登記的資源類型分布如表2所示, 共有11種類型的開放資源, 包括常規(guī)開放資源 (期刊論文和會議論文等) 和領(lǐng)域特色資源 (數(shù)據(jù)集和地圖等) 。其中, 收集期刊論文的OAR最多 (占比77.4%) , 其次是未發(fā)表的資源、學(xué)位論文、會議論文、專著、多媒體資源、參考資料、專門資源、學(xué)習(xí)對象資源、專利、數(shù)據(jù)集。其中專門資源包含地圖、公告、灰色文獻(xiàn)、新聞、科技報告等。根據(jù)統(tǒng)計發(fā)現(xiàn), 資源環(huán)境領(lǐng)域大多數(shù)OA R都存儲了多種類型的開放資源, 僅收錄一種資源的OAR相對較少, 這與近年來開放獲取范疇逐漸擴大的趨勢相同, OAR登記的開放資源類型多樣, 相對較全面。登記的資源類型中, 期刊論文、會議論文、學(xué)位論文、圖書可以較直接反應(yīng)學(xué)術(shù)成果的資源相對較多, 登記在OAR中的多媒體資源、專門資源、學(xué)習(xí)對象資源、數(shù)據(jù)集等資源比例相對較少。
表2 資源環(huán)境領(lǐng)域OAR的資源類型 下載原表
數(shù)據(jù)集資源以及專門資源中包含的地圖充分體現(xiàn)了資源環(huán)境領(lǐng)域的特色。登記數(shù)據(jù)集資源的OAR有14個, 其中8個是學(xué)科知識庫、7個是機構(gòu)知識庫, Dryad、PANGAEA、CEDA Repository、Earth-prints Repository[27]等重要學(xué)科知識庫都收集和存儲了數(shù)據(jù)集資源, 尤其是亞利桑那大學(xué)地球科學(xué)系的學(xué)科知識庫RRUFF Project[28]只登記數(shù)據(jù)集這一類資源。
大部分OAR遵循OAI-PMH協(xié)議, 能夠被專業(yè)搜索引擎收錄, 拓寬了資源的檢索途徑[29]。OAI-PMH協(xié)議支持OAR資源的元數(shù)據(jù)共享和互操作, 增強了系統(tǒng)的互操作性。Open DOAR中資源環(huán)境領(lǐng)域有133個 (占比68.2%) OA R提供OA I-PMH接口的鏈接地址, 支持用戶通過OAI-PMH協(xié)議獲取倉儲中資源的元數(shù)據(jù)內(nèi)容;而31.8%的OAR不提供OAI-PMH接口的鏈接地址, 其登記的開放資源的使用和獲取權(quán)利在具體每個OAR的服務(wù)平臺中都有相應(yīng)的政策和說明。
OAR登記資源的持續(xù)更新, 能保證系統(tǒng)的持久性, 推動倉儲的積極增長和發(fā)展。Open DOAR中OAR的元數(shù)據(jù)中資源量字段的信息2—4周更新一次[7]。從對2012—2017年發(fā)生數(shù)據(jù)更新的OAR數(shù)量來看, 2017年有153個資源環(huán)境領(lǐng)域OAR登記的學(xué)術(shù)資源進(jìn)行了數(shù)據(jù)更新, 2015—2017年有91.8%的OAR對登記數(shù)據(jù)進(jìn)行了更新, 有4個 (占比2.1%) OAR沒有提供數(shù)據(jù)更新年份。通過對數(shù)據(jù)更新情況的分析, 認(rèn)為資源環(huán)境領(lǐng)域OAR對機構(gòu)新增的開放學(xué)術(shù)資源進(jìn)行持續(xù)收集和存儲, 是開放學(xué)術(shù)資源建設(shè)比較可靠的數(shù)據(jù)源。
總體來看, 資源環(huán)境領(lǐng)域OAR登記期刊論文、學(xué)位論文、數(shù)據(jù)集等多種類型資源, 在數(shù)量上已有一定規(guī)模并且持續(xù)更新, 大部分倉儲通過提供OAI-PMH接口支持用戶對開放資源元數(shù)據(jù)信息的獲取。
目前, 國內(nèi)缺乏對資源環(huán)境領(lǐng)域開放學(xué)術(shù)資源的系統(tǒng)化發(fā)現(xiàn)、組織和利用實踐, 本文對Open DOAR中資源環(huán)境領(lǐng)域OAR的分析研究發(fā)現(xiàn), 該領(lǐng)域開放學(xué)術(shù)資源分布在195個OAR中, 除期刊論文外, 還有許多其他類型資源, 開放資源在數(shù)量上也具有一定規(guī)模, 雖然可以免費使用, 但因存儲分散, 使得科研人員沒有時間和精力去查找和利用。因此, 面對上述問題, 結(jié)合學(xué)科領(lǐng)域特色, 有針對性地進(jìn)行開放學(xué)術(shù)資源建設(shè), 對不同來源開放學(xué)術(shù)資源進(jìn)行系統(tǒng)化集成, 能夠提升開放學(xué)術(shù)資源的利用價值, 為科研人員提供資源保障和服務(wù)。本文結(jié)合分析結(jié)果, 針對資源環(huán)境領(lǐng)域開放學(xué)術(shù)資源的建設(shè)提出相關(guān)建議。
經(jīng)過長期發(fā)展, 開放獲取的范疇得到延伸, 開放學(xué)術(shù)資源包括期刊論文、圖書、科技報告、科學(xué)數(shù)據(jù)、學(xué)位論文等各種類型。資源環(huán)境領(lǐng)域的開放學(xué)術(shù)資源建設(shè)有必要對OAR中登記的各種類型開放學(xué)術(shù)資源進(jìn)行整合, 另外, 資源環(huán)境領(lǐng)域在科研過程的觀測和實驗中產(chǎn)生大量的科學(xué)數(shù)據(jù)資源, 而本文研究的Open DOAR中有14個OAR在不同程度上登記了科學(xué)數(shù)據(jù)資源, 因而在資源建設(shè)中應(yīng)突出開放科學(xué)數(shù)據(jù)資源的集成和保障。OAR中登記的開放資源畢竟有限, 為保障該領(lǐng)域開放學(xué)術(shù)資源的建設(shè)的全面性, 可從OAR登記的資源類型出發(fā), 按類型調(diào)研和補充其他來源的開放資源。
資源環(huán)境領(lǐng)域有195個OAR, 在該領(lǐng)域開放資源建設(shè)工作中如何遴選和收集所有來源的開放資源非常關(guān)鍵。從本文分析的OAR基本情況和資源特征看, 可從國家分布、語言分布、OAR類型、資源數(shù)量、資源類型、更新頻率、互操作性等特征出發(fā), 確立遴選OAR的標(biāo)準(zhǔn)和優(yōu)先順序。本文對OAR中開放資源遴選的方法提出兩種建議:一是優(yōu)先收集和整合以英語語言存儲開放資源、登記資源數(shù)量較多、更新頻率快、提供OAI-PMH接口的OAR中的開放資源;二是可僅從資源類型出發(fā), 優(yōu)先對OAR中某一類型資源實施全部收集和保障, 如優(yōu)先收集該領(lǐng)域中存儲期刊論文的151個OAR中的期刊論文資源, 再依次收集和保障其他類型的資源。
權(quán)所有©:上海陽合儲運
專業(yè)承接上海倉庫租賃、上海倉儲配送物流、上海電商倉儲企業(yè)服務(wù)與微笑同在"的先進(jìn)理念不斷發(fā)展壯大。