上海財(cái)經(jīng)大學(xué)以開源框架為基礎(chǔ),以私有云建設(shè)為核心,極大豐富和拓展了傳統(tǒng)文檔管理的內(nèi)涵。
在當(dāng)前國(guó)內(nèi)高校的數(shù)字化建設(shè)中,文檔是其中非常重要的部分,包括各種辦公文檔、電子表格、教學(xué)資源課件、科研成果、課堂圖片影像等文檔資料在各高校的發(fā)展建設(shè)中至關(guān)重要。文檔數(shù)量與容量的快速增長(zhǎng),給傳統(tǒng)服務(wù)器帶來了挑戰(zhàn)。
隨著云技術(shù)的發(fā)展,私有云存儲(chǔ)成為學(xué)校校園數(shù)字化建設(shè)中文檔管理的最佳選擇。它能夠有效控制數(shù)據(jù)及其安全性,可根據(jù)自己的需求特點(diǎn),部署特定的安全策略,還能與學(xué)校的教學(xué)系統(tǒng)平臺(tái)等第三方資源進(jìn)行整合。我們將該私有云存儲(chǔ)系統(tǒng)部署在安全數(shù)據(jù)托管中心,當(dāng)學(xué)校師生訪問該資源時(shí),不會(huì)受到網(wǎng)絡(luò)不穩(wěn)定等因素的影響,能提供較高的服務(wù)質(zhì)量。另外相對(duì)公有云而言成本較低,可免費(fèi)給學(xué)校師生提供長(zhǎng)期服務(wù),在部署方式上也更為靈活,能更好地適應(yīng)學(xué)?,F(xiàn)有的軟硬件架構(gòu)體系。
『 校園網(wǎng)現(xiàn)有文檔管理現(xiàn)狀 』
上海財(cái)經(jīng)大學(xué)現(xiàn)有院系及某些部門機(jī)構(gòu)的文檔管理一般分兩種模式,一種即原始的通過FTP文件服務(wù)器進(jìn)行管理,在安全管理及多用戶協(xié)作方面存在問題。另一種是部署SVN等服務(wù)器,可對(duì)文檔進(jìn)行多版本管理和多用戶的協(xié)同操作,但是缺少在移動(dòng)辦公、即時(shí)溝通、隨時(shí)分享等方面的功能,也不能根據(jù)學(xué)?,F(xiàn)有的組織架構(gòu)進(jìn)行分配,建立靈活的教學(xué)科研等項(xiàng)目小組。而且這種版本控制軟件比較專業(yè),在使用規(guī)模上難以大規(guī)模推廣,很多教師學(xué)生需要一個(gè)直觀且容易使用的平臺(tái),來滿足各種文檔管理的需要。
『 校園“云”協(xié)作總體構(gòu)思方案 』
針對(duì)以上問題,我們?cè)谏虾X?cái)經(jīng)大學(xué)校園網(wǎng)文檔管理中設(shè)計(jì)了新的解決方案,提出私有云協(xié)作的概念。它是一個(gè)文件協(xié)作管理系統(tǒng),通過整合組織架構(gòu)和靈活的項(xiàng)目小組,給學(xué)校師生提供一個(gè)以文件為中心的工作學(xué)習(xí)協(xié)作平臺(tái)。
從圖1可以看出,我們?cè)O(shè)計(jì)的系統(tǒng)支持多類型終端,包括網(wǎng)頁、iOS與Android移動(dòng)終端APP、PC客戶端和微信企業(yè)號(hào)。實(shí)現(xiàn)了任何時(shí)間、任何地點(diǎn)、任意終端的接入訪問。其中網(wǎng)頁主要提供文檔管理與查看、信息溝通和系統(tǒng)管理功能;PC客戶端提供了文件同步上傳和下載功能;移動(dòng)終端APP提供文件查看和共享、信息溝通;微信企業(yè)號(hào)提供信息推送和文件瀏覽功能。上述文檔包含了所有歷史版本信息,哪個(gè)用戶什么時(shí)候修改的,相關(guān)用戶都能方便地進(jìn)行查閱。
我們建設(shè)的私有云文檔協(xié)作系統(tǒng)整合了組織架構(gòu)和項(xiàng)目小組的協(xié)作模型,提供了高效便捷的文件共享與工作協(xié)同。該系統(tǒng)本身提供了全方位的安全保障機(jī)制,數(shù)據(jù)的傳輸和存儲(chǔ)采用了高級(jí)數(shù)據(jù)加密技術(shù),防止數(shù)據(jù)泄密。實(shí)現(xiàn)了多級(jí)細(xì)粒度權(quán)限控制,按需保護(hù)數(shù)據(jù)??梢暬奈臋n工作區(qū)權(quán)限依次分為:公共空間-我的院系部門-負(fù)責(zé)及參與的小組-個(gè)人空間等多種形態(tài),幫助學(xué)校打造專屬的可控文檔管理中心。不同的院系部門和項(xiàng)目小組有自己獨(dú)立隔離的文件協(xié)作空間,可由各級(jí)指定負(fù)責(zé)人來管理上述每個(gè)工作區(qū)用戶的訪問權(quán)限。
如圖2所示,我們將私有云文檔協(xié)作系統(tǒng)按功能分成了五個(gè)模塊:File Management(文檔管理),F(xiàn)ile Sharing(文檔共享),F(xiàn)ile Collaboration(文檔協(xié)作),F(xiàn)ile synchroniztion(文檔同步)和System management(系統(tǒng)管理)。這五個(gè)核心功能模塊在上述四種客戶端中都有設(shè)計(jì)實(shí)現(xiàn),但側(cè)重點(diǎn)不同,如網(wǎng)頁端側(cè)重全面整體的功能,移動(dòng)端APP側(cè)重信息的瀏覽和分享等。
1.文檔管理包括了文件上傳、文件下載、在線預(yù)覽、全文搜索、文件管理、版本控制等功能。其中版本控制會(huì)對(duì)系統(tǒng)中所有文檔進(jìn)行版本管理,用戶可通過網(wǎng)頁端查看某文檔的所有歷史版本,包括每個(gè)版本號(hào)、修改人、修改時(shí)間,且可對(duì)每個(gè)版本進(jìn)行預(yù)覽、下載和刪除操作。同時(shí)用戶也可通過PC端的文檔版本同步工具設(shè)置本地的一個(gè)同步文件夾,設(shè)置好自動(dòng)同步的時(shí)間間隔,然后系統(tǒng)會(huì)自動(dòng)將云端的所有文檔同步到本地,如果本地文檔有修改也會(huì)自動(dòng)將本地文檔同步到云端,因此用戶只需在自己的電腦上對(duì)文檔進(jìn)行維護(hù),然后由版本同步工具自動(dòng)同步,其他用戶就可在云端查看到該用戶對(duì)此文檔的修改。另外全文搜索具有索引引擎、查詢引擎、文本分析引擎、對(duì)外接口等,不僅可以搜索文檔中的內(nèi)容,還能直接搜索圖片里的文字。我們采用了OCR文字識(shí)別,可通過字符識(shí)別方法將圖片中的正體文字翻譯成計(jì)算機(jī)文字,然后通過搜索引擎定位包含該文字的圖片。
2.文檔共享包括文件和文件夾的共享、部門及項(xiàng)目小組的共享、共享權(quán)限控制和外鏈分享等。其中文件共享是指用戶可通過網(wǎng)頁端和移動(dòng)端APP共享文件,用戶可通過網(wǎng)頁端對(duì)文檔進(jìn)行內(nèi)部分享,即分享給系統(tǒng)中公共空間(所有用戶)或指定的部門和項(xiàng)目小組;而通過移動(dòng)端APP,用戶則除了內(nèi)部還可以進(jìn)行外部分享,包括QQ、微信與郵件分享,可以很方便地將文檔分享給自己的同事、同學(xué)、好友。外鏈分享指分享人可通過外鏈方式,將私有云文檔協(xié)作系統(tǒng)中的文件進(jìn)行對(duì)外文件分享,可對(duì)外鏈的有效期、訪問密碼及下載權(quán)限進(jìn)行設(shè)置,同時(shí)也支持通過郵件分享該外鏈的URL。得到該外鏈的用戶通過訪問URL可得到下載的文檔和分享人信息,并可通過網(wǎng)頁或二維碼來進(jìn)行下載。
3.文檔協(xié)作包括任務(wù)管理、即時(shí)消息發(fā)送、基于文件的討論、通知推送等。其中通知推送指協(xié)作項(xiàng)目團(tuán)隊(duì)、部門和公共空間中的每個(gè)工作進(jìn)展(包括文檔的添加更新和成員的更新)都會(huì)推送到移動(dòng)端APP,以便相關(guān)用戶能第一時(shí)間掌握信息。同時(shí)考慮到微信的日益普及,上海財(cái)經(jīng)大學(xué)微信企業(yè)號(hào)的師生用戶數(shù)已有16000多人,普及率超過95%,因此在設(shè)計(jì)本系統(tǒng)時(shí)將通知推送功能集成到了學(xué)校的微信企業(yè)號(hào)中,通過建立消息型應(yīng)用和配置自定義菜單,在移動(dòng)端APP收到的消息通過微信同樣能接收,方便部分沒有安裝APP的用戶及時(shí)獲取消息。即時(shí)消息發(fā)送指部門和項(xiàng)目小組成員可通過在組織內(nèi)發(fā)送消息進(jìn)行交流。文檔協(xié)作系統(tǒng)管理的對(duì)象是文檔,各個(gè)用戶可通過基于文件的討論,對(duì)指定文檔進(jìn)行評(píng)論注釋,方便整個(gè)團(tuán)隊(duì)的協(xié)作管理。另外任務(wù)管理中也可添加指定的文檔,設(shè)定任務(wù)的參與者與開始結(jié)束時(shí)間等,將工作任務(wù)分配給部門及項(xiàng)目小組成員,方便成員以任務(wù)的方式來管理維護(hù)文檔。
4.文檔同步包括實(shí)時(shí)和差量同步、斷點(diǎn)續(xù)傳和文件秒傳等功能。我們根據(jù)服務(wù)器上文件的MD5標(biāo)識(shí),只要存在相同文件內(nèi)容,就可實(shí)現(xiàn)秒傳。不僅節(jié)約同步時(shí)間,也節(jié)省帶寬和存儲(chǔ)空間,因此在服務(wù)器端重復(fù)文件只保留一份。
5.系統(tǒng)后臺(tái)管理模塊包括組織架構(gòu)管理、權(quán)限角色定義、空間配額配置、審計(jì)日志和系統(tǒng)回收站等。系統(tǒng)后臺(tái)管理主要由管理員在網(wǎng)頁端進(jìn)行控制,由于我們的認(rèn)證采用與現(xiàn)有AD認(rèn)證服務(wù)器對(duì)接的方式,因此所有用戶的組織架構(gòu)信息會(huì)自動(dòng)從AD進(jìn)行同步。系統(tǒng)管理員可以對(duì)部門和項(xiàng)目小組進(jìn)行空間配額設(shè)置,各個(gè)權(quán)限角色的定義,日志的查看審計(jì)。
部署上,系統(tǒng)支持跨區(qū)域分布式云存儲(chǔ)和集群部署,在代碼層面實(shí)現(xiàn)了Node Manager和Metadata Manager,可通過系統(tǒng)配置靈活的增減系統(tǒng)的節(jié)點(diǎn)服務(wù)器,進(jìn)行負(fù)載均衡,避免單點(diǎn)故障的發(fā)生。
『 校園“云”協(xié)作的整合擴(kuò)展 』
面對(duì)大量非結(jié)構(gòu)化文檔,為了方便用戶快速搜尋到相關(guān)文件的位置,在私有云協(xié)作系統(tǒng)中,整合了文本挖掘過程中的預(yù)處理分詞技術(shù)。在具體選用中,我們選擇了IKAnalyzer這個(gè)開源的基于Java開發(fā)的輕量級(jí)中文分詞工具包,它包括IK AnalyzerForLucene接口單元、IK Segmentation主分析器、詞元處理子單元、詞典配置管理模塊和擴(kuò)展配置管理單元這幾個(gè)模塊。該工具包自帶的主詞典擁有27萬左右的漢語單詞量,且提供了通過API或IKAnalyzer.cfg.xml配置文件對(duì)詞典進(jìn)行擴(kuò)展,還可以配置自己的擴(kuò)展停止詞字典,這樣某些不用解析的字就不會(huì)體現(xiàn)在分詞結(jié)果上。
實(shí)現(xiàn)流程如圖3所示,首先實(shí)例化一個(gè)IKAnalyzer分詞器,然后建立內(nèi)存索引對(duì)象RAMDirectory,將配置寫入索引IndexWriter。在后續(xù)的搜索過程中需要實(shí)例化搜索器,最后用構(gòu)造的Query對(duì)象在搜索器中進(jìn)行搜尋,可依次搜索到相似度最高的指定條數(shù)的記錄。
圖3 搜索實(shí)現(xiàn)流程
我們還在該私有云文檔系統(tǒng)內(nèi)部集成了對(duì)學(xué)校Blackboard教學(xué)軟件平臺(tái)的支持,該平臺(tái)是以課程為中心的網(wǎng)絡(luò)教學(xué)環(huán)境,在國(guó)際國(guó)內(nèi)各高校有著廣泛的應(yīng)用。通過擴(kuò)展Blackboard的BuildingBlock,實(shí)現(xiàn)了校園教學(xué)網(wǎng)和文檔協(xié)作系統(tǒng)的整合??梢苑奖愕貙⑽臋n系統(tǒng)中的教學(xué)資源課件及課程視頻等文檔發(fā)布到教學(xué)網(wǎng)相關(guān)課程中;通過在BB中增加模板,也可將教學(xué)系統(tǒng)中的文檔同步到文檔協(xié)作系統(tǒng)中去。通過系統(tǒng)整合,既豐富了私有云文檔系統(tǒng)的內(nèi)涵,又很好地提升了我校教學(xué)網(wǎng)中師生間、院系間和學(xué)科間的交流與協(xié)作功能,提升了學(xué)校教學(xué)信息化的整體水平,同時(shí)也方便了學(xué)校和院系加強(qiáng)教學(xué)質(zhì)量監(jiān)控。
我們?cè)谡线^程中使用了Building Block開發(fā)組件,該組件可實(shí)現(xiàn)Blackboard與外部系統(tǒng)的集成。它能作為課程和用戶工具集成到課程首頁和課程用戶工具面板中,也能作為系統(tǒng)管理員工具集成到系統(tǒng)管理員面板中。組件本身基于servlet,提供可擴(kuò)展API,支持熱部署,可以方便地在當(dāng)前系統(tǒng)增加集成功能。
Blackboard整合私有云文檔協(xié)作系統(tǒng)流程如圖4所示,首先在系統(tǒng)中增加了Blackboard基礎(chǔ)庫(kù)文件(bb-cms-admin.jar,bb-platform.jar和bb-taglibs.jar等)。隨后配置bb-manifest.xml,該文件是Building block的描述文件,配置接入的文檔協(xié)作系統(tǒng)名稱、整合頁面文件索引、組件類型等信息。在整合頁面中,我們添加了文件同步等功能,方便用戶操作。最后需導(dǎo)出該整合項(xiàng)目的jar包,由系統(tǒng)管理員在管理頁面中完成該jar包的安裝。
圖4 Blackboard整合私有云文檔協(xié)作系統(tǒng)流程
BuildingBlock組件還與外部系統(tǒng)間架設(shè)了橋連接,反過來也實(shí)現(xiàn)了通過調(diào)用Web服務(wù)在文檔協(xié)作系統(tǒng)中來引入Blackboard內(nèi)容。
經(jīng)過私有云文檔協(xié)作系統(tǒng)的建設(shè)和投入使用,學(xué)校人事處及科研處等職能部門與院系已經(jīng)將文檔管理的任務(wù)放在了本系統(tǒng)中,通過配置文檔工作區(qū)權(quán)限,將部門及全校公開文檔分別設(shè)置,相關(guān)人員可方便地在自己空間中查詢到對(duì)應(yīng)文檔,比之前單一通過文件服務(wù)器來管理的模式要方便有效得多。在本系統(tǒng)中我們已經(jīng)整合了文本挖掘技術(shù),整合了教學(xué)軟件平臺(tái)及移動(dòng)微信企業(yè)號(hào)功能,之后將會(huì)把它進(jìn)一步推廣成一個(gè)綜合的文檔協(xié)作管理平臺(tái),所有的文檔都能在系統(tǒng)中進(jìn)行操作和管理。學(xué)校師生如要查詢或打印文檔,查詢教學(xué)課件視頻或固定設(shè)備資產(chǎn)明細(xì),閱讀相關(guān)制度規(guī)則等都可在本系統(tǒng)內(nèi)完成,而不像之前各個(gè)分離的文檔信息孤島,要到特定系統(tǒng)中的某個(gè)位置才能查詢到指定文檔。
上海財(cái)經(jīng)大學(xué)以開源框架為基礎(chǔ),以私有云建設(shè)為核心,極大豐富和拓展了傳統(tǒng)文檔管理的內(nèi)涵,在校園網(wǎng)絡(luò)環(huán)境下給學(xué)校師生提供了更便捷的文檔服務(wù)。
(作者單位為上海財(cái)經(jīng)大學(xué)教育技術(shù)中心)
— — END — —
聯(lián)系客服