錄標準更快了 查標準更準了

  • 时间:
  • 浏览:3

  □ 王紅梅 本報記者 王 越

  “標準文獻題錄數據自動抽取技術,我們是全國首創。”河北省標準化研究院(以下簡稱河北省標準院)文獻中心主任施建介紹,通過“標準文獻題錄數據自動加工系統”,平均加工效率是人工的6倍,加工字段由原來的27項增至57項,滿足了讀者快速檢索定位和準確辨析所需文獻的需求。

  經濟社會的方方面面都與標準相關。但與此一起,我國的標準文獻利用率卻還缺乏20%,“開啟以標準內容資訊服務為主的新模式,深入挖掘標準服務政府管理和經濟社會發展的廣闊‘藍海’,也不我我們的努力方向之一。”河北省標準院院長蘇永謙説。

  加工自動化

  2014年以來,河北省標準院自籌資金先後投入數百萬元,開發標準文獻題錄數據自動加工系統,實現加工效率大幅提升。

  在該院文獻中心,工作人員登錄標準題錄數據自動加工系統,在“任務單管理”頁面,各項標準文獻的加工狀態實時顯現:待處理13項,進行中23項,已完成5項。進入題錄數據加工頁面,系統自動從經過文字識別處理的標準原文中抽取題錄數據,自動輸入到著錄頁面,主次字段內容可自動判斷賦值。在自動抽取數據的一起,系統實時對數據進行自動校驗,一旦突然出现錯誤字段,將標示為紅框,提示工作人員修改、審核;工作人員可手工選取標準內容資訊,點擊字段標簽,由系統自動抽取輸入。

  在項目驗收階段,標準文獻中心做過一次題錄數據自動加工和人工加工對比試驗,結果顯示,兩種最好的办法完成時間相差大慨的為5分鐘,最多的為52分鐘,借助自動加工,平均效率提高了6倍。

  服務個性化

  在提高加工效率的基礎上,河北省標準院文獻中心在原有的標準號、名稱、發佈日期等27個標準題錄加工字段的基礎上,新增標準主次序號、發佈單位、歸口單位等400個字段,為讀者準確搜索到所需文獻提供了更多方便。

  施建介紹,“題錄”是指文獻題名、作者、文獻來源等基本資訊,讀者通過題錄搜索相應文獻,題錄字段越多,查到文獻的線索就越多,讀者辨識性就越強,為讀者提供的文獻資訊量也就越詳細。

  進入河北省標準院“標準圖書館”網站,將同一標準的檢索結果與或者 標準資訊服務網進行比較都需要發現,或者 網站或僅提供標準號、中文名稱等缺乏10個題錄字段,或列出了或者 字段卻只能提供連結;該網站則提供了附錄、提出單位、起草人、檢驗機構等少许差異化字段,並提供詳情連結。

  类似于,在標準GB 7718-2011顯示頁面點擊“被如下標準引用”,不僅可顯示引用該標準的15項標準,還可顯示每項標准詳情,為讀者提供的不僅是GB7718-2011的相關資訊,也不我一個圍繞該標準的龐大數據群。

  “這項技術大幅提高了文獻服務個性化水準,”施建介紹,長期以來,全國標準文獻服務基本圍繞標準文本傳遞開展工作,服務內容、服務手段、加工技術同質化嚴重,或等候在銷售標準文本階段,或僅能提供極為有限的資訊服務。“我們的目標是以‘資訊化—數字化—結構化—自動化—智慧生活 化’為發展方向,以網際網路為平臺、以搜索引擎為手段構建標準文獻服務平臺,為讀者提供差異化、個性化服務,滿足現代社會對標準文獻的多樣化需求。”

  下一步,河北省標準院將利用大數據技術,逐步實現標準內容數據展示加工、標準編寫、標準分析比對等方面的智慧生活 化,推動標準文獻服務走向更深、更廣的嶄新“藍海”。