首页 | 网站地图
首页 > 圖書館學檔案學 > 網絡信息分類

網絡信息分類


图书基本信息
出版时间:2008-12
出版时间:科學出版社
作者:施國良
页数:152
书名:網絡信息分類
封面图片
網絡信息分類
前言
  隨著網絡信息的迅猛發展,龐大的網絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網絡信息組織中應用的理論與實踐問題。信息量的迅速增長與人們對信息的特定需求是人們學習、工作和生活中的一對矛盾。只有研究網絡信息資源的現狀與特征,找到網絡信息資源組織的規律,才能從根本上解決這一矛盾,為人們方便、快捷地利用網絡信息提供一個理想的途徑。  正是在這樣的背景下,本書首先從搜索引擎的不足之處出發,對分類法、分面分類法、網絡信息組織、數據庫等相關領域進行文獻調查;其次運用實驗方法對實物、服務和網絡文獻三個類型的網絡信息進行分面分析;再次選擇其中的實物類型進行概念設計、邏輯設計和物理設計;最後建立一個簡單的分面分類網絡應用模型,並將這個模型初步應用于上海寶山鋼鐵股份有限公司(以下簡稱寶鋼公司),旨在建立一個基于工藝和流程的企業知識組織系統。這個系統的底層正是分面數據庫。設計系統模型的參數為︰開源服務器Apache 2.O.50,開源數據庫5.O,服務器端腳本為PHP 5.2.4,瀏覽器端使用AJAX技術實現無刷新更新數據功能,從而基本上適應了分面分類法的應用原理。  本書的觀點是︰搜索引擎的局限性決定了僅僅依靠特性檢索方式無法解決用戶個性化的信息需求問題;枚舉式分類法用于指導實物排架的功能特性決定了其無法根本解決網絡信息激增所帶來的網絡信息組織問題;分面分類法並不能簡單地等同于阮岡納贊的冒號分類法,網絡上應用分面分類法必須遵循嚴謹的分面分析過程;網絡既為分面分類法的復甦提供了廣闊的應用舞台,也為分面分類法再次興起提供了強大的技術支持。  本書的結構為︰第1章,主要從網絡信息資源的現狀出發,分析目前網絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網絡信息組織尤其是網絡信息分類的理論與實踐進行評述,讓讀者對與本書有關的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網絡信息進行組織的可能性;第5∼7章,主要通過實驗的方法將分面分類法具體應用于網絡信息組織;第8章,作為案例,對寶鋼公司做了基于業務和流程的分面分類系統模型的介紹;第9章,主要討論分面分類法網絡應用的一些拓展問題;第10章,主要是概括全書的結論,並粗略地勾勒了未來的一些研究方向。
内容概要
隨著網絡信息的迅猛發展,龐大的網絡信息資源和人們特定的信息需求之間形成了巨大的矛盾。在此背景下,本書專門討論了分面分類法在網絡信息組織中應用的理論與實踐問題。首先,本書分析了網絡信息組織面臨的問題;其次,專門論述了分面分類法的原理、特征和獨特的性能及其用于網絡信息組織的長處、必要性和可能性;再次,詳細討論了分面分類法應用于網絡信息組織的基本技術特點、過程和方法,並結合實例說明其可操作性,使讀者既對網絡信息組織的特殊性有一個完整的了解,又對分面分類法的具體應用有了感性的認識;最後,將理論、技術與實踐相結合,用實驗的方法將分面分類法應用于網絡信息組織,並結合一個案例做了具體的說明。本書集原理和應用于一體,語言深入淺出,通俗易懂,並配有必要的圖表,具有較強的可讀性。  本書適合作為高等院校圖書情報類和信息管理類專業各層次學生的教學參考書和補充讀物,也可作為各類信息資源管理部門(包括政府部門和科研機構)工作人員、眾多網絡公司工作人員以及廣大計算機與網絡愛好者的參考書。
书籍目录
前言第1章 绪论  1.1 网络信息资源的现状与特征  1.2 网络信息资源组织的问题  1.3 搜索引擎的现状与问题  1.4 本书的框架结构与写作目的第2章 网络信息分类研究进展评述  2.1 关于分面分类研究  2.2 关于网络信息组织的研究  2.3 与网络信息分类有关的技术问题的研究第3章 网络信息分类的基本原理  3.1 分类问题的起源  3.2 从人类基本的思维方式看族性检索的重要性  3.3 对分类过程、性质与目的的探讨有助于认识分类的基本原理  3.4 对分类法种类的探讨有助于认识网络信息分类的基本原理  3.5 枚举式分类法对网络的尝试  3.6 网络信息分类的特殊性  3.7 小结第4章 分面分类法与网络信息组织  4.1 分面分类法的特征  4.2 网络信息组织应用分面分类法的标准  4.3 网络信息分面分类法的编制  4.4 小结第5章 网络分面分类系统概念模型设计  5.1 概述  5.2 实物类  5.3 服务类  5.4 电子文献类第6章 网络分面分类系统逻辑模型设计  6.1 逻辑模型概述  6.2 逻辑模型的设计第7章 网络分面分类系统物理模型设计  7.1 概述  7.2 数据结构的设计  7.3 访问方法的设计  7.4 数据存放位置的设计  7.5 系统配置的设计  7.6 用户界面设计第8章 案例研究——宝钢公司分面分类系统设计  8.1 案例背景  8.2 分面本体的设计  8.3 宝钢公司信息知识系统的物理设计与开发  8.4 小结第9章 网络信息分类的拓展  9.1 分面分类法网络应用中的两个问题  9.2 数据库模型的选择  9.3 用户界面设计问题第10章 结束语  10.1 研究结论  10.2 分类研究的局限性  10.3 未来的研究方向主要参考文献附录A 缩略语与全称对照表附录8 部分XM1数据库代码  B1  DTD模式  B2  XSD1    B3  数据表(部分)
章节摘录
  互聯網出現後,搜索引擎是一種重要的網絡信息檢索工具,它讓用戶鍵人關鍵詞,然後到數據庫中去匹配。不同于學科目錄,搜索引擎不用人工索引員來編制索引,而是通過軟件來自動生成包含網頁的數據庫。概括說來,搜索引擎的工作原理包括三個部分︰一是用某種程序,如“網絡爬蟲”(crawler),來收集眾多的網頁內容;二是以某種利于高效檢索的方式(如標引)組織這些網頁,形成數據庫;三是接受查詢,並用某種排序軟件進行排序,並輸出結果。  第一,爬蟲負責跟蹤網絡,以廣度優先或深度優先的方法從Web上下載頁面,按照鏈接從一個網站到另一個網站。不同的搜索引擎有不同的爬蟲,有的遍歷所有網站,有的則根據自己的標準選擇一些流行的網站遍歷。前者返回的結果量很大,而後者會返回更加相關的結果,速度也更快。  第二,爬蟲返回的每一個頁面都存放在一個數據庫中,對下載頁面的內容進行分析以用于索引,具體包括分詞、過濾、轉換等工作;然後將文檔表示為一種便于檢索的方式並存儲在索引數據庫中,一般采用的方法有矢量空間模型、倒排文檔、概率模型等;並通過自動抽詞和字順排列編制好索引。索引是每一個有效詞的列表,並有一個相應的指針指向它在數據庫中的位置。  第三,實現用戶查詢關鍵詞和目標文檔匹配度的計算,根據計算結果所有符合查詢要求的頁面URL按照相關度遞減的順序排列,並返回給用戶;用戶接口為用戶提供一個輸入查詢請求,定制查詢結果的Web頁面並將查詢結果格式化後返回給瀏覽器。同樣,不同的搜索引擎會遵循不同的原則︰有的標引爬蟲返回頁面中每一個單個的詞,有的只標引標題或短語。搜索引擎的第三個要素是搜索軟件。該軟件將用戶鍵人的提問關鍵詞與索引進行比較,發現匹配的結果並按照相關度進行排序。相關度排序標準依不同的搜索引擎而不同。  不同的搜索引擎所使用的爬蟲和標引方法會導致不同的結果。這就是為什麼在不同的搜索引擎中鍵入相同的關鍵詞會得到不同的結果。而且,由于這樣的操作方式,使得搜索引擎會返回較分類目錄更全面更專業的結果。這是因為它們搜索整個網頁而非網站的頂層頁面,使用的索引也是自動生成的,而非向分類目錄那樣使用預先生成的索引。
编辑推荐
  《網絡信息分類︰原理與應用》的第1章,主要從網絡信息資源的現狀出發,分析目前網絡信息組織與檢索存在的問題,從而引出全書的研究問題;第2章,主要對目前網絡信息組織尤其是網絡信息分類的理論與實踐進行評述,讓讀者對與《網絡信息分類︰原理與應用》有關的研究有一個簡要的了解;第3章,主要在理論上探討用分面分類法對網絡信息進行組織的必要性;第4章,主要在理論上探討用分面分類法對網絡信息進行組織的可能性;第5∼7章,主要通過實驗的方法將分面分類法具體應用于網絡信息組織;第8章,作為案例,對寶鋼公司做了基于業務和流程的分面分類系統模型的介紹;第9章,主要討論分面分類法網絡應用的一些拓展問題;第10章,主要是概括全書的結論,並粗略地勾勒了未來的一些研究方向。
PDF格式资源下载

 

 


 
社會科學 PDF/TXT下载|社科圖書网 @ 2018