首页 | 网站地图
首页 > 語言文字 > 中文文本自動分詞和標注

中文文本自動分詞和標注


图书基本信息
出版时间:2000-1
出版时间:商務印書館
作者:劉開瑛
页数:286
书名:中文文本自動分詞和標注
封面图片
中文文本自動分詞和標注
内容概要
  《中文文本自動分詞和標注》介紹了信息處理用現代漢語分詞詞表的收詞原則和方法,《信息處理用現代漢語分詞規範》設計原則及規範內容,中文文本歧義切分技術等內容。
书籍目录
第1章 自動分詞是中文信息處理的基礎工程 第一節 分詞的重要性及其主要目標 第二節 自動分詞中存在的主要問題第2章 《信息處理用現代漢語分詞規範》設計原則及規範內容 第一節 國際《分詞規範》的簡介與評述 第二節 《資訊處理用中文分詞規範》的基本架色第3章 信息處理用現代漢語分詞詞表的收詞原則和方法 第一節 研制《分詞詞表》的原則和有關問題 第二節 分詞詞表的選詞方法第4章 中文文本歧義字段切分技術 第一節 歧義字段的類別和采集方法 第二節 交集型歧義字段處理技術 第三節 多義型歧義字段分類及其處理技術第5章 中國姓名和未登錄新詞語的自動辨識 第一節 中國姓名的自動識別技術 第二節 未登錄新詞語的自動識別技術第6章 中國地名、組織機構名稱和英譯名的自動辨識 第一節 中國地名自動識別技術 第二節 中文機構名稱的識別與分析 第三節 英語譯名的自動辨識第7章 漢語詞性自動標注技術 第一節 詞性標注的意義和主要難點 第二節 信息處理用現代漢語詞類及標記集 第三節 語料庫詞類自動標注算法研究 第四節 基于規則的詞性標注方法第8章 漢語詞義自動標注技術第9章 漢語自動分詞軟件系統附錄1 信息處理用現代漢語分詞規範(GB13715)附錄2 信息處理用現代漢語詞類及標記集參考文獻
PDF格式资源下载

 

 

爬虫代理IP   代理IP   好用代理IP   推荐代理IP   百变IP  


 
社會科學 PDF/TXT下载|社科圖書网 @ 2018