求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

自定义词典查看源代码讨论查看历史

跳转至: 导航搜索
  自定义词典

自定义词典即标准词典中没有但作者又希望拼写检查能够作为正确单词接受的单词的列表。是Word中的一个功能。

简介

第1步,打开Word2010文档窗口,依次单击“文件”→“选项”命令。第2步,在打开的“Word选项”对话框中切换到“校对”选项卡,并单击“自定义词典”按钮。第3步,打开“自定义词典”对话框,在词典列表中选中Word2010默认的自定义词典Custom.dic,并单击“编辑单词列表”按钮。第4步,打开Custom.dic对话框,在“单词”编辑框中输入需要添加的单词,并单击“添加”按钮。如果需要删除自定义词典中的单词,可以在选中目标单词后单击“删除”按钮。完成编辑后连续单击“确定”按钮返回Word2010文档窗口。

评价

HanLP的核心词典训练自人民日报2014语料,语料不是完美的,总会存在一些错误。这些错误可能会导致分词出现奇怪的结果,这时请打开调试模式排查问题:(本文作者FontTian注:在本文动笔前,原词典一进变为了9970万版本的最大中文语料。但是词典说明中原作者没改)用户自定义词典采用AhoCorasickDoubleArrayTrie和二分Trie树储存,其他词典采用基于双数组Trie树(DoubleArrayTrie)实现的AC自动机AhoCorasickDoubleArrayTrie。关于一些常用数据结构的性能评估,请参考wiki。[1]

参考文献