自定義詞典檢視原始碼討論檢視歷史
自定義詞典 |
自定義詞典即標準詞典中沒有但作者又希望拼寫檢查能夠作為正確單詞接受的單詞的列表。是Word中的一個功能。
簡介
第1步,打開Word2010文檔窗口,依次單擊「文件」→「選項」命令。第2步,在打開的「Word選項」對話框中切換到「校對」選項卡,並單擊「自定義詞典」按鈕。第3步,打開「自定義詞典」對話框,在詞典列表中選中Word2010默認的自定義詞典Custom.dic,並單擊「編輯單詞列表」按鈕。第4步,打開Custom.dic對話框,在「單詞」編輯框中輸入需要添加的單詞,並單擊「添加」按鈕。如果需要刪除自定義詞典中的單詞,可以在選中目標單詞後單擊「刪除」按鈕。完成編輯後連續單擊「確定」按鈕返回Word2010文檔窗口。
評價
HanLP的核心詞典訓練自人民日報2014語料,語料不是完美的,總會存在一些錯誤。這些錯誤可能會導致分詞出現奇怪的結果,這時請打開調試模式排查問題:(本文作者FontTian註:在本文動筆前,原詞典一進變為了9970萬版本的最大中文語料。但是詞典說明中原作者沒改)用戶自定義詞典採用AhoCorasickDoubleArrayTrie和二分Trie樹儲存,其他詞典採用基於雙數組Trie樹(DoubleArrayTrie)實現的AC自動機AhoCorasickDoubleArrayTrie。關於一些常用數據結構的性能評估,請參考wiki。[1]