求真百科歡迎當事人提供第一手真實資料，洗刷冤屈，終結網路霸凌。

全文檢索查看源代码讨论查看历史

跳转至：导航、搜索

全文檢索
圖片來自tcc

全文檢索從文本或資料庫中，不限定資料欄位，自由地萃取出訊息的技術。^[1]

執行全文檢索任務的程式，一般稱作搜尋引擎，它將使用者隨意輸入的文字，試圖從資料庫中，找到符合的內容。

目录

1 全文索引的相關議題
2 演算法、搜尋策略之模型
3 評量之準則
4 開放原始碼之全文檢索系統
5 和中文有關的議題
6 優化
7 歷史及未來之趨勢
8 參考文獻

全文索引的相關議題

語根處理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
斷詞/分詞 word segmentation
倒排索引;反向索引- inverted index

演算法、搜尋策略之模型

布林式 boolean
統計模型 Probabilistic model
向量空間模型 vector base model
隱性語義模型 Latent semantic model

評量之準則

查全率(recall rate)，查準率(precision)

開放原始碼之全文檢索系統

和中文有關的議題

斷詞
語法解析
古籍議題
多語言混合

優化

剔除字(Stopwords)
詞性標註
-规范文件;權威檔-(authority file)
知識體系，本體論(ontology)
超連結分析(page rank)技術

歷史及未來之趨勢

自由語句搜尋

參考文獻

↑ 全文檢索，tcc

取自“https://pediainside.com/index.php?title=全文檢索&oldid=3128725”

020 圖書資訊學總論