中文分詞和TF-IDF
- 威海搜索引擎工作原理 威海中文分詞,TF-IDF
- 1350
中文分詞(Chinese Word Segmentation)指的是將一個漢字序列切分成一個一個單獨的詞。中文分詞是文本挖掘的基礎(chǔ),對于輸入的一段中文,成功的進行中文分詞,可以達到電腦自動識別語句含義的效果。TF-IDF(term frequency–inverse document frequency)是一種用于信息搜索和信息挖掘的常用加權(quán)技術(shù)。在搜索、文獻分類和其他相關(guān)領(lǐng)域有廣泛的應(yīng)用。TF-
Public @ 2016-02-22 16:12:36