一夲道中文无码av免费看|无码中文字幕av免费放∨|欧美乱人伦视频中文字幕|亚洲日韩色欧另类欧欧美

  1. <li id="iw7nw"><th id="iw7nw"><pre id="iw7nw"></pre></th></li>
    <bdo id="iw7nw"></bdo>
  2. 首頁 > 科技 > 互聯(lián)網(wǎng) > 正文

    如何用機器學習算法提高全文檢索準確性

    文章來源:IT經(jīng)理網(wǎng)
    字體:
    發(fā)布時間:2016-09-06 14:34:18

    移動警務大數(shù)據(jù)-1

    全文本檢索是大多數(shù)web開發(fā)者日常工作中都會面對的常見而棘手的問題,通常也是你的客戶或者老板對你咆哮的原因。最簡單的,你可以在MySQL中建立全文本索引并使用類似“MATCH() … AGAINST()” 這樣的查詢語句來滿足小規(guī)模數(shù)據(jù)庫查詢需求。

    但是當數(shù)據(jù)庫中的記錄成千上萬地增加時,以上方法實現(xiàn)的全文本檢索性能將急劇下滑,數(shù)據(jù)庫響應開始變得遲緩。這表明MySQL并不是一個理想的全文本檢索引擎,這時候你應該切換到檢索準確性和效率更高的ElasticSearch上了,并部署一個基于Lucene的全文本檢索集群來實現(xiàn)高性能。

    你可能會奇怪為什么Lucene的全文檢索性能和準確性如此優(yōu)異,機器學習領域?qū)<褺urak Kanber在一篇博客中為我們詳盡剖析了全文本檢索背后的概念,并且對TF-IDF(詞頻-逆文檔頻率)和當今最優(yōu)秀的全文檢索算法Okapi-25的原理和實現(xiàn)進行了代碼級的闡釋,推薦大家參考學習。

    發(fā)表評論 共有條評論
    用戶名: 密碼:
    驗證碼: 匿名發(fā)表