一夲道中文无码av免费看|无码中文字幕av免费放∨|欧美乱人伦视频中文字幕|亚洲日韩色欧另类欧欧美

<small id="iw7nw"></small>

<li id="iw7nw"><th id="iw7nw"><pre id="iw7nw"></pre></th></li>

<bdo id="iw7nw"></bdo>

首頁 > 科技 > 互聯(lián)網(wǎng) > 正文

如何用機器學習算法提高全文檢索準確性

文章來源：IT經(jīng)理網(wǎng)

字體：大中小

發(fā)布時間：2016-09-06 14:34:18

全文本檢索是大多數(shù)web開發(fā)者日常工作中都會面對的常見而棘手的問題，通常也是你的客戶或者老板對你咆哮的原因。最簡單的，你可以在MySQL中建立全文本索引并使用類似“MATCH() … AGAINST()” 這樣的查詢語句來滿足小規(guī)模數(shù)據(jù)庫查詢需求。

但是當數(shù)據(jù)庫中的記錄成千上萬地增加時，以上方法實現(xiàn)的全文本檢索性能將急劇下滑，數(shù)據(jù)庫響應開始變得遲緩。這表明MySQL并不是一個理想的全文本檢索引擎，這時候你應該切換到檢索準確性和效率更高的ElasticSearch上了，并部署一個基于Lucene的全文本檢索集群來實現(xiàn)高性能。

你可能會奇怪為什么Lucene的全文檢索性能和準確性如此優(yōu)異，機器學習領域?qū)＜褺urak Kanber在一篇博客中為我們詳盡剖析了全文本檢索背后的概念，并且對TF-IDF（詞頻-逆文檔頻率）和當今最優(yōu)秀的全文檢索算法Okapi-25的原理和實現(xiàn)進行了代碼級的闡釋，推薦大家參考學習。

首頁推薦

6月去哪兒玩？快看這些初夏好去處！

初夏時分，陽光充沛溫暖，天...

熱門圖片

24小時熱門資訊

24小時論壇熱帖

新聞熱點

250名困難傷殘人士受到幫助

2017-08-17 10:36:42

山東省婦聯(lián)主席邢善萍赴萊蕪慰問維和犧牲軍人楊樹朋遺孀

2016-07-25 17:06:02

顏莊桂云廣場舞萊蕪廣寒宮杯廣場舞初賽

2016-08-01 14:58:09

萊蕪蓮花山

2016-07-19 13:02:28

萊蕪奇石愛好者-馮文松

2016-07-23 09:38:13

一夜暴雨致萊蕪個別村莊被淹水位漫過膝蓋

2016-07-25 17:04:24

新聞爆料

圖片精選

點擊排行