欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

全文索引 排名計算問題

系統(tǒng) 1740 0

排名計算問題

計算排名的過程,取決于一系列因素。不同語言的斷字符對文本進行的詞匯切分也不同。例如,字符串“dog-house”可以被一種斷字符斷為“dog”和“house”而被另一種斷字符斷為“dog-house”。這意味著匹配和排名將根據(jù)所指定語言而有所不同,因為不僅詞不同,而且文檔長度也不同。文檔長度的差異可能會影響所有查詢的排名。

諸如 IndexRowCount 之類的統(tǒng)計信息可能會大不相同。例如,如果一個目錄的主索引有二十億行,那么對一個新文檔的索引將被編制為內(nèi)存中的中間索引,而基于該內(nèi)存中索引內(nèi)的文檔數(shù)對該文檔的排名可能與主索引中的文檔排名不同。因此,建議在完成產(chǎn)生大量要創(chuàng)建索引或重新創(chuàng)建索引的行的任意填充后,使用 ALTER FULLTEXT CATALOG ... REORGANIZE Transact-SQL 語句將這些索引合并為一個主索引。全文引擎也會根據(jù)參數(shù)(例如中間索引的數(shù)目和大小)自動合并索引。

MaxOccurrence 值被規(guī)范化到 32 個范圍的其中一個內(nèi)。這意味著,比方說,50 個詞長的文檔與 100 個詞長的文檔的處理方式相同。下面是用于規(guī)范化的表。由于這兩個文檔的長度位于相鄰表值 32 與 128 之間的范圍內(nèi),因此將認為它們具有相同的有效長度 128 (32 < docLength <= 128)。

復制代碼
                    { 16, 32, 128, 256, 512, 725, 1024, 1450, 2048, 2896, 4096, 5792, 8192, 11585, 

16384, 23170, 28000, 32768, 39554, 46340, 55938, 65536, 92681, 131072, 185363, 

262144, 370727, 524288, 741455, 1048576, 2097152, 4194304 };


                  

CONTAINSTABLE 排名

CONTAINSTABLE 排名使用以下算法:

復制代碼
                    StatisticalWeight = Log2( ( 2 + IndexedRowCount ) / KeyRowCount )

Rank = min( MaxQueryRank, HitCount * 16 * StatisticalWeight / MaxOccurrence )
                  

短語匹配項的排名方式與各個鍵類似,只不過要估計 KeyRowCount (包含該短語的行數(shù)),并且此值可能會比實際值大。

ISABOUT 排名

CONTAINSTABLE 使用 ISABOUT 選項支持查詢加權(quán)詞。按照傳統(tǒng)信息檢索系統(tǒng)的說法,ISABOUT 表示向量空間查詢。所使用的默認排名算法為廣為人知的公式 Jaccard。將根據(jù)查詢中的每個詞計算排名,然后按如下描述將這些排名相結(jié)合。

復制代碼
                        ContainsRank = same formula used for CONTAINSTABLE ranking of a single term (above).

Weight = the weight specified in the query for each term. Default weight is 1.

WeightedSum = Σ[key=1 to n] ContainsRankKey * WeightKey

Rank = ?( MaxQueryRank * WeightedSum ) / ( ( Σ[key=1 to n] ContainsRankKey^2 ) 

      + ( Σ[key=1 to n] WeightKey^2 ) - ( WeightedSum ) )


                      

FREETEXTTABLE 排名

FREETEXTTABLE 排名基于 OKAPI BM25 排名公式計算。FREETEXTTABLE 查詢將通過派生詞(原始查詢詞的變形)向查詢中添加詞,這些詞將被作為單獨的、與派生出它們的詞沒有特殊聯(lián)系的詞來處理。同義詞庫功能派生出的同義詞將被當作單獨的、具有同等加權(quán)值的詞來處理。查詢中的每個詞都會對排名產(chǎn)生影響。

復制代碼
                    Rank = Σ[Terms in Query] w ( ( ( k1 + 1 ) tf ) / ( K + tf ) ) * ( ( k3 + 1 ) qtf / ( k3 + qtf ) ) )

Where: 

w is the Robertson-Sparck Jones weight. 

In simplified form, w is defined as: 

w = log10 ( ( ( r + 0.5 ) * ( N – R + r + 0.5 ) ) / ( ( R – r + 0.5 ) * ( n – r + 0.5 ) )

N is the number of indexed rows for the property being queried. 

n is the number of rows containing the word. 

K is ( k1 * ( ( 1 – b ) + ( b * dl / avdl ) ) ). 

dl is the property length, in word occurrences. 

avdl is the average length of the property being queried, in word occurrences. 

k1, b, and k3 are the constants 1.2, 0.75, and 8.0, respectively. 

tf is the frequency of the word in the queried property in a specific row. 

qtf is the frequency of the term in the query. 
                  

全文索引 排名計算問題


更多文章、技術(shù)交流、商務合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: av国产精品 | 人妻熟女久久久久久久 | 国产精品极品美女在线观看免费 | 亚洲性在线观看 | 蜜桃精品噜噜噜成人av | 亚洲免费在线看 | 一级做a爱过程免费视频麻豆 | 午夜影音| 成年视频免费观看 | 新97人人模人人爽人人喊 | 日本大片久久久高清免费看 | 九九热精品在线视频 | 欧美三级成人理伦 | 麻豆精品视频在线 | 日韩欧美福利视频 | 午夜精品久久久久久91 | 狠狠色狠狠色 | 色综合色狠狠天天综合色 | 欧美视频99 | 久久久www成人免费精品 | 日韩视频在线播放 | www.妞干网.com | 亚洲一区二区三 | 亚洲一区二区免费看 | 国产一卡二卡三卡 | 亚洲精品久久久久久中文字幕小说 | 一级特黄女人生活片 | 99视频这里只有精品国产 | 天天操你 | 欧美国产精品一区二区免费 | 国产99久久精品一区二区永久免费 | 日本精品视频 | 色婷婷激婷婷深爱五月小说 | 亚洲片在线观看 | 狠狠干91| 久久精品国产99久久6动漫亮点 | 日韩欧美一区二区三区在线视频 | a级片在线免费播放 | 日韩欧美精品在线 | 精品免费视频 | 欧美久久久久久 |