濮阳杆衣贸易有限公司

主頁 > 知識(shí)庫 > SQL2005CLR函數(shù)擴(kuò)展 - 關(guān)于山寨索引

SQL2005CLR函數(shù)擴(kuò)展 - 關(guān)于山寨索引

熱門標(biāo)簽:浙江地圖標(biāo)注 海南自動(dòng)外呼系統(tǒng)價(jià)格 松原導(dǎo)航地圖標(biāo)注 舞鋼市地圖標(biāo)注app 九鹿林外呼系統(tǒng)怎么收費(fèi) 創(chuàng)業(yè)電銷機(jī)器人 滄州營銷外呼系統(tǒng)軟件 電銷機(jī)器人虛擬號(hào)碼 沈陽智能外呼系統(tǒng)代理
本文只是一個(gè)山寨試驗(yàn)品,思路僅供參考.
--------------------------------------------------------------------------------
原理介紹:
索引建立
目錄結(jié)構(gòu)劃分方案也只是很簡易的實(shí)現(xiàn)了一下,通過unicode把任意連續(xù)的兩個(gè)字符(中文或英文)分為4個(gè)字節(jié)來做四層目錄,把索引的內(nèi)容對應(yīng)的主關(guān)鍵字(主要為了使用sql索引和唯一性)作為文件名,兩個(gè)字符在索引內(nèi)容中的位置作為文件后綴來存儲(chǔ).文件本身為0字節(jié),不保存任何信息.

比如一條數(shù)據(jù) "pk001","山寨索引"
山寨索引 四個(gè)字的unicode為
[0]: 113
[1]: 92
[2]: 232
[3]: 91
[4]: 34
[5]: 125
[6]: 21
[7]: 95
那么對應(yīng)的文件結(jié)構(gòu)為
../113/92/232/91/pk001 .0
../232/91/34/125/pk001 .1
../34/125/21/95/pk001 .2

索引使用
比如搜索"寨索引 "
則搜索 "../232/91/34/125/" 目錄下的所有文件,然后根據(jù) pk001 .1的文件后綴名1,去看 ../34/125/21/95/pk001.2文件是否存在.依次類推,最后返回一個(gè)結(jié)果集.
--------------------------------------------------------------------------------
實(shí)用性
具體的實(shí)用性還有待驗(yàn)證.這只是實(shí)現(xiàn)了精確的like搜索,而不能做常見搜索引擎的分詞效果.另外海量數(shù)據(jù)重建索引的性能也是面臨很嚴(yán)峻的問題,比如cpu負(fù)載和磁盤io負(fù)載.關(guān)于windows一個(gè)目錄下可以保持多少個(gè)文件而不會(huì)對文件搜索造成大的性能損失也有待評估,不過這個(gè)可以考慮根據(jù)主鍵的文件名hash來增加文件目錄深度降低單一目錄下的文件數(shù)量.
--------------------------------------------------------------------------------
演示效果
實(shí)現(xiàn)了針對test標(biāo)的name和caption兩個(gè)字段作索引搜索.
 
-- 設(shè)置和獲取索引文件根目錄
--select dbo.xfn_SetMyIndexFileRoot('d:/MyIndex')
--select dbo.xfn_GetMyIndexFileRoot()
-- 建立測試環(huán)境
 go
create table test( id uniqueidentifier , name nvarchar ( 100), caption nvarchar ( 100))
insert into test select top 3 newid (), ' 我的索引 ' , ' 測試 ' from sysobjects
insert into test select top 3 newid (), ' 我的測試 ' , ' 索引 ' from sysobjects
insert into test select top 3 newid (), ' 測試索引 ' , ' 測試索引 ' from sysobjects
insert into test select top 3 newid (), ' 我的索引 ' , ' 索引 ' from sysobjects
create index i_testid on test( id)
-- 建立索引文件
declare @t int
select @t=
dbo. xfn_SetKeyForMyIndex( id, 'testIndex' , name + ' ' + caption)   
from test
-- 查詢數(shù)據(jù)
select  a.*   from   test a, dbo. xfn_GetKeyFromMyIndex( '測試 索引 我的' , 'testIndex' )  b
    where a. id= b. pk
/*
0C4634EA-DF94-419A-A8E5-793BD5F54EED   我的索引 測試
2DD87B38-CD3F-4F14-BB4A-00678463898F   我的索引 測試
8C67A6C3-753F-474C-97BA-CE85A2455E3E   我的索引 測試
C9706BF1-FB1F-42FB-8A48-69EC37EAD3E5   我的測試 索引
8BBF25CC-9DBB-4FCB-B2EB-D318E587DD5F   我的測試 索引
8B45322D-8E46-4691-961A-CD0078F1FA0A   我的測試 索引
*/
--drop table test
--------------------------------------------------------------------------------
clr代碼如下:編譯為MyFullIndex.dll
復(fù)制代碼 代碼如下:

using System;
using System.Data.SqlTypes;
using Microsoft.SqlServer.Server;
using System.Collections;
using System.Collections.Generic;
public partial class UserDefinedFunctions
{
    /// summary>
    /// 設(shè)置索引目錄
    /// /summary>
    /// param name="value">/param>
    /// returns>/returns>
    [Microsoft.SqlServer.Server.SqlFunction ]
    public static SqlBoolean SetRoot(SqlString value)
    {
        if (value.IsNull) return false ;
        if (System.IO.Directory .Exists(value.Value))
        {
            root = value.Value;
            return true ;
        }
        else
        {
            return false ;
        }
    }
    /// summary>
    /// 獲取索引目錄
    /// /summary>
    /// returns>/returns>
    [Microsoft.SqlServer.Server.SqlFunction ]
    public static SqlString GetRoot()
    {
        return new SqlString (root);
    }
    /// summary>
    /// 建立索引
    /// /summary>
    /// param name="key"> 主鍵 /param>
    /// param name="indexName"> 索引名稱 /param>
    /// param name="content"> 索引內(nèi)容 /param>
    /// returns>/returns>
    [Microsoft.SqlServer.Server.SqlFunction ]
    public static SqlInt32 SetIndex(SqlString key,SqlString indexName,SqlString content)
    {
        if (key.IsNull || content.IsNull||indexName.IsNull) return 0;
        return _setIndex(key.Value,indexName.Value, content.Value);
    }

    /// summary>
    /// 查詢索引
    /// /summary>
    /// param name="word"> 關(guān)鍵字(空格區(qū)分) /param>
    /// param name="indexName"> 索引名稱 /param>
    /// returns>/returns>
    [SqlFunction (TableDefinition = "pk nvarchar(900)" , Name = "GetIndex" , FillRowMethodName = "FillRow" )]
    public static IEnumerable GetIndex(SqlString word,SqlString indexName)
    {

        System.Collections.Generic.List string > ret = new List string >();
        if (word.IsNull || indexName.IsNull) return ret;
        return _getIndex2(word.Value, indexName.Value);
    }

    public static void FillRow(Object obj, out SqlString pk)
    {
        string key = obj.ToString();
        pk = key;
    }
    static string root = @"d:/index" ;

    /// summary>
    /// 獲取有空格分隔的索引信息
    /// /summary>
    /// param name="word">/param>
    /// param name="indexName">/param>
    /// returns>/returns>
    static System.Collections.Generic.List string > _getIndex2(string word, string indexName)
    {
        string [] arrWord = word.Split(new char [] { ' ' }, StringSplitOptions .RemoveEmptyEntries);

        System.Collections.Generic.List string > key_0 = _getIndex(arrWord[0], indexName);

        if (arrWord.Length == 0) return key_0;
        System.Collections.Generic.List string > [] key_list=new List string >[arrWord.Length-1];
        for (int i = 0; i arrWord.Length-1; i++)
        {
            System.Collections.Generic.List string > key_i = _getIndex(arrWord[i+1],indexName);
            key_list[i] = key_i;
        }

        for (int i=key_0.Count-1;i>=0;i--)
        {
            foreach (System.Collections.Generic.List string > key_i in key_list)
            {
                if (key_i.Contains(key_0[i]) == false )
                {
                    key_0.RemoveAt(i);
                    continue ;
                }
            }
        }
        return key_0;
    }
    /// summary>
    /// 獲取單個(gè)詞的索引信息
    /// /summary>
    /// param name="word">/param>
    /// param name="indexName">/param>
    /// returns>/returns>
    static System.Collections.Generic.List string > _getIndex(string word, string indexName)
    {
        System.Collections.Generic.List string > ret = new List string >();
        byte [] bWord = System.Text.Encoding .Unicode.GetBytes(word);
        if (bWord.Length 4) return ret;

        string path = string .Format(@"{0}/{1}/{2}/{3}/{4}/{5}/" , root,indexName, bWord[0], bWord[1], bWord[2], bWord[3]);
        if (System.IO.Directory .Exists(path) == false )
        {
            return ret;
        }
        string [] arrFiles = System.IO.Directory .GetFiles(path);

        foreach (string file in arrFiles)
        {
            string key = System.IO.Path .GetFileNameWithoutExtension(file);
            string index = System.IO.Path .GetExtension(file).TrimStart(new char [] { '.' });
            int cIndex = int .Parse(index);
            bool bHas = true ;
            for (int i = 2; i bWord.Length - 3; i = i + 2)
            {
                string nextFile = string .Format(@"{0}/{1}/{2}/{3}/{4}/{5}/{6}.{7}" ,
                    root, indexName, bWord[i + 0], bWord[i + 1], bWord[i + 2], bWord[i + 3], key, ++cIndex);

                if (System.IO.File .Exists(nextFile) == false )
                {
                    bHas = false ;
                    break ;
                }
            }
            if (bHas == true ret.Contains(key)==false )
                ret.Add(key);

        }
        return ret;
    }

    /// summary>
    /// 建立索引文件
    /// /summary>
    /// param name="key">/param>
    /// param name="indexName">/param>
    /// param name="content">/param>
    /// returns>/returns>
    static int _setIndex(string key,string indexName, string content)
    {
        byte [] bContent = System.Text.Encoding .Unicode.GetBytes(content);
        if (bContent.Length = 4) return 0;
        for (int i = 0; i bContent.Length - 3; i = i + 2)
        {
            string path = string .Format(@"{0}/{1}/{2}/{3}/{4}/{5}/" , root,indexName, bContent[i + 0], bContent[i + 1], bContent[i + 2], bContent[i + 3]);
            if (System.IO.Directory .Exists(path) == false )
            {
                System.IO.Directory .CreateDirectory(path);
            }
            string file = string .Format(@"{0}/{1}.{2}" , path, key, i / 2);

            if (System.IO.File .Exists(file) == false )
            {
                System.IO.File .Create(file).Close();
            }
        }
        return content.Length;
    }
};

--------------------------------------------------------------------------------
部署的sql腳本如下
--drop function dbo.xfn_SetMyIndexFileRoot
--drop function dbo.xfn_GetMyIndexFileRoot
--drop function dbo.xfn_GetKeyFromMyIndex
--drop function dbo.xfn_SetKeyForMyIndex
--drop assembly MyFullIndex
--go
CREATE ASSEMBLY MyFullIndex FROM 'd:/SQLCLR/MyFullIndex.dll' WITH PERMISSION_SET = UnSAFE;
--
go
-- 索引搜索
CREATE FUNCTION dbo. xfn_GetKeyFromMyIndex ( @word nvarchar ( max ), @indexName  nvarchar ( 900))   
RETURNS table ( pk nvarchar ( 100))
AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. GetIndex
go
-- 索引建立
CREATE FUNCTION dbo. xfn_SetKeyForMyIndex ( @pk nvarchar ( 900), @indexName  nvarchar ( 900), @word nvarchar ( max ))   
RETURNS int
AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. SetIndex
go
-- 獲取索引文件根目錄
CREATE FUNCTION dbo. xfn_GetMyIndexFileRoot ()   
RETURNS nvarchar ( max )
AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. GetRoot
go
-- 設(shè)置索引文件根目錄(默認(rèn)目錄為 d:/myindex )
CREATE FUNCTION dbo. xfn_SetMyIndexFileRoot ( @FileRoot nvarchar ( max ))   
RETURNS bit
AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. SetRoot
go
您可能感興趣的文章:
  • mssql 建立索引
  • SQL2000 全文索引完全圖解
  • MSSQL 大量數(shù)據(jù)時(shí),建立索引或添加字段后保存更改提示超時(shí)的解決方法
  • 關(guān)于重新組織和重新生成索引sp_RefreshIndex的介紹
  • MSSQL自動(dòng)重建出現(xiàn)碎片的索引的方法分享
  • 理解Sql Server中的聚集索引
  • Sql Server中的非聚集索引詳細(xì)介
  • 在SQL SERVER中導(dǎo)致索引查找變成索引掃描的問題分析
  • 詳解sqlserver查詢表索引
  • SQL2005重新生成索引的的存儲(chǔ)過程 sp_rebuild_index

標(biāo)簽:咸寧 西藏 日喀則 公主嶺 商洛 臺(tái)灣 寶雞

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《SQL2005CLR函數(shù)擴(kuò)展 - 關(guān)于山寨索引》,本文關(guān)鍵詞  SQL2005CLR,函數(shù),擴(kuò)展,關(guān)于,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《SQL2005CLR函數(shù)擴(kuò)展 - 關(guān)于山寨索引》相關(guān)的同類信息!
  • 本頁收集關(guān)于SQL2005CLR函數(shù)擴(kuò)展 - 關(guān)于山寨索引的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    且末县| 郑州市| 舒城县| 黄龙县| 仲巴县| 且末县| 汉川市| 连云港市| 北流市| 江北区| 伊川县| 甘南县| 小金县| 浦县| 中超| 枣庄市| 孝昌县| 灵台县| 翼城县| 苏州市| 阳春市| 博野县| 德州市| 麻栗坡县| 凌海市| 上高县| 大理市| 丹巴县| 荣昌县| 绥棱县| 静海县| 芮城县| 兴义市| 夏河县| 轮台县| 武定县| 洛阳市| 肃宁县| 沙洋县| 涿鹿县| 兰西县|