人人上人人干人人操人人,国产情侣91一区二区三区

您當(dāng)前所在位置：首頁(yè) → 數(shù)據(jù)庫(kù) → MSSQL → 關(guān)于SQL Server中索引使用及維護(hù)簡(jiǎn)介

關(guān)于SQL Server中索引使用及維護(hù)簡(jiǎn)介 時(shí)間：2015-06-28 00:00:00 來(lái)源：IT貓撲網(wǎng) 作者：網(wǎng)管聯(lián)盟 我要評(píng)論(0)

在應(yīng)用系統(tǒng)中,尤其在聯(lián)機(jī)事務(wù)處理系統(tǒng)中,對(duì)數(shù)據(jù)查詢及處理速度已成為衡量應(yīng)用系統(tǒng)成敗的標(biāo)準(zhǔn)。而采用索引來(lái)加快數(shù)據(jù)處理速度也成為廣大數(shù)據(jù)庫(kù)用戶所接受的優(yōu)化方法。

在良好的數(shù)據(jù)庫(kù)設(shè)計(jì)基礎(chǔ)上，能有效地使用索引是SQL Server取得高性能的基礎(chǔ)，SQLServer采用基于代價(jià)的優(yōu)化模型，它對(duì)每一個(gè)提交的有關(guān)表的查詢，決定是否使用索引或用哪一個(gè)索引。因?yàn)椴樵儓?zhí)行的大部分開銷是磁盤I/O，使用索引提高性能的一個(gè)主要目標(biāo)是避免全表掃描，因?yàn)槿頀呙栊枰獜拇疟P上讀表的每一個(gè)數(shù)據(jù)頁(yè)，如果有索引指向數(shù)據(jù)值，則查詢只需讀幾次磁盤就可以了。所以如果建立了合理的索引，優(yōu)化器就能利用索引加速數(shù)據(jù)的查詢過(guò)程。但是，索引并不總是提高系統(tǒng)的性能，在增、刪、改操作中索引的存在會(huì)增加一定的工作量，因此，在適當(dāng)?shù)牡胤皆黾舆m當(dāng)?shù)乃饕牟缓侠淼牡胤絼h除次優(yōu)的索引，將有助于優(yōu)化那些性能較差的SQLServer應(yīng)用。實(shí)踐表明，合理的索引設(shè)計(jì)是建立在對(duì)各種查詢的分析和預(yù)測(cè)上的，只有正確地使索引與程序結(jié)合起來(lái),才能產(chǎn)生最佳的優(yōu)化方案。本文就SQLServer索引的性能問(wèn)題進(jìn)行了一些分析和實(shí)踐。

一、聚簇索引(clustered indexes)的使用

聚簇索引是一種對(duì)磁盤上實(shí)際數(shù)據(jù)重新組織以按指定的一個(gè)或多個(gè)列的值排序。由于聚簇索引的索引頁(yè)面指針指向數(shù)據(jù)頁(yè)面，所以使用聚簇索引查找數(shù)據(jù)幾乎總是比使用非聚簇索引快。每張表只能建一個(gè)聚簇索引，并且建聚簇索引需要至少相當(dāng)該表120%的附加空間，以存放該表的副本和索引中間頁(yè)。建立聚簇索引的思想是：

1、大多數(shù)表都應(yīng)該有聚簇索引或使用分區(qū)來(lái)降低對(duì)表尾頁(yè)的競(jìng)爭(zhēng)，在一個(gè)高事務(wù)的環(huán)境中，對(duì)最后一頁(yè)的封鎖嚴(yán)重影響系統(tǒng)的吞吐量。

2、在聚簇索引下，數(shù)據(jù)在物理上按順序排在數(shù)據(jù)頁(yè)上，重復(fù)值也排在一起，因而在那些包含范圍檢查(between、<、<=、>、>=)或使用group by或order by的查詢時(shí)，一旦找到具有范圍中第一個(gè)鍵值的行，具有后續(xù)索引值的行保證物理上毗連在一起而不必進(jìn)一步搜索，避免了大范圍掃描，可以大大提高查詢速度。

3、在一個(gè)頻繁發(fā)生插入操作的表上建立聚簇索引時(shí)，不要建在具有單調(diào)上升值的列(如IDENTITY)上，否則會(huì)經(jīng)常引起封鎖沖突。

4、在聚簇索引中不要包含經(jīng)常修改的列，因?yàn)榇a值修改后，數(shù)據(jù)行必須移動(dòng)到新的位置。

5、選擇聚簇索引應(yīng)基于where子句和連接操作的類型。

聚簇索引的侯選列是：

1、主鍵列,該列在where子句中使用并且插入是隨機(jī)的。

2、按范圍存取的列，如pri_order > 100 and pri_order < 200。

3、在group by或order by中使用的列。

4、不經(jīng)常修改的列。

5、在連接操作中使用的列。

二、非聚簇索引(nonclustered indexes)的使用

SQLServer缺省情況下建立的索引是非聚簇索引，由于非聚簇索引不重新組織表中的數(shù)據(jù)，而是對(duì)每一行存儲(chǔ)索引列值并用一個(gè)指針指向數(shù)據(jù)所在的頁(yè)面。換句話說(shuō)非聚簇索引具有在索引結(jié)構(gòu)和數(shù)據(jù)本身之間的一個(gè)額外級(jí)。一個(gè)表如果沒有聚簇索引時(shí),可有250個(gè)非聚簇索引。每個(gè)非聚簇索引提供訪問(wèn)數(shù)據(jù)的不同排序順序。在建立非聚簇索引時(shí)，要權(quán)衡索引對(duì)查詢速度的加快與降低修改速度之間的利弊。另外，還要考慮這些問(wèn)題：

1、索引需要使用多少空間。

2、合適的列是否穩(wěn)定。

3、索引鍵是如何選擇的，掃描效果是否更佳。

4、是否有許多重復(fù)值。

對(duì)更新頻繁的表來(lái)說(shuō)，表上的非聚簇索引比聚簇索引和根本沒有索引需要更多的額外開銷。對(duì)移到新頁(yè)的每一行而言，指向該數(shù)據(jù)的每個(gè)非聚簇索引的頁(yè)級(jí)行也必須更新，有時(shí)可能還需要索引頁(yè)的分理。從一個(gè)頁(yè)面刪除數(shù)據(jù)的進(jìn)程也會(huì)有類似的開銷，另外，刪除進(jìn)程還必須把數(shù)據(jù)移到頁(yè)面上部，以保證數(shù)據(jù)的連續(xù)性。所以，建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:

1、某列常用于集合函數(shù)(如Sum,....)。

2、某列常用于join,order by,group by。

3、查尋出的數(shù)據(jù)不超過(guò)表中數(shù)據(jù)量的20%。

三、覆蓋索引(covering indexes)的使用

覆蓋索引是指那些索引項(xiàng)中包含查尋所需要的全部信息的非聚簇索引，這種索引之所以比較快也正是因?yàn)樗饕?yè)中包含了查尋所必須的數(shù)據(jù),不需去訪問(wèn)數(shù)據(jù)頁(yè)。如果非聚簇索引中包含結(jié)果數(shù)據(jù),那么它的查詢速度將快于聚簇索引。

但是由于覆蓋索引的索引項(xiàng)比較多,要占用比較大的空間。而且update操作會(huì)引起索引值改變。所以如果潛在的覆蓋查詢并不常用或不太關(guān)鍵，則覆蓋索引的增加反而會(huì)降低性能。

四、索引的選擇技術(shù)

p_detail是住房公積金管理系統(tǒng)中記錄個(gè)人明細(xì)的表，有890000行，觀察在不同索引下的查詢運(yùn)行效果，測(cè)試在C/S環(huán)境下進(jìn)行，客戶機(jī)是IBM PII350(內(nèi)存64M),服務(wù)器是DEC Alpha1000A(內(nèi)存128M),數(shù)據(jù)庫(kù)為SYBASE11.0.3。

1、 select count(*) from p_detail

where op_date>’19990101’ and op_date<’19991231’ and pri_surplus1>300

2、 select count(*),sum(pri_surplus1) from p_detail

where op_date>’19990101’ and pay_month between‘199908’ and’199912’

不建任何索引查詢1 1分15秒

查詢2 1分7秒

在op_date上建非聚簇索引查詢1 57秒

查詢2 57秒

在op_date上建聚簇索引查詢1 <1秒

查詢2 52秒

在pay_month、op_date、pri_surplus1上建索引查詢1 34秒

查詢2 <1秒

在op_date、pay_month、pri_surplus1上建索引查詢1 <1秒

查詢2 <1秒

從以上查詢效果分析，索引的有無(wú)，建立方式的不同將會(huì)導(dǎo)致不同的查詢效果，選擇什么樣的索引基于用戶對(duì)數(shù)據(jù)的查詢條件,這些條件體現(xiàn)于where從句和join表達(dá)式中。一般來(lái)說(shuō)建立索引的思路是：

(1)、主鍵時(shí)常作為where子句的條件，應(yīng)在表的主鍵列上建立聚簇索引，尤其當(dāng)經(jīng)常用它作為連接的時(shí)候。

(2)、有大量重復(fù)值且經(jīng)常有范圍查詢和排序、分組發(fā)生的列，或者非常頻繁地被訪問(wèn)的列，可考慮建立聚簇索引。

(3)、經(jīng)常同時(shí)存取多列，且每列都含有重復(fù)值可考慮建立復(fù)合索引來(lái)覆蓋一個(gè)或一組查詢，并把查詢引用最頻繁的列作為前導(dǎo)列，如果可能盡量使關(guān)鍵查詢形成覆蓋查詢。

(4)、如果知道索引鍵的所有值都是唯一的，那么確保把索引定義成唯一索引。

(5)、在一個(gè)經(jīng)常做插入操作的表上建索引時(shí)，使用fillfactor(填充因子)來(lái)減少頁(yè)分裂，同時(shí)提高并發(fā)度降低死鎖的發(fā)生。如果在只讀表上建索引，則可以把fillfactor置為100。

(6)、在選擇索引鍵時(shí)，設(shè)法選擇那些采用小數(shù)據(jù)類型的列作為鍵以使每個(gè)索引頁(yè)能夠容納盡可能多的索引鍵和指針，通過(guò)這種方式，可使一個(gè)查詢必須遍歷的索引頁(yè)面降到最小。此外，盡可能地使用整數(shù)為鍵值，因?yàn)樗軌蛱峁┍热魏螖?shù)據(jù)類型都快的訪問(wèn)速度。

五、索引的維護(hù)

上面講到,某些不合適的索引影響到SQLServer的性能,隨著應(yīng)用系統(tǒng)的運(yùn)行,數(shù)據(jù)不斷地發(fā)生變化,當(dāng)數(shù)據(jù)變化達(dá)到某一個(gè)程度時(shí)將會(huì)影響到索引的使用。這時(shí)需要用戶自己來(lái)維護(hù)索引。索引的維護(hù)包括：

1、重建索引

隨著數(shù)據(jù)行的插入、刪除和數(shù)據(jù)頁(yè)的分裂，有些索引頁(yè)可能只包含幾頁(yè)數(shù)據(jù)，另外應(yīng)用在執(zhí)行大塊I/O的時(shí)候，重建非聚簇索引可以降低分片，維護(hù)大塊I/O的效率。重建索引實(shí)際上是重新組織B-樹空間。在下面情況下需要重建索引：

(1)、數(shù)據(jù)和使用模式大幅度變化。

(2)、排序的順序發(fā)生改變。

(3)、要進(jìn)行大量插入操作或已經(jīng)完成。

(4)、使用大塊I/O的查詢的磁盤讀次數(shù)比預(yù)料的要多。

(5)、由于大量數(shù)據(jù)修改，使得數(shù)據(jù)頁(yè)和索引頁(yè)沒有充分使用而導(dǎo)致空間的使用超出估算。

(6)、dbcc檢查出索引有問(wèn)題。

當(dāng)重建聚簇索引時(shí),這張表的所有非聚簇索引將被重建。

2、索引統(tǒng)計(jì)信息的更新

當(dāng)在一個(gè)包含數(shù)據(jù)的表上創(chuàng)建索引的時(shí)候，SQLServer會(huì)創(chuàng)建分布數(shù)據(jù)頁(yè)來(lái)存放有關(guān)索引的兩種統(tǒng)計(jì)信息：分布表和密度表。優(yōu)化器利用這個(gè)頁(yè)來(lái)判斷該索引對(duì)某個(gè)特定查詢是否有用。但這個(gè)統(tǒng)計(jì)信息并不動(dòng)態(tài)地重新計(jì)算。這意味著，當(dāng)表的數(shù)據(jù)改變之后，統(tǒng)計(jì)信息有可能是過(guò)時(shí)的，從而影響優(yōu)化器追求最有工作的目標(biāo)。因此，在下面情況下應(yīng)該運(yùn)行update statistics命令：

(1)、數(shù)據(jù)行的插入和刪除修改了數(shù)據(jù)的分布。

(2)、對(duì)用truncate table刪除數(shù)據(jù)的表上增加數(shù)據(jù)行。

(3)、修改索引列的值。

六、結(jié)束語(yǔ)

實(shí)踐表明，不恰當(dāng)?shù)乃饕坏谑聼o(wú)補(bǔ)，反而會(huì)降低系統(tǒng)的執(zhí)行性能。因?yàn)榇罅康乃饕诓迦搿⑿薷暮蛣h除操作時(shí)比沒有索引花費(fèi)更多的系統(tǒng)時(shí)間。例如下面情況下建立的索引是不恰當(dāng)?shù)模?/p>

1、在查詢中很少或從不引用的列不會(huì)受益于索引，因?yàn)樗饕苌倩驈膩?lái)不必搜索基于這些列的行。

2、只有兩個(gè)或三個(gè)值的列，如男性和女性(是或否)，從不會(huì)從索引中得到好處。

另外，鑒于索引加快了查詢速度，但減慢了數(shù)據(jù)更新速度的特點(diǎn)?？赏ㄟ^(guò)在一個(gè)段上建表，而在另一個(gè)段上建其非聚簇索引，而這兩段分別在單獨(dú)的物理設(shè)備上來(lái)改善操作性能。

關(guān)鍵詞標(biāo)簽：SQL Server

相關(guān)閱讀

文章評(píng)論

查看所有0條評(píng)論>>