我們知道哈希表是一種非常高效的數(shù)據(jù)結(jié)構(gòu),設(shè)計(jì)優(yōu)良的哈希函數(shù)可以使其上的增刪改查操作達(dá)到O(1)級(jí)別。Java為我們提供了一個(gè)現(xiàn)成的哈希結(jié)構(gòu),那就是HashMap類,在前面的文章中我曾經(jīng)介紹過HashMap類,知道它的所有方法都未進(jìn)行同步,因此在多線程環(huán)境中是不安全的。為此,Java為我們提供了另外一個(gè)HashTable類,它對(duì)于多線程同步的處理非常簡單粗暴,那就是在HashMap的基礎(chǔ)上對(duì)其所有方法都使用synchronized關(guān)鍵字進(jìn)行加鎖。這種方法雖然簡單,但導(dǎo)致了一個(gè)問題,那就是在同一時(shí)間內(nèi)只能由一個(gè)線程去操作哈希表。即使這些線程都只是進(jìn)行讀操作也必須要排隊(duì),這在競爭激烈的多線程環(huán)境中極為影響性能。本篇介紹的ConcurrentHashMap就是為了解決這個(gè)問題的,它的內(nèi)部使用分段鎖將鎖進(jìn)行細(xì)粒度化,從而使得多個(gè)線程能夠同時(shí)操作哈希表,這樣極大的提高了性能。下圖是其內(nèi)部結(jié)構(gòu)的示意圖。
創(chuàng)新互聯(lián)建站服務(wù)項(xiàng)目包括定襄網(wǎng)站建設(shè)、定襄網(wǎng)站制作、定襄網(wǎng)頁制作以及定襄網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,定襄網(wǎng)站推廣取得了明顯的社會(huì)效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到定襄省份的部分城市,未來相信會(huì)繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
1. ConcurrentHashMap有哪些成員變量?
//默認(rèn)初始化容量 static final int DEFAULT_INITIAL_CAPACITY = 16; //默認(rèn)加載因子 static final float DEFAULT_LOAD_FACTOR = 0.75f; //默認(rèn)并發(fā)級(jí)別 static final int DEFAULT_CONCURRENCY_LEVEL = 16; //集合最大容量 static final int MAXIMUM_CAPACITY = 1 << 30; //分段鎖的最小數(shù)量 static final int MIN_SEGMENT_TABLE_CAPACITY = 2; //分段鎖的最大數(shù)量 static final int MAX_SEGMENTS = 1 << 16; //加鎖前的重試次數(shù) static final int RETRIES_BEFORE_LOCK = 2; //分段鎖的掩碼值 final int segmentMask; //分段鎖的移位值 final int segmentShift; //分段鎖數(shù)組 final Segment<K,V>[] segments;
在閱讀完本篇文章之前,相信讀者不能理解這些成員變量的具體含義和作用,不過請(qǐng)讀者們耐心看下去,后面將會(huì)在具體場景中一一介紹到這些成員變量的作用。在這里讀者只需對(duì)這些成員變量留個(gè)眼熟即可。但是仍有個(gè)別變量是我們現(xiàn)在需要了解的,例如Segment數(shù)組代表分段鎖集合,并發(fā)級(jí)別則代表分段鎖的數(shù)量(也意味有多少線程可以同時(shí)操作),初始化容量代表整個(gè)容器的容量,加載因子代表容器元素可以達(dá)到多滿的一種程度。
2. 分段鎖的內(nèi)部結(jié)構(gòu)是怎樣的?
//分段鎖 static final class Segment<K,V> extends ReentrantLock implements Serializable { //自旋最大次數(shù) static final int MAX_SCAN_RETRIES = Runtime.getRuntime().availableProcessors() > 1 ? 64 : 1; //哈希表 transient volatile HashEntry<K,V>[] table; //元素總數(shù) transient int count; //修改次數(shù) transient int modCount; //元素閥值 transient int threshold; //加載因子 final float loadFactor; //省略以下內(nèi)容 ... }
Segment是ConcurrentHashMap的靜態(tài)內(nèi)部類,可以看到它繼承自ReentrantLock,因此它在本質(zhì)上是一個(gè)鎖。它在內(nèi)部持有一個(gè)HashEntry數(shù)組(哈希表),并且保證所有對(duì)該數(shù)組的增刪改查方法都是線程安全的,具體是怎樣實(shí)現(xiàn)的后面會(huì)講到。所有對(duì)ConcurrentHashMap的增刪改查操作都可以委托Segment來進(jìn)行,因此ConcurrentHashMap能夠保證在多線程環(huán)境下是安全的。又因?yàn)椴煌腟egment是不同的鎖,所以多線程可以同時(shí)操作不同的Segment,也就意味著多線程可以同時(shí)操作ConcurrentHashMap,這樣就能避免HashTable的缺陷,從而極大的提高性能。
3. ConcurrentHashMap初始化時(shí)做了些什么?
//核心構(gòu)造器 @SuppressWarnings("unchecked") public ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel) { if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0) { throw new IllegalArgumentException(); } //確保并發(fā)級(jí)別不大于限定值 if (concurrencyLevel > MAX_SEGMENTS) { concurrencyLevel = MAX_SEGMENTS; } int sshift = 0; int ssize = 1; //保證ssize為2的冪, 且是最接近的大于等于并發(fā)級(jí)別的數(shù) while (ssize < concurrencyLevel) { ++sshift; ssize <<= 1; } //計(jì)算分段鎖的移位值 this.segmentShift = 32 - sshift; //計(jì)算分段鎖的掩碼值 this.segmentMask = ssize - 1; //總的初始容量不能大于限定值 if (initialCapacity > MAXIMUM_CAPACITY) { initialCapacity = MAXIMUM_CAPACITY; } //獲取每個(gè)分段鎖的初始容量 int c = initialCapacity / ssize; //分段鎖容量總和不小于初始總?cè)萘? if (c * ssize < initialCapacity) { ++c; } int cap = MIN_SEGMENT_TABLE_CAPACITY; //保證cap為2的冪, 且是最接近的大于等于c的數(shù) while (cap < c) { cap <<= 1; } //新建一個(gè)Segment對(duì)象模版 Segment<K,V> s0 = new Segment<K,V>(loadFactor, (int)(cap * loadFactor), (HashEntry<K,V>[])new HashEntry[cap]); //新建指定大小的分段鎖數(shù)組 Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize]; //使用UnSafe給數(shù)組第0個(gè)元素賦值 UNSAFE.putOrderedObject(ss, SBASE, s0); this.segments = ss; }
ConcurrentHashMap有多個(gè)構(gòu)造器,但是上面貼出的是它的核心構(gòu)造器,其他構(gòu)造器都通過調(diào)用它來完成初始化。核心構(gòu)造器需要傳入三個(gè)參數(shù),分別是初始容量,加載因子和并發(fā)級(jí)別。在前面介紹成員變量時(shí)我們可以知道默認(rèn)的初始容量為16,加載因子為0.75f,并發(fā)級(jí)別為16?,F(xiàn)在我們看到核心構(gòu)造器的代碼,首先是通過傳入的concurrencyLevel來計(jì)算出ssize,ssize是Segment數(shù)組的長度,它必須保證是2的冪,這樣就可以通過hash&ssize-1來計(jì)算分段鎖在數(shù)組中的下標(biāo)。由于傳入的concurrencyLevel不能保證是2的冪,所以不能直接用它來當(dāng)作Segment數(shù)組的長度,因此我們要找到一個(gè)最接近c(diǎn)oncurrencyLevel的2的冪,用它來作為數(shù)組的長度。假如現(xiàn)在傳入的concurrencyLevel=15,通過上面代碼可以計(jì)算出ssize=16,sshift=4。接下來立馬可以算出segmentShift=16,segmentMask=15。注意這里的segmentShift是分段鎖的移位值,segmentMask是分段鎖的掩碼值,這兩個(gè)值是用來計(jì)算分段鎖在數(shù)組中的下標(biāo),在下面我們會(huì)講到。在算出分段鎖的個(gè)數(shù)ssize之后,就可以根據(jù)傳入的總?cè)萘縼碛?jì)算每個(gè)分段鎖的容量,它的值c = initialCapacity / ssize。分段鎖的容量也就是HashEntry數(shù)組的長度,同樣也必須保證是2的冪,而上面算出的c的值不能保證這一點(diǎn),所以不能直接用c作為HashEntry數(shù)組的長度,需要另外找到一個(gè)最接近c(diǎn)的2的冪,將這個(gè)值賦給cap,然后用cap來作為HashEntry數(shù)組的長度?,F(xiàn)在我們有了ssize和cap,就可以新建分段鎖數(shù)組Segment[]和元素?cái)?shù)組HashEntry[]了。注意,與JDK1.6不同是的,在JDK1.7中只新建了Segment數(shù)組,并沒有對(duì)它初始化,初始化Segment的操作留到了插入操作時(shí)進(jìn)行。
4. 通過怎樣的方式來定位鎖和定位元素?
//根據(jù)哈希碼獲取分段鎖 @SuppressWarnings("unchecked") private Segment<K,V> segmentForHash(int h) { long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE; return (Segment<K,V>) UNSAFE.getObjectVolatile(segments, u); } //根據(jù)哈希碼獲取元素 @SuppressWarnings("unchecked") static final <K,V> HashEntry<K,V> entryForHash(Segment<K,V> seg, int h) { HashEntry<K,V>[] tab; return (seg == null || (tab = seg.table) == null) ? null : (HashEntry<K,V>) UNSAFE.getObjectVolatile(tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE); }
在JDK1.7中是通過UnSafe來獲取數(shù)組元素的,因此這里比JDK1.6多了些計(jì)算數(shù)組元素偏移量的代碼,這些代碼我們暫時(shí)不關(guān)注,現(xiàn)在我們只需知道下面這兩點(diǎn):
a. 通過哈希碼計(jì)算分段鎖在數(shù)組中的下標(biāo):(h >>> segmentShift) & segmentMask。
b. 通過哈希碼計(jì)算元素在數(shù)組中的下標(biāo):(tab.length - 1) & h。
現(xiàn)在我們假設(shè)傳給構(gòu)造器的兩個(gè)參數(shù)為initialCapacity=128, concurrencyLevel=16。根據(jù)計(jì)算可以得到ssize=16, sshift=4,segmentShift=28,segmentMask=15。同樣,算得每個(gè)分段鎖內(nèi)的HashEntry數(shù)組的長度為8,所以tab.length-1=7。根據(jù)這些值,我們通過下圖來解釋如何根據(jù)同一個(gè)哈希碼來定位分段鎖和元素。
可以看到分段鎖和元素的定位都是通過元素的哈希碼來決定的。定位分段鎖是取哈希碼的高位值(從32位處取起),定位元素是取的哈希碼的低位值?,F(xiàn)在有個(gè)問題,它們一個(gè)從32位的左端取起,一個(gè)從32位的右端取起,那么會(huì)在某個(gè)時(shí)刻產(chǎn)生沖突嗎?我們?cè)诔蓡T變量里可以找到MAXIMUM_CAPACITY = 1 << 30,MAX_SEGMENTS = 1 << 16,這說明定位分段鎖和定位元素使用的總的位數(shù)不超過30,并且定位分段鎖使用的位數(shù)不超過16,所以至少還隔著2位的空余,因此是不會(huì)產(chǎn)生沖突的。
5. 查找元素具體是怎樣實(shí)現(xiàn)的?
//根據(jù)key獲取value public V get(Object key) { Segment<K,V> s; HashEntry<K,V>[] tab; //使用哈希函數(shù)計(jì)算哈希碼 int h = hash(key); //根據(jù)哈希碼計(jì)算分段鎖的索引 long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE; //獲取分段鎖和對(duì)應(yīng)的哈希表 if ((s = (Segment<K,V>)UNSAFE.getObjectVolatile(segments, u)) != null && (tab = s.table) != null) { //根據(jù)哈希碼獲取鏈表頭結(jié)點(diǎn), 再對(duì)鏈表進(jìn)行遍歷 for (HashEntry<K,V> e = (HashEntry<K,V>) UNSAFE.getObjectVolatile (tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE); e != null; e = e.next) { K k; //根據(jù)key和hash找到對(duì)應(yīng)元素后返回value值 if ((k = e.key) == key || (e.hash == h && key.equals(k))) { return e.value; } } } return null; }
在JDK1.6中分段鎖的get方法是通過下標(biāo)來訪問數(shù)組元素的,而在JDK1.7中是通過UnSafe的getObjectVolatile方法來讀取數(shù)組中的元素。為啥要這樣做?我們知道雖然Segment對(duì)象持有的HashEntry數(shù)組引用是volatile類型的,但是數(shù)組內(nèi)的元素引用不是volatile類型的,因此多線程對(duì)數(shù)組元素的修改是不安全的,可能會(huì)在數(shù)組中讀取到尚未構(gòu)造完成的對(duì)象。在JDK1.6中是通過第二次加鎖讀取來保證安全的,而JDK1.7中通過UnSafe的getObjectVolatile方法來讀取同樣也是為了保證這一點(diǎn)。使用getObjectVolatile方法讀取數(shù)組元素需要先獲得元素在數(shù)組中的偏移量,在這里根據(jù)哈希碼計(jì)算得到分段鎖在數(shù)組中的偏移量為u,然后通過偏移量u來嘗試讀取分段鎖。由于分段鎖數(shù)組在構(gòu)造時(shí)沒進(jìn)行初始化,因此可能讀出來一個(gè)空值,所以需要先進(jìn)行判斷。在確定分段鎖和它內(nèi)部的哈希表都不為空之后,再通過哈希碼讀取HashEntry數(shù)組的元素,根據(jù)上面的結(jié)構(gòu)圖可以看到,這時(shí)獲得的是鏈表的頭結(jié)點(diǎn)。之后再從頭到尾的對(duì)鏈表進(jìn)行遍歷查找,如果找到對(duì)應(yīng)的值就將其返回,否則就返回null。以上就是整個(gè)查找元素的過程。
6. 插入元素具體是怎樣實(shí)現(xiàn)的?
//向集合添加鍵值對(duì)(若存在則替換) @SuppressWarnings("unchecked") public V put(K key, V value) { Segment<K,V> s; //傳入的value不能為空 if (value == null) throw new NullPointerException(); //使用哈希函數(shù)計(jì)算哈希碼 int hash = hash(key); //根據(jù)哈希碼計(jì)算分段鎖的下標(biāo) int j = (hash >>> segmentShift) & segmentMask; //根據(jù)下標(biāo)去嘗試獲取分段鎖 if ((s = (Segment<K,V>)UNSAFE.getObject(segments, (j << SSHIFT) + SBASE)) == null) { //獲得的分段鎖為空就去構(gòu)造一個(gè) s = ensureSegment(j); } //調(diào)用分段鎖的put方法 return s.put(key, hash, value, false); } //向集合添加鍵值對(duì)(不存在才添加) @SuppressWarnings("unchecked") public V putIfAbsent(K key, V value) { Segment<K,V> s; //傳入的value不能為空 if (value == null) throw new NullPointerException(); //使用哈希函數(shù)計(jì)算哈希碼 int hash = hash(key); //根據(jù)哈希碼計(jì)算分段鎖的下標(biāo) int j = (hash >>> segmentShift) & segmentMask; //根據(jù)下標(biāo)去嘗試獲取分段鎖 if ((s = (Segment<K,V>)UNSAFE.getObject(segments, (j << SSHIFT) + SBASE)) == null) { //獲得的分段鎖為空就去構(gòu)造一個(gè) s = ensureSegment(j); } //調(diào)用分段鎖的put方法 return s.put(key, hash, value, true); }
ConcurrentHashMap中有兩個(gè)添加鍵值對(duì)的方法,通過put方法添加時(shí)如果存在則會(huì)進(jìn)行覆蓋,通過putIfAbsent方法添加時(shí)如果存在則不進(jìn)行覆蓋,這兩個(gè)方法都是調(diào)用分段鎖的put方法來完成操作,只是傳入的最后一個(gè)參數(shù)不同而已。在上面代碼中我們可以看到首先是根據(jù)key的哈希碼來計(jì)算出分段鎖在數(shù)組中的下標(biāo),然后根據(jù)下標(biāo)使用UnSafe類getObject方法來讀取分段鎖。由于在構(gòu)造ConcurrentHashMap時(shí)沒有對(duì)Segment數(shù)組中的元素初始化,所以可能讀到一個(gè)空值,這時(shí)會(huì)先通過ensureSegment方法新建一個(gè)分段鎖。獲取到分段鎖之后再調(diào)用它的put方法完成添加操作,下面我們來看看具體是怎樣操作的。
//添加鍵值對(duì) final V put(K key, int hash, V value, boolean onlyIfAbsent) { //嘗試獲取鎖, 若失敗則進(jìn)行自旋 HashEntry<K,V> node = tryLock() ? null : scanAndLockForPut(key, hash, value); V oldValue; try { HashEntry<K,V>[] tab = table; //計(jì)算元素在數(shù)組中的下標(biāo) int index = (tab.length - 1) & hash; //根據(jù)下標(biāo)獲取鏈表頭結(jié)點(diǎn) HashEntry<K,V> first = entryAt(tab, index); for (HashEntry<K,V> e = first;;) { //遍歷鏈表尋找該元素, 找到則進(jìn)行替換 if (e != null) { K k; if ((k = e.key) == key || (e.hash == hash && key.equals(k))) { oldValue = e.value; //根據(jù)參數(shù)決定是否替換舊值 if (!onlyIfAbsent) { e.value = value; ++modCount; } break; } e = e.next; //沒找到則在鏈表添加一個(gè)結(jié)點(diǎn) } else { //將node結(jié)點(diǎn)插入鏈表頭部 if (node != null) { node.setNext(first); } else { node = new HashEntry<K,V>(hash, key, value, first); } //插入結(jié)點(diǎn)后將元素總是加1 int c = count + 1; //元素超過閥值則進(jìn)行擴(kuò)容 if (c > threshold && tab.length < MAXIMUM_CAPACITY) { rehash(node); //否則就將哈希表指定下標(biāo)替換為node結(jié)點(diǎn) } else { setEntryAt(tab, index, node); } ++modCount; count = c; oldValue = null; break; } } } finally { unlock(); } return oldValue; }
為保證線程安全,分段鎖中的put操作是需要進(jìn)行加鎖的,所以線程一開始就會(huì)去獲取鎖,如果獲取成功就繼續(xù)執(zhí)行,若獲取失敗則調(diào)用scanAndLockForPut方法進(jìn)行自旋,在自旋過程中會(huì)先去掃描哈希表去查找指定的key,如果key不存在就會(huì)新建一個(gè)HashEntry返回,這樣在獲取到鎖之后就不必再去新建了,為的是在等待鎖的過程中順便做些事情,不至于白白浪費(fèi)時(shí)間,可見作者的良苦用心。具體自旋方法我們后面再細(xì)講,現(xiàn)在先把關(guān)注點(diǎn)拉回來,線程在成功獲取到鎖之后會(huì)根據(jù)計(jì)算到的下標(biāo),獲取指定下標(biāo)的元素。此時(shí)獲取到的是鏈表的頭結(jié)點(diǎn),如果頭結(jié)點(diǎn)不為空就對(duì)鏈表進(jìn)行遍歷查找,找到之后再根據(jù)onlyIfAbsent參數(shù)的值決定是否進(jìn)行替換。如果遍歷沒找到就會(huì)新建一個(gè)HashEntry指向頭結(jié)點(diǎn),此時(shí)如果自旋時(shí)創(chuàng)建了HashEntry,則直接將它的next指向當(dāng)前頭結(jié)點(diǎn),如果自旋時(shí)沒有創(chuàng)建就在這里新建一個(gè)HashEntry并指向頭結(jié)點(diǎn)。在向鏈表添加元素之后檢查元素總數(shù)是否超過閥值,如果超過就調(diào)用rehash進(jìn)行擴(kuò)容,沒超過的話就直接將數(shù)組對(duì)應(yīng)下標(biāo)的元素引用指向新添加的node。setEntryAt方法內(nèi)部是通過調(diào)用UnSafe的putOrderedObject方法來更改數(shù)組元素引用的,這樣就保證了其他線程在讀取時(shí)可以讀到最新的值。
7. 刪除元素具體是怎樣實(shí)現(xiàn)的?
//刪除指定元素(找到對(duì)應(yīng)元素后直接刪除) public V remove(Object key) { //使用哈希函數(shù)計(jì)算哈希碼 int hash = hash(key); //根據(jù)哈希碼獲取分段鎖的索引 Segment<K,V> s = segmentForHash(hash); //調(diào)用分段鎖的remove方法 return s == null ? null : s.remove(key, hash, null); } //刪除指定元素(查找值等于給定值才刪除) public boolean remove(Object key, Object value) { //使用哈希函數(shù)計(jì)算哈希碼 int hash = hash(key); Segment<K,V> s; //確保分段鎖不為空才調(diào)用remove方法 return value != null && (s = segmentForHash(hash)) != null && s.remove(key, hash, value) != null; }
ConcurrentHashMap提供了兩種刪除操作,一種是找到后直接刪除,一種是找到后先比較再刪除。這兩種刪除方法都是先根據(jù)key的哈希碼找到對(duì)應(yīng)的分段鎖后,再通過調(diào)用分段鎖的remove方法完成刪除操作。下面我們來看看分段鎖的remove方法。
//刪除指定元素 final V remove(Object key, int hash, Object value) { //嘗試獲取鎖, 若失敗則進(jìn)行自旋 if (!tryLock()) { scanAndLock(key, hash); } V oldValue = null; try { HashEntry<K,V>[] tab = table; //計(jì)算元素在數(shù)組中的下標(biāo) int index = (tab.length - 1) & hash; //根據(jù)下標(biāo)取得數(shù)組元素(鏈表頭結(jié)點(diǎn)) HashEntry<K,V> e = entryAt(tab, index); HashEntry<K,V> pred = null; //遍歷鏈表尋找要?jiǎng)h除的元素 while (e != null) { K k; //next指向當(dāng)前結(jié)點(diǎn)的后繼結(jié)點(diǎn) HashEntry<K,V> next = e.next; //根據(jù)key和hash尋找對(duì)應(yīng)結(jié)點(diǎn) if ((k = e.key) == key || (e.hash == hash && key.equals(k))) { V v = e.value; //傳入的value不等于v就跳過, 其他情況就進(jìn)行刪除操作 if (value == null || value == v || value.equals(v)) { //如果pred為空則代表要?jiǎng)h除的結(jié)點(diǎn)為頭結(jié)點(diǎn) if (pred == null) { //重新設(shè)置鏈表頭結(jié)點(diǎn) setEntryAt(tab, index, next); } else { //設(shè)置pred結(jié)點(diǎn)的后繼為next結(jié)點(diǎn) pred.setNext(next); } ++modCount; --count; //記錄元素刪除之前的值 oldValue = v; } break; } //若e不是要找的結(jié)點(diǎn)就將pred引用指向它 pred = e; //檢查下一個(gè)結(jié)點(diǎn) e = next; } } finally { unlock(); } return oldValue; }
在刪除分段鎖中的元素時(shí)需要先獲取鎖,如果獲取失敗就調(diào)用scanAndLock方法進(jìn)行自旋,如果獲取成功就執(zhí)行下一步,首先計(jì)算數(shù)組下標(biāo)然后通過下標(biāo)獲取HashEntry數(shù)組的元素,這里獲得了鏈表的頭結(jié)點(diǎn),接下來就是對(duì)鏈表進(jìn)行遍歷查找,在此之前先用next指針記錄當(dāng)前結(jié)點(diǎn)的后繼結(jié)點(diǎn),然后對(duì)比key和hash看看是否是要找的結(jié)點(diǎn),如果是的話就執(zhí)行下一個(gè)if判斷。滿足value為空或者value的值等于結(jié)點(diǎn)當(dāng)前值這兩個(gè)條件就會(huì)進(jìn)入到if語句中進(jìn)行刪除操作,否則直接跳過。在if語句中執(zhí)行刪除操作時(shí)會(huì)有兩種情況,如果當(dāng)前結(jié)點(diǎn)為頭結(jié)點(diǎn)則直接將next結(jié)點(diǎn)設(shè)置為頭結(jié)點(diǎn),如果當(dāng)前結(jié)點(diǎn)不是頭結(jié)點(diǎn)則將pred結(jié)點(diǎn)的后繼設(shè)置為next結(jié)點(diǎn)。這里的pred結(jié)點(diǎn)表示當(dāng)前結(jié)點(diǎn)的前繼結(jié)點(diǎn),每次在要檢查下一個(gè)結(jié)點(diǎn)之前就將pred指向當(dāng)前結(jié)點(diǎn),這就保證了pred結(jié)點(diǎn)總是當(dāng)前結(jié)點(diǎn)的前繼結(jié)點(diǎn)。注意,與JDK1.6不同,在JDK1.7中HashEntry對(duì)象的next變量不是final的,因此這里可以通過直接修改next引用的值來刪除元素,由于next變量是volatile類型的,所以讀線程可以馬上讀到最新的值。
8. 替換元素具體是怎樣實(shí)現(xiàn)的?
//替換指定元素(CAS操作) public boolean replace(K key, V oldValue, V newValue) { //使用哈希函數(shù)計(jì)算哈希碼 int hash = hash(key); //保證oldValue和newValue不為空 if (oldValue == null || newValue == null) throw new NullPointerException(); //根據(jù)哈希碼獲取分段鎖的索引 Segment<K,V> s = segmentForHash(hash); //調(diào)用分段鎖的replace方法 return s != null && s.replace(key, hash, oldValue, newValue); } //替換元素操作(CAS操作) final boolean replace(K key, int hash, V oldValue, V newValue) { //嘗試獲取鎖, 若失敗則進(jìn)行自旋 if (!tryLock()) { scanAndLock(key, hash); } boolean replaced = false; try { HashEntry<K,V> e; //通過hash直接找到頭結(jié)點(diǎn)然后對(duì)鏈表遍歷 for (e = entryForHash(this, hash); e != null; e = e.next) { K k; //根據(jù)key和hash找到要替換的結(jié)點(diǎn) if ((k = e.key) == key || (e.hash == hash && key.equals(k))) { //如果指定的當(dāng)前值正確則進(jìn)行替換 if (oldValue.equals(e.value)) { e.value = newValue; ++modCount; replaced = true; } //否則不進(jìn)行任何操作直接返回 break; } } } finally { unlock(); } return replaced; }
ConcurrentHashMap同樣提供了兩種替換操作,一種是找到后直接替換,另一種是找到后先比較再替換(CAS操作)。這兩種操作的實(shí)現(xiàn)大致是相同的,只是CAS操作在替換前多了一層比較操作,因此我們只需簡單了解其中一種操作即可。這里拿CAS操作進(jìn)行分析,還是老套路,首先根據(jù)key的哈希碼找到對(duì)應(yīng)的分段鎖,然后調(diào)用它的replace方法。進(jìn)入分段鎖中的replace方法后需要先去獲取鎖,如果獲取失敗則進(jìn)行自旋,如果獲取成功則進(jìn)行下一步。首先根據(jù)hash碼獲取鏈表頭結(jié)點(diǎn),然后根據(jù)key和hash進(jìn)行遍歷查找,找到了對(duì)應(yīng)的元素之后,比較給定的oldValue是否是當(dāng)前值,如果不是則放棄修改,如果是則用新值進(jìn)行替換。由于HashEntry對(duì)象的value域是volatile類型的,因此可以直接替換。
9. 自旋時(shí)具體做了些什么?
//自旋等待獲取鎖(put操作) private HashEntry<K,V> scanAndLockForPut(K key, int hash, V value) { //根據(jù)哈希碼獲取頭結(jié)點(diǎn) HashEntry<K,V> first = entryForHash(this, hash); HashEntry<K,V> e = first; HashEntry<K,V> node = null; int retries = -1; //在while循環(huán)內(nèi)自旋 while (!tryLock()) { HashEntry<K,V> f; if (retries < 0) { //如果頭結(jié)點(diǎn)為空就新建一個(gè)node if (e == null) { if (node == null) { node = new HashEntry<K,V>(hash, key, value, null); } retries = 0; //否則就遍歷鏈表定位該結(jié)點(diǎn) } else if (key.equals(e.key)) { retries = 0; } else { e = e.next; } //retries每次在這加1, 并判斷是否超過最大值 } else if (++retries > MAX_SCAN_RETRIES) { lock(); break; //retries為偶數(shù)時(shí)去判斷first有沒有改變 } else if ((retries & 1) == 0 && (f = entryForHash(this, hash)) != first) { e = first = f; retries = -1; } } return node; } //自旋等待獲取鎖(remove和replace操作) private void scanAndLock(Object key, int hash) { //根據(jù)哈希碼獲取鏈表頭結(jié)點(diǎn) HashEntry<K,V> first = entryForHash(this, hash); HashEntry<K,V> e = first; int retries = -1; //在while循環(huán)里自旋 while (!tryLock()) { HashEntry<K,V> f; if (retries < 0) { //遍歷鏈表定位到該結(jié)點(diǎn) if (e == null || key.equals(e.key)) { retries = 0; } else { e = e.next; } //retries每次在這加1, 并判斷是否超過最大值 } else if (++retries > MAX_SCAN_RETRIES) { lock(); break; //retries為偶數(shù)時(shí)去判斷first有沒有改變 } else if ((retries & 1) == 0 && (f = entryForHash(this, hash)) != first) { e = first = f; retries = -1; } } }
在前面我們講到過,分段鎖中的put,remove,replace這些操作都會(huì)要求先去獲取鎖,只有成功獲得鎖之后才能進(jìn)行下一步操作,如果獲取失敗就會(huì)進(jìn)行自旋。自旋操作也是在JDK1.7中添加的,為了避免線程頻繁的掛起和喚醒,以此提高并發(fā)操作時(shí)的性能。在put方法中調(diào)用的是scanAndLockForPut,在remove和replace方法中調(diào)用的是scanAndLock。這兩種自旋方法大致是相同的,這里我們只分析scanAndLockForPut方法。首先還是先根據(jù)hash碼獲得鏈表頭結(jié)點(diǎn),之后線程會(huì)進(jìn)入while循環(huán)中執(zhí)行,退出該循環(huán)的唯一方式是成功獲取鎖,而在這期間線程不會(huì)被掛起。剛進(jìn)入循環(huán)時(shí)retries的值為-1,這時(shí)線程不會(huì)馬上再去嘗試獲取鎖,而是先去尋找到key對(duì)應(yīng)的結(jié)點(diǎn)(沒找到會(huì)新建一個(gè)),然后再將retries設(shè)為0,接下來就會(huì)一次次的嘗試獲取鎖,對(duì)應(yīng)retries的值也會(huì)每次加1,直到超過最大嘗試次數(shù)如果還沒獲取到鎖,就會(huì)調(diào)用lock方法進(jìn)行阻塞獲取。在嘗試獲取鎖的期間,還會(huì)每隔一次(retries為偶數(shù))去檢查頭結(jié)點(diǎn)是否被改變,如果被改變則將retries重置回-1,然后再重走一遍剛才的流程。這就是線程自旋時(shí)所做的操作,需注意的是如果在自旋時(shí)檢測到頭結(jié)點(diǎn)已被改變,則會(huì)延長線程的自旋時(shí)間。
10. 哈希表擴(kuò)容時(shí)都做了哪些操作?
//再哈希 @SuppressWarnings("unchecked") private void rehash(HashEntry<K,V> node) { //獲取舊哈希表的引用 HashEntry<K,V>[] oldTable = table; //獲取舊哈希表的容量 int oldCapacity = oldTable.length; //計(jì)算新哈希表的容量(為舊哈希表的2倍) int newCapacity = oldCapacity << 1; //計(jì)算新的元素閥值 threshold = (int)(newCapacity * loadFactor); //新建一個(gè)HashEntry數(shù)組 HashEntry<K,V>[] newTable = (HashEntry<K,V>[]) new HashEntry[newCapacity]; //生成新的掩碼值 int sizeMask = newCapacity - 1; //遍歷舊表的所有元素 for (int i = 0; i < oldCapacity ; i++) { //取得鏈表頭結(jié)點(diǎn) HashEntry<K,V> e = oldTable[i]; if (e != null) { HashEntry<K,V> next = e.next; //計(jì)算元素在新表中的索引 int idx = e.hash & sizeMask; //next為空表明鏈表只有一個(gè)結(jié)點(diǎn) if (next == null) { //直接把該結(jié)點(diǎn)放到新表中 newTable[idx] = e; }else { HashEntry<K,V> lastRun = e; int lastIdx = idx; //定位lastRun結(jié)點(diǎn), 將lastRun之后的結(jié)點(diǎn)直接放到新表中 for (HashEntry<K,V> last = next; last != null; last = last.next) { int k = last.hash & sizeMask; if (k != lastIdx) { lastIdx = k; lastRun = last; } } newTable[lastIdx] = lastRun; //遍歷在鏈表lastRun結(jié)點(diǎn)之前的元素, 將它們依次復(fù)制到新表中 for (HashEntry<K,V> p = e; p != lastRun; p = p.next) { V v = p.value; int h = p.hash; int k = h & sizeMask; HashEntry<K,V> n = newTable[k]; newTable[k] = new HashEntry<K,V>(h, p.key, v, n); } } } } //計(jì)算傳入結(jié)點(diǎn)在新表中的下標(biāo) int nodeIndex = node.hash & sizeMask; //將傳入結(jié)點(diǎn)添加到鏈表頭結(jié)點(diǎn) node.setNext(newTable[nodeIndex]); //將新表指定下標(biāo)元素?fù)Q成傳入結(jié)點(diǎn) newTable[nodeIndex] = node; //將哈希表引用指向新表 table = newTable; }
rehash方法在put方法中被調(diào)用,我們知道在put方法時(shí)會(huì)新建元素并添加到哈希數(shù)組中,隨著元素的增多發(fā)生哈希沖突的可能性越大,哈希表的性能也會(huì)隨之下降。因此每次put操作時(shí)都會(huì)檢查元素總數(shù)是否超過閥值,如果超過則調(diào)用rehash方法進(jìn)行擴(kuò)容。因?yàn)閿?shù)組長度一旦確定則不能再被改變,因此需要新建一個(gè)數(shù)組來替換原先的數(shù)組。從代碼中可以知道新創(chuàng)建的數(shù)組長度為原數(shù)組的2倍(oldCapacity << 1)。創(chuàng)建好新數(shù)組后需要將舊數(shù)組中的所有元素移到新數(shù)組中,因此需要計(jì)算每個(gè)元素在新數(shù)組中的下標(biāo)。計(jì)算新下標(biāo)的過程如下圖所示。
我們知道下標(biāo)直接取的是哈希碼的后幾位,由于新數(shù)組的容量是直接用舊數(shù)組容量右移1位得來的,因此掩碼位數(shù)向右增加1位,取到的哈希碼位數(shù)也向右增加1位。如上圖,若舊的掩碼值為111,則元素下標(biāo)為101,擴(kuò)容后新的掩碼值為1111,則計(jì)算出元素的新下標(biāo)為0101。由于同一條鏈表上的元素下標(biāo)是相同的,現(xiàn)在假設(shè)鏈表所有元素的下標(biāo)為101,在擴(kuò)容后該鏈表元素的新下標(biāo)只有0101或1101這兩種情況,因此數(shù)組擴(kuò)容會(huì)打亂原先的鏈表并將鏈表元素分成兩批。在計(jì)算出新下標(biāo)后需要將元素移動(dòng)到新數(shù)組中,在HashMap中通過直接修改next引用導(dǎo)致了多線程的死鎖。雖然在ConcurrentHashMap中通過加鎖避免了這種情況,但是我們知道next域是volatile類型的,它的改動(dòng)能立馬被讀線程讀取到,因此為保證線程安全采用復(fù)制元素來遷移數(shù)組。但是對(duì)鏈表中每個(gè)元素都進(jìn)行復(fù)制有點(diǎn)影響性能,作者發(fā)現(xiàn)鏈表尾部有許多元素的next是不變的,它們?cè)谛聰?shù)組中的下標(biāo)是相同的,因此可以考慮整體移動(dòng)這部分元素。具統(tǒng)計(jì)實(shí)際操作中只有1/6的元素是必須復(fù)制的,所以整體移動(dòng)鏈表尾部元素(lastRun后面的元素)是可以提升一定性能的。
注:本篇文章基于JDK1.7版本。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持創(chuàng)新互聯(lián)。
當(dāng)前名稱:Java并發(fā)系列之ConcurrentHashMap源碼分析
路徑分享:http://aaarwkj.com/article6/gjccig.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供營銷型網(wǎng)站建設(shè)、ChatGPT、Google、動(dòng)態(tài)網(wǎng)站、標(biāo)簽優(yōu)化、App開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)