Ⅰ 為什麼重寫equals()的時候要重寫hashCode()
在Java開發中,理解equals()和hashCode()的使用是至關重要的,尤其在涉及對象的比較和存儲時。兩個方法都是在Object類中定義,但它們的用途和工作原理截然不同。
equals()方法用於比較兩個對象是否相等。在Java中,使用==或equals()方法進行比較。後者適用於引用類型,比較的是對象的欄位值而非內存地址。默認情況下,equals()方法通過比較對象的內存地址實現,這在大多數情況下是沒有意義的。因此,為了實現引用類型之間的有意義的比較,需要重寫equals()方法,以比較對象的欄位值。
而hashCode()方法則用於返回對象的哈希值。在哈希表(如Java的HashSet、HashMap)中,哈希值用於計算對象在數組中的位置,以實現高效查找和存儲。如果兩個對象的哈希值相同,可能會導致哈希沖突,這時需要通過其他方法(如鏈表或二次定址)解決。
那麼,為什麼在重寫equals()方法時需要同時重寫hashCode()方法呢?這是因為哈希表的效率依賴於哈希函數(即hashCode()方法)的正確性。如果兩個對象相等(即equals()返回true),它們的哈希值也應該相同,以確保哈希表中的唯一性。反之,如果不一致,可能會導致哈希沖突,影響性能。
為了正確實現對象的去重功能,如使用HashSet,必須同時重寫equals()和hashCode()方法。如果只重寫equals(),但沒有重寫hashCode(),可能會在哈希表中保留重復的元素,違反了去重的初衷。因此,同時重寫這兩個方法,確保它們在邏輯上相一致,是實現高效且正確的對象比較和存儲的關鍵。
Ⅱ C#初學者對Equals方法的幾個常見誤解
很多C#的教材都會強調對象相等的概念。我們都知道,在C#的世界裡存在兩種等同性。一種是邏輯等同性:如果兩個對象在邏輯上代表同樣的值,則稱他們具有邏輯等同性。另一種是引用等同性:如果兩個引用指向同一個對象實例,則稱他們具有引用等同性。
眾所周知,Object類型有一個名為Equals的實例方法可以用來確定兩個對象是否相等。Object的Equals的默認實現比較的是兩個對象的引用等同性。而Object的派生類ValueTpye重寫了Equals方法,它比較的是兩個對象的邏輯等同性。也就是說,在C#里,引用類型的默認Equals版本關注的是引用等同性,而值類型關注的是邏輯等同性。當然,這並不總能滿足我們的要求。所以每當我們更在意引用類型的邏輯等同性的時候,我們就應該重寫Equals方法。
重寫引用類型的Equals方法以改變其默認的比較方式的一個著名例子是String類。當我們寫出「string1.Equals(string2)」這樣的代碼時,我們比較的不是string1和string2這兩個引用所指向的是否為同一個實例(引用等同性),而是比較string1與string2所包含的字元序列是否相同(邏輯等同性)。
誤解一:Equals方法和operator==具有相同的默認行為。
對於引用類型,如果沒有為它重載==操作符,且其父類型也沒有重寫Equals方法,則這個引用類型Equals方法和operator==具有相同的默認行為,即它們比較的都是對象的引用等同性。然而對於值類型來說,就完全不是這么回事了!因為如果你沒有為自定義值類型重載operator==的話,就不能寫這樣的代碼「myStruct1 == myStruct2」,否則會得到一個編譯錯誤,原因是值類型沒有相等操作符重載的默認實現。
誤解二:自定義類的Equals的方法默認實現將自動調用operator==方法,或operator==方法的默認實現將自動調用Equals方法。
經常聽到有人說某某類型是引用類型,所以它的Equals方法的默認實現將自動調用operator==方法。這種說法完全是沒有道理的。正如上文所說的,引用類型Equals方法的默認實現來自Object,而值類型的默認實現來自TypeValue,就算他們會使用==操作符,使用的也是Object或TypeValue的重載版本。原則上來說,只要我們沒有重寫一個類的Equals方法,那麼它就會繼承其父類的實現,而父類是沒有機會使用子類型的操作符重載的。同樣,只要我們沒有在一個類的==操作符重載中調用Equals方法,它是不會自動調用的。
誤解三:值類型的默認Equals實現是對兩個對象進行逐位比較的。
有些人認為值類型的Equals默認實現就是通過比較兩個對象在內存中的位表示,即如果所有的二進制位都相等,則說明這兩個對象「等同」。這是不準確的。因為其實值類型的Equals默認實現是對值類型的每個欄位都調用該欄位類型的Equals方法,如果所有欄位的Equals方法都返回true,則他們才可能相等。來看一個例子:
很顯然,a和b擁有完全不同的二進制位表示。但是最終列印的結果是:
?
MyClass的Equals方法被調用了。True
這說明值類型的默認實現是通過調用欄位的Equals方法來確定兩個對象是否相等,而不是通過比較他們的二進制位是否一致來確定的。
誤解四:Equals是非常基本、非常常用的方法,所以其默認的實現不存在性能問題。
對於引用類型,Equals的默認實現很簡單,僅僅需要判斷兩個引用是不是同一種類型、兩個引用指向的是不是同一塊內存就可以了。所以其性能也沒有問題。但是對於值類型,Equals的任務就沒有這么簡單了。它需要對兩個對象的所有欄位都做出比較,即逐欄位調用欄位類型的Equals。由於在ValueType(值類型Equals方法默認實現的位置)中,不可能知道它所有的子類型都包含哪些欄位,所以為了調用子類型欄位的Equals方法,ValueType的Equals就需要使用反射技術。您可能已經看出來了,反射並不是一種性能友好的技術,所以值類型的Equals方法算不上高效。這也正是為什麼微軟推薦我們為自定義值類型重寫Equals方法的原因。