前言

你可能或多或少都有看過或聽過「MD5 加密」、「MD5 解密」、「SHA-1 加密」、「SHA-1 解密」、「雜湊加密演演算法」。但MD5 和SHA-1 實際上並不是加密演演算法,而是雜湊演演算法。那麼究竟加密跟雜湊到底有什麼不一樣,又該如何區分,這篇會跟大家好好聊一聊

雜湊(Hash)

其實雜湊在一些壓縮演演算法或者排序演演算法也都有用到,但這邊只就資訊安全相關的部分進行討論。

特性

  1. 雜湊演演算法的輸出又被稱做「雜湊值」(hash value)。
  2. 無論原文的內容長短,雜湊值都會是固定的長度,不同雜湊演演算法的輸出長度不同,即輸出長度與雜湊演演算法有關,不受原文長度影響。
  3. 相同的內容作為相同雜湊演演算法的輸入,得到的輸出必定一樣。不同的內容作為相同雜湊演演算法的輸入,得到的相同輸出的機率極低。因此,兩個原文的內容即便只差一個字,雜湊演演算法產生的兩個輸出內容卻會差非常多。
  4. 無法將雜湊演演算法的輸出解回原本的輸入,雜湊是單向的。

用途

  1. 檔案校驗碼(Checksum)

用來快速判斷檔案是否和原本相同。

舉個栗子:論壇檔案下載

有在論壇下載過檔案的人應該都很常見到一長串 MD5 或 SHA-1 驗證碼,就是用來讓你快速檢查你下載的檔案裡頭的內容,是不是跟上傳者上傳的檔案一樣。不一樣的話可能就是你載錯檔案、檔案有毀損或檔案被人加料了。

2.不需要被還原的資料

舉個栗子:避免明文儲存使用者密碼

避免直接儲存使用者的明文密碼,除了避免資料庫外泄時,攻擊者無需進一步運算就可以直接

常見演演算法

  1. SHA 系列
  2. MD5
  3. BLAKE2

結論

就是一串拿來做檢查的字串,但根據使用需求可以有不同的用途。

所以,為什麼雜湊不是加密?

雜湊和加密很容易被人搞混的原因,主要是因為,雜湊和加密通常是一起使用的,常常被拿在一起講,所以久而久之就搞混了。

但其實可以透過以下幾點來區分:

  • 加密需要密鑰,且可以透過解密得到原文。(加密可逆)
  • 雜湊不需密鑰,無法逆向解出原始輸入。(雜湊不可逆)
    • 雖然可以透過額外儲存的rainbow table 來找尋原始輸入,但彩虹表是預先計算並儲存下來的,而不是雜湊演演算法本身的設計。
  • 舉例
    • 今天如果我拿到一串密文,我是有辦法透過解密,得到原始的明文的,而且如果使用非對稱式加密的話,我什至還可以驗證傳送方是不是本人(是否有被進行中間人攻擊)。
      • 雜湊演演算法在這裡也會被使用,通常會被拿來檢驗傳送的訊息是否有被更改過。
      • 傳送方附上原始訊息經過某個雜湊演演算法得出的雜湊值,接收方在解開這個訊息之後,會透過相同的雜湊演演算法來驗證。
    • 但如果是拿到一串雜湊值的話,理論上是無法逆向得到原始的明文的,根本無法拿來做資料的傳遞。

所以別再說出「MD5 加密」、「MD5 解密」、「SHA-1 加密」、「SHA-1 解密」之類的話啦!

原文標題:What is the difference between encryption and hashing?

原文作者: M157q

譯文出自:雲子可信官方論壇

譯者:雲子可信漢化組


推薦閱讀:
相关文章