UTF-8是一種用於存儲支持多語言的Unicode字串的編碼方式。
Unicode和UTF-8是在上世紀90年代以後開發的,囙此在80年代開發的ZIP格式不支持UTF-8。 然而,隨著ZIP格式成為壓縮檔的標準格式,ZIP格式也需要支持Unicode,於是開發出各種能够在ZIP文件處理UTF-8字串的方法。
Bandizip支持兩種方式:一、將檔名直接保存為UTF-8; 二、將檔名保存為MBCS並在擴展欄位再保存UTF-8檔名。

用ZIP壓縮檔時,將檔名以Unicode(UTF-8)保存
這是將壓縮在ZIP檔案中的檔名以UTF-8保存的管道。 此為APPNOTE定義的標準UTF-8檔名保存管道,但有些壓縮程式時常出現無法正確識別或因錯誤處理而無法正常顯示檔名(出現亂碼)的問題。
用ZIP壓縮檔時,將Unicode(UTF-8)檔名保存在擴展欄位
這是將檔名保存為MBCS並在ZIP格式的擴展欄位再保存UTF-8檔名的管道。 該管道也由APPNOTE定義為Info-ZIP Unicode Path Extra Field。 由於將檔名另外保存在擴展欄位,ZIP文件大小可能會增大數十位元組,但基本上檔名保存為MBCS,囙此相容性更佳。
在使用不同語言的作業系統上,如果使用支持該擴展欄位的壓縮程式(7-Zip、WinRAR、WinZip),檔名不會出現亂碼。
下圖是在日文版Windows使用7-Zip打開在韓文版Windows壓縮的檔案的畫面。

用TAR/TGZ壓縮檔時,將檔名以Unicode(UTF-8)保存

TAR或TGZ等格式是主要在Unix使用的壓縮格式,Unix系統使用UTF-8檔名。 啟用該功能後壓縮檔,即便檔名中含有韓文,也能在Unix系統上正常解壓。
但Windows的有些程式可能無法正確識別TAR/TGZ格式的UTF-8內碼表。
源文來自:https://cn.bandisoft.com/bandizip/help/utf8/
發佈於 2025-04-18
广东