最早關於 Maya 編碼方案的文章來自「古文種的統一碼字體」(Unicode Fonts for Ancient Scripts)。該文引《瑪雅文字目錄》(A Catalog of Maya Hieroglyphs)( J. Eric S. Thompson,1962),編碼了約 1200 個字元。

順帶一提,該文同時給出了瑪雅數字的編碼方案。而瑪雅數字因見於瓜地馬拉國貨幣,先於瑪雅文字得到編碼。

瑪雅數字 (Mayan Numerals). Unicode 11.0.0.

Jameson Quinn. Mayan Numerals. L2/16-264.Jameson Quinn. Mayan Numerals. L2/16-264r.

該文的問題在於認為「瑪雅文字系統」是「四面附標的音素文字系統」,而事實上「瑪雅文字系統」較之更為複雜。

George Douros. Maya, version 4.18. Unicode Fonts for Ancient Scripts, April 2018.

硬要類比,「瑪雅文字系統」與「日本文字系統」接近。「日本文字系統」包含「漢字」和「假名」,其中「漢字」為「基於音節的詞素文字系統」,而「假名」為「音節文字系統」。「瑪雅文字系統」也包含「詞素文字系統」的部分和「音節文字系統」的部分,區別在於後者相較「假名」則更接近於「諺文」,為「基於線性音節塊型字母表的音素文字系統」。

Kushim Jiang. 象形文字是人類第一選擇的文字嗎. Pohu.

直觀地說,以上兩字均表示「美洲虎」。前者為「詞素文字系統」部分,整體對應「ba:lam」;後者為「音節文字系統」部分,左部對應「ba」,右上對應「la」,右下對應「ma」。

Carlos Pallán Gayol, Deborah Anderson. Unlocking the Mayan Hieroglyphic Script with Unicode. DH2016 – Krákow, Poland.

因此,瑪雅文字的編碼方案一方面要編碼「詞素文字系統」部分的整體字元,另一方面則要編碼「音節文字系統」部分的音節字元。音節字元之間的連接則可以參考「古埃及文字」(Egyptian Hieroglyphs)區塊,採用「縱向連字元」(vertical joiner)、「橫向連字元」(horizontal joiner)等的機制。

Carlos Pallán Gayol. A preliminary proposal for encoding Mayan Hieroglyphic text in Unicode. L2/18-038.

Carlos Pallán Gayol. Proposal to Encode Mayan Hieroglyphs. L2/18-047.

順帶二提,引文里還給出了百餘種瑪雅文字構形的列表,與漢字構形描述符不同,這一表格區分了不同字寬的構形。如左右結構下同時有 2:5、5:2、1:1、3:4,同時兩邊構件是否等高、構件之間是否緊貼也被區分。經過比對,如若不區分構件的字寬,這百餘種構形均可對應到增補 4 個新符號後的漢字構形描述符。

因此,在技術層面上,編碼瑪雅文字並不比古埃及文字難,主要的難度則應在於字樣的搜集與示例字體的設計。


推薦閱讀:
相关文章