生僻地名用字专栏开设已有一段时间,期间,我们的工作得到了很多帮助,取得了不少进展,但也遇到了一些问题。基于现在的情况及以往的经验,我们决定作如下声明:

1.本专栏作者所做的工作同天津大学官方没有任何联系

到目前为止,天津大学官方从未在任何时间以任何方式给我们的工作提供过任何形式的实质性帮助,从未在任何场合对我们所做的工作做过任何形式的宣传。我们不期望其给我们的工作提供任何非常规的有利条件,不对天津大学官方及其任何下属机构负责。

2.我们所做的工作的目的是:搜集中国大陆现代地名中正在使用的或者曾经使用过的适合编码的统一码未编码字的书证,以解决无法在电子设备上使用这些字进行广泛文本传输的问题。

相信不少人都看到过类似「某字电脑无法显示或电脑字型档所无,无法办理某业务」之类的新闻,其实很多这种情况都可以归因于这些字没有被 ISO/IEC 10646 国际标准收录。此标准收录了大量字元(包括多种文字及符号等,每个字元对应一个固定的编码,以实现不同设备之间无障碍的信息交流),已经广泛应用在我们日常生活所使用的电子设备中(我国的相关强制国标GB 18030 也遵循ISO/IEC 10646 国际标准)。汉字即是此标准收录字元的一部分,只有一个汉字被赋予一个类似「身份证」的编码,我们才能 不致混乱地 在电子设备上使用此字沟通与交流。

中日韩统一表意文字基本区码表部分截图,在Word中可用Alt+X进行Unicode码同对应字元的转换

我们之后所做的工作可概括如下:在之前研究的基础上,进一步搜集并检索地方志及其它相关资料,系统整理未编码地名用字的各种相关信息,并对其形、音、义进行初步探讨和考证,向IRG(Ideographic Research Group, according to IRGN2381)提交其中的可靠证据,并参与IRG的其它日常事务。

注:IRG(ISO/IEC JTC1/SC2/WG2/IRG),即表意文字小组,或译表意文字工作组,是国际标准化组织和国际电工委员会下属的负责制定汉字编码国际标准(ISO/IEC 10646 国际标准中日韩统一表意文字部分)的非盈利机构。这里所说的汉字是广义的楷体汉字,不仅包括日本汉字、韩国汉字、喃字、壮字等,也囊括隶定字等特殊类型的汉字。

3.我们不接受任何有附加条件的资助,并保证所获得的资金资助将全部用于搜集相关资料,但这些资金资助将由我们全权支配。

根据我们对各种相关失败工作的分析和总结,我们认为做好这类工作最重要的条件是独立和积累。与一些大型项目相比,我们工作极低的花费和较高的效率十分有力地证明了这一点。

我们保证将获得的全部资金资助用于与统一码外字相关的资料的搜集(不仅限于地名生僻字书证),搜集到的资料使用过后,将被全部捐赠至大学图书馆,此大学图书馆将对其进行电子化,并将电子版提供给我们,我们再转发至捐赠者手中。除上述扫描版电子书(一般为PDF格式)外,捐赠者不会获得其它任何形式的正收益。

4.我们的工作成果会在整理后统一发表,并且会提供原始来源、进行信息更新。我们永远不会用我们的成果以任何形式收取任何费用,但我们希望您在引用我们的数据时可以附上来源。

相信很多人都知道国学大师网站,我也不得不说,用这个网站查字非常方便。但国学大师网站从字海网上抄袭了数不清的释义,却不附来源,没有一句感谢。

他们的网站是这么说的:

貌似很文明,很绅士,但当初找他们要求删除的时候他们比流氓还要流氓,更有趣的是他们的致谢也从有字海网变成了没有。

上小学的时候我们就知道,如果抄别人的作业错的一模一样是会被老师发现的,同理,采用同样的对比方法,可以很容易得出结论。

我们认为,也许这样的行为可以在短期内得到很大的收益,甚至有利于知识的传播;但长期来看,此种行为必然会阻碍先进文化的进步。其久打不倒的现实正是其在短时间内为其他人提供大量收益的侧面表现。

回到本专栏的情况,我们认为这些信息的公开远比钱重要得多,也希望各位使用者、引用者能理解我们。

5. 我们与四川外国语大学周文德教授建立了合作关系,将参与项目《地名用字搜集整理、形音义研究与基础信息平台建设》相关研究工作。

2019 年1 月末,我与2018 年度国家社科基金重大招标项目《地名用字搜集整理、形音义研究与基础信息平台建设》(18zDA294)的首席专家、四川外国语大学教授周文德先生进行了面对面的交流,并开始进行合作和成果交流,以及参考资料的共享。我们的研究理念、研究思路均比较相近,相信我们的合作将会取得更多丰富的、实质性的、负责任的成果。

6.最后,谨向所有为汉字编码做出无私贡献的专家和学者致敬。

相信绝大多数人在阅读本文之前都没有听说过IRG这个机构,甚至从不知道有一个汉字编码的国际标准。而汉字编码的发展程度在一定程度上决定了今后汉语文本的信息化能力,这又在一定程度上决定了汉语文化圈在信息时代的文化竞争力。令人遗憾的是,国内现今无论是普通人还是学者,甚至是专业字体制作者和输入法公司的技术人员都缺乏最基本的汉字编码知识,以至于 @搜狗输入法 PUA(Private Use Areas,即私用区,国际标准规定用户可以自由定义字形的码位集合)中出现大量已编码字, 科学出版社出版了不知所云的《计算机字元编码——Unicode 与 Windows》一书(详见回答:你读过哪些不值得一读的烂书?它们分别烂在哪里?)。

IRG的日常工作相当繁杂,这就要求IRG的专家有非常的耐心和相当高的个人能力,而这种对于能力和耐力的要求与他们从事相关工作所获得的零收益甚至是负收益是完全不匹配的。或者说得更直白一点,IRG专家们完全可以用他们的能力和精力获得更多的金钱和名誉。总之,IRG中各位专家的工作也许永远不会被很多人理解甚至了解,我也只能在此发出一点微弱的声音,对他们饱满的热情和辛勤无私的默默付出致以我们最高的敬意。


推荐阅读:
相关文章