科学家重新为 27 个人类基因进行命名,只因为它们会被 Excel 自动转换成日期

高度发展的人类拥有成千上万组基因,无数种可能组合呈现出了你我独一无二的样貌与特征。但是,为这些基因进行研究的科学家们,长期以来却被一项大问题所困扰,那就是试算表软体 Microsoft Excel。

为了对基因进行详细的研究跟了解,同时也便于学界称呼跟识别,科学家为每个基因都给予了一个由英文字母跟数字所组成的名称,在学界也被称呼为「符号」(Symbol)。

在过去一年时间以来,总共有 27 个人类基因符号,获得科学家重新进行命名,但是其原因并非定义不准确或违反学界规则,而是由于 Microsoft Excel 不断将这些「基因符号」误读为「日期」。

科学家重新为 27 个基因进行命名,只因为某些基因会被 Excel 自动转换成日期

Microsoft Excel 是套主流的试算表软体,当然科学家也会拿它来进行工作,但很显然微软没有想到,这款面向大众消费者的软体,居然会对科学研究造成困扰。

举例来说,当科学家在 Microsoft Excel 的表格中输入「MARCH1」,也就是「Membrane Associated Ring-CH-Type Finger 1」,一组跟人类手指有关的基因符号时,Excel 会自动将其识别为「日期」的 March 1,转换成 3 月 1 日进行呈现。

科学家重新为 27 个基因进行命名,只因为某些基因会被 Excel 自动转换成日期

一名英国 Quadram 研究所的系统生物学家 DezsőMódos 向媒体表示,这虽然不能算是 Microsoft Excel 的 Bug,但它真的非常烦人。更糟糕的是,Microsoft Excel 自动把基因符号转换成日期的「好意」行为,甚至影响到相关论文的同侪审查工作。

根据 2016 年的一项研究,科学家检查了 3,597 篇已发表论文中的遗传数据,却赫然发现有大约五分之一的基因符号,竟然受到了 Excel 错误的影响,为科学精准性带来了相当程度的威胁。

科学家重新为 27 个基因进行命名,只因为某些基因会被 Excel 自动转换成日期

身为一套成熟的试算表软体,照理来说 Microsoft Excel 应该有相当简单的解决办法,能够提供给苦恼的科学家。但是,众所周知 Excel 并不提供关闭自动格式转换的选项,科学家只能在键入文字之后,手动修改资料形态,让基因符号以纯文字方式呈现。

上述这种已经很麻烦的处理方法,却仍然有一个显而易见的缺点。假设科学家并不是个操作 Microsoft Excel 的能手,那么在开启同行传来的试算表时,若忘记进行转换,那么这些基因符号终究还是会以日期的方式,显示于表格之中。

考虑到 Microsoft Excel 并非科学家专用的软体,负责基因命名的国际人类基因组组织(HUGO)旗下,人类基因组组织基因命名委员会(HGNC),决定用一个最直截了当的方式来解决问题,那就是把会影响数据处理和检索的基因符号,用有规则的方式重新命名。

科学家重新为 27 个基因进行命名,只因为某些基因会被 Excel 自动转换成日期

举例来说,前面提过的「MARCH1」现在已重新更名为「MARCHF1」,而「SEPT1」则已变为「SEPTIN1」,这样一来当科学家于 Microsoft Excel 中输入文字时,就不会自动被转换成日期。

事实上,基因更名在科学界也并非先例。在过去,CARS 也曾变更为 CARS1,WARS 也更改成了 WARS1,至于 MARS 则调整为 MARS1,但它们的更名理由是为了避免侮辱词或常用词,并非是为了某套特定的电脑软体。

科学家重新为 27 个基因进行命名,只因为某些基因会被 Excel 自动转换成日期

HGNC 表示,截至目前为止,有 27 个基因符号获得更加友善的名称。且为了避免将来造成识别上的混乱,所以官方也在资料库中,同时保留了旧的基因符号与更名记录。

遗传学家 Janna Hutz 在 Twitter 上分享了 HGNC 重新命名的做法后,科学家社群间的反应异常活跃,她说国际人类基因组组织的选择「令人震惊」,但也有科学家兴奋表示「终于改了!」,甚至有人指称,这真的是当天最重要也最大条的新闻。

参考来源:The Verge

相关文章