Excel正在自动更正科学研究。这并不酷

作者:乔纳森·斯特里克兰

Excel正在自动更正科学研究。而现在这种工作方式并不酷
Excel正在自动更正科学研究。这并不酷现在该怎么做

由于“自动更正”或“自动完成”,您发送或接收到的邮件很有可能是乱码成百上千的模因这些错误会导致错误的沟通,通常会带来可笑的结果。比如这个. 或这个. 或这个.

但发生在你的科学论文上就不那么有趣了。学术论文通常包括补充文件,其中包含支持论文结论的数据、图表和图表。这些文件中有许多是电子表格。

广告

自2004年以来,科学家们注意到,流行的电子表格程序MicrosoftExcel有一个坏习惯,即将某些基因名称转换为其他类型的数据。例如,遗传学家使用作为速记对于膜相关环CH型手指1。但Excel将MARCH1解释为日期,自动将其转换为3月1日的1-Mar或其他名称。

Excel将一些其他基因名称错误地识别为坐标或浮点。你可能可以推断出1-Mar实际上是MARCH1,但2.31E+13如何?Excel就是这样转换RIKEN标识符2310009E13的。RIKEN是日本的一家大型研究机构,除其他外,还进行基因组计划。(为了记录在案,我们尝试将RIKEN标识符插入Excel电子表格,并将其自动转换为2.31E+19,但仍然错误,并且仍然不是那些学术论文中的意图。)

尽管研究人员早在十多年前就发现了这个问题,但这个问题一直持续到今天。研究人员马克·齐曼、约塔姆·埃伦和阿萨姆·奥斯塔筛选了35000多份补充文件,看看这个问题实际上有多普遍。他们开发了自动软件,搜索任何看起来可能是基因名称列表的数据。他们确定了7467个基因列表,代表了18种不同期刊上3597篇已发表论文的补充数据。结果表明,这些已发表论文中有704篇包含Excel格式错误的文件。这是19.6%的失败率。换句话说,近五分之一的已发表论文包含有Excel格式错误的补充文件。

这不仅仅是一个不便。研究人员依靠已发表的作品来指导他们自己的项目。如果文件中包含错误,那么整理问题并找到相关数据可能会很困难,也很耗时。

为什么不干脆关闭自动格式化功能呢?根据研究小组的说法,没有办法永久禁用Excel中的功能。你可以在每次创建新文件时手动更改每个选项,但这样做效率很低。不过,他们确实指出,Google Sheets并没有采用相同的格式化方法。W更重要的是,如果您首先将所有数据放入谷歌表格,然后将其复制到另一个电子表格程序中,格式保持不变。

有意思的是,一个旨在帮助人们使用电子表格的特性在学术界引起了这样的头痛。也许Excel的未来版本将包括一个选项来无限期地禁用自动格式化特征。直到那时,遗传学家应该仔细检查他们的工作或者考虑切换到谷歌表。

广告

广告

加载。。。