所有网络开发人员都该超越ASCII,继续前进了

描述

现在,所有网络开发人员

都该超越ASCII,继续前进了

由于最早的计算和网络工作都出现在美国和欧洲,因此拉丁字母及其惯例(例如从左至右的字符顺序)被应用在了软件和硬件当中。在亚太地区域名注册机构做了几年总经理之后,唐•赫兰德(Don Hollander)认为,互联网应用应该支持尽可能多的语言和书写系统。

赫兰德现在是普遍适用性指导小组(Universal Acceptance Steering Group,UASG)的秘书长。该组织认为,所有有效顶级域名(TLD),例如“.com”“.tech”“.信息”,都应适用于任何网站或电子邮件应用程序。在这个过程中,网站不仅将更便于全球各地的人访问,也能够使公司在目前丢失的市场上达成交易或获取客户信息。据UASG估计,若能实现,每年能够带来98亿美元的经济效益。

“过去几年里,域名空间发生了很大的变化。”赫兰德说。一开始,顶级域名要么是3个字母(比如.edu),要么是两个字母(比如国家代码.de)。2010年左右,事情发生了变化,人们开始呼吁TLD的多样化。

这一呼声带来了两大变化。一是创造了扩展gTLD(长度为3个甚至更多字母的通用顶级域名),因此.law和.info这类域名现在都可以使用了(UASG网站本身也使用了.tech域名)。二是可以使用不包含拉丁字母的语言设置TLD,电子邮件地址和TLD也可以使用通用Unicode字符。到2013年,新建的TLD已超过2000个。

到2015年,赫兰德说,在域名系统(DNS)级别上,也就是在管理TLD和将其与特定数字网络地址关联的目录级别上,对处理这些新的各式各样TLD的能力进行了大规模的整理。(不过也存在一些问题。从代码的角度来看,表情符号比较复杂,同一个表情符号可以由多种方式组成。因此,虽然存在基于表情符号的网址,但很难管理。)

赫兰德说,普及和传播也是一项挑战。因为如果特定应用的驱动代码仍然只支持2到3个字母的TLD和由拉丁字母组成的电子邮件地址,那么网络是否存在新式域名也就无关紧要了。但可惜的是,许多应用开发人员还没有与时俱进。

以往,创建一个检查电子邮件地址或TLD是否有效的软件程序非常简单。10年前,如果某个应用程序要求用户填写电子邮件地址,开发人员可能会通过一些方法来进行测试,检查其响应是否有效。比如,它应该有“@”符号、后跟句点,之后跟着2到3个字母。如果没能通过这些测试,那么电子邮件地址就是无效的。

出现更长的域名和Unicode以后,开发人员的这些测试就会更复杂。“现在,我需要查看2~6个,甚至是7个字符。”赫兰德说。尽管如此,这个问题很大程度上已经得到了解决。“这并不难。”他说,而且GitHub和Stack Overflow这些开源网站上有大量代码可供开发人员使用,使用这些代码可确保其应用能够被普遍接受。对于想要深入挖掘有关问题的人员,UASG的网站上提供了相关标准的文档和链接。此外,UASG还拥有关于各种语言的信息和代码库,这些都是最新的。(赫兰德说,比如Python现在就不是最新的了。)

最后,普遍适用性是让几十亿母语并非拉丁字母书写的人更多地访问互联网的一种便捷方式。赫兰德希望开发人员能够记住这一点。“世界变了,开发人员也应该让他们的系统与时俱进。”他说。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分