为什么网址都是英文的?
本文参加百家号#科学了不起#系列征文赛。
简短的答案是:网址是英文的,因为制订网址标准的人大部分是讲英语的美国人。
更长的答案是:在互联网的早期,连接远程计算机的唯一方法是提供其唯一的IP地址,即一长串数字,如165.254.202.218。但在1983年,随着网络上计算机数量的不断增长,威斯康星大学开发了域名系统(DNS),它将数字IP地址映射到更容易记住的域名,如baidu.com。
1990年,英国科学家蒂姆·伯纳斯-李(Tim Berners-Lee)发明了万维网,到1992年,超过100万台电脑联网,其中大部分在美国。1994年,由几个美国政府机构的代表组成的标准组织——互联网工程任务组(IETF)发布了一套网址标准,称之为统一资源定位器,即url。
为了使网址易于阅读、书写、键入和记忆,IETF将网址限制为少量字符,即英语(或拉丁语)字母表的大小写字母、数字0到9以及一些符号。允许的字符基于美国信息交换标准代码,即美国ASCII字符集,该代码在美国开发,于1963年首次发布。
这一切对讲英语的国家来说都很好,但截至2009年,全世界16亿互联网用户中,超过一半的人使用的语言不是英语(或拉丁语)字母表的字符集。要了解使用网络对这些人来说是什么样的,想象一下你只需要使用阿拉伯语来浏览网络。你最喜欢的网站上的内容仍然是英文的,但是你使用的每个网站的网址都是由完全陌生的字符组成的,这些字符甚至在你的键盘上都找不到。
与此相反,这种情况实质上是互联网用户的体验,他们不仅使用另一种语言,而且使用完全不同的字母表或字符集进行读写。例如,访问一个像埃及这样的网站,网站内容完全是阿拉伯语,而网址只使用英语字符,两者之间的区别立刻变得清晰起来。
鉴于越来越多的非英语用户在线,英语网址不再是国家的法律也就不足为奇了。2009年,负责互联网域名管理的美国非营利组织ICANN批准使用国际化域名(IDNs),这意味着网址将能够包含中文、韩文、阿拉伯文或西里尔文等非英文字符。