没有他的发明,我们甚至没有机会嘲笑微软IE浏览器。如果没有他的发明,谷歌、亚马逊、百度、阿里巴巴就不会存在。没有他的发明,你iphone上的Siri会比现在更愚蠢。
他是蒂姆·伯纳斯-李(Tim Berners-Lee),一位英国计算机科学家,他的发明叫万维网(World Wid Web)。
伯纳斯-李不是一个“乔布斯”般如雷贯耳的名字,但关于他最有噱头的段子又极具 10 万+ 标题的潜力:
“互联网之父”本可碾压比尔·盖茨成为世界首富,但他竟没有为发明申请专利!
假如申请发明专利,世界首富不是盖茨而是他!
如果他愿意,二十年前就能成为世界首富!
事实上,没有人是真正的“互联网之父”,因为互联网并不是一个单独的发明,说伯纳斯-李是“万维网之父”比较准确。伯纳斯-李没有申请专利,不是因为他没有意识到这个发明的价值,而是出于推广万维网的考虑。
很多人分不清互联网(Internet)和万维网(World Wid Web)的区别,简单理解互联网就是一个全球性的网络,而万维网是我们使用互联网最常用的入口。做一个不太恰当但容易理解的比喻吧:
如果把互联网当成围城里的宝石,想要拥有它必须从城墙门口进入。你有很多个门可以选择:HTTP 之门、FTP 之门、SMTP 之门......你不用弄懂这些神符一样的英文代表了什么,只需要知道代表了万维网的“HTTP 之门”,是门槛最低的那道门,而这道门的钥匙就是浏览器。
在万维网没有被发明前,互联网已经存在了很多年,但上网并不是一件轻松愉快的事。那时人们通过拨打服务器号码上网,入口不是浏览器,没有网页、没有图片、更没有视频,只有像下面这样的一行行文字信息。
毫无疑问,万维网是伯纳斯-李最重要的发明,但他这一辈子做的事情还有很多,比如成立万维网联盟、提出语义网、呼吁数据公开、成立社交互联数据平台,但都紧紧围绕同一个主题:打破“信息、数据之墙”,促进开放互联。
诞生万维网的福地,是一个看似和计算机没啥关系的地方
伯纳斯-李从小是一个计算机迷。他父母都曾经参与了世界上第一台商业电脑“曼彻斯特·马克一号”(Manchester Makr I)的设计研发,这让他从小就对计算机知识耳濡目染。
1973 年-1976 年,他在牛津大学女王学院学习物理专业。大学期间,由于违反规定被禁止使用学校的计算机,他自己动手用一台电视、一个摩托罗拉旧的微处理器(Motorola 6800)、一根焊接棒,拼出了一台计算机。
1976 年大学毕业后,伯纳斯-李在不同公司担任程序员,但每一份工作都持续不了很长时间。1980 年 6 月-12 月,伯纳斯-李以咨询顾问的身份,为欧洲核子研究中心从事软件工程方面的工作。欧洲核子研究中心是物理界一个著名的研究所,也是发现“上帝粒子”(希格斯粒子)的地方。
1980 年的欧洲核子研究中心,是一个信息需要高频交换、但又充满了各种“信息围墙”的地方:一万人在这里来来往往,其中只有 3000 名左右是这间研究所的员工,其余都是来自世界各地的研究院。他们用着不同的电脑、不同的网络、不同的数据格式、不同的文件系统。
作为一个软件工程师,伯纳斯-李需要帮助这些研究人员连接上不同的电脑,运行不同的软件程序,在不同格式的文件中找到有联系的信息,这个过程“让人充满了挫败感”。
为了改变这种局面,伯纳斯-李打造了一个基于超文本的索引系统 Enquire,可以帮研究人员在不同的电脑中迅速找到信息,尽管它还只是一个单机程序、有很大的局限性。
Enquire 的底层技术“超文本”,最早于 1963 年被提出,于 1976 年被发明出来投入使用。超文本如今在互联网上随处可见,我们可以为文字加上链接,点击后便可跳转到相应的网页、文件或文档的某一处。某种意义上,基于超文本的 Enquire 就是万维网的原型。
伯纳斯-李很快又离开了欧洲核子研究中心,加入了一家电脑公司,参与远程网络呼叫设计,因而获得了网络设计经验。1984 年,他以研究员的身份重返欧洲核子研究中心工作。
为什么伯纳斯-李没有给“万维网”的发明申请专利?
回到欧洲核子研究中心的伯纳斯-李,已经具备了开发万维网的条件:超文本和网络设计经验、超强的动手能力、开放的思维方式,再加上欧洲核子原子中心这样一个天然的实验场。
外部环境也已经成熟:TCP/IP 协议、域名系统等底层技术逐渐完善,降低普通人上网门槛的需求也越来越强烈。
1989 年 3 月,伯纳斯-李萌生了将超文本系统和网络结合在一起、创造一个全球性超文本链接网络的想法:
万维网需要的技术,例如超文本系统、因特网和多种字体的文字文件,都已经被设计出来了。我只需要把他们结合在一起......把现在的文件系统都想象成大型虚拟文件系统的一部分。
伯纳斯-李撰写了一个提案交给自己的主管迈克·森道尔(Mike Sendall),后者当时并没有非常感兴趣,只在提案的封面上写下一栏简短的评语:不太明确,但令人激动......(Vague, but exciting...)。18 个月后,迈克才允许伯纳斯-李兼职实现这个提案,但只是抱着试试看的心态。
伯纳斯-李很快开始动手编码,到 1990 年圣诞,他基本上定义了 Web 的基本概念:HTTP(超文本传输协议)、HTML(超文本标记语言)、URL(统一资源定位符)。你不用了解这三个名词的技术实现,只需要知道:
- HTTP 超文本传输协议:负责传输信息
- HTML 超文本标记语言:负责在网页上显示信息
- URL 统一资源定位符:负责给每一个网页一个地址,方便你找到它
这三样东西结合起来,塑造了我们今天习以为常的上网方式:在地址栏输入网页的地址,便能跳转到相应的网页;如果该文档上有超链接,还能点击它进行跳转。相互关联的信息通过“点击-跳转”联系了起来。
1991 年 8 月,伯纳斯-李将他发明的第一个网页浏览器开放给了公众,并且上线了世界上第一个网页:。
这个网页非常简单,抬头三个大字:World Wide Web。正文介绍了万维网是什么、所用的技术、参与项目的人、项目的历史等。
值得一提的是,万维网项目参与者中,有一位名为罗伯特·卡里奥(Robert Cailliau)的信息工程师,他长期使用着Hypercard,这是一个苹果 1987 年发布、2004 年关停的超文本系统,通过卡里奥间接影响了万维网的设计。
万维网发明出来后,伯纳斯-李并没有申请专利,因为他自己清楚得很,“开放”是万维网普及的前提,“你不能计划着做一个宇宙一样大的空间,同时保持控制”。
万维网开放给公众的 1991 年,同时诞生的还有明尼苏达大学的 Gopher。Gopher 在后来和万维网的竞争中落败,部分原因就是收费策略。
事实上,伯纳斯-李确实曾经考虑过为自己的发明申请专利,但不是万维网而是浏览器。最后,他还是因为自己“开放互联”的价值观放弃了这个做法。
“几百万人突然发现万维网可能比性爱还要棒”
诞生头两年,万维网其实并没有多少人用。不管伯纳斯-李怎么努力推广,每天只有 10-100 次点击率,就连技术社区也不接纳万维网。
他将万维网相关论文提交给了一个超文本社区 Hypertext'91,但被拒绝了。万维网在他们看来太简单了,并且违背了社区规则。
当时,超文本社区的信仰是,链接不应该指向不存在或已删除的文件,因此当时其他一些超文本系统都被约束在一个单独、孤立的数据库里。
而万维网是一个全球性的开放系统,如果某个服务器坏了或某个文档(网页)被删除了,链接就成了坏链。万维网的开放性在超文本社区看来,反而成了对信仰的亵渎。
改变出现在 1993 年,这一年 Mosaic 浏览器面世。Mosaic 浏览器是第一个可以在文字中插入图片,而不是在单独网页中显示图片的浏览器。它支持万维网、Gopher 等多个网络标准,并且拥有友好的用户界面、简易的安装步骤、可靠的性能。
Mosaic 浏览器发布之时,市面上有好几个竞争者如 Erwise、ViolaWWW、MidasWWW 和 tkWWW,但种种特性使它脱颖而出、大受欢迎,并带动了万维网的流行,“几百万人突然发现万维网可能比性爱还要棒”。
万维网真正使得互联网由少数精英使用的信息传输渠道,变成了供全世界共用的信息共享平台。1993 年后,越来越多的公司开始在万维网的基础上提供服务、做生意,万维网重塑世界经济的故事不必再述。
万维网影响力逐步加大的同时,伯纳斯-李也获得了相应的肯定:2004 年获得大英帝国爵级司令勋章、2017 年获得计算机科学领域的最负盛名的奖项——图灵奖。
对于任何一个人来说,取得如此成就已经可以躺在功劳簿上睡大觉,但伯纳斯-李真是闲不下来,他对互联网的贡献远不止万维网这个发明。
苹果手机上的 Siri,也得益于伯纳斯-李的工作
在伯纳斯-李 1989 年的提案中,万维网“不仅是一个文本文档的互联网络,也是一个知识的互联网络”。
万维网首先通过超文本链接实现了文档(网页)的互联,到 1998 年,伯纳斯-李正式将“知识互联网络”的构想命名为语义网(Semantic Web),并将自己的工作重心放在推广语义网上。
语义网是万维网的变革和延伸,它的目的是让计算机也能像人类一样了解网页上的内容。
比如,人们看到网页上的天气预报,会知道哪个数字是温度,哪个是湿度。语义网的目的就要通过隐藏的编码,告诉计算机哪个数字代表温度,哪个数字代表湿度,并且说明 “温度” 和“湿度”的含义。
2006 年,语义网发展到了一个瓶颈,需要大量结构化的公开数据,伯纳斯-李提出了互联数据(Linked Data)的概念,还在 2009 年的 TED 大会上呼吁政府和机构公开原始数据(Raw Data)。同年,白宫成立了一个网站 Da,要求所有的部门都要有公开数据。
大量数据公开后,有机构把它们进行了结构化,这些结构化的互联数据库默默影响着人工智能的发展。
2011 年,IBM 的人工智能沃森(Watson)在美国电视智力竞赛节目《危险边缘》(Jeopardy!)中击败人类选手,获得百万美元大奖,就是采用了 DBpedia(维基百科的结构化数据库)、YAGO(集成 Wikipedia、WordNet 和 GeoNames 三个来源的数据库)等成果。
2012 年,Google 收购了一家做结构化数据的公司 Metaweb,在后者数据库 Freebase 的基础上发起了知识图谱(Knowledge Graph)项目。苹果的 Siri,也是脱胎于一个基于语义网的项目 CALO(Cognitive Assistant that Learns and Organizes)。
一个账号登上所有应用、不怕应用倒闭的新平台
尽管伯纳斯-李一直推动网络往开放互联的方向发展,但“数据围墙”的现象还是以另一种形式重现了:科技公司借助免费服务将用户控制在自己的应用内,用户的数据分散在各个平台,更无力保护自己的隐私。
矛盾在最近几年集中爆发了,标志性事件莫过于今年 Facebook 被曝出 2016 年时保护隐私不力,让剑桥分析公司得以未经授权访问 5000 万用户数据。社会开始出现一股批评科技公司、将数据还给用户的思潮。
在这样的时间节点,伯纳斯-李的新项目恰逢其时。2018 年 9 月 29 日,他发布了一篇名为《互联网的一小步......》的文章,对外宣布成立一家基于 Solid 平台的初创公司 Inrupt。
2015 年,伯纳斯-李就在麻省理工启动了 Solid 项目。Solid 全称社交互联数据(Social Linked Data),是一个去中心化的社交平台,基于 2006 年提出的互联数据(Linked Data)的技术和规范。
现在我们使用社交平台的现状是,微信有个账号、QQ 有个账号、微博有个账号,此外还有 Twitter、Facebook等。每个账号的数据都独立保存在运营方自己的服务器里,互不打通。
这样有两个显而易见的弊端:1.用户数据掌握在运营方手里,有被滥用的可能;2.如果运营方经营不善或者关停服务,那用户在这个社交平台的数据也将付诸东流。Path 和 Google+ 的关停,就是最好的例子。
Solid 的解决方案把用户数据和应用分离开了,让用户把自己的数据都集中在一起,称之为“个人在线数据”(Personal Online Data,简称 POD)。然后,将 POD 储存在自己建的服务器,或者受信任的个人在线数据商(Personal Online Data Stores,简称 PODS)。
用户会有一个 WebID,可以登陆所有基于 Solid 平台的应用,用户能自己控制给哪个应用多少信息。
目前,Solid 平台还处于原型阶段,主要面向开发者。伯纳斯-李用 Solid 平台的技术打造了一款自己使用的应用,国外一家媒体看过后评价道:
这款应用程序,使用了 Solid 的去中心化技术,允许伯纳斯-李无缝访问他的所有数据——他的日历、音乐库、视频、聊天记录、研究。它就像 Google Drive,Microsoft Outlook,Slack,Spotify 和 WhatsApp 的混合体。
至于 Inrupt,是帮助 Solid 平台成长的一个初创公司。Inrupt 之于 Solid,好比 Mosaic 浏览器之于万维网,是一个领路人的角色。伯纳斯-李希望 Inrupt 能够为 Solid 带来一个 “生态系统”,其中的市场机会包括 Solid APP 和 Solid 数据存储等。
伯纳斯-李本人已经向麻省理工学院请了长假,专心在开发者群体中推广 Solid 和 Inrupt。这是他又一次转变工作重心。过去,伯纳斯-李一直在致力于通过万维网、语义网互联公开信息,现在他尝试通过 Solid 来互联个人信息、解决科技大公司垄断用户数据的问题。
这必定不是一个短期内可以看到成效的项目:社交巨头和互联网公司不会将用户账号数据拱手相让,让用户个体自发迁移也需要极大的教育成本。但正如万维网刚诞生时缺少关注,谁也不知道 Solid 会不会成为下一颗参天大树。