2021年3月27日星期六

卡罗琳·琼斯(Caroline A. Jones):控制论生物的艺术应用

 卡罗琳·琼斯(Caroline A. Jones)是麻省理工学院建筑系的艺术史教授,著有《单凭视力:克莱门特·格林伯格的现代主义与感官的官僚化》(Eyesight Alone:Clement Greenberg's Modernism and the Bureaucratization of the Senses)、《工作室中的机器:构建战后美国艺术家》(Machine in the Studio: Constructing the Postwar American Artist)、《全球艺术作品》(The Global Work of Art)。

倾向于控制论的艺术家的作品关注的是在现状下人工智能无法触及的生命的涌现行为。(The work of cybernetically inclined artists concerns the emergent behaviors of life that elude AI in its current condition。

布罗克曼(John Brockman)谈卡罗琳·琼斯(Caroline A. Jones

卡罗琳·琼斯(Caroline A. Jones)深入研究艺术制作、发行和接收过程中所涉及的技术,她对现代艺术和当代艺术兴趣浓厚。“作为一名艺术史学家,我的许多问题都围绕我们能创造什么样的艺术,我们能创造什么样的思想,我们创造出的什么观念能使人类超越我们的顽固、自私,使我们不再‘只关心我们的小群体’。我喜欢的哲学家和哲学思想会质疑西方对个人主义的痴迷。那些哲学家和哲学思想来自许多不同的地方,它们再现了20世纪60年代出现的各种各样的问题。”

她最近开始关注控制论的历史。她在麻省理工学院的课程“自动机、自动化、系统、控制论”(Automata, Automatism, Systems, Cybernetics从反馈的角度探讨了人机界面的历史,探索了对这一理念的文化理解而非工程理解。她的探索从维纳、香农和图灵的初级读物开始,然后从科学家和工程师再到艺术家、女权主义者、后现代理论家的作品和思想。她的目标是:提出一种新的以文化为基础的进化中心范式,即“社群主义和种间共生,而不是适者生存”(communalism and interspecies symbiosis rather than survival of the fittest

作为一名历史学家,卡罗琳对她所说的“左控制论”(left cybernetics“右控制论”(right cybernetics进行了区分:“我所说的左控制论,在某种意义上,是一个双关语或笑话,指被‘抛弃’的控制论。在另一个层面上,它是一个模糊的政治团体,暗示着我们的左海岸——加利福尼亚的伊莎兰学院(Esalen),是戴维·凯泽称(Dave Kaiser)之为‘嬉皮士物理学家’(hippie physicists)的团体。这个术语不恰当,但它可以让我们认识到,有一群人受惠于军工联合体,有时非常不幸,正是这群人给了我们批评他们的工具。”

受控制的艺术非常重要,但对于受控制的生活来说,艺术更为重要。(Cybernated art is very important, but art for cybernated life is more important.)——白南准,1966

1950年,当诺伯特·维纳(Norbert Wiener《人有人的用处》(The Human Use of Human Beings: Cybernetics and Society一书面世时,艺术家们最初并没有想要从控制论中得到人工智能。在20世纪50年代和60年代,那些自称拥护控制论的艺术家很少能接触到“思维机器”(thinking machines。而且,具有艺术天分的工程师们最开始制造的是海龟、变戏法者(jugglers)和寻光机器人宝贝(light-seeking robot babes),而不是巨大的大脑(giant brains)。艺术家们使用电路实验板、铜线、简单的开关和电子传感器,和控制论者一起制作雕塑,创造模拟交互感应环境,这种交互感应能模拟动作和界面,更多地与本能驱动力和战后性政治有关,而与知识生产的自动化无关。如今,一种不受约束的“智能”,一种既不受硬件束缚,也不受肉体束缚的“智能”(intelligence)使得人工智能变得难以理解,让人们忘记了早期艺术家接受控制论的时代。我们现在应该重温这些努力:早期艺术家努力使法国哲学家吉尔·德勒兹(Gilles Deleuze)和费利克斯·瓜塔里(Félix Guattari)所称的“机械门”(machinic phylum)这种关系模型化,“机械门”与人类在一个同物理、物质、情感刺激和信号世界接触的身体中的思维和感觉有关。

控制论现在似乎已经衰退,变成了无处不在的人工智能,这远非注定如此。“控制论”(Cybernetics一词指已有4个世纪之久的一些概念在战后所显现的新意:反馈、机器阻尼、生物内稳态、逻辑计算和自受工业革命推动的启蒙运动以来一直存在的系统思想。这个领域的人物包括笛卡尔、莱布尼茨、萨迪·卡诺(Sadi Carnot)、克劳修斯(Clausius)、麦克斯韦和瓦特。尽管如此,维纳创造的这个词仍然具有深远的文化影响。前缀“赛博”(cyber-)如今使用范围很广,这证实了人们对清楚揭示人类与机器之间错综复杂的关系的渴望。在维纳笔下,“赛博”仅指“动物和机器的控制与通信”(control and communication in the animal and the machine。但是在数字革命之后,“赛博”一词已不再仅仅是伺服系统、反馈循环和开关,它还包括软件、算法和电子人。倾向于控制论的艺术家的作品关注的是在现状下人工智能无法触及的生命的涌现行为。

最初杜撰这个词时,维纳借用了古希腊语“舵手”(κυβερνήτης / kubernétés这个词,该词指一个男性形象,能将他的力量和本能引导到船舵上,他能看懂海浪,能判断风向,能控制舵柄,能指挥奴隶让他们无意识地、机械地划桨。这个希腊单词已经借由拉丁语迁移到现代英语中,从kuber-变化到guber-,字根的意思变为“州长”(governor),是另一个指男性控制的词,詹姆斯·瓦特(James Watt)用它来描述19世纪时他用来调节失控蒸汽机的装置。由此,控制论采纳了长期以来将人类和装置类比的思想,添加了“-ics”,将其推广到应用科学中。维纳的三个C(command、control、communication,即指挥、控制、通信)利用概率数学,将生物和机械系统的理论化为一组信息输入,从而实现在一个环境中输出行动——这是在人工智能的谱系中通常被最小化的议程。

但是,词源学无法描绘出参与者的兴奋感,因为数学加入了理论生物学(theoretical biology(阿图罗·罗森布鲁[Arturo Rosenblueth])和信息理论(克劳德·香农、沃尔特·皮茨[Walter Pitts]、沃伦·麦卡洛克[Warren McCulloch]),促使该领域发表了一系列跨学科的研究和出版物,这些研究和出版物不仅改变了科学的发展方式,还改变了未来人类参与技术领域的方式。正如维纳所说:“我们已经彻底改变了我们的环境,我们现在必须改变自己才能生存。”(We have modified our environment so radically that we must now modify ourselves in order to exist.最紧迫的问题是:我们如何改变自己?我们是在朝着正确的方向前进,还是迷路了,成为我们的工具的工具?回顾早期人文主义者和艺术家对控制论所做的贡献,可能有助于我们走向一个不那么危险,更具道德感的未来。

1968年对于“控制论”一词的文化传播和艺术汲取来说是重要的一年。那一年,霍华德·怀斯画廊(Howard Wise Gallery)在曼哈顿市中心举办了蔡文颖(Wen-Ying Tsai“控制论雕塑”(Cybernetic Sculpture展览,波兰人贾西娅·赖夏特(Jasia Reichardt在伦敦的当代艺术学院举办了她的“控制论意外”(Cybernetic Serendipity展览。(她作品中的“控制论”意在让人想到“由计算机制造或与计算机一起制造”[made by or with computers],尽管我们并没有在她的大多数艺术品反应电路中看到计算机。)1948年至1968年的20年既见证了控制论概念传播到更广泛的文化之中,也见证了借由跨国公司,计算机慢慢地从专有军事设备进入到学术实验室,使艺术家得以接触到计算机的过程。对于家用爱好者来说,这些控制元件——“传感器器官”(sensor organs(电子眼、运动传感器、麦克风)和“效应器官”(effector organs(电子“面包板”、开关、液压系统、气动系统),使计算机不像是“电子大脑”(electronic brain,反倒更像是一套零件中的辅助器官。目前还没有一个关于“人工智能”的比喻能占据主导地位。所以艺术家是用现成材料拼凑电子体的鬼才,对行为感兴趣,但对计算或认知毫不来电。人们模模糊糊地认为“计算机”是迈向“理性人”(Homo rationalis)的计算器,但这更多的是渴望而非成就。

从当今艺术与科学成像工具的数字化融合来看,贾西娅·赖夏特(Jasia Reichardt的展览具有预言性,她坚持将艺术和“创造性应用科学”(creative applied science之间的界限变得模糊。根据展览目录,“没有阅读所有与作品相关的说明,就无法参观展览,读完所有说明,他才会知道他正在欣赏的作品是出自艺术家、工程师、数学家还是建筑师之手”。(no visitor to the exhibition, unless he reads all the notes relating to all the works, will know whether he is looking at something made by an artist, engineer, mathematician, or architect.所以,目录的封面是白南准创作的“机器人K-456”(Robot K-456(1964年),这是一个滑稽的、功能不健全的机器人,这台机器人被描述成“一个以其令人不安和独特的行为而闻名的女性机器人”(a female robot known for her disturbing and idiosyncratic behavior,与它对阵的是像芭蕾舞一样的“运动的对话”(Colloquy of Mobiles(1968年),这个作品是二阶控制论者(second-order cybernetician)戈登·帕斯克(Gordon Pask创作的。戈登·帕斯克(Gordon Pask与伦敦一位剧院设计师合作,制作出一个由铰链和杆组成的细长“男性”(male)装置,该装置是为了与附近的球状“女性”玻璃纤维实体进行通信。我们不知道,如果没有阅读目录里的文章,是否有人能真正地看懂该项目的本质。重要的是,帕斯克关注的是他的机器人的行为,它们的互动性,它们在人工环境中所起的反应,以及它们对人类行为的“思考”(reflection)。

当代艺术学院的“控制论意外”(Cybernetic Serendipity展推出了一个重要的范例:机器生态系统(the machinic ecosystem观察者是这个系统的一部分,其任务是找出可能的交互触发因素。因为要充分体验艺术,这些参观伦敦画廊的观众突然变成了“控制论生物体”(cybernetic organisms,也就是电子人(cyborgs),人们需要进入一种与伺服机制(servomechanisms)共生的搭配模式之中。当我们研究一些其他的同时期艺术作品时,人机交互环境的美学变得愈发清晰。其中最早的涌现行为的实例之一是Senster,这个作品是艺术家、工程师爱德华·伊赫纳托维奇(Edward Ihnatowicz1970年创作的交互雕塑(interactive sculpture)。医学机器人工程师,同时也是一家致力于宣传爱德华·伊赫纳托维奇(Edward Ihnatowicz奇鲜为人知的职业生涯的网站编辑,亚历克斯·奇瓦诺维奇(Alex Zivanovic称这个作品是“第一个由计算机控制的交互式机器人作品之一”(one of the first computer controlled interactive robotic works of art。这里,“计算机”有了自己的一席之地,尽管它仅是一个只有12位的设备。但是,爱德华·伊赫纳托维奇(Edward Ihnatowicz想要表现的并不是“智能”,而是想让它表达情感行为。Senster不可思议的成功关键在于它的程序设计,爱德华·伊赫纳托维奇(Edward Ihnatowicz用程序将这个液压装置设计成4.5米长(其铰链设计和外观的灵感来自龙虾爪),以表达对附近人类的羞怯感。Senster的声道和运动传感器对大分贝噪声和突然的攻击性动作会产生回缩反应。只有那些愿意轻声说话,并注意它的行为动作的人,Senster才会安静地、充满好奇地接近他们。爱德华·伊赫纳托维奇(Edward Ihnatowicz自己就有过这种亲身体验,当时他第一次把该程序组装好,听到他清了清嗓子,这台机器急切地转向他。

在对这些控制论生物的艺术应用中,我们越来越意识到有必要让公众在技术化环境中亲身体验一下,让他们与机器进行直观的交流。蔡文颖(Wen-Ying Tsai“控制论雕塑”(Cybernetic Sculpture展览就突显出这种必要性。我们期望那些体验过拟真装置的人能尝试体验机械生命:什么样的行为会触发伺服机制?很有可能的是,画廊的人类服务员不得不解释这个礼仪:“拍手,然后雕塑会做出反应。”正如一位早期的评论家所描述的那样:

一丛细长的不锈钢棒从一个盘子里冒出来。这个底座每秒振动30次,杆以谐波曲线快速弯曲。在一个黑暗的房间里,闪光灯照亮这些装置。闪光灯的脉冲有不同变化,它与声音和接近度传感器相连。这样,当有人接近它或在它附近发出噪声时,它会做出反应。杆子似乎在移动,一根发出微光,一根闪闪发光,还有一根跳着怪异的金属芭蕾舞蹈,它们的动作从安静到大幅摆动,然后再回到缓慢的、无法形容的美感之中。

与Senster一样,该装置激发出并模拟了一种情感而非理性的交互作用。人类感觉到他们看到的这些行为表明装置是有反应的生命体,蔡文颖(Wen-Ying Tsai创作的这些作品通常被归类为“植物”或“水生”(aquatic)。这种对环境和动力的追求在当时的国际艺术界很普遍。除了霍华德·怀斯(Howard Wise的马厩外,还有巴黎的流亡者形成的团体GRAV,尼古拉斯·舍费尔(Nicolas Schöffer“控制论建筑”(cybernetic architectures,德国Zero Gruppe的光和塑料旋转,等等,所有这些都对即将到来的装置艺术进行界定,并让人们对其有所了解。

20世纪60年代后期,艺术家们利用控制论生物的目的不是开发“智能”。因为他们知道这些机器不会说话,不能产生情感,所以他们有信心进行坦率的模拟。他们感兴趣的是能唤起驱动力、本能和情感的机械动作;他们模仿性行为和动物行为,好像这些都是下意识的。这些艺术家对数据或信息的处理不感兴趣,尽管汉斯·哈克(Hans Haacke1972年的作品“实时系统Real-Time Systems是朝这个方向发展的。艺术家和科学家在两大洲建立的控制论文化将人类带入技术领域,并以机器优雅而灵敏的行为吸引了人们的感知。在早期的控制论美学中,“人工”(artificial)和“自然”(natural)交织在一起。

但一切并没有止步于此。对于这种不加批判的、男性化为主的控制环境的发展至关重要的是,出现了一个激进的、批判的女性艺术家群体。这个令人惊叹的女性群体出现于20世纪90年代,她们非常了解自己的前辈在艺术和技术上的创作,但1970年的《激进软件》杂志(Radical Software的女权主义者创始人,以及唐娜·哈拉维(Donna Haraway1984年鼓舞人心的论战《赛博格宣言》(A Cyborg Manifesto所带来的文化冲击,给她们的启发更大些。白南准和帕斯克的破败的性别剧院,以及爱德华·伊赫纳托维奇(Edward Ihnatowicz蔡文颖(Wen-Ying Tsai创作的简单作品,现在都被加以利用,变成有悟性、有表现力、充满后现代主义的作品,就像林恩·赫什曼·利森(Lynn Hershman Leeson“多利克隆系列”Dollie Clone Series, 1995—1998年)一样,这个系列包括互动集合装置“赛伯罗伯塔”(Cyberroberta“遥控机器人娃娃泰莉”Tillie,the Telerobotic Doll),在技术领域,它们非常滑稽搞笑,冲观众眨眼,使我们清楚地意识到自己作为观察者与被观察者所处的窥淫立场。

20世纪60年代男性控制论雕塑家建立了“简单的”(innocent)技术领域,到了20世纪90年代,女权主义艺术家将这种技术领域转化为一种完全宽泛的状态,需要我们批判性关注。同时,女权主义者也解决了人工智能试图模拟谁的“智能”的问题。对于赫什曼·利森(Hershman Leeson这样的艺术家来说,为了响应克隆羊多莉的技术“胜利”(triumph),最重要的就是将肉类生产和“肉类机械”(meat machines)联系起来。赫什曼·利森把多莉当作克隆体进行创作,为当代个体变成意识形态、复制、可塑体领域的一部分这种现象提供了批判框架。

20世纪90年代至21世纪最初10年的技术女权主义者并非都是计算机领域工作者,但她们的作品却使先前技术环境中男性艺术家主导的机械和动力学特性变得更加复杂。例如,朱迪丝·巴里(Judith Barry创作的“想象,死亡的猜想”(Imagination,Dead Imagine,1991年)中,雌雄同体的远程电子人不会动:他或她由纯粹的信号、平面上闪烁的投影组成。在她的作品中,朱迪丝·巴里(Judith Barry对20世纪晚期技术的异化效应表达了自己的看法。一个雌雄同体的头部图像显现在一个巨大的立方体上,这个立方体由5个面组成,每面是边长3米的屏幕,安装在一个3米宽的镜像底座上。各种黏糊糊的、难看的液体(黄色、红橙色、棕色)、干燥的东西(不知道是锯末还是面粉),甚至还有昆虫,像毛毛细雨或灰尘一样顺着电子人的头往下流,巨大的屏幕完美呈现出电子人坚忍的高尚气质。通过大型、立体的“柏拉图式”形式,“想象,死亡的猜想”(Imagination,Dead Imagine)仍然是人工的,被限制在一个框架里,拒绝一个完全没有智慧的超然“智慧”。

新千年的艺术家们继承了这一批判传统,沿袭了当前的人工智能范式,也就是从部分模拟转向智能化主张。1955年第一次提出“人工智能”(artificial intelligence)这一术语,计算机科学家约翰·麦卡锡(John McCarthy和他的同事马文·明斯基(Marvin Minsky纳撒尼尔·罗切斯特(Nathaniel Rochester、克劳德·香农推测:“理论上,学习的每一个方面或任何其他智能特征都可以被精确地描述,这样我们可以制造一台机器来模拟这些方面或特征。”(every aspect of learning or any other feature of intelligence can in principle be so precisely described that a machine can be made to simulate it.在过去的64年里,曾经的这个不大的理论目标变得野心勃勃,今天的谷歌DeepMind把这一目标变成“解决智能”(Solve intelligence。破解密码!但不幸的是,我们所听到的不是破解了密码,而是破坏了小规模资本主义、社会契约和文明的脚手架。让出租车和卡车司机丢掉工作,机器人化的直接营销,霸主化的娱乐,私有化的公用事业,以及去人性化的医疗保健,这些都是维纳害怕我们会爱上的“鞭子”(whips)吗?

艺术家们无法解决这些问题。但他们可以提醒我们,人类还有创造性潜能没有得到开发,这些潜能在1970年左右就浮现出来,那时候,“信息”(information)尚未成为资本,“智能”尚未等同于数据采集。当我们回顾早期的那些可能性时,能充分唤起人们思考用当代工作能做些什么的是法国艺术家菲利普·帕雷诺(Philippe Parreno)“萤火虫作品”(firefly piece,之所以这样称呼是为了避免重复它的实际标题:“有节奏的本能,能够超越现有的生存力量”(With a Rhyothmic Instinction to Be Able to Travel Beyond Existing Forces of Life,2014年。这件雕塑作品被艺术家描述为“自动装置”(an automaton),它将闪烁的黑白萤火虫图案投影与黑色二进制数字上的绿色摆动带并列。这些图案和二进制数字是用数学家约翰·霍顿·康威(John Horton Conway1970年发明的一款生命游戏“元胞自动机”(cellular automaton)的算法制作的。

康威给无限的二维网格中任何被照亮(“活的”)或变黑(“死的”)的正方形(“细胞”)设置参数。规则如下:如果一个细胞周围没有别的细胞,那它很快会因孤独而死亡。如果一个细胞接触到三个或更多“活”细胞,它也会死,因为太拥挤。细胞若想活下来就只能有两个邻居,等等。当一个细胞死亡后,它能为其他细胞创造生存的条件,产生出似乎在移动和生长的模式,像迅速消失的神经脉冲或能生物发光的硅藻簇一样在网格中移动。在史蒂芬·霍金(Stephen Hawking2012年的电影《生命的意义》(The Meaning of Life)中,解说员将康威的数学模型描述成模拟“一个像大脑一样的复杂事物如何从一套基本的规则中产生”(how a complex thing like the mind might come about from a basic set of rules,揭示了当代人工智能所具有的野心:“这些复杂的属性来自简单的法则,这些法则不包含运动或繁殖等概念”([T]hese complex properties emerge from simple laws that contain no concepts like movement or reproduction,但是它们产生“物种”(species),而且细胞“甚至可以繁殖,就像现实世界中的生命一样”。

就像生命一样?艺术家们知道模拟和表征的诱惑,了解技巧的天才和“生命”的现实之间的区别。帕雷诺(Parreno)的作品是我们通过具体的、透视的参与而获得的“生命”体验的直观集合。我们的意识受电子(控制论)羁绊,但我们并不认为这套由人类生成的优雅模拟有自己的智慧。

控制论生物的艺术运用也提醒我们意识本身不仅仅是“在这里”,它是流入和流出,协调那些感官的、闪烁的信号。大脑的活动范围远远超出了头盖骨的范围以及它的模拟物“主板”。玛丽·凯瑟琳·贝特森(Mary Catherine Bateson对她父亲格雷戈里的二阶控制论做出解释,她说精神是物质的,“不一定由边界(如皮肤的外壳)来定义”(not necessarily defined by a boundary such as an envelope of skin。帕雷诺(Parreno)将艺术模拟与数学模拟相结合,强化维纳式的观点,即任何这样的模型本身都不像生命。模型仅仅是组成“智能”的信号系统的一部分,只有当与模型对等的动物或人参与到生动的意义创造时,模型构成“智能”。当代人工智能使任务和子程序工具化、专门化,将这些训练与真正的智慧混淆,使自己陷入困境。本文简要地提及一些文化史,提醒我们,将数据视为智能,将数字网络视为“神经”,或将孤立的个体视为生命单位,这种观点甚至与康威的野蛮模拟也是格格不入的。

我们可以将当前人工智能顽固的傲慢视为“右控制论”(right cybernetics,这使我们有了当前的自动化武器系统,使优步对人类工人充满敌意,也让谷歌做着资本主义美梦。现在我们必须回到“左控制论”(left cybernetics,也就是理论生物学家和人类学家致力于对智能系统的跨物种理解。格雷戈里·贝特森(Gregory Bateson认为,企业仅仅是模拟“部分人的集合”(aggregates of parts of persons),将利润最大化的决策与“思想中更广泛、更明智的部分”(wider and wiser parts of the mind)分离开来,这个观点的提出实在是太及时了。

这里所提出的控制论认识论为我们找到一种新方法。个体心理体现在各个方面,不仅存在于身体之内,也存在于身体之外,同时,还有一个更大的心理,个体心理只是其中的一个子系统。格雷戈里·贝特森(Gregory Bateson认为,这个更大的心理可以与上帝相媲美,也许正是有些人口中所说的“上帝”,但在完全相互关联的社会系统和行星生态中,它仍旧是内在的。这不是外部“上帝”的集体幻想,外部“上帝”从人类意识的外部说话。贝特森认为,这种长期存在的一神教观念使得人类将自然和环境看成脱离于人类“个体”之外的“可以利用的礼物”。相反,贝特森所说的“上帝”是我们在世界上短暂体验与意识互动的一个占位符:输入和行动会带来更大的心理,然后与其他实体配合,成为其他行动的输入,形成我们迫切需要的模式的共生关系网。

从20世纪70年代的蔡文颖到20世纪90年代的赫什曼·利森(Hershman Leeson),再到2014年的帕雷诺(Parreno),艺术家们一直在批判“右控制论”,一直在致力于寻求“人工”智能的替代、具身和环境体验。他们对控制论生物的艺术运用为我们提供了共生智慧,在这个世界可以实现的各种诗学中我们能体验到这种智慧:产生生命运动的信号的节奏和直觉行动与电机和磁技术领域合作。生命,在它神秘的负熵中,与物质和心智有关。

原文来自《AI的25种可能

2021年3月24日星期三

道格拉斯·恩格巴尔特(Douglas Engelbart):用计算机提升建筑师的工作能力

 道格拉斯·恩格巴尔特Douglas Engelbart,1925—2013)在1963年发明了计算机鼠标。他于斯坦福研究院创立了增强研究中心Augmented Research Center,ARC),并用建筑学中的场景及项目来展望计算机技术的发展情况,思考该技术将来能够给用户带来哪些丰富的体验。道格拉斯·恩格巴尔特Douglas Engelbart)在1962年为Augmented Human Intellect Study项目撰写提案书时,提出了augmented architect at work(在工作中受到计算机技术协助的建筑师)这一理念。在这个受到美国Air Force Office of Scientific Research资助的研究中,道格拉斯·恩格巴尔特Douglas Engelbart)建议通过这样一个项目来提升人的能力,用他自己的话来说,就是“增强人类处理复杂问题的能力,让他更清楚地知道,怎样才能令自己的需求得到满足,并据此拿出适当的解决方案”道格拉斯·恩格巴尔特Douglas Engelbart)的系统要比尼古拉斯·尼葛洛庞帝(Nicholas Negroponte及Leon Groisser在MIT的URBAN2与URBAN5城市设计系统早6年(尼葛洛庞帝在1970年的The Architecture Machine一书中,于参考资料中谈到了Engelbart的这项研究提案)。

道格拉斯·恩格巴尔特Douglas Engelbart)当年设想的工作环境与建筑师目前的工作方式其实差得并不太远,而且他从刚刚提出项目规划的那个时候开始,就一直是这样想的。道格拉斯·恩格巴尔特Douglas Engelbart)觉得建筑师应该有一块足够大的屏幕,同时还要拥有设计与绘图所需的辅助设备以及一台处理工作任务的计算机。他说:“我们想象一下,建筑师是怎样在这些设备的帮助之下完成工作的。建筑师坐在工作站里,面对着一块边长约91.44厘米的显示屏。这款屏幕就是他的工作台,该屏幕由计算机控制。这台计算机可以称为他的clerk(助手)建筑师能够通过一块比较小的键盘以及其他各种设备来与之沟通。假设建筑师要开始设计一幢建筑物。他已经把基本的布局与结构形式想好了,现在,他要在屏幕上演示效果。”建筑师与计算机的关系很友好,他要“仔细指导这位clerk”,以便让后者把自己早前输入的想法给呈现出来。道格拉斯·恩格巴尔特Douglas Engelbart)写道:“建筑师只需要仔细操作他的clerk,就可以做出一张透视图,以观察陡坡上面的建筑情况与铁路布局情况。各种树木也会留在这套视图中,它们是以符号来表示的。此外,建筑师还能观察到各种用途的连接点……他可以通过鼠标指针来指定自己所关注的两个点,同时用左手在键盘上面快速移动并敲击,这样的话,两点之间的距离及高度差就会随着建筑师的操作而变化。他可以在屏幕右边那三分之一的显示区域中实时地观察到这种变化。”根据道格拉斯·恩格巴尔特Douglas Engelbart)的设想,建筑师在与计算机交互的过程中,会收到后者给出的新数据。“建筑物的结构已经起来了,他现在要不断地观察,不断地调整,而且要经常停下来,在计算机上查询各种手册与信息目录,并做出相应修改,以便更好地协调这套结构中的各个部位。”此外,建筑师还可以把各个方面的设计数据输入到计算机中,以分析出大家会怎样使用这幢建筑物,然后把这些信息保存起来,以便与其他建筑师及承包商分享。建筑师用计算机所制作出来的这种设计方案其实是一种原始的超链接原型结构,可以“把隐藏在实际成果背后的想法给体现出来,并让我们知道这些想法是怎样逐渐成熟的”。

简单来说,道格拉斯·恩格巴尔特Douglas Engelbart)设想的这种工作方式其实就是后来所说的人机交互。重要的是,这套设想指出了智能的计算机辅助设计系统在其后50年中所要解决的问题。建筑问题是多维的,而且是程序化的,其中要涉及三维空间中的元素,并且要考虑到现实世界中的一些情况(例如建筑物内部的交通拥堵问题)。道格拉斯·恩格巴尔特Douglas Engelbart)研究的是一种新的计算机程序,他从建筑学的角度重新定义了这种程序,道格拉斯·恩格巴尔特Douglas Engelbart)认为,这样的程序应该与特定空间所具备的功能有关。此外,这种计算机辅助设计系统还有一个特点,它拿到用户明确给出的信息(例如用户绘制的设计元素)之后,会暗地执行一些操作,以了解这套设计方案有可能表现出的某些特征,然后把这些特征反馈给用户(比方说,根据恩格巴尔特的设想,建筑师的clerk[也就是他做设计时所用的这台计算机]会把门的开闭方式以及阳光从窗户外面照进来的效果给展示出来)。这些系统本来是给建筑领域设计的,然而其他行业的用户对此也很感兴趣,也想要使用这样的系统来辅助其工作。正如道格拉斯·恩格巴尔特Douglas Engelbart)所总结的那样,只要你所思考的是一种“符号化的概念”,就会发现这套系统很有帮助

将来,我们在解决问题时,会尽可能利用这位clerk(也就是这台计算机)所具备的运算能力来处理数学任务。不过,数学之外的一些任务也可以交给计算机处理,它能够帮助我们操作相关的信息并予以展示,让我们能够更好地对这些非数学的领域进行规划、组织与研究。以符号化的概念来思考的人无论使用什么形式(例如英语、图表、形式化的逻辑或数学),都可以极大地得益于该系统。

最后一句话尤其值得注意。建筑学中的用例经常能够移用到其他情境。道格拉斯·恩格巴尔特Douglas Engelbart)的这句话就指出了这一点,而且这也正是本书在讲述相关的历史时所依循的一条主线。无论是构建虚拟的数字世界,还是建设真实的三维空间,我们都会在工作过程中提出一些新的方法,这些方法会启发我们采用新的方式来学习、沟通,并处理信息。

道格拉斯·恩格巴尔特Douglas Engelbart)开始在研究怎样用智能设备来辅助人类工作时,之所以选建筑师作代表,可能有两方面原因。一方面,固然是因为建筑师与其他职业相比更需要使用功能强大的计算机与周边设备,而另一方面则在于,这样举例能够更好地显现出计算机在处理大规模的问题时所表现出的功效。尤为重要的是,道格拉斯·恩格巴尔特Douglas Engelbart)在研究过程中领悟到了建筑学的巨大意义,这门学问能启发我们把整个世界打造得更加美好。

原文:《架构启示录》(“Architectural Intelligence: How Designers and Architects Created the Digital Landscape”)

相关阅读:

Douglas Engelbart,“Augmented Human Intellect Study”(Air Force Office of Scientific Research,1962)

提高我们提升的能力:呼吁投资新未来(道格拉斯·恩格尔巴特)

道格·恩格尔巴特是如何成就“所有演示之母”(the Mother of All Demos)

2021年3月21日星期日

凯文·凯利(Kevin Kelly):未来5000天,智能手机之后又一个重要科技将被发明

 科技杂志《连线》主编、被誉为网络文化的发言人和观察者——凯文·凯利(Kevin Kelly)在2020年10月举办的东钱湖教育论坛上发表了演讲,探讨未来人类应如何与AI相处、教育会有哪些变革、以及如何掌握“Techno Study”这一全新的学习模式。

凯文·凯利提出,假如你已经成为了智能手机的“重度使用者”,那么恭喜你,在接下来的5000天,你还将有很多机会继续学习新技能,毕竟,一切才刚刚开始……

以下为凯文·凯利(Kevin Kelly)演讲内容:

01.学习技术如同学习生存法则

“技术学习(Techno Learning)”是我自创的术语,它代表着一种无论是个人还是公司都需要的技能。这种技能能够帮助他们迈入新的领域,也就是我们口中的“未来”。

技术学习立足于我们的生活现实,我们生活中最重要的事情就是技术。试想一下,你的生活如果没有了智能手机会怎么样?想想智能手机带给我们的一切,给我们生活带来的所有变化——我们可以网购,可以查天气预报,制定出行计划和导航……所有这些便捷都得益于我们掌中的手机。

智能手机的出现还不到5000天,短短4800天前,智能手机才刚刚问世。社交软件也是如此。你能想象到一款App会带给我们如此大的好处和便利吗?而社交软件才刚刚上线3200天。所有这些东西都是新事物,都是新世纪的发明。这就是我们一直打造、一直生活着的世界。

首先,我想重点介绍一下那些未来我们需要发展和学习的技能,这些技能可以为我们指引方向,合理利用它们,会给5000天后的新世界带来福祉。

我特别想谈一谈,我们的教育在接下来的5000天会发生什么样的变化。

我认为, 5000天后的教育是占主导地位的,是充满创造力的,也将因技术的革新而得到推动。技术的革新改变了我们看待世界的方式,使我们能做更多事情,也为我们打开了新思路。

技术会如何“改变”个人和企业在未来5000天里所需的技能呢?有三大技能:

第一,学会学习。不只是学习新东西,而是学习如何学习新东西;不只是创造新事物,而是学会如何创造新事物。

第二,从答案到问题的转变。教育可以是封闭的,也可以是开放的。教育是多种多样的,也应该是惠及年轻人、惠及人生的。从我的个人经验来说,教育应当开放、多元,相信大家都同意这一点,但问题是我们应当如何做?

第三,了解技术相关的基本知识。就好比你是一个猎人,就必须深谙自然生存法则一样,技术是我们所生存的第二个“大自然”,我们必须深入了解它。

02.找到适合自己的学习方式

教育是去教别人如何学习,但未来世界上最厉害的超能力,则是学会独立自主地“学得更好”,而不只是学习通用的方法。

大千世界,人人各异,我和你,我们每个人学习的能力都不一样。有的人擅长通过“听”来学习;有的人动手能力强;有的人小憩一会儿后学习效率更佳;有些人就需要“熟能生巧”式的训练。

我们每个人都需要找到适合自己的学习方式,从而获得最佳的学习效果。我们希望教育和学校能帮助我们通过训练、考试、老师的教育,找到最合适自己的学习方式。

那么,在未来,如何才能“学得更好呢”?有一种技术能够提高我们的学习能力,那就是 “智能眼镜”

通过智能眼镜,你可以看到真实的世界,也能看到虚拟的世界,被称为混合现实(Mixed Reality)——因为你既能看到现实世界,又能在镜片上看到嵌入的虚拟世界。

我认为智能眼镜将是继智能手机之后的又一个重要的科技发明,从方方面面看,这项技术都是个大技术,可以被应用到很多领域中,而且研发周期会很长,运营投入会很大。就和手机需要基站和App还有其它基础建设支撑一样,这种眼镜也需要一个类似规模的,甚至更大规模的基础建设来支撑其运维。

混合现实真的非常非常厉害——虚拟世界是靠计算机做出来的,但是,为了能够看到现实世界并将其与虚拟世界融合,我们必须同时对现实世界“数字化”。

因此,现实世界中的所有事物都会有一个数字化的双胞胎兄弟,包括你的房间、房间里面的物什、窗外的街道、街道旁的建筑,甚至我们自己,都有一个数字化的双胞胎。而这些数字化的东西,则用于导向和把虚拟的东西植入到现实生活中来。

所以从某种意义上讲,我们可以数字化地绘制整个现实世界——这就是所谓的“数字孪生”(Digital Twin)。

比如,用智能眼镜绘制一个卧室,然后在某个位置放置一个虚拟的椅子,还可以通过菜单选择颜色,然后我们就可以把这个虚拟的椅子放在卧室的任何地方。用我们的眼睛看,好像真的有个椅子在那。虽然现在我们可以通过用手机来制造这种假象,但是还是不够逼真。

未来,在全场景体验下,这将是一个数字化的共享世界,就是说,如果我们都在同一个房间里,我们都将从各自的视角看到这个房间, 我们将会身处一个共享的虚拟世界(Virtual World)、共享的混合世界(Mixed World)、共享的镜像世界(Mirror World),从某种意义上来说,这是一个持续存在的世界。

我们离开,然后再回来,它还是在原地没动,它既是一个仿制品,又是一个虚拟物体。这个概念非常复杂,某种意义上来说,这个世界是运动的,我们可以与它进行交互,从而引入学习的概念。因为我们可以通过这种技术来自学,可以亲身去体验。

身处这个虚拟世界,我们能亲眼看到心脏在跳动,我们可以用双手去操纵分子中的原子,我们可以与这个世界交互,一切都是实时反馈的。

我们可以在这个世界里铸造复杂的机器、分解不同的部件、选中和点亮这些部件、甚至还可以出现一双手,来手把手地教我们如何修理这些机器。

所以突然之间,我们在一个“混合”的世界里面记录着点点滴滴,我们可以真正地学得非常非常快。相当于每时每刻都有一个老师在指导我们,有一双手可以为我们指路,有箭头为我们指明方向——这就相当于一个只要我们登录就永远在线的老师。

这个镜像世界是一个我们正在打造的新世界,它十分复杂,有很多挑战和障碍要面对,这就是“混合现实”。

03.智能眼镜将会是社交属性最强的媒介

我们戴的智能眼镜既可以很简单,也可以很复杂,有些已经投入使用了。对于制造业和企业来说,智能眼镜非常常见。

我们以为第一次接触智能眼镜更可能是在工作场合而非家中,其实呢?其实世界上80%的人都不在办公桌前工作。所以也可以说,这是一种脱离办公桌环境的技术,或者说,这种技术不是为了在办公桌前使用诞生的。

智能眼镜可以替代办公桌,也可以用在生活中的其它方面。对于不需要坐在办公桌旁的人来说,智能眼镜的使用在这个人群中将会非常普遍。

我们将用这项技术用来学习,以及学会如何学习。因为凭借这项技术,我们可以通过手势和声音来学习,不仅仅是用手指打字,而是全身都在运动,这是学习的一个非常重要的方面。更重要的是, 我们将会在实践中学习——这就是教育的未来。未来教育的重心将从学校转移到我们做事情的环境中去。做事不一定就是拿薪水的工作,而是以任务为导向的事,我们会在做事的过程中学习。

在场景中学习,和他人一起学习,小组学习是最有效率、最好的学习方法。 混合现实、智能眼镜将会是社交属性最强的媒介,我们戴上眼镜后可以与朋友在不同的环境中互动,这也是最佳的学习环境。

我们可以创造虚拟人像,虽然现在技术还不太成熟,但起码从疫情中使用网络会议的经验来看,远程学习是可以实现的。我希望未来的人们能比我们做得更好,而且我们也要比之前做得更好。

我觉得最受低估、最被埋没的学习技术是用户上传内容的短视频频道。因为事实证明, 最好的学习方法就是去向别人传授知识,向别人传授知识的过程也是你学习的过程,这也是这些视频网站、短视频网站的意义所在。

通过教别人东西,可以实现自我学习 这真的是一种非常酷的想法。

04.答案终将过时

今天,如果你想知道某个问题的答案,你可以询问机器、搜索引擎等等,它们都能提供答案,而且它们将会越来越聪明。

着重强调“在学校要努力学习如何找到问题的答案”这样的观点是十分十分错误的,也终将会过时。

不要再专注于答案了!一定要搞清楚什么是最适合自己的学习方式,从而优化我们的学习过程,当我们遇见新的问题,我们才知道该怎么去学习。

机器回答问题的能力各有不同,因为世界上有很多人工智能和机器,可能有些是擅长回答这个领域的问题,有些更擅长回答那个特定的问题。

如果你遇到一个数学问题,你可以问某个机器;如果有一个翻译方面的问题,你也会从另外一个机器上寻求一些建议;如果又遇到一个证明问题,那又是不同的情况了,多种类型的AI程序为我们提供服务,我们也会问不同类型的AI不同的问题。

人工智能给我们学习上带来的启发在于为我们提供了不同的思考方式。

比如一张图片创造于AI的大脑中,当机器被命令“创造一种从未见过的动物”时,图片就会出现。所以,这些机器与众不同的思维方式会帮助我们在思考上另辟蹊径。我们可以利用这些机器,与机器合作,一同思考,我们可以创造出前所未有的新事物。

在古老的神话中存在半人马,即半人半马的怪物,它们是强大的生物。如今我们人类和AI的合作就与之类似,人类和AI合为一体,共同运作。这意味着用全新的方式思考,让我们的思想插上翅膀,跳出固有的条条框框,这是完全不同的思维方式,也是新经济发展的引擎,换一种思考方式的动力。

所以我们可以运用技术拓宽我们的思路,启迪我们智慧, 使用AI进行全新的思考,即与机器合作,而非排斥机器。

05.AI将会成为我们的“神助攻”

这意味着从某种程度上来说,AI将会成为我们的“神助攻” 在我们耳边说悄悄话,帮助我们完成任务。你可以想象一下,就像一个可以实时翻译的耳机在我耳边即时中英文互译,这种技术能帮助我们做许多想做的事情。

另一方面,如果这种技术真的实现了,把一个小装置放在耳朵里就可以做到多语言同声传译,那真是一大壮举!可能未来5-7年内,这项技术就会有所突破,它能解放数百万技术能力优秀,但仅仅因为英语不好而受制的人破除语言的障碍,让他们参与到全球经济中来,为世界各地的公司提供服务。这就是一个AI成为人类合作伙伴的例子,它们就是我们的合作伙伴。

到时候,我相信你的薪资高低将取决于你的个人能力有多优秀,也和你与AI的合作能力挂钩。

机器人和AI将会为人类创造新岗位,你可以想象这些新岗位——机器人修理师、遗传顾问、首席信任官……在未来五年中,我们会创造很多新工种。

事实上,未来两年后你的工作可能还未被发明出来,不管你年纪多大,人类一直在创造一批又一批的新职业。你今天所做的工作可能自产生至今还不到20年。无论你是什么头衔身份,你在什么样的环境内工作,你今天的职位甚至工作,可能20年后就不存在了。

对于未来的这些新职业、新工种来说,效率不再是第一位的了,因为效率和生产力是用来要求机器和AI的,这是它们的强项。它们能够竭尽全力提高单位时间的效率。

06.人类的长处在于提问

人类的长处不在于追求效率,我们更擅长于探究未解之谜,更喜欢提出问题。

问题是低效的,而回答是高效的。问题让你停下来,阻止你前进,甚至让你后退,它们难以回答,而且会衍生出新问题。所以未来的世界,问题会包罗万象,而且这些问题都不是一时半会能解决的。

如果你想要获得问题,你需要聘用的一个人类,因为人类擅长提出问题。

在今后的学校里我们会发现,在这里训练学生回答问题并不是重点,因为他们可以使用AI解答问题。真正需要的是知道如何提出问题,如何提出更好的问题。

在未来,我们的教育应该去要训练人们如何问问题,而不是去想着如何提高效率——要为他们自己着想,想着如何去尝试、去探索、去测试、去发明——这些都是低效的事情,发明和创新都是低效的过程,也正是未来教育需要训练人们去做的事情,能引发创造的事情。

07.关于“技术学习”的5个洞见

了解技术相关的基本知识,这是需要刻意练习的技能,就像微积分和阅读。我们需要花费很多很多年才学会读和写,就像我们花费好几年学习代数和微积分一样,都是靠着经年累月的练习才掌握的。这是一个训练和学习的过程。

我们也不能完全闭门造车,全靠自己一个人,我们也需要老师的帮助,需要学习、测试、训练,否则我们就无法获得对科学的洞察力,也无法知道技术的运行法则。

给大家分享关于“技术学习”的5个洞见:

1. 我们必须要忘记旧东西才能学会新东西,不仅仅是培养新习惯那么简单。

我们必须要忘记这些旧习惯、固有的思维,才能养成新习惯、形成新思维,这是一个必要的步骤。好比我们以前用电视,现在我们要逐渐遗忘电视的运作方式,从而学习互联网的运作方式;我们要忘记电话的运作方式,从而学习镜像世界的运作方式。

2. 在任何时候,当我们有一项新科技时,我们要选择那条能提供最多选项的科技发展方向。

因为它最有潜力。有些科技看上去很强大,但是它们提供的选项很少,会限制我们的发展,让我们举步不前,所以我们要看看有没有其他选择,能带来更多可能的科技才是今后世界所需要的。

3. 我们创造出来的每样东西都需要维护,天下没有免费的午餐。

我们不可能无偿使用App或者工具——这里的“无偿”并不只代表价格,也代表我们付出的代价。我们必须去维护这些东西。你要去学习如何操作新的界面,如何修复错误……

我们赋予新事物存在的权利时,也要包容它随之产生的错误,这也是新事物产生的代价。我们要理解新事物,要知晓它的极限,对它不断迭代升级,这是一种责任。

所以每样新科技都会给我们带来益处,但每样新科技也需要我们有所付出承担责任。

4. 旧科技仍会被人们所青睐,而且也将持续发挥作用。

例如自行车,尤其是有了电动自行车之后,这个交通工具就变得越来越有用了。所有科技都是久经考验的,而且也拥有持续的价值。

即使许多旧科技的问题都由新科技已经解决了,也不代表我们应该忘记所有旧科技。因为大多数生活中的旧科技很少会消失或者被弃用它们还有价值,所以我们应该多花时间去持续不断地重新评估这些旧科技的价值。

5. 学会放下科技,学会放空,给科技自由。

使用科技是一种交易,新科技越强大,反噬人类的可能性就越大,带来的问题也越大。像互联网和社交媒体这种世界上最强大的科技,会带来很多严重的问题。

因此 我们必须清楚地认识到,“放手”科技并不是因为它不好,相反,就是因为它太好了,所以我们要与它保持距离,距离产生美,这样我们才能保持对追求新科技的热爱。

我们要将新科技的风险和没有科技的风险进行比较,或者将新科技和旧科技的风险进行比较,这也必须是我们教育的组成部分,而且我们也要考虑到如果没有这些事物会出现怎样的情况,这也是另一种技能。

古人云,福祸相依。科技发展的利弊也是相互依存共生的,我们要学会如何解决随之而来的问题。但我个人认为,未来我们有能力去轻而易举地解决这些问题。相比解决问题,我们更要做好准备 迎接并拥抱来自未来的馈赠。

学会如何学习由答案向问题转变,全力去推广科技智慧,了解技术相关的基本知识,这些都是下一个5000天内会发生的大事。

好戏才刚刚上演,并且未来5000天里发生的变化将远远大于之前5000天。30年后,也就是2050年将会诞生很多现在还不存在的新事物。这一代人将发明它们,这意味着虽然一切看起来飞速发展,但是你仍然没有落后,现在还是“新纪元”的第一天。

作者:凯文·凯利 来源:湖畔问教(ID:Hupanwenjiao)

去中心化社交媒体(Decentralize Social Media)

 社交媒体网络的中心化已经给社交媒体平台及其用户带来一堆问题。其中包括侵犯隐私权,并造就了审核数十亿用户内容等不可能完成的任务。

我在下文中描述了一种「去中心化社交协议decentralized social protocol,DSP),可以通过让用户控制自己的内容并让他们负责网络内的价值创造和转移(giving users control over their own content and putting them in charge of value creation and transfer within their networks,来帮助解决或缓解这些问题。通过允许用户从众多界面提供商、内容服务器和广告商中进行选择,而不是由单一平台将这些必要角色垄断于一身,这一设想才可能得以实现。

我将描述用于配置文件管理、隐私保护、托管、用户界面、广告网络、内容过滤器、元数据等的去中心化解决方案。简而言之,这覆盖了社交媒体的所有基本组成部分。

原则:一切皆去中心(Decentralize Everything

不需要多说,去中心化协议的主要设计原则之一就是去中心化。但是,中心化的趋势很强大,任何可能的时候将会形成中心,要预测它们将在何处生根并成长,是需要有远见的。

以互联网上广泛使用的 TCP / IP 和 HTTP 协议为例。当它们被采用时,它们似乎完全是去中心化的。任何人都可以建立一个网站,任何人都可以访问它,只要能连接互联网和一个 IP 地址就能访问。还有什么能比这个更平均主义呢?在早期的网络中,我们看到在这样的环境中可以期待的蓬勃发展。但是,没有人预见到网络效应将发挥主导作用。

如今任何人都可以建立与 Facebook、YouTube、Reddit 或 Twitter 竞争的网站。但没有人会使用它。它可能具有更好的隐私保护、更好的功能且没有广告,但是它不具备给这些技术巨头带来不可逾越的优势的另外一个因素:其他用户。即使拥有庞大用户群的谷歌试图通过打造 Google+ 与 Facebook 竞争,在花费了 7 年时间、耗费了数十亿美元巨资之后最终还是失败了。

在 TCP / IP 和 HTTP 协议环境下,去中心化在 URL 处戛然而止。谁控制 URL,谁就能控制 URL 的所有内容。结果是,facebook.comgoogle.comamazon.com 等 URL 已成为地球上一些最强大、市值最高的公司。

而在去中心化社交协议之下,我们必须走得更远。

在社交环境中,最小的、没有约束的单位是个人,用户。因此,当我们谈论去中心化时,我们是在谈论将所有决策权和授权交由用户掌握。仅仅让他们拥有建立网站、及选择要访问哪些网站的权力,已不再足够。

由于中心化将在任何可能的地方蔓延生长,因此去中心化社交协议设计者和开发者必须竭尽所能阻止中心化。不幸的是,这需要想象力和努力。实现不完全的去中心化要容易得多,将真正困难的部分留给他人或用自己的中心化平台填补空白。科技巨头已经实现部分去中心化。他们不生成内容,那交给用户去做。 去中心化社交协议必须拥有他们已实现中心化的功能,设计一种将这些功能也实现去中心化的系统。

内容由谁控制?

信息从根本上不同于实体资产。信息几乎可以被免费复制,因此当人们谈论「拥有」数据时,可能会造成歧义。版权法的存在是为了抗御信息固有的这种丰富性,以防止复制副本(为了保障内容创建者的利益)。有关分类和保密的法律也对人们未经同意分享信息的做法予以惩罚。但是,P2P 文件共享破坏了这些法律;而吹哨人(whistleblowers)的涌现,也破坏了保密法律。控制信息、阻止信息传播变得非常困难。

在去中心化系统中,不能依靠中心机构来执行此类法律,因此我们必须按事先规定的条款处理信息。我们谈论的不是谁拥有用户内容的问题,而是谈论谁有权访问用户的内容

现代社交媒体平台的默认立场是该平台拥有内容,并中心化掌控访问权限。在去中心化社交协议下,内容创建者(用户)应使用涉及密钥共享的加密方案来控制访问。只要有可能(理想情况下),服务提供商不可以访问未加密的用户内容,只有创建者已授予访问权限的人才可以访问它。

加密将控制权完全掌握在密钥持有者手中,因此,在我们寻找可以遏制中心化的地方时,去中心化社交协议中保存加密密钥的位置将为我们指明方向。密钥必须尽可能(理想情况下)由用户掌管。除非是为公众特别创建,否则所有信息,无论是存储的还是传输的信息,都应默认加密。

这与当前范式截然不同,是一个根本性的转变。在用户控制自己的数据的情况下,网络效应失去了仅有的立足之地。如果组成各种社交网络的内容和关联是在协议层进行管理,则网站会失去在用户头上的垄断权

再一次(与早期互联网一样),任何人都可以建立竞争性网站或应用程序,只是这一次用户将掌控自己的所有内容以及他们有权访问的其他内容,而不是两手空空。用户的切换成本将降至最低,因为新网站将只是相同内容的一个新界面。这样的环境将促进创新的蓬勃发展,扩大用户的选择范围,并显著改善用户体验的方方面面。

资金至关重要!

社交媒体平台每年带来数百亿美元的收入,这些收入几乎全部是由广告投放产生的。忽视资金问题很简单,让去中心化社交协议服务提供商发明自己的商业模式,并希望在用户转换成本较低的情况下,提供商可以有出色表现并满足用户的需求。但是,协议中内置的假设导致我们这个世界今天变成了这个样子。

我们必须面对的事实是,货币是中心化的关键要素。用户带来了广告商,广告商带来了钱,钱为服务的扩展和开发提供了经费,更好的服务带来了更多的用户。资金对于这种反馈回路至关重要,这种反馈回路将所有人吸引到同一个服务提供商,其真正的业务是为用户的眼球关注匹配广告。

这可能是 去中心化社交协议设计中最具挑战性的部分,但也可以说是最重要的。无论如何,用户必须处于价值创造和转移流程的核心位置。鉴于用户关注是系统价值的源泉,这个问题应该是可以克服的。

重新构建社交媒体(Restructuring Social Media

考虑到以上设计原则,让我们看一下现代社交媒体平台中利益相关者之间的关系,以及如何在去中心化社交协议下重新构建这些关系。

图1描绘了构成当前以平台为中心范式的四个组件。共有三个利益相关者:平台platform,红色)广告商advertisers,绿色)用户users,蓝色)。一切都经过平台。该平台拥有并中心化控制内容服务器,存储用户通过其界面生成的内容,并从该内容中提取部分内容予以显示。至关重要的是,该平台是用户和广告商之间的纽带。广告商向平台付费以向用户显示广告,从而为广告商产生点击。在这种架构下,平台掌控所有钥匙。它控制着系统生成的所有价值。

在去中心化社交协议支持下,新系统必须以用户为中心(user-centric。如图2所示,用户是其他三个利益相关者之间的纽带:界面提供者(interface providers)、内容服务器(content servers)和广告商(advertisers)。不是由平台作为用户和广告商之间的纽带,而是广告商直接向用户付费,通过竞标在用户界面上投放广告。然后,界面提供商和内容服务器将争夺这一广告收入。不再是提供交互界面的单一平台,而是很多界面提供商可以向用户提供其服务。不再是平台拥有和控制所有内容,而是内容服务器竞争托管用户的加密内容。

在去中心化社交协议下,用户可以控制所有钥匙,并控制系统生成的所有价值。这种以用户为中心的范式需要重新考虑在线服务的设计和构建方式。当前的平台可以分为三个部分:内容、用户界面和有时被称为「业务逻辑」(business logic)的部分。「业务逻辑」(business logic)是平台用来收集相关内容并将其发送到用户界面显示的所有指令。它是用于搜索、排序和实时处理内容的算法。推荐引擎、聚合器和各种形式的人工智能AI都是「业务逻辑」(business logic)。

图3简化演示了如何通过当前的中心化平台将内容交付给用户。用户通过用户界面发出请求,用户界面将请求传递到「业务逻辑」(business logic)服务器(步骤 1 和 2)。该服务器确定需要什么内容,然后从内容服务器获取它(步骤 3 和 4)。然后准备好要显示的内容,并发送到用户界面,用户界面将其显示给用户(步骤 5 和 6)。业务逻辑和内容服务器由平台控制,并在平台的计算机上运行,而用户界面(例如浏览器或应用程序)在用户的计算机上运行。

在去中心化社交协议下,由于交互界面提供者无权访问内容,因此它们无法自行执行业务逻辑。这必须在用户端通过所谓的「用户客户端」(user client)来完成。用户客户端只是一个应用或浏览器插件,可以执行业务逻辑并管理用户的个人资料和钱包。然后,接口提供商的功能只是将业务逻辑发送给用户客户端,指示其收集内容并进行编纂,以通过用户界面进行显示。

图4演示了如何操作过程。用户再次通过用户界面发出请求,该请求被传递到界面提供商的业务逻辑服务器(步骤 1 和 2)。然后,界面提供商将适当的业务逻辑发送回用户处的用户客户端(第 3 步)。用户客户端执行业务逻辑——根据需要从内容服务器收集内容——将输出发送到用户界面以显示给用户(步骤 4 至 7)。在用户客户端和用户界面之间执行的步骤6是在用户设备上本地运行的。单个应用或带有去中心化社交协议插件的浏览器可以同时处理用户客户端和界面,因此从用户角度来看,用户客户端可能「处于幕后」(under the hood)。

为简单起见,在图3和图4中未显示广告商。如果上述操作确实运行良好,图3中已连接到业务逻辑服务器,图4中连接到用户客户端。更复杂的关系也可能成立。例如,用户客户端可以根据用户设置、钱包余额或任何其他本地存储的信息,在初始请求发送到接口提供商之前对其进行修改。所有这些都未在图中演示,因此图中只是看到了社交网络的基本重组。

什么是社交网络?

到目前为止,我们一直在相对高的层级讨论设计原理。本文的其余部分将讨论去中心化社交协议在实践中如何运行的想法。大家请将它们视为这一问题讨论的起点,而不是最终的答案。

从本质上讲,去中心化社交协议到底是什么?我们看一下主要的社交媒体平台,我们会看到Twitter主打简短的公开言论,Facebook强调与朋友分享,Reddit侧重于小众社区,Instagram侧重于图片,YouTube侧重于视频,等等。我们不需要为它们一一复制一个去中心化版本,因为它们的本质是相同的,区别仅仅在于与他人交流和共享内容的方式不同。仅此而已。

从这种层次的抽象着手设计去中心化社交协议,既可以简化它,又可以最大程度地扩展其覆盖范围。上面列出的所有社交媒体平台,其中很多现在已经存在、有些尚待想象,都应该能够在去中心化社交协议上运行。这些平台(和任何通信平台)区别的维度如下:

  1. 内容类型(Content type
  2. 内容访问(Content access
  3. 语境(Context
  • 内容类型(Content type

视频、图片、音频、文本或任何其他内容类型之间本质上没有什么不同。它们都可以被降解为数字1和0,并且需要以相同的基本方式进行处理。存储、访问、语境和各种元数据,无论内容类型如何, 去中心化社交协议都应以相同的方式处理。Instagram、YouTube和SoundCloud基本上是同一网站,只是它们主打的内容类型有所不同。去中心化社交协议应该抽象化(abstracted),这样所有内容都可以支持,包括新的内容类型(例如 VR、触觉)

  • 内容访问(Content access

公开推文、推给好友的状态更新、群聊,私聊;根据谁有权访问内容,它们之间有所不同。去中心化社交协议将需要使用加密来确保只有获得许可的人才能查看内容,但又要足够灵活,以使界面提供商可以设计出种类丰富的内容共享机制。

公开内容易于处理,因为每个人都可以访问,因此无需加密。为了限制访问,我们需要加密。一种方法是使用对称密码对内容进行加密,使只限于持有该内容特定密钥的人才能访问该内容,然后将该密钥分发给使用非对称密码共享内容的一方(或多方)

不用说,这种复杂性不会展现在用户眼前。用户只需要知道已经与他们共享了新内容。默认情况下,服务提供商(界面提供商和内容服务器)不可以访问未加密的内容。

  • 语境(Context

当谈到传播问题,语境就非常关键。语境的不同,笑话就可能变成威胁,杠精可能变成哲人。所有内容都有各自的语境,因此,去中心化社交协议必须具备丰富的方式来将语境捕获为元数据,以便内容可以按创建者的意图来呈现。

内容的语境通常是其他内容:视频的评论或「赞」、反对票转推等。指向所引用内容的一根简单手指就足够了。但是,这一内容和所有内容都需要归类。

需要将一个系统集成到去中心化社交协议中,该系统可以捕获从子贴subreddit到朋友圈,从LinkedIn风格的网站到博客的所有内容。一种方法是使用标签(tags)。我建议从当前平台收集语境分类,并编纂一个标签列表。这些不应硬编码到去中心化社交协议中,而应作为文档开放给服务提供商,以供其借鉴和添加。

像往常一样,这种复杂性不影响出现在用户视野中。用户创建内容时,通常不会有意识地考虑语境,他们只是知道自己在发推文,在猫主子meme subreddit发帖,或单击他们所喜爱视频旁边的心形图标。生成的内容应根据所使用的界面提供商的业务逻辑进行自动打标签(更多信息请参见下文)这样无论使用什么界面,当用户生成内容时,其他界面提供商都将知道如何向其用户诠释和显示内容。

因此,如果有人在Twitter风格的网站上为您的内容「点了一个赞」,而其他人在Facebook风格的网站上为您的内容「点了一个赞」,无论别人使用哪个网站,查看您内容的每个人都会看到两个赞。

通过调整这三个参数,可以使用去中心化社交协议复制所有各种平台。更重要的是,在不需要抗衡网络效应的情况下,其他无法赢得受众的社交媒体和传播服务现在应该发现,它们可以满足小众社区的需求。

有人可能会说,上面所列举的三个清单中缺少「内容约束」(content constraint)。Twitter与众不同之处不是将用户推文长度限制为280个字符吗?确实是这种情况,但是去中心化社交协议不需要处理内容约束,因为它可以通过语境来实现。

例如,在使用Twitter风格的服务时,用其界面(推文)生成的内容可以这样标记。该界面不允许用户生成超过280个字符的内容,因此该界面中标记为推文的所有内容不得超过280个字符。如果用户要独立生成超过280个字符的推文,则这种类似推特的服务不会简单地将其显示给其他用户。

个人资料管理(Profile Management

用户才是给去中心化社交协议协议带来生命的关键因素。处理用户资料时,去中心化协议的主要挑战是名称空间(name space。中心化平台通过将所有已注册用户名的列表放在一个位置,并在用户尝试注册新名称时检查是否重复来处理其名称空间。 (当然,用户必须在他们使用的每个平台上重新注册,并且可能会发现他们在一个平台上注册的用户名,在另一个平台上已经被人占用)。对于去中心化协议,事情并不是那么简单。没有要查询的中央列表,也没有中央权威拒绝重复。

但是,我们可以借助密码学来给出解决方案。公钥密码学将使任何人都可以通过任何界面提供商轻松创建公钥和私钥对。公钥代表您在去中心化社交协议网络中的身份,而私钥将由您的用户客户端保留,并用于证明在该身份背后的是您。公钥是伪随机生成的,因此两个人生成同一密钥的几率非常小,可以放心地忽略。哇!现在您在网络上拥有唯一的名称和身份。但是可能几乎没人愿意自己显示的身份是外观随机的一串字符串。

处理此问题的一种方法与在现实世界中处理该问题的方法相同:让人们随心所欲地称呼自己,忽略重复。当您不确定是在与谁打交道时,只需检查一下对方的唯一ID。

另一种方法是建立名称服务器机制(name server scheme,类似于如何将唯一IP地址转换为唯一域名。在这种情况下,公钥类似于IP地址,用户名类似于域名。为了实现去中心化,用户客户端和界面提供商可以保留他们遇到的所有密钥/名称对的列表。当注册新名称时,用户客户端将会「四处询问」该名称是否已经存在于任何列表中。如果没有,则宣布新的密钥/名称对生成。如果用户遇到已经在列表中重复使用的名称,则该界面可能会用随机数(1、2、3 等)或其他一些区别来消除歧义。

另一种解决方案是使用区块链来记录不存在重复的密钥 / 名称对(key/name pairs without duplication。不过要求在区块链上进行注册,这一规则的麻烦是它侵蚀了隐私。区块链必然是公开的,但是并非所有用户都如此在意名称空间的重复,以至于希望全世界都知道他们的去中心化社交协议身份。他们可能只使用去中心化社交协议与亲朋好友建立联系,而消除歧义并不是一个大问题。

区块链注册还需要以区块链原生代币计价的费用。这给推广带来了麻烦,因为新用户免费使用了数十年现代网络平台后,就没法指望他们会为使用去中心化社交协议付费(更多信息请参见下文)

选择权应该在用户手中,而不是他们必须考虑和处理的事情,而是其用户客户端或界面提供商应该做的事情。无论是区块链、名称服务器,还是只询问一下网络中加的好友,都需要在成本、隐私和中心化之间进行权衡。在底层,可以用公钥解决这个问题,但是界面提供商必须想出办法来处理用户名与公钥的匹配问题。

声誉管理(Reputation Management

现在我们有了用户资料,接下来来看看这些用户资料如何相互关联。在一个理想的世界中,社交网络将成为相互尊重和共同体面基础上文明理智讨论问题的场所。显然,我们没有生活在一个完美的世界中。社交媒体用户更像是暴徒,平台感受到越来越多的压力,只能投放温和的内容。平台发现自己无法决定数十亿用户允许和不允许什么内容。无论他们做什么,都会使一部分用户感到沮丧。

去中心化社交协议通过将给用户声誉打分(rating the reputations of users这一责任实现去中心化,来避免这一问题。每个平台都不再向整个用户群发号施令,而是保留一个由其他用户点赞或点踩的评分表,并与网络中的其他人员分享该列表。这个构想称为信任网络(Web of Trust ,WoT),它是一种将系统中不良行为者的影响最小化的漂亮的、简单的方法。它是我们在现实世界中做法的在线版本。

假设您社交圈边缘的某个人邀请您喝咖啡。您怎么判断是否应该接受?您询问圈子里在您心目中眼光准确的人。如果所有人都说他很有侵略性或很无聊,那么您可能不会赴约,如果他们评论很正面,反之亦然。 WoT的工作原理相同。与其将所有的信任寄托在一个平台上,不如从网络中您已经信任的人员那里获得很多输入参数,而他们也从您那里得到输入。当然,WoT是在协议层处理的,因此具体问题不劳用户操心。

设计用于去中心化社交协议的WoT落地机制时,需要格外谨慎。应该尽可能抽象,以接纳不可预见的应用,并将决策权置于用户一端。工作机制可能是这样的:假设一个名为spambot2020的用户不断在您精心制作的公开消息中发布指向快速致富项目的链接。您应该能够这些令人不爽的内容标记为「垃圾邮件」。该帐户中的内容将不再为您显示。更重要的是,它也不会出现在信任您的人眼前。该标记可能是根据去中心化社交协议的内容访问和语境系统标签和共享的另一段内容。

不是所有决定都能像标注一个帐户是垃圾邮件一样容易,立即屏蔽某个帐户中的所有帖子可能不是最好的选择。幸运的是,WoT具有高度的灵活性,允许每个用户确定如何诠释和处理其网络中的标志。标记可以有不同的标签(例如,垃圾邮件、拉仇恨、杠精、机器人、赞、聪明、有趣),并且可以根据用户的偏好进行不同的加权。如果您信任的人强烈信任喜欢某首歌的其他人,那么您也可能会喜欢这首歌。您自己的标志和其他人的标志都会自动加在一起,以帮助界面提供商确定向您显示的内容及其醒目程度。

现有平台已经做到这一点,每个平台都有自己的专有算法。在去中心化社交协议下,WoT层的底层架构和内容由用户控制,因此他们可以选择所需的任何界面,届时界面提供商会有更多种类,并提供更多选择。

这揭示了WoT的真正魅力:没有中心化的观点(there is no centralized point of view)。如果我将某人标记为杠精,则这些人仅是我眼中的杠精。这不是「真相」。一些用户可以接受我的判断,对被指控的杠精进行权衡,另一些用户则可以忽略它,而另一些用户则可以把这种标签视为正面评价,将其视为「荣誉徽章」(badge of honor)。

关键是,每个界面提供商都将选择如何过滤和显示内容。反过来,用户将能够从非常丰富的选项中进行选择,甚至可以根据自己的心情每天或时时更改过滤标准和界面。没有人会再抱怨遭到不公平禁言或审查,因为每个用户都有发言权,而每个其他用户都有权不听他/她说话。

不过,WoT不仅用于过滤掉不良内容。它也是一个去中心化系统,可以帮助用户选择可以信任的商业伙伴。正如将在下文看到的,对于解决如何在用户、广告商和服务提供商之间进行价值创造和转移的难题,WoT将具有无可限量的价值。

价值创造和转移(Value Creation and Transfer

社交媒体平台通过出售广告位来赚钱。他们的平台是免费的、向公众开放,但是除了用户选择的内容之外,还包含广告。有争议的是,平台使用用户的个人数据和内容对广告进行分类,以便可以帮助广告商更精准地定位潜在客户。在去中心化社交协议下,服务提供商无法访问用户内容,而用户可以访问。因此,如果我们要完全实现社交媒体的去中心化,则需要重新设计这种已经非常成功的广告驱动的商业模式。

当前,平台充当广告商和用户之间可信赖的中间人。广告商向平台付费,并相信他们的广告将按照协议的频率显示给协议的用户类型。广告商开始重视给其链接带来最多流量的平台,但他们真正看重的是用户。用户观看品牌广告、点击广告并最终进行购买,或做出广告商希望的事情,是用户创造了价值。用户创造价值,因此应该向用户付费

但是,平台确实可以为广告商提供有价值的服务,因此我们必须确保去中心化社交协议可以做到这一点。例如,去中心化社交协议必须确保不会将广告投放到一堆假帐户中,那些假账号可能只是为了收取广告收入而建立的,要做的是向正确的用户展示正确的广告。这就是WoT通过优雅的解决方案重新发挥作用的地方。

具体可能是这样的:广告为符合其定位的每个用户竞标广告位,而用户从在其屏幕上显示的每个广告中获取收入。用户的客户端使用密码对广告进行签名,然后将其发送给广告商,这样广告商就可以知道自己的广告已被看到。如果用户点击广告,则广告商也知道这一点,因为该用户登陆了广告商的网站。如果用户执行了广告商希望他们做的事情(例如进行购买或点击链接),则广告商会向用户发送签名的收据,包含用户操作的价值、发生的时间以及其他元数据。

这意味着,在用户使用的每个步骤中,都有其创造价值的证明,他们可以公开分享这些价值,以吸引更多广告商竞标其广告位。签名收据就像是WoT中的信任代币。如果用户尝试欺骗该系统,并通过虚拟帐户向自己出售广告,并不会有影响,因为这些虚拟帐户不会与真实广告商建立任何信任关系,它们将被忽略。因此,一名用户点击广告的次数越多,并遵循广告商的需求,就越能向其他广告商证明,自己是良好的投资对象,就可以赚到更多的钱。从某种意义上说,这种广告比当前平台所提供的广告更具针对性,并且绝不会分享用户的内容或侵犯其隐私。

这种架构存在一个问题,但是密码学可以再次提供解决方案。用户可能希望广告商知道:自己点击了广告,并登陆网站花费了300美元,但如果该网站出售的是某些药物,或为某个政党接受了捐款,用户可能不想让人知道。从技术上讲,用户可以选择不公开来自此类站点的代币,但是无论如何,所有这些复杂性都应该对用户隐藏。我们不希望他们每次单击链接时都必须做出如此困难的决定。

相反,应该创建一个未公开的用户资料,链接到用户的主要个人资料,专门用于用户与广告商的互动。因此,用户的声誉和对广告商的价值将与随机生成的公共密钥相关联。广告商会知道用户的购物和点击习惯——对于客户定位非常有用的信息——但不会知道他们是谁,或在去中心化社交协议上做什么和分享什么。

广告商可能不会对用户一个个进行单独分析和竞标。专家肯定可以以不同方式(基于用户匿名公开的个人资料)将用户打包成不同类别,以迎合广告商。但是,这应该不会引起中心化问题。此类专家入局的障碍很少,因为底层的WoT数据是去中心化的和公开的。

一个悬而未决的问题是,要使用哪种付款系统来完成所有这些工作。我不认为去中心化社交协议应该回答这个问题,而应该让第三方开发者创建插件。可以与去中心化社交协议一起开发用于支持小额支付的当红支付系统的初始插件,以推动去中心化社交协议的启动。而更好的办法是,可以部署去中心化支付协议decentralized payment protocol, DPP)

服务(Services

现在用户手里有了钱,我们就可以讨论如何以去中心化方式支付必要的去中心化社交协议服务。

  • 内容存储和访问(Content storage and access)

中心化平台提供的服务之一是按需存储和交付内容(storing and delivering content on demand。散布在全球各地的数据中心都致力于这项任务。因为去中心化社交协议必须真正去中心化,该服务也必须去中心化。不能有单一实体负责这一工作。任何人都必须能以非常低的门槛提供这项服务,并且用户必须负责如何处理其数据。在用户控制广告收入的情况下,可以展开一场激烈的竞争,内容服务器将在这一市场尝试以尽可能便宜和快速的方式交付内容。

在实践中这可能行得通:用户搜索一条内容,例如「查理咬了我的手指」视频。内容服务器答复给出报价。用户客户端权衡响应速度和价格,然后将付款发送到最佳服务器,内容在这里交付。当然,所有这些将由算法在一瞬间处理,而无需人工干预。设置内容服务器应该只需要很少的技术技能。为此,已经在运行网络服务的人们可以安装软件,利用其过剩的存储空间和带宽。甚至家用计算机和设备也可以实现此功能。

WoT可以用于帮助该系统更平稳地运行。彼此信任的内容服务器和用户可以更轻松地交换内容和付款,而无需为每个内容竞价并达成交易。从本质上讲,内容服务器可以授予一系列信用额度给遵循协议确立声誉的用户,或给他们希望与之建立WoT连接的新用户。

双方都可以试验使用不同的算法。可以为寻找网络上最便宜、最快速和最可靠的服务器的用户部署探索/利用(explore/exploit ,E/E)算法。在服务器端,他们希望存储可以存储的最有价值的内容:访问量最高的内容

在实践中的具体运转将会很复杂,因为访问(需求)受制于可用性(供应)。成为托管内容每天访问量1000次的唯一服务器,好过托管内容每天访问量达100万次的百万台服务器中的一台。服务器在抢生意时将尝试使用不同的算法。

但是,某些内容可能访问量很少,因此没有服务器愿意托管它们。也许是两个人之间的私人信息,很少被重读。存储此类内容将需要付费。同样,服务器可以争夺存储您存档内容的特权。用户在这些情况下需要多留一些后手,以免托管其内容的唯一服务器宕机。

在这种安排下,我们可以预期,数据存储和访问的费用将非常便宜,等于或接近于成本。假设可以以零边际成本使用多余的服务器容量,并且可以在获客和WoT打分上获得一定的价值,那么某些情况下甚至可以免费提供数据服务。

  • 用户界面

当然,去中心化社交协议难题的另一个至关重要的部分是用户与网络交互时的体验。就是我们大多数人在想到社交媒体时所想到的:内容流、朋友列表、收件箱、主页、头像、论坛、聊天窗口等。不出所料,平台利用其掌控的数据集,垄断了数据的用户体验。例如,只有一个地方可以查看您的Facebook个人资料,即facebook.com

必须在去中心化社交协议下将其实现去中心化,那样任何网站或应用都可以显示您的内容,但无需访问该内容。由于用户可以控制自己的内容,因此他们从界面提供商那里所需要的全部内容就是与该内容进行交互的、直观且令人愉悦的方式。任何人都应该能够设置服务,并尝试以不同方式让用户生成其内容,并与其内容进行交互,而不仅仅是只能在twitter.com上访问的Twitter页面布局。

想象一下一个Facebook风格的主页。左侧是您的朋友列表,中间是您朋友们更新的信息提要,右侧是一些广告。假设您正在通过平板电脑上的应用查看该内容。当您打开应用时,将从界面提供商那里提取业务逻辑,该界面提供商告诉应用如何生成页面。基本信息,如个人资料、密钥和钱包,作为应用的一部分,与用户客户端一起存储在本地。如果是全新安装的应用,并且您之前已经有预置的个人资料,则该应用将从内容服务器中提取加密的用户资料,而您必须输入密码。

该应用将接受广告商的最高出价、对您的钱包授信、并在右侧显示广告。它将从内容服务器中提取您的朋友列表,以及相关的内容,例如您被授予访问权限的图片和帖子。该应用将使用从界面提供商获得的业务逻辑中的算法,对所有内容进行排序和显示

为此,界面提供商可以收费,用户可以由产生的广告收入支付。与内容服务器一样,由于用户的转换成本非常低,可以预期界面提供商之间会出现激烈的竞争。因此,用户和广告商不会去控制内容和界面的平台,而是广告商、内容服务器和界面提供商都会去争取用户,激烈争抢用户的注意力和价值。

这种设计带来的一个问题是,依赖于访问用户内容的服务将成为不可能。例如,如果用户私人消息已加密且分散在多个内容服务器上,那么用户如何通过关键字搜索其这些私人消息?理想情况下,我们不会打开潘多拉魔盒,允许服务提供商访问内容,即使是在为用户提供服务的幌子下。我们就这样陷入困境。值得庆幸的是,通常会有一个创新解决方案,使用户既保障隐私又具备实际功能。

在上面的搜索示例中,界面提供商可以向用户客户端发送一种算法,使用关键字为用户内容编制索引,并将该索引存储在仅用户可访问的单独文件中。当用户想要执行搜索时,她/他的用户客户端会pull体量较小的索引文件进行搜索,然后仅pull出与索引中关键字匹配的内容。

这是一种以用户为中心而不是以服务为中心的工程范式。它可以保护隐私,并且随着用户端处理能力的不断扩展,对于多数应用来说,将用户置于事物的中心不会是问题。

但是在用户眼中,主要区别在于记住并保护其密钥安全词的责任。如果用户忘记密码,则没有平台可以重置。解决此问题的任何其他解决方案都会让第三方可以访问您的内容。也许可以部署多签名加密方案,在这种机制中,几个受信任的合作方可以恢复一个人的密码。这种方式下,任何人都无法独自访问或访问您的内容,只有当您需要恢复密码时才会。

最终,以用户为中心的系统将权力赋予用户,而权力伴随着责任。考虑到近年来各大社交平台的黑客攻击和数据泄露事件,用户会期待以上解决方案及其带来的自主权。没有人比您自己更关心您的隐私和安全。

  • 边缘用例(Edge cases)

我们知道社交媒体平台是可以盈利的,因此按总金额计算,广告收入是超过平台提供所有服务的成本。因此,我们预计绝大多数个体去中心化社交协议用户获得的广告收入,足以支付其内容服务器和接口提供商的成本。不过看一下三个边缘案例还是很有启发性的。

在一种极端情况下,某些用户可能无法产生足够的广告收入来支付其费用。一种可能的情况是,如果用户从未点击过广告,则广告商最终将停止付费以显示这些广告。不过,品牌广告商可能仍然愿意支付很少的费用,从而允许一些内容交付。在最坏的情况下,这样的用户可能会简单地保管自己的内容,而忽略了服务提供商所带来的便利性。或者更好的情况是,他们可以自己成为服务提供商,并有足够的收入来满足自己的去中心化社交协议使用需求。

在另一种极端情况下,可能有一些用户对广告商来说非常有价值,以至于他们带来的广告收入超过了支付使用各种去中心化社交协议服务所需的成本。鉴于社交媒体平台从网络效应中受益,创造了数十亿美元的利润,因此可以合理预期,许多用户将通过使用去中心化社交协议并与广告客户进行互动而获利。

我们考虑的最后一种情况是一些离群索居的用户,他们宁愿看不见广告不收取任何广告收入,而自己掏腰包为去中心化社交协议服务付费。这样的用户将不得不自己为他们的去中心化社交协议钱包充值,充值金额将慢慢耗尽。

  • 内容问题(The Content Problem

每个问题的解决方案都为一系列新问题播下了种子。以内燃机为例。内燃机是对马力能源的巨大改进。它消除了城市街道上的马匹粪便,释放了资金并极大地扩展了人类的能力。没有人愿意回到马车和犁的时代,但是我们确实得处理空气污染、汽车碰撞和其他问题。如果电动、无人驾驶汽车能够解决这些问题,我们可以确保它们最终将成为我们子孙后代必须解决的新问题的源头。

去中心化社交协议有助于解决网络效应和社交媒体平台中心化带来的问题。一旦被采用,没有人会想回归到没有隐私、只有一个界面选项的时代。但是毫无疑问,我们会遇到一系列新问题。一个显而易见的问题——我们终将要处理的问题,我称之为「内容问题」(the content problem)。

如上所述,我们可以期望去中心化社交协议成为不存在审查的领域。如果一个界面审查了用户的内容,那么用户可以转移到另一个不审查用户内容的界面。如果这个用户是在指出侵犯人权行为,或只是在行使言论自由,那自然是好事。但是,并非所有内容都是可以自由出街的言论。有些内容是有害的,因为它会直接或间接导致无辜的人受到伤害。一个明显的例子是恋童癖。

如果去中心化社交协议因成为传播这种内容的工具而闻名,没有人会希望与它扯上任何关系。界面提供商、内容服务器、广告商和去中心化社交协议背后的开发者不会为此贡献自己的才能和资源。普通用户将无法获得上述去中心化的所有好处。去中心化社交协议将一败涂地。

可以说,内容问题是由作为去中心化社交协议核心的加密技术引起的。如果去中心化社交协议不加密用户内容,则内容服务器可以扫描有害内容并将其拒绝。但这会破坏每个去中心化社交协议用户的隐私,其中大多数是普通的守法公民。为了解决内容问题,我们需要一种方法来识别正常内容汪洋大海中的有害内容,而无需访问或看到其中的任何内容。从表面上看,这似乎是不可能完成的任务。

不过,我在这里提出了一种称为零知识人工神经网络Zero Knowledge Artificial Neural Networks,ZKANN)的解决方案,该方案使用密码学和网络机器学习来做到这一点。归根结底必须开发类似的东西,来解决内容问题。

总结

当今的社交平台在吸引用户注意力及其创造的价值方面拥有巨大的影响力。平台通过网络效应将人们锁定,可以迎合广告商,甚至以牺牲用户利益为代价。平台已经开发出复杂算法来利用人类心理中常见的弱点。虚荣、偷窥和愤怒,使用户一直盯着屏幕,点击,刷屏和轻扫,想看到更多,而这些都会显示更多的广告。

在去中心化社交协议下,每个人受到的激励与服务用户保持一致,用户会使用最重视他们的界面。就我个人而言,我想使用让我感到平静、快乐,并与我关心的人和内容保持联系的界面。

去中心化社交协议要取得成功,必须提供目前社交平台所做到的无缝体验,但又要具有去中心化带来的额外好处。加密、内容服务器、小额支付、ZKANN和 广告网络的复杂性,必须从普通用户的视野中消失。用于所需要知道的就是该系统可以正常工作,有时他们的钱包里甚至还有一些多余的钱。

在许多方面,去中心化社交协议都是早期互联网愿景的兑现,但我们不是去中心化到域级别,而是全面去中心化给用户,将控制权和隐私权交到他们自己手中。

顺便说一下,我没有对去中心化技术的现状和最新发展进行具体调研。在监狱牢房内进行一部分调研是很困难的,而全部做到是不可能的。我确信上面的许多想法都不是新鲜事物,但我希望我的想法对将来构建和使用去中心化社交协议的人有所帮助。

中文:如何彻底革命社交媒体、实现去中心化?丝绸之路创始人在狱中提出了构想

原文:Decentralize Social Media

挖掘Roblox的发展战略

Roblox如何避开游戏坟场,成长为25亿美元的公司?

有一些成功的公司发展迅速,获得了大量的媒体报道。然后Roblox,这家公司至少花了十年的时间才取得了巨大的成功,但相对于其目前的成功水平,它几乎没有得到任何认可或关注。

为什么Roblox的故事大多不为人知?一个原因是,它是从整整一代游戏门户和平台中脱颖而出的。有些人,比如King.com,运气好,或者转行做了业务。而其他的则基本上都失败了。

一旦像Facebook、苹果和谷歌这样的公司进入游戏领域,试图建立自己的平台看起来只是一个坏主意——因此不值得一提。除此之外,创始人兼CEO戴夫·巴斯扎基(Dave Baszucki)似乎对媒体的报道不感兴趣。

但总的来说,问题是,Roblox在很多年、很多年里,只是看起来是一个无足轻重的故事。该公司有数百万用户,当然。任何一款流行的游戏也是如此。在它的早期,Roblox甚至看起来就像Minecraft,这款游戏在Roblox上线很久之后才发布,但它的发展速度要快得多,快得多。

然而,今天我们却在这里。Roblox现在声称,美国所有9-12岁的儿童中,有一半都在其平台上。它的月独立用户已经跃升至9000万,并准备走向国际,可能会让这个数字成倍增长。而且它是独一无二的。基本上,除了一些像Steam这样的远亲,其他所有通过门户网站提供游戏的发行服务最终都已经衰落了。

这就是Roblox不仅生存了下来,还搭建了一个蓬勃发展的平台的故事。

从一个构想开始

在Roblox之前,有一家做教学软件的公司Knowledge Revolution。虽然设计的目的是让学生模拟物理实验,但或许可以预见的是,他们也把它当成了游戏。

"乐趣似乎就在建立自己的实验中。"戴夫·巴斯扎基(Dave Baszucki)说。"当人们在玩的时候,我们进了学校和实验室,他们都在做汽车撞车、建筑倒塌,做的东西真的很有趣。"有了沙盘,孩子们不只是做了关于质量或速度的实验,他们还做了一些游戏,或者是可以向朋友们炫耀的体验,让他们开怀大笑。

Knowledge Revolution公司成立于1989年,由戴夫·巴斯扎基(Dave Baszucki)和他的兄弟Greg(他后来并不是Roblox的联合创始人,但现在是其董事会成员)创立。近十年后,它被做专业仿真工具的MSC软件公司以2000万美元收购。在离开前,Dave又在那里继续工作了4年,成为一名天使投资人。

戴夫·巴斯扎基(Dave Baszucki)把钱投给了Friendster,这家公司在社交网络范畴比Facebook和MySpace更早。这笔投资为Roblox的另一个想法埋下了种子。总的来说,Knowledge Revolution和Friendster的遗产是支撑Roblox的两个关键组成部分:一个是具有强大的创造工具的物理沙盒,一个是社交图。

戴夫·巴斯扎基(Dave Baszucki)本人是拼图中的第三块。戴夫·巴斯扎基(Dave Baszucki)是老一辈企业家的一部分,可以说是史蒂夫·乔布斯一代,他的原型似乎比乔布斯本人更接近于罗杰斯先生(Mr. Rogers):不苟言笑、热情洋溢,从不声称自己有卓越的洞察力,更喜欢把自己的成就归功于他人。在谈话中,他表现出了与Roblox相关的核心和非核心的兴趣,比如虚拟环境、游戏、教育、数字身份和科技的未来。就在这个令人心驰神往的混合体中,Roblox的想法产生了。

首次发布

Roblox最初名为Dynablox,由戴夫·巴斯扎基(Dave Baszucki)和Erik Cassel于2004年创办,他是一位曾在Knowledge Revolution公司工作的工程师。

Roblox并不独特。Roblox成立之初,正值大型虚拟世界和游戏平台的蓬勃发展时期:宽带的采用、硬件的改进、多人游戏的发展以及硅谷生态系统的复苏,都让Roblox产生了像Second Life(2003年成立)、IMVU(2004年)和Metaplace(2006年)这样的沉浸式社交环境。在追求年轻受众的过程中,Roblox也与Habbo Hotel (2000年)和Club Penguin (2005年)等儿童平台分享了DNA。它甚至与King.com(2003)和Kongregate(2006)等休闲游戏平台有一些相似之处。

刚开始的时候,两位联合创始人并不确定是什么让他们的愿景与众不同。"我们有过几次错误的开始,但最后我们说,我们必须去做这个完全统一的产品。"戴夫·巴斯扎基(Dave Baszucki)说。

形成的愿景一直持续到现在。Roblox将依靠用户生成的内容——社区制作的游戏。但它将承担起其他一切责任。该公司将创建游戏开发工具,并运营运行这些工具的服务器。它将建立门户,并添加聊天和好友等社交功能。为了启动社区,它甚至会建立自己的游戏。

这些活动中的任何一个都足以占据一家创业公司。比如说,游戏引擎Unity与Roblox同年成立的游戏引擎。两者都是3D游戏引擎,功能相似,允许用户构建环境,编写脚本,控制游戏的各个环节。Roblox甚至比Unity更有优势,因为它提供的多人游戏服务可以在每个副本中支持最多100名玩家同时进行游戏。

但Unity仅仅专注于引擎的开发。Roblox仍然必须建立其他一切。在实践中,这意味着要一个个地处理功能——尽可能地将每个功能都制作成最基本、最精简的版本。在2004年和2005年期间,Baszucki和Cassel单枪匹马地制作出了游戏的alpha和beta版本。

这段时间发布的Roblox环境的第一款原型的粗糙程度令人难以置信。"我们在动画化之前,我们曾就头像是否可以在支持动画效果之前发布进行过一次大讨论。"Baszucki回忆说。答案是肯定的。几十名测试者通过展示广告带来的测试者,玩了一个版本的游戏,游戏中的头像像幽灵一样飘来飘去,很僵硬。他们甚至在后来的更新中加入了动画效果时抱怨。

但真正的考验是社区成员是否会使用创作工具,最初的创作工具很粗糙,也很有限。Baszucki和Cassel在2006年推出了第一版Roblox Studio,社区成员立即开始制作自己的游戏,与Roblox自己制作的游戏相媲美。"这比我们能想到的一切都要好得多。我们得到的是彩弹战争,我们可以乘坐的模型火车,万圣节的豪宅,"Baszucki说。

同年年中,Roblox雇佣了第一批员工,他们立即投入到构建其他功能的工作中。Matt Dusek是与John Shedletsky并肩作战的首批两名员工之一,他构建了一些早期的通讯功能。"早在2006年的时候,在网上一起玩还是一件苦差事。当时没有社交图,所以早期我就建立了好友系统。那时候他们有留言板,但是没有私信,所以我就建了一个私信系统。我们开始打下了很多基础。"

他说。在聘请了Dusek和Shedletsky后不久,Roblox就完成了110万美元的B轮投资,确保了公司的近期发展。在接下来的两年里,公司继续为创作者和社区以及生活在门户网站上的游戏开发功能。然而,在2008年,它停止了常规性的游戏制作:创作者社区已经发展到足够大、足够活跃,能够创造出大部分内容。基础已经到位——他们只是需要多年的努力工作。

坚定不移地坚持一个愿景,抵御一切杂念。

当然,简单的说一个公司需要几年的工作,就把创建公司的性质轻描淡写了。

一来是心无旁骛。Roblox那一代的公司都在不断尝试不同的策略,而忽视成功的公司并不容易。比如说,Club Penguin公司曾赌上自建环境,这是一种针对儿童的大型多人在线游戏,并获得了巨大的成功,以至于在2007年以3.5亿美元的价格卖给了迪士尼。“第二人生”的用户数较低,但似乎引起了媒体的无限关注。

在休闲游戏领域,潮流正在发生转变。2008年,苹果公司的App Store推出,并在随后的几年中成为移动游戏的核心。而Facebook则更加吸引眼球,到2009年10月,Farmville的MAU就达到了2000万。这两个游戏目的地拉动了很多Roblox的同行的注意力。比如King.com,在2010年加入了Facebook的热潮,并在随后的几年中放弃了门户。2012年,《糖果粉碎传奇》(Candy Crush Saga)发布后,它甚至还能显得很有先见之明。同年,Roblox推出了自己的iOS应用,但还是坚持了自己的策略:玩家必须通过其门户网站才能进入单个游戏。

同样是在2009年,Mojang发布了《Minecraft》,它的外观是是简单的方块,但这是一个完整的世界——这是一款与Roblox平台的游戏。到2013年,它的付费用户达到了1000万。"《Minecraft》是当时最大的事件之一。当《Minecraft》到来的时候,拥有非常相似的受众群体,迅速的超越了Roblox。Roblox的工程、技术副总裁亚当·米勒(Adam Miller)说:“这需要一定的毅力,不能只是抄袭《Minecraft》,然后说这是一款更好的游戏,它应该不仅仅是一款游戏。”

在某些方面,Roblox保持了时髦:例如,它在2008年推出了Robux币的销售,并在2013年为开发者推出了虚拟商品,在游戏行业的大部分人还在尝试着接受免费游戏的理念的时候,加入了微交易。它还支持和培育了一个无偿内容创作者社区,在这个时期,除了YouTube等少数几家公司外,很少有其他公司这样做。

尽管如此,发生在游戏领域的活动仍然是一种哲学上的威胁。当Roblox的公司在Roblox本身还没有任何希望的时候,另一家公司已经在这个领域已经大获全胜,那家公司的成功策略就成了一种诱惑。"有朋友、熟人、竞争对手在你耳边喋喋喋喋不休地说,也许你就可以这样做,"杜塞克说。

但最终,竞争对手的作用是突出了Roblox的愿景与众不同。"我们在谈论第二人生,以及他们从虚拟世界到相邻的虚拟世界的徘徊。这真的是我们所看到的吗?你从《海盗》到《宇航员》再到《恐龙之国》走过?你可以这么做,但这不是我们所看到的,"Dusek说。相反,Roblox团队坚持了自己的愿景,即这是一个上面有很多游戏的平台。

当Roblox在开发内部功能的时候,其他的分心之举也随之出现,这些功能成为短期内的成功,是建立一个巨大平台的日常工作中的感叹号。帽子就是其中之一。任何专注的游戏玩家都知道,射击类电子游戏《团队要塞2》以帽子闻名于世,它的帽子可以在玩家之间出售和交易。这是该游戏取得巨大经济成就的基础。Roblox也有这样的特点:它在销售虚拟商品方面的第一个尝试就是玩家的帽子,玩家们似乎都很喜欢。"早期推出的帽子是如此的成功。当时有这种明显的压抑的需求...........所以就有了一个想法,那就是我们可以有整个公司关于创建一个在线角色的想法。"Dusek说。

无视这些杂念的能力是Roblox成功的一个不容小觑的方面。无一例外,TechCrunch为这篇文章采访过的每一个人,都把这种对愿景的顽强坚持归功于Dave Baszucki(除了Baszucki本人,他把功劳归于整个团队)。

"在马克·扎克伯格(Mark Zuckerberg)身边,我还没有看到过像他这样专注于使命,有远见卓识和长远眼光的人,"Greylock Partners的管理合伙人David Sze说,他是Roblox最近的1.5亿美元的一轮融资的领投人。Sze在早期的时候就认识Baszucki,并观察了Roblox在解决这些早期问题时的情况。"他承受着巨大的压力,认为这并不奏效,他需要改变一些事情...........[但是]他真正理解了需要实现的部分,并且从未动摇过,而其他人的愿景是有部分的,并没有长期坚持。"

需要指出的是,Sze是在回想中提出这些看法的;他之所以认识Baszucki,是因为他们的孩子在同一所学校上学,但并没有投资Roblox的早期投资。而事实上,回想起来可能最容易把Baszucki看成是一个有远见卓识的人。他缺乏急躁和意志力,无论好坏,都与科技界的火眼金睛的预言家们不无关系。他似乎很确定自己所知道的事情,而他所知道的是Roblox的长期愿景。

建设社区

回忆起Roblox的早年,很容易:公司还在增加功能,并确定了自己的战略。但从公司成立到今天,有15年的时间,对于一家消费类公司来说,这15年的时间太长了。从外人看来,这15年的时间是一个漫长而缓慢的过程。

"我的看法是,你有一个大范围的不同组件,而Roblox一开始是以最原始的方式构建所有的组件,并随着时间的推移进行迭代。我认为即使是在内部,人们也很难看到它是如何随着时间的推移而改变的,因为它的发展是如此之快。"技术副总裁Adam Miller说。

看到这些变化最好的地方可能是平台本身。几乎所有在Roblox上开发的游戏都还在运行,这要归功于团队在持续更新中依然保持兼容兼容已有游戏上所做的努力。

较早的游戏无论是环境还是头像,都显得比较块状和原始。这些年来,这种外观已经变得更加精致。而较新游戏中的头像则变得更加圆滑、流线型。块状的地形现在包括了光滑、复杂的形状。游戏的UI也得到了改善,这对社交功能的外观和感觉都有影响。性能也变得更好了,游戏现在在PC端和它的移动应用上都能很好的运行,这款游戏在2012年发布的时候,现在已经占到了一半以上的用户。不那么明显了,但仍然很重要,由于服务器和客户端的沟通方式发生了变化,作弊变得更加困难。

但这些都是主要的变化。实际的日常变化通常要小得多。Matt Dusek说当时用来创建游戏的缩略图的刀片式服务器是放在塑料椅子上的。"这是屏幕刮像素,但这意味着什么,每当你有一个Windows更新,更新就会在它面前弹出,所有的缩略图都会在上面显示出Windows更新框的一角。"团队花了几年的时间慢慢更换了这些临时的技术方案。

工程副总裁亚当·米勒讲述了另一个故事,他讲述了自己来到公司8年后,发现游戏的运行速度似乎只有30帧/秒。"他们说,不,不,是60帧。于是我们看了看屏幕,测量了一下,果然,我们的渲染速度是60帧/秒,但我们在每次运算之后渲染两帧。"不用说,这个问题很快就被解决了,但仍有很多类似的问题遗留在系统中。

也是在那个中间的年代,社区开发者变得更加重要。早年的时候,Roblox自己做游戏,其中很多游戏都很受欢迎。后来,公司不再做自己的游戏了:一切都要靠社区来创造。

但大多数Roblox的开发者都只是个孩子。Matthew Dean在16岁时就开始在Roblox上开发游戏。在尝试了几次之后,他获得了成功,名为《目录天堂》。但他对整个游戏的体验非常随意,甚至连游戏的玩家数量都没有跟踪。"我在几个星期内就把游戏做出来了,发布了,告诉了大家,没有得到任何关注,所以我就把它忘了。半年后,我看了一下《Roblox》的头版头条,它在头条上,突如其来。我不知道它是怎么来的,"Dean回忆说,他现在是Roblox的产品经理。

如果说有什么方法可以概括那些漫长的岁月里的逐渐成长和改进,那就是Roblox对长期计划的持续坚持。"五年前,Dave主导了这个倡议,创建了一份文件,作为公司共同的参考点,关于我们同意的愿景,"Miller说。"我们会在一个房间里进行辩论,一旦我们达成共识,它就会成为我们可以参考的文件,每年我都会在组织上进行一次演讲。我们最近才把它提出来,上面的每一个项目都仍然有效。"

失去一个联合创始人

有一个事件确实值得特别强调。2013年,Baszucki的联合创始人Erik Cassel去世了。"有一天,他看起来像是有点胃痛回家休息,然后我们发现他得了癌症,"Baszucki说。

Cassel是初创公司所希望和希望的那种技术型创始人:他有能力打造出稳定的系统,即使是最早期的系统。"Erik是一个原型设计大师,而且他的原型能够在生产环境中运行几年。他爆发一下的产出往往相当于一个团队开发几年的成果。"杜塞克说。

"对于Roblox的许多关键基础元素,他都会有非常前瞻性的观点,"Baszucki说。"有一个早期的例子,我的比较原始的方式是围绕着评分和游戏想出架构,Erik说,我们必须嵌入Lua脚本,这样你就可以做任何事情,而不是制作一个固化的功能。有一个优雅、简单的设计关键真的很重要。"

在Cassel的同事们的记忆中,他是一个和蔼可亲的人,他向公司最早的工程师传授了自己的手艺。

"真正疯狂的事情是,当我们看了那么多关于得了癌症的人的书,我有一个先入为主的想法,就是放下一切,爬上珠穆朗玛峰,和家人一起出去玩。对他来说,这正是他想做的事情。他几乎一直坚持到最后,"Baszucki说。

近期

经过这么长时间的积累,不知道什么时候,Roblox终于可以被认为成功了。也许是在2016年12月,当平台宣布月活跃用户达到3000万的时候。又或者是2017年3月宣布获得2400万美元的E轮融资,2018年9月,该公司又融资1.5亿美元,到2019年4月,其MAU数量翻了三番,月活跃用户数达到9000万。

或者说,现在可能还不是宣布Roblox成功的时候。如果说有什么可以从这家公司到目前为止的漫长人生中学习到的东西,那就是它不会像普通的消费类创业公司那样有目标地存活下来。没有病毒式的拐点,没有早期投资者的快速翻身。Roblox一直专注于长期的、几乎是哲学性的目标:建立一个新的娱乐和通讯类别,而不仅仅是一家公司或快速套现。"我们一直有这样的态度,产品是永远不会完成的。我们认为它是以百分之一的比例来实现愿景。当我们推出的时候是3%。今天,我们仍然延续了这个态度。"Baszucki说。后来,他提到有一个30年的愿景,在这个愿景中,用户有一个完整的数字身份——也许是在Roblox这样的沉浸式环境中。

从Roblox的工程团队中传出的工作也表明,该公司仍然把自己看成是在打基础。例如,该公司花了几年的时间和大量的工程资源设计了游戏引擎,使其游戏引擎也能运行应用基础架构,并写入每个平台上的最低级API,比如iOS上的Metal。因此,Roblox现在可以在iPhone、Android和Xbox等设备上以原生级性能运行,但只需要少数工程师来维护这些应用。"在Roblox做这件事已经花了三年的时间,我不知道有多少像我们这种规模的公司,当时有100人,现在差不多有500人,愿意为这么长时间的回报而花费那么多的工程精力,"领导这项工作的高级工程总监Claus Moberg说。

不管Roblox是否能被称为成功,但资金的涌入和玩家的涌入已经将公司的招聘工作推向了高潮。比如说,曾是Atlassian公司的开发者关系主管的Grace Francisco就被调到Roblox担任副总裁,负责他们不断壮大的开发者社区。动视的高管Enrico D'Angelo来到Roblox,担任Roblox的产品副总裁。Dan Williams离开了Dropbox,他曾担任基础设施工程总监,领导Roblox转向自己的云计算,建立自己的服务器群,并脱离亚马逊AWS等托管服务。前苹果公司亚太区总经理Chris Misner出任国际总裁。

Roblox的大部分新鲜血液代表了新的举措,或者是旧的优先事项的巨大扩展。例如,自2006年Studio推出以来,开发者关系在Roblox一直很重要。但是,随着开发者社区的发展--目前已经有200万名创作者——公司增加了更多与社区互动的方式。它允许一些最成功的创作者在其圣马特奥办公室工作。该公司在2015年启动了一个针对开发者和团队的加速器,并在同年举办了一场大会。

简而言之,Roblox已经告别了缓慢而稳定的增长,进入了高速增长期。这不是一个无风险的过渡。该公司仍然需要赢得国际观众,以及老玩家的青睐。它必须在较新的竞争对手和社交网络格局的变化中生存下来。


挖掘Roblox的发展战略

Roblox能不能创造出一个新的娱乐和传播类别,即所谓的 "人与人的共同体验"

当它还是一家小型创业公司的时候,很少有观察者会相信这样的前景。但在15年后——正如我们的Roblox EC-1的起源故事中所讲述的那样——这家公司已经积累了9000万用户,并获得了新的1.5亿美元的风险投资战利品。它抓住了美国年轻人的想象力,成为了娱乐领域的创业宠儿。

但是,究竟什么是人类的共同体验?嗯,无法准确描述——因为它还是一个新兴的范畴。这几乎就像那个寓言故事里,九个瞎子在抚摸和描述一头大象。

联合创始人兼首席执行官Dave Baszucki说:“每个人的看法略有不同。在Roblox看来,共同体验是指身临其境的环境,用户可以在这里玩耍、探索、交谈、闲逛,并创造出与线下、现实生活一样彻底丰满的身份(即使不至于像他们的线下、现实生活一样丰满)。”

但Roblox的下一个十年也将是其最具挑战性的时期,因为它寻求从9000万用户扩展到可能的10亿甚至更多。要做到这一点,它需要完成两件事。

首先,它需要将玩家的年龄范围扩大到目前的青少年受众之外。第二,它必须赢得国际市场。要做到这两点,将是一个有许多活动部件的难题。

今天的Roblox

Roblox做得很好的一件事就是吸引了一定年龄段内的孩子。该公司表示,在美国所有9到12岁的孩子中,大部分都在其平台上。

在这个年轻化的细分领域内,Roblox可以说已经开创了人机合作体验类游戏。很多游戏都是合作性的,而不是竞技性的,或者说目标不明确,或者说似乎并不重要。比如Roblox最受欢迎的游戏之一就是《MeepCity》,玩家可以在虚拟环境中跑来跑去,在虚拟环境中聊天,就像在中学一样,不一定要和游戏的机制有任何互动。

些环境和你今天在App Store或Steam上看到的东西还有什么区别呢?有几个特点似乎是共同的。

其一,环境看起来很粗糙。一位Robloxian将该公司对外观的宽松态度归结为 "没有过分强调视觉上的逼真度"。

Roblox游戏也忽视了现在几乎所有游戏公司所推崇的设计原则。教程不多,用户界面不完善,而且让人感觉到KPI(如留存率和参与度)并没有被仔细衡量。

这与Facebook和App Store等平台上的游戏的起步方式类似,所以说Roblox只是处于类似的早期阶段似乎是合理的。的确如此——但它也在与设计更严谨的手机游戏直接竞争。它有一半以上的玩家都在智能手机上,在这里,他们可以选择一款看起来更精致的免费游戏,比如Fortnite或Clash of Clans,这款游戏的玩家可以选择免费的游戏。

关于Roblox吸引大玩家的原因,更准确的解释是,儿童娱乐市场有一个空白。到目前为止,只有Roblox填补了这一空白,尽管它有各种缺点。

"几十年来,非结构化的、无指导的游戏量一直在下降。[孩子们]有更多的家庭作业,以及课后的戏剧等结构化活动。

Roblox的首席业务官Craig Donato解释说:"我们解决的一大未被满足的需求之一就是给孩子们提供一个有想象力的地方。如果你在我们的平台上玩体验,你不是为了赢而玩。你和你认识的人一起进入这些世界,分享一种体验。"

《模拟人生》(The Sims)等游戏也曾尝试过同样的做法,但最终在孩子们的试玩中渐渐淡出。Roblox的诀窍一直在持续增长:它为孩子们提供了无穷无尽的游戏,释放他们的想象力。但是,就像我们不指望成年人能用芭比娃娃玩得开心一样,大多数成年人不太可能会喜欢Roblox的游戏。

当然,如果你指着Roblox,嘲笑它的野心是很容易的,因为它要赢得所有年龄段的人的青睐。这种笑声也会是短视的。

正如领导Roblox最近一轮投资的Greylock Partners投资人David Sze所指出的那样。"当我们投资Facebook的时候,有大量的推举,认为没有人会在大学之外使用它。" 赢过一个人口统计学的公司,就有很大的机会赢得别人。

Roblox也证明了自己的进化能力。曾几何时,该平台的玩家中90%为男性。现在,这个比例已经下降到了60%左右。Roblox现在玩的女生人数远远多于一般的游戏平台。

发展到新的年龄段

为了吸引老用户,Roblox正在努力改善其环境和角色的外观、感觉和规模。

"有一个特定的年龄段,像视觉和尺度这样的东西开始变得重要,我们希望解锁这种可能性,"该公司三位工程副总裁之一的亚当·米勒说。

比如说,Roblox已经在做的一个举措,就是更新的灯光引擎。在任何一个虚拟环境中,灯光的作用都比第一眼看上去更重要:它决定了环境的外观和感觉是否有灵感。"照明材料一起创造出的真实感,和深度感,所以我们把它作为一项投资优先考虑,以提升游戏的视觉质量。"产品副总裁Enrico D'Angelo说。

除了灯光引擎,也就是Roblox准备谈的那部分之外,我还了解到他们在很多其他方面的外观设计上也在努力。比如说头像,已经从早期的正方形和长方形的集合,进化成了更加精致的R15角色,形状更加多样,顾名思义,就是15个身体部位。下一步就是想办法让角色看起来更漂亮,动作更有说服力。

环境,也可以扩大。如今,Roblox游戏的规模不可能像《魔兽世界》这样的MMO游戏那样,但该公司正在努力扩大可能的环境规模和玩家数量(目前限制为100人)。

"这是一个很大的性能工作,让代码更有效率,多线程...........我认为我们比其他公司花在性能上的时间更多,这可能是很多人看Roblox的时候都想不到的,"公司工程副总裁Adam Miller说。"他们认为哦,这只是一款儿童游戏。可能在工程团队中,有四分之三的人都专注于性能。"

Roblox在吸引年长观众方面还有一个更直接的控制权,那就是给他们看的游戏。目前,Roblox的首页对任何访客来说都差不多,无论他们是12岁还是24岁,是男是女,不像YouTube等其他UGC驱动的网站那样,每个用户看到的视图都是自定义的。

"已经有相当多的内容会吸引不同年龄段的玩家,但很难找到,"Miller说。再次,Roblox并没有什么具体的内容要宣布,但很可能他们未来会在搜索中加入定制化的内容。

吸引开发者

上述的所有改进都是Roblox可以自己做的事情。比如说,增强的灯光,可以应用到现有的游戏中,只需要开发者相对较少的参与,就可以将其应用到现有的游戏中。但对于其他的改进,公司还得依靠游戏开发者来完成。

开发者社区已经是一个巨大的关注领域。据该公司表示,今年Roblox的参与和教育工作将覆盖超过100万名学生。

这里有一个相当规模的在线知识库,该公司运营着一个加速器,提供实习机会,并有自己的年度聚会——Roblox开发者大会。它吹嘘着每年快速增长的开发者收入(2017年支付了3000万美元,2018年支付了6000万美元)。它所有的努力加起来,如今平台上的开发者加起来有200万开发者。

因为这个社区主要是孩子们为了好玩而开发的,所以也比很多专业的社区更有协作性。"他们相互之间没有超级竞争。他们会互相帮助很多。这就提升了所有团队的水平...........我们社区里有真正强大的冠军,他们懂得互相帮助。他们实际上会在不同的团队中轮流工作。他们不会被永久分配到一个工作室,"开发商关系副总裁Grace Francisco说。

但尽管Roblox在儿童群体中取得了成功,但Roblox仍然需要更大的、更专业的团队来组建,并制作出老玩家喜欢的那种更大的体验。

某种程度上来说,在现有的开发者社区中,工作室已经开始形成。比如说Red Manta工作室,这个工作室的结构似乎比较传统,有一个老板和几个员工,还有一个比典型的Roblox更大的Roblox游戏正在开发中,名为《世界//零》,看起来就像传统的MMO。

但Roblox可以通过吸引大型游戏行业的工作室来加快发展速度,因为很多独立工作室都在那里苦苦挣扎。"5到20人的商店,在这个时代,他们在Unity或虚幻中构建,并在App Store上发布,[营销和玩家获取]对他们来说真的很难。我认为有了Roblox,尤其是一旦我们提高了视觉保真度和世界的大小,这就变成了一个非常有趣的机会。"产品副总裁D'Angelo说,他的背景是在AAA发行商动视的背景。

"在我看来,对于那些可能想做多人游戏但没有后台工程的小工作室,或者想做超级社交的游戏但无法吸引用户的小工作室来说,我们的价值取向令人信服。"

问题是,习惯了Unity或虚幻的工作室可能会很难顺利地过渡到Roblox引擎,而Roblox引擎缺乏诸如源码控制等功能(对拥有多个编码员的团队来说很重要)或第三方插件和资产的商店。

"当我们的开发者社区开始培养出一批专业的开发者时,他们对专业工具的要求和要求也越来越高。你可以从平台上的游戏质量上看到这一点。我们最受欢迎的游戏,比如《越狱》和《MeepCity》,可能都有5到6万行代码。如果你在编写5万行[Roblox的编程语言]Lua的时候,没有使用某种游戏状态管理库,那么你就会出现令人难以置信的bug,"工程部高级总监Claus Moberg说。

因此,Roblox正在努力增加功能,磨平粗糙的地方——例如,它与Playfab建立了新的合作关系,为开发者提供分析服务。如果它能打造出合适的工具,以及继续展现出越来越高的收益,无疑将至少吸引到一些在移动和PC游戏市场上苦苦挣扎的开发者。

成功的机率

简而言之,Roblox需要改进多种功能,以覆盖更广泛的人群:图形、性能、其游戏开发工具和开发者社区。它能够做到这一点的证据是它花了15年的时间打造出了今天的样子,而它的团队和资源却少得多。

但是,即使Roblox把它现在所做的一切工作都做完了,也不能保证18-25岁的年龄段的人群,比如说18-25岁的人群,会不会来到这个平台上。过去的3D环境并不能提供太多的指导,如果有的话。

比如说《第二人生》,它仍然存在于游戏和社交环境之间的朦胧地带。它在2007年达到峰值,大约有100万用户,据说在2017年只有60万玩家,尽管十年来一直在进行技术改进。

回到Baszucki的隐喻,大象仍然是看不见的:我们看不到它的最终形状,也看不到这个形状是否适合除孩子以外的任何观众。Roblox的外观和感觉与《第二人生》完全不同;其他的比较点,比如Facebook上的社交游戏,同样相差甚远。虽然Roblox可以全面改善其产品,但其他一些,目前未知的成分可能需要扩大人口结构。

这就是为什么用户生成的内容和外部开发者很重要的原因:虽然公司本身不能说一个成人的Roblox游戏会是什么样子,但一个由数百万开发者组成的社区或许还能想出它的样子。

这并不是说这家公司没有想法。Baszucki最喜欢的一个想法是教育:利用虚拟环境,让今天我们只能通过阅读或观看视频了解到的创意互动。

"我想,我们将开始看到更多的出现。很久以前,当你研究内战的时候,你会去研究百科全书。现在,人们会去看视频或书籍。我们正在想象一个未来,你在研究内战的时候,你进去体验一下,亲身去了解一下内战。"巴斯祖基说。

Roblox,作为维基百科的替代品?奇怪的事情已经发生了。但在它真的发生之前,我们只能静观其变,看平台上会出现什么。

国际化

除了扩大年龄范围外,Roblox的另一个主要增长渠道是走向国际,赢得全球孩子们的青睐。

一旦它对他们来说已经本土化了,理论上来说,任何地方的孩子都会像美国的孩子一样喜欢Roblox。"我不认为人类历史上从来没有哪一个时期,15岁的孩子会有更多的相同。"多纳托说。

在一次旅行中,他的家人住在了不丹的一户人家。"大人们不可能有更多的不同。大不相同。我的孩子和他们家的孩子几乎是一样的。他们在上网,看同样的视频,学习同样的东西。"

话虽如此,但Roblox想要进入另一个国家并不容易。翻译只是第一步,即使是这样也不容易,因为大部分内容都是由第三方开发者制作的,他们很可能只会说一种语言。

"我们不能强制要求并说OK,每个人都必须翻译他们的游戏。更加有趣的是,业界没有人在规模化地解决这些问题,"Roblox的三位工程副总裁之一的Julian Walshaw-Vaughan说。

少数公司都有翻译计划——比如说YouTube有机器翻译视频,但Roblox有一个更全面的计划。除了让像MeepCity或NaturalDisaster Survival这样的热门游戏,无论用户来自哪个国家,都能听得懂,该公司还设想了一个未来,来自不同国家的用户可以用自己的母语进行聊天和互动。

目前,Roblox通过将所有的字符串都存储在表格中,这样每增加一种新的语言,就会多填一栏,让开发者在翻译上更容易一些,最近,它还帮助前150款游戏本地化为5种语言。即便如此,它仍然认为开发者要付出太多努力。

"我们想让它自动为我们的社区工作...........它[将是]采用机器学习、众包和传统方法的混合体,并试图融合这些技术,"Walshaw-Vaughan说。这就是 "跨越数百万个游戏。这是一个很大很大的问题,需要解决。"

可能更令人担忧的是,无论语言如何,如何保持聊天和玩家互动都是一个挑战。

作为一个还主要由孩子们组成的平台,Roblox必须要小心翼翼地走一步,尤其是在高度管制的国家。一旦它被正式本地化到一种新的语言——比如说德语——就必须确保它能捕捉到微妙的不恰当的互动。

"这种复杂性的一部分是,在德国的孩子中,我们要注意什么,他们的俚语,他们使用的口音。我们在这方面投入了大量的研发工作,而且还在不断发展。"公司国际部总裁Chris Misner说。

到目前为止,Roblox已经躲过了其他平台因节制问题而受到的大部分负面关注。比如说,YouTube在其YouTube Kids频道周围遭遇了多起丑闻,甚至在它将节制人员增加到1万多人的时候,也是如此。相比之下,Roblox在全球范围内拥有超过800名版主。

而且,由于它专注于儿童,如果平台上出现严重的问题,Roblox可能会比YouTube这样的成人网站遭受更多的打击。像去年报道的一名7岁儿童被虚拟强奸的故事——最后只引起了一点小的轰动,公司很快就进行了修复——很容易失控。

不过,目前来看,Roblox似乎已经很好地处理了这一威胁,并努力确保其节制系统能够适应不断增长的受众。

总而言之,Roblox赢得儿童国际市场的可能性看起来相当不错。Roblox在美国儿童市场上占有巨大的份额,在西欧等新的本土化市场上的立足点也越来越大,这是Roblox必输无疑。即使Roblox只能抓住传统的青少年玩家,它也有可能获得数以亿计的新玩家,尤其是在中国市场,因为它刚刚与腾讯达成了协议。

至于Roblox能否慢慢扩大玩家的年龄范围,那要看时间、运气,以及开发工具和开发者社区的持续进步。一直以来,还没有一家公司像Roblox这样——既愿意做一个游戏引擎,又愿意提供一个相当规模的平台来承载游戏。它需要规模、收入和技术上的巧思来赢得广大开发者的青睐。

对于今天的Roblox来说,幸运的是,它正乘着这股由来已久的浪潮:这个平台正通过口碑传播,在一群忠实的、尽管年轻的用户群中传播。

虽然它的用户量仍然只有9000万,但今天的Roblox真正有趣的是,它让我们看到了一个几乎不存在的现实。用户生成的内容和开放式的儿童内容,几乎没有什么其他的冠军,也没有一个能成长为数亿用户的冠军。

如果Roblox能够继续发展,它将成为新一代公司的指导性榜样。而如果它继续发展下去,或许还能证明人类的共同体验不仅仅是一个发烧的梦想。一整代公司都没能创造出身临其境的社交环境——但在游戏和聊天之间的空间里,Roblox或许还能证明,还有一个全新的社交类别等待着被发现。

原文:

How Roblox avoided the gaming graveyard and grew into a $2.5B company

Digging into the Roblox growth strategy

《超连接》:创造互联网时代

信息与传播技术简史

传播不仅仅是技术中介的行为,也不只是说话或写作的过程;传播是史前的,先于文字和语言出现的,特别是当我们想到有那么多通过身体语言而实现的传播时,我们甚至可以说传播是无语言的。在文字和书写发明以前,人们通过动作、含糊的声音、叫喊和简陋的象征符号——例如,山洞绘画、石刻以及烟雾信号——向彼此传递信息。尽管这些信息直到现在也没能被完美地接收和理解,但是它们很好地回应了人们对于彼此交流、被注目、认知和理解的永恒追求。

在交流过程还无法被保存的史前时期,传播主要通过动作、简单的声音和肢体语言完成。渐渐地,语言开始出现,交流变得复杂;简单的发声变成了一个个词语,词语逐渐发展成口头语言。约15万年前,正式的语言开始形成和扩散,这个时间点也可能会更早——在没有文字记录的情况下,要准确指出这个时间点是极其困难的。著名的传播学理论家马歇尔·麦克卢汉(Marshall McLuhan将语言比作公路交通,这启发了法国哲学家亨利·伯格森(Henri Bergson写下这段文字,“语言之于人的心智,就像车轮之于双脚和身体。”(language does for intelligence what the wheel does for the feet and the body麦克卢汉说,语言使得智能“从一处传递至另一处”(move from thing to thing,这让人们的思想和观念得以传播和更轻易地分享。

当语言在人类文明中扎根以后,人们能够分享内容范围更广,也更具体的信息。一开始,人们分享的信息是好记的事实,这些事实通常是他们要传递给下一代的重要信息,例如国王和宗族的名字。当他们分享了这些信息以后,事实就会固定在人们的脑海中以及群体的集体记忆中。对于未来的群体成员而言,获知这些事实非常重要,这会成为他们作为组织成员的角色和身份的来源。这样分享信息的行为成为人们相互联系的重要方式。

距今约五千年前,正式的书写系统开始在美索不达米亚、中国和埃及出现,一开始只是用于记录日常事务和商业交易。人们使用外在于身体的技术——例如蘸了植物浆液或动物血液的骨头和贝壳——在一些可用的物体表面记录信息。语音元素和字母同时出现,这使得人们可以就更具体,也更广泛的问题进行交流。人们不必再把所有东西都记在脑中,既然人们能把越来越多的东西记录下来并传递给他人,信息也愈发复杂、愈发抽象,也具有愈发长久的生命。生活在时间轴不同位置的人们能够更加具体地了解他们的前辈。这使得能够跨越时空的更加具体、复杂的社会关系的形成成为可能。

词语和符号先是被刻进石头和陶土上,随后又被用尖头笔和墨水印在了羊皮纸、布匹和纸张上。这些早期的媒介[这些才是真正的“软件”(software)]使得数据和信息能够被保存和传递。手工印制的和抄写的书卷、书本、小册子和报纸——试图到达更广泛受众的第一种大众媒体——随之而来。这些文件最初由人们无比艰辛地手工抄写,直到活字印刷的发明:原文件被刻在陶土、木头或者结实的金属上,这样用模板就可以反复印刷。

在1450年左右,约翰内斯·古登堡(Johannes Gutenberg引入了被称作印刷按压器的机械活字印刷术,宣告了大众生产和传播时代的开启。包括《圣经》在内的书籍开始被大量印刷,它们也确实都变成了畅销书。活字印刷术很快流行起来,五十年内,数以千万计的书被印制出来。小册子、报纸和杂志也应运而生。伴随着大众媒体时代的兴起,快速的社会变革也随之而来:政治运动(例如美国革命)、社会运动(人权、劳工及女权)以及大众教育都因为开始掌握广泛传递信息和观念的能力而汇聚力量。从这时开始,信息与传播技术开始带来大大小小的社会变革,并且事实上已经成为这些社会发展中不可或缺的组成部分。

19世纪早期,电力的基础技术——例如电磁学和电池——开始快速发展,电力的实际应用也接踵而至。这些应用使用电来传递信息,例如留声机(最初是与声音有关的)、摩斯码、电报、电话以及广播和电影等大众媒体,讯息能够更加快捷地从一个地方传递到另一个地方。20世纪则在前一个世纪的基础上有了更显著的发展,电视、视讯电话(奇怪的是,视频通话很早就被发明出来,但是直到网络摄像头时代才开始流行)、电脑以及早期像砖头那么大的手机(这时的手机还不具备超越电话之上的计算机功能,但是具备了数字传播中的移动特性)。有趣的是,新技术的出现并没有取代那些旧的技术,不同的传播技术被同时使用,有时还会激发现存技术作出变革。

到了20世纪,数据可以通过如此多的方式被如此广泛地存储和分享,以至于媒介(media一词有了更加丰富的含义。它可以用来定义信息传播的平台类型(广播、印刷、数字、移动、社交/互动、多媒体),用来指称媒体的内容(如新闻媒介、广告媒介),用来指不同的时代(传统媒介、新媒介)。当我们提到媒介一词时,差不多是在指上述所有类型的媒介。其中,一种能够即时将信息传递给广大人群的最新也是最重要的媒介——互联网——开始崭露头角。

计算机与互联网简史

事实上,现代计算机的先驱可以追溯到数千年前,那时人们发展出非机械化(后来机械化)的方式来计算总和、记录信息、对信息进行分类,以及实现一些基本的自动化功能。对海量信息进行组织和分类的更加现代的系统要追溯到梅尔维尔·杜威(Melvil Dewey杜威十进制系统(Dewey Decimal System,这是一个开发于1876年用来整理图书和其他图书馆资源的分类系统,以及保罗·奥克特(Paul Octer亨利·拉方丹(Henri LaFontaine在1895年发明的通用十进制系统(Universal Decimal System。该系统被寄希望用于将“全世界的信息”收集、整理和分享于一个全方位的国际化的文件中心。此外,奥克特还发明了一个系统,在该系统中,读者可以使用屏幕和键盘来阅读图书,该系统还可实现数量众多的个体远程观看同一个事件,即所谓的视频会议。

按照目前已知的状况,“计算机”(computer一词最早出现于17世纪早期,用来指非常擅长算术和有天赋的人,这类人被简称为“计算机”。当然了,现在当我们提到计算机,想到的是可编程的机器,这些机器执行着复杂的任务,使用数字进行编码,并可以链接到其他电脑,从而将信息从一个电脑传递给另一个电脑。

从19世纪中后期至20世纪初,计算机变得更加现代化,并开始逐渐出现上述种种功能。查尔斯·巴贝奇(Charles Babbage于1837年使计算机的发展迈出了关键一步,他设计了第一台可编程机械设备;爱达·洛芙莱斯(Ada Lovelace被认为是世界上第一个电脑程序员(19世纪40年代);19世纪80年代,赫尔曼·霍勒里斯(Herman Hollerith发明了穿孔制表机(keypunch machine),这加速了计算机的信息处理;1936年,艾伦·图灵(Alan Turing设计出了第一台电子数字计算机。

许多人认为,现代计算时代开始于20世纪三四十年代。当时,工程师和数学家万尼瓦尔·布什(Vannevar Bush开始思考机器如何将人类思维自动化,他于1931年建立了一个巨大的、差不多是房间大小的机器,叫作“微分分析器”(differential analyzer,可以用来分析微分方程。1945年,他在《大西洋月刊》(Atlantic Monthly)上发表了具有里程碑意义的文章《诚如我思》(As We May Think,文中描述了一台名为memex的机器如何通过在文件之间建立链接(提供计算机化的超链接)来扩展人们的记忆,这使得人们能够建立“一串条目”(a trail of many items,并且偶尔插入“自己的评论,或者将其链接到主路径上,或者通过侧路径加入到特定项目中”(“a comment of his own, either linking it into the main trail or joining it by a side trail to a particular item”)。布什的工作受到当时技术水平的制约,他在网络和超链接发明之前就去世了,但他的想法直接启发了那些欲建立互联网和网络的人。

20世纪50年代,许多计算机科学家、心理学家、物理学家和其他学者开始构思和开发建立互联网所需的交互式计算机。由计算机科学家约翰·麦卡锡(John McCarthy领导的一些学者专注于开发与人工智能(artificial intelligence相关的计算系统,这些系统能够执行任何人工智能任务,例如视觉感知、语音识别和决策。麦卡锡及其同事们开发的人工智能促进了计算机的发展,这种计算机可以优化人们在一些游戏——例如跳棋和国际象棋——中的表现,并解决逻辑问题。美国国防部资助了这项研究,这明确了“智能机器”(“smart machines”)的重要性。1954年,美国发明家乔治·德沃尔(George Devol发明了第一台数字化操作和编程的机器人Unimate,并使其在新泽西州的装配线上工作,这为机器人领域奠定了基础。以计算机程序为基础的人工智能的拓展产品——机器人(robots)——将承担可实现自动化的简单任务,但正如我们所看到的,随着时间的推移,他们也将承担更复杂的任务,并变得更加逼真。

与此同时,心理学家约瑟夫·利克莱德 (J. C. R. Licklider)等研究人员意识到,开发能够执行多步骤普通任务的计算机也很有必要。他设想了一种人机合作或共生关系(《人机共生(Man-Computer Symbiosis)》),其特征是“人与他的电子伙伴形成非常紧密的联系”(“very close coupling between the human and the electronic members of the partnership”)。约瑟夫·利克莱德 (J. C. R. Licklider)描述了利用计算机实现的各种可能的用途,包括数字图书馆、电子商务和网上银行,他还设想了使用点击式系统。

约瑟夫·利克莱德 (J. C. R. Licklider)的同行者们——研究交互计算的先驱们——开始研发使网络式计算得以实现的技术。受万尼瓦尔·布什(Vannevar Bush强烈影响的道格拉斯·恩格尔巴特 (Douglas Engelbart)提出了用计算机增强人类智慧(human intellect augmented by computers),并创建了相关的研究实验室,超链接技术和计算机鼠标就是由该实验研发出来的。此外,美国的保罗·巴兰(Paul Baran和英国的唐纳德·戴维斯(Donald Davies分别开发了一种称为分组交换(packet switching)的数据块传输方法。计算机硬件、软件以及指导计算机做什么的编程代码变得越来越复杂。连接计算机的协议、网络标准和分配的域名开始出现。互联网诞生的条件已经成熟。

我们现在所说的互联网实际上始于负责军事技术开发的国防部的一个项目,该部门被称为国防高级研究计划局(DefenseAdvanced Research Project Agency,简称DARPA)。在DARPA的一个计算机研究小组,利克莱德(Licklider)、巴兰(Baran)、伦纳德·克莱恩洛克(Leonard Kleinrock和项目经理拉里·罗伯茨(Larry Roberts——都来自麻省理工学院(MIT)——等人开始发明和测试各种模型。类似的研究也在其他地方进行着,例如进行军事和武器研究的全球非营利性研究和发展组织RAND,以及唐纳德·戴维斯(Donald Davies工作的英国国家物理实验室(NPL)。1965年,罗伯茨与托马斯·梅里尔(Thomas Merrill合作,通过低速拨号电话线,将一台位于马萨诸塞州的电脑连接到加利福尼亚的一台电脑上,创建了第一个广域网(尽管规模很小)。罗伯茨把这种将计算机联网的想法称为“阿帕网”(ARPANET

不久,很多学术机构对这个项目产生了浓厚的兴趣。阿帕电脑网络站点在加利福尼亚大学洛杉矶分校、加州大学圣巴巴拉分校、犹他大学和斯坦福研究所分别建立起来。保罗·巴兰(Paul Baran极力主张,互联网的节点或附件不应该直接连接到单一的集中来源,而应该是分布式的,以便其中一个节点出现问题时整个网络不会崩溃,不会被敌人的攻击一击即中。而他的这一想法也最终实现了。这些网站之间的协调活动——主要是资源的共享和数学功能的表现——始于1969年,在1970年,更多的计算机加入到这个网络中来。1972年,在国际计算机通信大会(International Computer Communication Conference)上,罗伯特·卡恩(Robert Kahn)成功地向公众介绍并演示了这一系统。

由于研究不仅继续沿着使分散的计算机连接和联网的路径发展,还对这种网络可能的用途进行探索,于是,阿帕网演变成我们所知道的互联网。对此感兴趣的研究人员、商业人士以及政府和军事用户利用这些电脑相互分享信息。此外,一项名为“比特网”(BITNET的项目试图连接所有的学术大型计算机。斯坦福研究中心的国家信息中心(National Information Center, NIC)的伊丽莎白·“杰克”·范勒(Elizabeth“Jake”Feinler要求提供域名,随即,大量阿帕网的纸质目录和详细介绍该系统工作原理的文件也被公布。“NIC就像历史上的谷歌,”范勒说,“人们想要任何东西都会来找我们。”

随着阿帕网的建立和运行,应用程序被开发出来。与此同时,一个人们可以用来互动的平台也被开发出来。1972年,美国国防部的工程师雷·汤姆林森(Ray Tomlinson发出了第一封电子邮件(他说,他发送完就忘记了邮件的内容),并且做出了一个非常有影响力的决定——“@”符号将被用作电子定位的符号。随后,拉里·罗伯茨写了一个电子邮件的实用程序。有了这个程序以后,人们几乎是立即开始创建邮件列表,让有相近兴趣的人群——如科幻小说爱好者或葡萄酒品尝者——共享信息并进行讨论。文顿·瑟夫(Vinton Cerf)回忆说:“我们立即意识到,电子邮件除了作为办公室的备忘录系统外,还是个社交媒体。”(“We could see instantly that email was a social medium, in addition to simply being an interoffice memo system”这项简单而强大的以电子方式交换信息的功能迅速成为互联网最受欢迎的用途之一,最终成为数十亿人的日常活动。

1974年,在文顿·瑟夫(Vinton Cerf)约根·达拉(Yogen Dala)卡尔·森夏恩(Carl Sunshine)的传输协议文件中,互联网(internet, internetwork的缩写)一词第一次出现。不久之后,很明显,互联网引人注目的用途之一将既不是军事的也不是学术的,甚至不是工业的,而是社会的。随后,研究者们开始实验其他类型的应用程序,如游戏、文件共享和语音通信。一些早期的群发消息和公告牌系统开始出现,但相对较少的人能够想到使用它们。计算机本身还不普及,连接到其他计算机和计算机网络所需的拨号连接不仅速度慢而且很昂贵。那时,只有为数不多的人掌握了操作计算机的专门知识,因为图形化的、“窗口式”(windows-like)的网络导航模式(如点击式界面)还没有被发明出来。

尽管如此,小型的本地计算机网络(local computernetworks, LANs也出现了,在20世纪70年代,更大规模的局域网也出现了。一些研究人员、商业人士以及政府和军事组织的成员开始使用这些计算机和初生代的互联网来相互分享信息。与此同时,电脑的体积和价格都在下降。微型处理器——一种包含大部分计算机电路的小芯片——的发明,使得计算机第一次能够被放置在桌面上,几年后,甚至能够置于人们的手中。

1973年,IBM和惠普推出了第一款台式的可编程计算机,主要用于科学和研究。此外,施乐公司(Xerox)、科莫多公司(Commodore)、RadioShack公司,以及史蒂夫·乔布斯(Steve Jobs史蒂夫·沃兹尼亚克(Steve Wozniak也纷纷开发出早期的个人计算机。在此期间,微软创始人保罗·艾伦(Paul Allen比尔·盖茨(Bill Gates开始开发一个操作系统,使得计算机能够解释和执行他们的编码指令。到20世纪70年代后期,早期采用者开始入手个人计算机,尽管计算机的使用还非常有限,但也有着不错的市场表现。

20世纪70年代后期,一个名为X.25的分组交换系统开始在国际上普及,从美国和欧洲到加拿大和澳大利亚,网络基础设施开始在全球蔓延。到1982年,数据可以通过发送控制的协议(Transmission Control Protocal,简称TCP; InternetProtocal,简称IP)实现标准化。计算机科学家拉迪亚·珀尔曼(Radia Perlman在原有基础上引入了一些新技术,使得数据可以更容易地被移动和管理,网络也可以测量和自我组织。由此产生的全球互联网络开始被广泛地称为“因特网”(the Internet,那时还是使用大写的“I”,有时也被称作信息高速公路)。1985年,美国国家科学基金会网络(National Science Foundation Network)资助了5个大型的、相互连接的超级计算中心,这些中心连接着区域网络和高校,以及连接着这个网络所需的设备和电路。这个庞大的网络(或网络之网络),被称为“国科会网络”(NSFNET),被认为是现代互联网的“脊梁”(backbone)。

就像我们现在所知的那样,当时的互联网虽然已经形成了一定的规模,但在1983年,美国人口中仅有约10%的人拥有个人电脑,而这些人中只有约10%的人(约1.4%的美国人)使用互联网发送和接收消息。电脑的应用和使用还不显著,操作系统既慢又麻烦。此外,还有一个很大的结构性障碍:国家科学基金会的使用政策禁止任何个人或商业机构使用NSFNET“主干”网络。尽管规模较小的网络可以制定自己的政策,但规模较大的网络——互联网本身——被认为应该只能用于支持研究、教育和非营利性公司。但不久之后,这个政策就受到了挑战,互联网不再受到限制。

1990年,作为与互联网连接的地区性网络之一,名为MERIT的密歇根网络(Michigan network)向国家科学基金会(National Science Foundation)提出探索互联网的商业潜力。一家营利性公司被允许开发和拥有计算机和传输线路并且吸引顾客。尽管这种发展并不是没有争议的(实际上,政府方面就国际互联网的未来发展举行了国会听证会),商业互联网服务提供商最终也被允许成为迅速扩张的互联网的一部分,其基础设施和服务正在不断更新。诸如Sprint、AT & T、IBM和MCI这样的通信公司资助并建立了相应技术来促进互联网的扩张和私有化。计算机服务公司(CompuServe, 1979)、神童公司(Prodigy, 1984)和美国在线(America Online, AOL, 1985)开始提供服务包和人们“上网”的手段,微软开始开发和提供除操作系统之外的浏览器和服务器。1995年,国家科学基金会结束了对互联网项目的赞助,互联网得以实现私有化。

尽管私营公司开始涉足供应商或服务提供商,但没有任何中央或全球机构控制互联网——国防部不控制,研究智库不控制,大学也不控制。互联网成功发展和认同的关键在于其开放的和分布式的架构。开放性当然同时有其利弊。恶意程序——被称作计算机病毒——开始被编写和部署,用来破坏计算机和网络的运行。被称为恶意软件的恶意代码可能会迅速从一台计算机传播到另一台计算机,清除硬盘驱动器,窃取数据或用不会消失的图形占领计算机屏幕。会严重损坏计算机的垃圾邮件(spam)可能会同时发送给无数账户。随着时间的发展,针对恶意软件和垃圾邮件的拦截服务和过滤器也会变得越来越精准,从而解决其中的一大部分问题。

尽管如此,互联网的开放性——被认为是其功能和社会应用的关键,也是其特性的核心——通过每一次迭代和创新得以保存和扩展。网络中的每一个环节都可以独立存在,不依靠任何一个部分来工作。当处在这个“网”中的服务和应用程序开始在仍然相对年轻的互联网上传播时,其影响是直接的和深刻的。

网的诞生

直到1990年,互联网还是一个相对小规模的现象。全世界的互联网用户可能不到500万。“只有具备专业知识的人才能找到后来被称为‘网站’的东西,”(Only people with specialized knowledge could find what later came to be called ‘web sites,’雷尼(Rainie)和威尔曼(Wellman)指出,“只有真正的专家才能建立网站。”(and only real specialists could build them虽然互联网在技术上是对商业开放的,但是互联网的内部导航、运作机制和可用性——可能的机会、效果和好处——在很大程度上仍然是未知的。互联网依旧是陌生的、难以理解的领域。

所有这一切都随着1989—1991年万维网(World Wide Web,WWW)的发展而变化。万维网是欧洲核研究中心(NuclearRearch, CERN)的英国工程师蒂姆·伯纳斯·李(Tim Berners-Lee)的创意,他发展了“万维网”(WorldWideWeb)一词。该词曾经和现在都是指,通过超文本(hypertext)系统连接在一起的一系列文件。早在20世纪60年代,超文本就被美国工程师道格拉斯·恩格尔巴特 (Douglas Engelbart)及其团队在扩展研究中心(Augmented Research Center)广泛使用。超文本包含超链接(hyperlinks),后者允许用户轻松地、非线性地从一个数据点击到另一个,并已成为互联网使用的核心特征。通过确保文档可以被嵌入超文本链接,万维网能将用户带到网络上的任何地方,伯纳斯·李认为,通过这种方式,网络的一个部分或分支无法主导或超越整个系统。文件可以连接进一个庞大的、网络化的结构并且相互连接。很快,“互联网”被简化为“网络”(the web)一词。

蒂姆·伯纳斯·李(Tim Berners-Lee)对网络和互联网的发展做出了重要的技术和智力贡献,同样重要的是他(和欧洲核研究中心)的决心:他们决定将网络去中心化,免费提供给任何人使用。1993年,欧洲核研究中心向所有社会组织提供了免费的网络技术,这是互联网历史上的一个关键时刻,它意味着不受限制的使用权将成为互联网最引人注目和最具吸引力的特征。在互联网的开放式架构的辅助下,这预示着互联网的全球性(尽管不是普遍的)扩张和影响。1996年,美国的《电讯法案》(The Telecommunications Act)要求所有美国的教室、图书馆和医院都要连接到互联网。随着电子邮件和数据传输技术(包括文件、聊天、电话和视频的传输)的发明,网络成为人们聚集、彼此联系、开展社交活动的地方。最终,人们在这里建立网络和分享媒体资讯。

支持万维网广泛发展的技术被迅速地发明出来,并且被计算机用户快速采纳和扩散。1993年,“马赛克”(Mosaic——一种图形化且易于使用的网页浏览器——代替了笨拙的基于文本的浏览器“地鼠”(Gopher;此后不久,就出现了更容易使用的图形化浏览器“网景导航”(Netscape Navigator。现在,人们可以在没有专业知识和技能的情况下在网页上“旅行”或“冲浪”。网页成为有趣的视觉实体:比起今天的网页,那时的网页虽显简单,却比最早的版本更加丰富多彩和精致。1998年的《数字千年版权法案》(The Digital Millennium Copyright Act,DMCA规定,对于在美国使用的受版权保护的内容,网站可免责于用户可能出现的侵犯版权行为(尽管有争议的内容必须暂时被拿下)。网页导览——例如雅虎——开始对网络信息进行归纳整理。这提供了基于万维网的商业和银行业务的早期版本。

搜索引擎随后出现,它为人们提供了在网上找到他们想要的东西的手段,但是并没有立即被视为重要的工具。互联网被设想为“用于连接的基础设施,而不是分类或组织内容的基础设施”(“an infrastructure of connection, not of sorting or of organization”)。克里斯蒂安·桑德维克(Christian Sandvig指出,“对那个时代典型的互联网用户来说,计算机通常不会以任何有意义的方式对内容进行分类。不对音乐或电影加以排序(推荐),电子邮件不会被自动地标为‘重要’或‘垃圾邮件’,搜索引擎也并不是特别有用。”(To the typical Internet user of that era, computers did not usually sort content in any way that was meaningful. They did not sort (recommend) music or movies, email was not automatically highlighted as ‘important’ or ‘spam,’ and search engines were not particularly useful事实上,1994年推出的第一个重要的搜索引擎Alta Vista——紧随更早的搜索引擎WebCrawlerLycos而出现——的成功是没有被预见到的。人们普遍认为,不可能或不必要对网络进行有效的分类和编目。

20世纪90年代中期,斯坦福大学博士生拉里·佩奇(LarryPage)谢尔盖·布林(Sergey Brin)开发出搜索引擎谷歌(Google),并于1997年下半年向公众开放使用。谷歌并没有通过搜索词的位置来排列搜索结果,而是通过链接到它的页面数(PageRank系统)来确定网站的相关性。2001年,谷歌通过开发复杂的、基于规则的公式或算法来革新网络搜索的过程,从而更有效地对信息进行排序和组织。随着时间的推移,这些算法变得越来越复杂,使得搜索更加个性化,能够向你(搜索者)提供最感兴趣的链接。

这些创新为越来越多的交互式软件、媒体平台和被称为应用程序或app的专业程序的开发铺平了道路。有着广泛背景和特殊兴趣的人们开始创造现在席卷文本网络的错综复杂的网页、网站和博客。许多人的想象力被这种创新的流动所吸引,创造内容和相关技术的方式变得更加明显、可用、可实现和便宜。没有专业知识的人正在参与对互联网的塑造。

但是,互联网那时还没有,而且现在也没有完全普及。促进互联网连接的技术在20世纪80年代中期开始在欧洲渗透[这要归功于丹尼尔·卡伦贝格(Daniel Karrenberg)等人],20世纪80年代后期在亚洲发展[韩国的全吉男(Kilnam Chon)起到了关键作用],20世纪90年代开始在非洲扩展[这是许多人努力的结果,包括埃及的塔雷克·卡麦勒(Tarek Kamel)、南非的麦克·劳里(Mike Lawrie)、肯尼亚的Shem Ochuodho以及东非的Charles Musisi]。目前世界上只有约一半的人使用互联网,人们还需要做很多的事情才能将撒哈拉以南的非洲,以及亚洲和拉丁美洲最穷的地区带入线上世界。在全球的许多地区,电子(和物理)基础设施还不够发达,除了最富有的公民,其他人还无法承担。此外,专制或极权主义政权可能会审查或过滤互联网,使人们无法自由地获取和传播信息。然而,移动电话通信的扩张——即使是在发展中国家——更加迅速,这为许多个人提供了互联网接入,否则他们将无法使用互联网。

深层的“暗”网也在出现

阿帕网刚刚出现,没有编目的、无法通过普通的网络检测到的、小型的、孤立的网络就开始出现。这些神秘的网站有时被称为“暗网”(darknets),在整个20世纪80年代,这些神秘的网站数量不断增加,在我们今天所知的互联网开始成形的时候,这些网站也以指数级增长。由于需要特殊的加密,这些网站上经常发生非法活动,如共享有版权的资料、非法赌博、交换和使用包括儿童色情在内的非法色情内容。由于这些网站不会出现在搜索引擎上,想要访问的人需要知道URL,并手动输入,这似乎提供了某种程度的身份保护和匿名性。

21世纪初,Freenet发布,该软件有助于登录难以追踪的网站和互联网区域。2005年,美国海军学院(U.S. Naval Academy)发布了Tor软件,该软件可以隐藏用户的位置和IP地址。Tor的目的是保护某些持不同政见者的身份,同时为那些想要在互联网上访问“暗网”和通常不想被发现或识别的访问非法网站的人提供了掩护。随着Tor的广泛使用,软件盗版激增。2005年,每天有多达50万部电影被非法播放,非法复制和使用微软Office软件的行为十分猖獗。据估计,2005年,由于“黑暗网络”(dark web)大肆活动,全球公司损失了340亿美元以上。

从那时起,暗网就呈现扩张之势。2009年,比特币——一种无法追踪的数字货币——被开发和引入市场,它将成为这类货币中最被广泛接受的一种,非常适合参与非法活动和发展非法业务(也包括其他更可接受的用途)。非法毒品和武器的买卖市场建立起来,生意兴隆。数据黑客更容易达到破坏性的目的。例如,在2015年阿什利·麦迪逊(Ashley Madison)遭遇的数据黑客攻击中,那些加入并利用该网站进行婚外情的个人发现自己的数据遭到黑客攻击,并被转移到暗网。该网站要求他们以比特币的形式支付2500美元,不然就将他们的不忠行为公之于众。近年来,犯罪黑客和网络犯罪开始激增,检验着地方和国家层面的执法资源和技术技能。

暗网也被用于各种政治和恐怖的目的。极权主义政权中的人可能会使用加密和未编目的网站来组织反抗,与外部世界进行沟通——当政权禁止公民使用互联网时,这种行为变得更加迫切。所有国家的公民都可以利用这些网站进行对话,组织他们希望对当权者保密的运动。但近年来,极端分子和恐怖组织利用黑暗网络招募成员,组织和实施破坏性活动,这种行为正急剧增加。

“暗网”是“深网”(deep web)的一个子集,深网包括数据库、需要注册的页面和网站(包括用于网上银行的网站),以及付费墙后面的网站。有许多这样的网站和页面,它们的数量每年呈指数增长。这些网站大多数都不是有害的,但如果没有进行特殊注册,也无法登录——也就是说,它们存在于网络的“深处”。此外,那些还没有准备好“活命”的网站和页面版本,或者那些曾经是活着的但后来被删除的版本,仍然可以作为深网的一部分而存在、存档或被检索。当我们被告知“互联网上没有任何东西真正消失”时,想想深网就能明白这句话的意义。

无线通信和移动通信

信息与传播技术——尤其是数字技术——的最大进步之一,就是无线通信能力的发展。通过使以象征符号为中介的媒介世界触手可得,无线和移动技术已经成为现代社会生活中不可缺少的组成部分。虽然我们认为手机(现在是智能手机)是这些技术中最重要的技术,但它们之前还有许多创新,使得个人虽然在物理空间中的距离越来越远,却在旅途中保持社交关系。这些创新包括道路、铁路、汽车、飞机、石板、笔墨、书报、晶体管收音机和手持式相机,所有这些工具都有助于实现便携式交流。我们通信的设备越来越小、越来越便携,这反映了许多现代人在旅途中获取信息和享受社会联系的愿望。

无线通信可以追溯到19世纪后期,当时发现了使无线连接成为可能的电磁波。无线电波通过双向无线电——例如公民频段(citizen band)无线电——进行电子传输和电报发送。后来,广播电视节目和用于确定汽车、船只和飞机的位置的全球定位系统(GPS)出现了。到20世纪中叶,蜂窝数据技术、人造卫星和其他无线网络成为现代移动电话、计算机连接、Wi-Fi和无线宽带互联网的基础。

手机技术最初是以汽车电话的形式出现的,于1946年首次亮相。它们庞大而昂贵,当然也受制于当时的技术。虽然它们是移动的,但当时没有完善的蜂窝数据技术和晶体管技术,因此呼叫更像是公民频段的无线电传输,其中一个人必须等待另一个人讲完一句话才能进行对话,并且其他人可以很容易地听到。最早的手机像手提箱那么大,“唯一可以打的电话是打给服务站,因为拨打电话所需的电源实际上会耗干全部的汽车电池”。

摩托罗拉(Motorola)曾一度引领移动手机业的发展,手机不再被固定在汽车上。1973年,工程师马丁·库珀(Martin Cooper)在纽约市制成了第一个移动电话。这个电话差不多两磅半重,电池续航时间只有20分钟,但这并不重要,曾有人引述库珀的说法,“因为你拿不了那么久的电话”。

直到20世纪90年代,有充足的无线电频率被分配,移动电话开始成为可行的大众技术;而后,电话的尺寸和价格都大幅下降,它才获得了广泛的认可。进入21世纪,手机真正变得“智能”:除具备短信和网页浏览等基本功能,手机还是迷你的娱乐和信息中心。四代“移动电话技术”(称为1G、2G、3G和4G,两代之间相差约10年)被用来标记移动电话的功能差异。技术的改进包括:在1981年的第一代通信技术中,在通话期间,当用户在不同的站点间移动时,呼叫需要从一个站点传输到下一个站点;而在2012年的第四代技术中,这种技术被互联网的分组交换技术所取代,这使得流音频、视频和电话的密度更高。

对于智能手机而言,通过电话进行对话不再是其首要目的。21世纪第一个十年的后期,手机和智能手机开始采用全键盘,而不是将字母嵌入数字键盘,无线数据价格也开始下降,这使得发送文本信息成为主流。发短信(texting)是一种相对简单、方便、不会产生干扰的沟通方式。它可以在任何活动和环境中静静地完成。发短信是一种方便而有效的沟通方式,它使得许多近距离的、持续进行的人际连接成为可能。

近年来,美国人口中使用短信的比例急剧上升,使用手机进行语音通话的比例则大幅下降。从2006年到2011年,发短信的美国成年人占比几乎翻了一番,从31%上升到59%,这个数字还在继续增加。超过75%的美国青少年发短信,年纪较大的青少年平均每天发送超过100条短信。现代智能手机是真正的迷你电脑,包含着照相机、文字处理功能、互联网接入和众多的应用程序。

现在,手机已经遍布全球,甚至进入了一向贫困的农村或人口稀少的地区(这些地区本来可能根本无法利用该技术),尽管在这些地区,人们使用的更可能是基本的电话功能且无法访问互联网;此外,在这些地区,几个人共享一个电话并不罕见。许多移动网络用户很少或从不使用台式机、笔记本电脑或平板电脑来访问互联网。移动技术和虚拟现实(virtual reality)或增强现实(augmented reality)技术的进步,也带来了在移动设备上进行游戏行为的巨大增长。

早期的在线联网

当一群人(或群组或组织)相互连接或联系在一起,并且彼此间形成一些联系且相互影响时,他们就可以说是“联网的”(networked)。当我们说一些实体是联网的,这意味着我们能够追踪和绘制出他们构成网络的具体方式,其中一些网络是微妙的,甚至是无形的。

在线社交网络(online social networking)经常被描述为互联网和万维网的最新应用之一,但它实际上早于这二者。第一个计算机化的人际社交网络在20世纪70年代中期出现,它在促进物理空间中相互分离的人们之间的信息交流方面具有重大的历史意义,并且在早期使用时有着令人难以置信的兴奋感。

许多人认为穆维·图罗夫(Murray Turoff)是社交互动计算(social, interactive computing)之父。在他20世纪70年代早期的工作中,首先是为政府工作,之后在新泽西理工学院(New Jersey Institute of Technology)代教,他设计了几个项目,让分散的个人通过计算机分享信息。其中最著名的或许是一个名为“电子信息交换系统”(Electronic Information Exchange System, EIES)的电话会议系统,其中包括早期的在线教育课程。有趣的是,它还鼓励用户之间进行面对面的会议。许多在EIES之后设计在线网络的人都提到,这个早期的在线计划如何影响他们对数字连接和联网的看法。

建立一个人们可以发送电子消息且其他人可以对此进行回应的系统,是人们在线连接的一种方式。起初,这种信息交换不是同步发生的:事实上,在早些时候,可能需要几天甚至几周才能得到回应!20世纪70年代早期,加州伯克利(Berkeley)附近各社区通过电线将终端连接起来而构成的“社区记忆”(Community Memory等实验项目就允许人们交换信息,使其能够提交问题并做出回答;伊利诺伊大学开发的柏拉图系统(PLATO允许人们分享“笔记”(最初是教育导向)、玩游戏、聊天和建立网络,并最终在世界各地传播这些信息;起源于1978年伊利诺伊州芝加哥市的计算机公告板系统(Computerized Bulletin Board System,从一开始就打算通过拨号吸引更广泛的公众。此后,这种发帖和回帖机制通常被称为公告板系统或BBS,最终被简称为论坛(或信息、讨论板)。

20世纪70年代,网络游戏诞生,并以稳定的速度普及开来。一些游戏是基于冒险的,并鼓励玩家们一起创造被称为虚拟“世界”的东西。这些游戏被称为MUDs(multiuser domains,多用户域)MOOs(multiuser object-oriented domains,多用户面向对象的域)MPORGS(multiplayer online role-playing games,多人在线角色扮演游戏)。在这些游戏中,大量的用户共同创造有意义的领域或环境,在这些领域或环境中,他们互动、游戏并形成关系——包括恋爱关系和网络性爱(cybersexual)关系。玩家依靠彼此来创造和居住在游戏空间或“世界”中。

在图形界面发展之前,这些世界只是基于文本,而没有图像或头像。尽管如此,他们还是让玩家感觉自己处于一个多维的环境中。宽敞的、共同的环境为人们提供了一个不仅可以玩游戏,还可以相互了解的“地方”,这一直是游戏体验的一个关键方面。紧随其后的是基本的图形界面和一系列互动游戏[如1974年的“龙与地下城”(Dungeons and Dragons)和“世界”(如“模拟人生”(The Sims),2000年的“生活体验”(life experience)电子游戏]的出现。参与者感觉自己真正沉浸在社交互动中,有时甚至感受到虚拟现实的体验,这种体验确实是非常真实的。

很早就进入社交网络世界的人通常是“技术控”(techies)——对计算机或游戏的兴趣高于平均水平的人(否则的话,他们根本无从知晓如何获得这种非常罕见的计算机化技术)。他们需要有足够的耐心来处理非常缓慢的数据传输和等待响应的时间,并且有着极大的好奇和兴趣以这种全新的方式进行连接。这些坚持不懈的早期使用者和用户给了这个全新的技术社交活动一个起飞和成长的机会。

1980年,杜克大学的汤姆·特拉斯科特(Tom Truscott吉姆·埃利斯(Jim Ellis发明了另一种让人们分享和讨论文章及帖子的方法,被称为Usenet,最初只在杜克大学和北卡罗来纳大学使用。它使用阿帕网而不是互联网。Usenet没有单一的中央机构或服务器。相反,这是一种庞大而分散的结构,能够让那些对不同主题感兴趣的人群在基于文本的分类新闻组中找到彼此,发布和检索文章及消息,并以自由和未经审查的方式讨论这些交流(这是因为没有中央权力机构可以审查,尽管新闻组已受到监控)。它以相当快的速度广泛传播。不幸的是,由于其开放和未经审查的性质,一些用户在整个系统中不受限制地散布盗版、非法和色情内容,最终威胁到其作为首要的在线社交网络的地位。而且,来自讨论组和论坛的竞争也开始在互联网上蔓延开来,这些讨论组和论坛以易于使用的图形界面为特征,预示着Usenet的衰落。Usenet最终从阿帕网转移到互联网,由于它是如此分散,因而无法一下子全部关闭。事实上,它仍然存在,尽管不再在社交网络中占主导地位。到2010年,Usenet在杜克大学也不再运作。

1984年,医生拉里·布里奇(Larry Brilliant)说服自由派杂志《全球评论》(Whole Earth Review的出版商斯图尔特·布兰德(Stewart Brand联手创建一个独特的在线社交网络,其部分是共同体,部分是商业机构。布里奇的想法很简单:“让一群有趣的人保持连续的沟通,我们在旁边,看看会发生什么。”(Take a group of interesting people, give them the means to stay in continuous communication with one another, stand back, and see what happens这个实验付出了很大的代价,被恰当地命名为“全球电子链接”(Whole Earth’Lectronic Link, WELL,形成了一个独特的社交网络。其特点是成员之间进行激烈、深入的交流,互相提供各种支持,包括有时候会汇款和开面对面的会议。WELL影响了接下来几乎所有形式的社交网络,包括为大学生建立的早期在线社区Tripod(成立于1992年)和GeoCities(成立于1994年),后者允许用户仿照城市区域设立网站。

在20世纪八九十年代,WELL的规模和范围不断扩大,WELL的精神——认为互联网可以是高度社交的观念——开始渗透到人们共同的意识中。在1994年和1995年,维基(Wiki)这一网络应用开始出现,它使得人们可以在网上相互协作地建立、编辑文档和网站,只要他们喜欢,就可以实时发布。美国在线的即时信使(Instant Messenger)(AIM,成立于1997年)允许参与者实时聊天,流行,甚广。黑板应用(Blackboard)(也建立于1997年)是一个教育课程管理系统,为在线教学提供结构化的手段。博客的出现也开始使互联网成为一种个人的也是公共的表达空间。

第一篇博客——尽管没有明确地命名——通常被认为是斯沃斯莫尔(Swarthmore)的学生贾斯廷·霍尔(Justin Hall)发出的,他在1994年开始在链接网(justin's links发布关于他生活的文章(在撰写本文时,该博客仍在运营)。这样的网站被称为网络日志(因为他们“登录网络”[logged the web]),后来被称为博客(blog),包括链接集合、日记般的思考和忏悔、信息扩散或上述这些的集合。从1999年开始,平台Blogger为个人提供了创建和分享博客的简单方法,从而有助于这一实践的普及。由于互联网还没有被广泛理解,许多人想知道为什么有人会选择在线分享私人的想法和感受。事实上,2002年,博客作者希瑟·阿姆斯特朗(Heather Armstrong)因在网上抱怨她作为网页设计师和平面设计师的工作而被解雇,这是在线分享的潜在恶果的一个早期例证。尽管如此,在Blogger和其他博客和日志网站(如Xanga和LiveJournal)诞生的几年之内,博客已经被广泛接受;到2006年,有超过4000万篇博客文章在互联网上发布。

维基百科(Wikipedia)诞生于2001年,此后,视频、音频和文本会议等维基和协作实践不断增长。维基百科是在易于访问的地方收集大量信息这一行为的拓展,这与百科全书(其名称部分来源于此)类似,但前者由2000多万用户(或“编辑者”)不断更新(其中大多数是具有技术技能的男性)。它开始成为更专业的在线百科全书Nupedia的补充,后来则直接替代了Nupedia。维基百科也使用开放源代码(open source)软件,这意味着它的内容是免费分发的和可再生产的。这样的系统可能会损害开放的可靠性和安全性,但是,那些对百科内容进行监管的用户会尽量减少不准确性,在需要的时候对条目内容加以审视,并要求提供额外的信息,而且条目的准确性会随着时间的推移得到理想的改善。它不是一个万无一失的系统,也不是一个有着黄金标准的研究工具,但是当用批判的眼光来使用它时,它可以成为探讨某主题的很好的起点。目前来看,它也没有公司的偏见,因为它不接受广告,并声称它永远不会。

这些早期的网络系统非常重要,不仅因为它们证明在线连接的技术是可行的,而且非常重要的是这些技术带来的副产品——强大而真实的社区意识。那些通过在线网络进行交流的人经常会感到他们被紧紧地联系在一起,就像社区或俱乐部的成员那样真实地、密切地相连。当然,这是一种建立社会性的新方式。被约翰·佩里·巴洛(John Perry Barlow称为“电子前沿”(electronic frontier)的早期开拓者,向其他人展示了网上所花费的时间能够带来真实的、有意义的社交和社群交往质量。很快,这种质量就成为互联网的实际代名词。

全功能的社交网络站点和社交媒体

在20世纪90年代后期与21世纪之交,出现了一些与早先的实验完全不同的网站,它们拥有一个专业化的名称——社交网站(SNS)。这些网站与之前的网站不同,用户可以很容易地看到自己“朋友”和“粉丝”的名单和档案。这些朋友和追随者通常是他们已经熟悉或者知道的人。SNS的成员也可以创建个人资料页面,将他们使用的网站个性化。与过去的网站相比,它们通常更容易操作,并且随着时间的推移变得越来越方便用户使用。

这些网站也不同于先前网站的规模。它们可以同时提供一对一,或一对多的沟通功能,赋予用户个人传播和“大众媒体”的感觉和功能。网站上的资料通常可以轻松地共享和转发,信息和个人资料也可以通过搜索引擎访问。社交网站有时被称为新媒体,但由于显著和影响深远的社交功能,其最切合的名称应当是社交媒体(social media),尤其是那些媒体分享能力显著的平台。

通常来说,首个公认的全功能社交网站是1997年的“六度”(Six Degrees)。虽然AIM网站已经开始提供好友名单,同学网(Find Alumni, View Yearbooks & Plan Class Reunions)允许成员加入其所在的高中或大学并且寻找可以联系到的人,一些早期的约会和社区网站允许创建和发布个人档案,六度却是第一个将所有这些功能综合起来的网站。在当时来看,这似乎是太“超前”(ahead of its time)了。虽然当时六度吸引了数百万用户,但用户的地理位置过于分散,基于面对面互相认识的大规模人际网络未能形成。然而,在线社交网络的第一真理愈发明显:人们使用在线社交网络大多是为了维持和加强他们与面对面相识的人的联系。

下一批受到广泛运用的SNS围绕日志(LiveJournal)、社区兴趣(AsianAvenue, BlackPlanet)、商业(Ryze)和虚拟世界(Cyworld)而组织起来。2002年,Friendster面世,这一社交网站具有明确的目标:帮助朋友的朋友(和朋友的朋友的朋友等)接触并且见面。Friendster的快速发展带来了技术和文化的问题,当公司努力去实现用户希望的功能时,用户却感受到愿望的幻灭。有趣的是,当Friendster的热度在美国逐渐消退时,它却在菲律宾、新加坡、马来西亚和印度尼西亚受到欢迎。Friendster的成功曾一度说服许多团体推出自己的社交网站,大约在2003年,这类网站爆发式地涌现出来(尤其是LinkedIn、Tribe.net和MyChurch)。

社交网站围绕着媒体共享这一主题而发展起来。2003年以后,Flickr(照片分享)和YouTube(视频分享)等媒体分享网站在其网站上增加了社交网络功能,成为完整的社交网站和真正的社交媒体网站。今天,社交媒体和社交网络在很多方面是同义词,因为大多数社交网站允许(事实上是鼓励)媒体共享,用户经常一起完成这些活动。2003年推出的MySpace——作为全方位服务的SNS——特别受到音乐人和乐队的欢迎。人们开始根据他们的音乐偏好和其他各种共同的兴趣与他人联系。作为当时最受欢迎的社交网站,MySpace的成员(越来越多的青少年)越来越多,网站成员会鼓励他们的朋友加入。最后,MySpace被卖给了另一家公司,并被牵连进几起未成年的性犯罪和丑闻,随后,它就失去了顶级社交网站的地位。

MySpace的下滑恰逢Facebook(最初称为“thefacebook”)的崛起,而后者最终成为全球最大和最具影响力的社交网站。2004年,Facebook最初由马克·扎克伯格(Mark Zuckerberg)在哈佛大学其他同学的协助下建立,建立之初仅限于哈佛大学校内使用;2005年,扩展到其他大学和高中;接下来扩展到职场专业人士,并于2006年开始向更广泛的世界扩散。截至撰写本文为止,Facebook仍是全球用户最多、知名度最高的社交网站,用户总数约20亿,其中7.5亿为每日都登录的深度用户。然而,有些人认为,Facebook的增长是以牺牲其早期的亲密和“酷”的特征为代价的。

在接下来的发展中,Facebook做出了以下战略决策:通过广告将网站商业化,在整个互联网中嵌入“点赞”按钮,允许网站中存在大量的应用程序,并与被称为“无摩擦共享”(frictionless sharing)的网站一起使用。上述这些举措都被批评为了经济利益而侵蚀了用户间的亲密关系和社区感。在2016年美国总统选举中,一些很明显是假的“新闻”文章、广告和看起来像确有其人其实却是机器人(机器人程序)的假账户盛行,这些账户是故意用于传播错误信息的,可能会影响Facebook用户关于选举的意见和行动。现在,很多人依靠社交媒体——特别是Facebook——为他们提供有关时事和新闻的信息。马克·扎克伯格在2017年9月的一条帖子中为没有对这些现象采取更警惕的措施表示了道歉,他写道,“我请求大家的原谅:我过去的工作使人们产生了分化而非将人们团结在一起,我将努力做得更好。”2017年10月,Facebook发布了3000多条与俄罗斯有关的广告,这些在竞选期间出现在Facebook的平台上的信息大部分是带有分裂性的。这一争议凸显了社交媒体对发布在其平台上的内容的作用和责任——这一争议肯定将在未来数月乃至数年上演,并让社交媒体公司加大监管力度。

Facebook还开发出了一套算法,并利用这套算法确定谁是他们的真正用户,如何最好地与他们联系,并且鼓励他们更深入地参与到网站中。然后,Facebook开始通过收集和出售他们的数据来赚钱,诸如Twitter和Pinterest等其他社交网站也是如此。此外,社交网站也可以通过在公司销售广告或股票来赚钱。

Facebook已经证明,社交网络可以是非常大的业务。社交媒体、社交网站以及博客网站目前多如牛毛,其中一些——如Twitter、Instagram和Foursquare,以及WordPress、Blogger和Tumblr等博客网站——已经非常流行和有影响力,用户数量达到数百万。社交媒体专家、设计师、作家和管理人员同计算机科学家、信息技术专业人士和其他技术野心家一道构成了规模庞大、发展迅速的现代劳动力。但是,应该注意的是,在很多网站和博客上,大量的网页内容都是免费提供和分享的,这使得那些希望通过这种工作来赚钱的人们的处境变得复杂。越来越多的人在这些“知识产业”(knowledge industries)谋职,在这一产业中,观点的交流(例如教育、科学和大众媒体等领域)占主导地位。

21世纪前十年的三重革命

2000年以来,互联网、移动通信以及社交网络的不断发展在社交连接方面引发了一场不亚于革命的进步。社交网络研究人员李·雷尼(Lee Rainie)巴里·威尔曼(Barry Wellman)把这三个进步的交汇点称为“三重革命”(triple revolution)。位于不同技术发展水平的社会都受到了影响。

在21世纪之前,使用宽带服务或无线技术访问互联网较为罕见。移动连接和社交媒体还处于起步阶段。目前,世界上约一半的家庭都接入了互联网,常常被用户带在身上的移动电话更使得人们通过按下一个按钮就接触到信息和娱乐,通过发送短信、打电话和社交网站就能建立社交连接。在10个美国人中,差不多有7个使用Facebook、Twitter、Pinterest和LinkedIn等社交网站,他们通常是受过大学教育且收入较高的人。当人们接入互联网时,社交网络往往是他们的第一项活动,即使在不发达地区也是如此。

从20世纪90年代开始,各种专业服务和网站开始在互联网上占有一席之地。在线广播电台(从1994年开始)和亚马逊(1994年)、eBay(1995年)等零售商开始在电子游戏、各种兴趣网站以及色情网站发现他们的受众。体育、新闻、娱乐和名人八卦等主题的网站也数量激增。1999年,肖恩·范宁(Shawn Fanning)推出了名为Napster的点对点文件共享程序,开创了音乐共享、发行和制作的新时代。尽管该网站由于涉及版权和音乐所有权等法律问题而在两年后被关闭,但Napster创造了通过互联网和数字媒体传播音乐的新文化,后来的iTunes(2001)、YouTube(2005)以及Netflix和Hulu(均成立于2007年)都凭借这种传播形式取得了巨大的成功。

随着20世纪90年代中期互联网的大幅增长,为了使带宽(bandwidth)或信息容量能够满足用户的需求,针对宽带容量的投资也开始增加。与此同时,大型互联网服务提供商和微软、谷歌以及亚马逊等公司需要巨大的计算能力、服务器和在线存储空间。这一需求导致的结果是云计算(cloud computing)这是21世纪的第一个十年里最重要的计算发展之一。云计算是“基于无处不在的网络访问和与网络位置无关的资源库,按需求进行的自助服务计算资源的模式”(a model for delivering on-demand, self-service computing resources with ubiquitous network access and location-independent resource pooling。也就是说,所有这些数字活动和存储都发生在非物理空间中,该空间独立于任何硬件而存在,并且可以从任何计算机设备进行访问。然而,当数据被数字化和远程集中时,也存在严重的漏洞。

各种信息开始大量生成和传播。随着知识越来越集中在大型数据库中,这些大型数据集的管理和分析——通常被称为“大数据”(big data)——变得越来越重要。由于信息成为技术密集型社会中的“主要流通物”(primary good),社会成员们开始觉得几乎需要不断地生产和处理信息。获取、检查和认证信息的技能变得至关重要。因此,这样的社会有时被称为信息、知识、信息—网络或网络社会。

三重革命是一场全球革命。虽然数字技术的红利仍然由那些更有权势的人获得,许多人还无法完全接入互联网,但是这项技术可以为网络的发展和资源向社会中下阶层流动提供一种机制和途径。例如,在许多情况下,将计算机、互联网连接和数字素养带到欠发达地区的举措有助于经济条件的改善以及赋予当地社区和人群以权力。

以上对传播技术和媒体历史的概述仅仅关注了人类历史的一小部分,即那些创建了技术发达、被计算机所渗透的社会的行动和态度。在反思信息传播技术的历史时,我们应该记住,技术不仅受到其发明者影响,也被采纳者和使用者塑造。许多技术最终被使用的方式与其创造者最初的构想大相径庭。亚历山大·格雷厄姆·贝尔(Alexander Graham Bell)发明了电话,他原本是想让其作为助听设备,现在却被用于远距离交流,并成为移动通信革命的中心。正是社会中的人们——包括你和我,以及那些在社交上和技术上更有影响力的人——决定着技术的发展路径和技术将要创建的社会类型。

技术为我们的日常生活带来了一系列重要的改变。想想吧,如果计算机化没有影响到你的生活,那么你的生活在个人、小团体、组织和社会层面将会是多么不同,你的人际关系、你的线上和线下环境,以及你在其中的体验将会是多么不同,甚至是你都会变得不同。你应当把学到的东西个人化,并将其应用到自己的生活中,并试着更好地理解那些生活在不同情况中但可能有相似需求的人们的生活:在我们复杂的、瞬息万变的世界中寻找意义。

原文:《超连接:互联网、数字媒体和技术-社会生活》

俄罗斯互联网

原文: The Russian Internet 俄罗斯互联网的故事可以追溯到早期的持不同政见者论文和该地区电信的诞生。 这是一个关于信息控制的故事,从纸张到声波再到针对哲学、阴谋和新闻的互联网数据包。 尽管大多数美国人可以对俄罗斯政治和互联网控制的现状做出假设,但现实更加复杂和...