全媒体视角
有人说,MOOC泡沫破了。从著名的信息技术发展的Gartner曲线来看,MOOC已经到了要释放动能的时候,要把积累起来的势能有效地释放出来,MOOC目前正在向深度和广度两方面发展,因此需要我们有足够的耐心和智慧。在这个过程中,需要继续投入能量,信息化正在迈入一个新阶段—智能化。
国防科技大学副教育长王怀民少将精彩演讲视频
国防科技大学副教育长王怀民少将
国防科技大学副教育长王怀民少将在LINK2017在线教育论坛暨教育部在线教育研究中心在线教育奖励基金(全通教育)颁奖典礼上的精彩演讲—
大家好!刚才听了杨宗凯校长的报告非常有启发。我这个报告希望从支撑今天的网络教学变革的角度谈支撑技术,题目是“分布计算2.0:基于互联网的联接计算”。我想结合自己这几年来在信息技术领域的研究及教学工作谈几点意见。
首先,汇报一下我们对分布计算2.0这个问题的认识和探讨。分布计算的研究对象,简单来说是多个独立的计算实体组成的系统,它们是通过网络连接、通过通讯协议有效协同,这样的信息作为分布计算的研究对象。
今天在这个场合讲这个话题,我想从两个视角来看:一个我们称为分布计算1.0,实际上分布计算这个概念在60年代末就开始提出了。那么1.0,我们称为以计算机为中心的,它关注的问题是如何将确定数量计算实体组合成为具有明确性能或可靠性需求的计算系统。大家注意我强调的两个关键词,一个是确定的数量计算实体,一个是明确可靠性需求的计算系统,这是我们1.0关注的问题。
今天跟大家分享,支撑包括在线教育在内这些新型的应用的支撑技术,我们指的是分布计算2.0。关注的是如何将持续成长的网络资源联接成为更大规模、更加高效的网络信息系统,是以网络为中心的。它是我们今天信息社会赖以发展的重要的支撑技术。对这样的话题、这样一个联接的进程,我们已经有了很多的体会。
有专家说,这样一个网络信息系统是人类这30年做的一件大事,我们就是在织这张网。关注信息系统领域的学者凯文·凯利说过一句话,人类最近30年做的一件大事就是织网。现在都到百亿台的设备,联接超过45亿在线网页,联接35亿网民以及未来的成百亿、千亿甚至更大规模的设备。
这个进程在推进之中,我们今天看到的在线教育,以MOOC为例,已经连接了数千所院校,数千门课程,来自全球将近200个国家和地区的数千万的学习者和教师,联接在这样一个环境下。实际上这样一个技术,已经在支撑这个社会在前进了。
从发展角度上看,支持这样一个包括像慕课在内的在线教育网络信息系统持续成长和发展的核心技术是什么?请大家特别注意,我用了“持续成长发展”。因为这样的系统不是一蹴而就的,是在一个持续成长发展过程当中走到今天的。未来会走向哪里,我们也不是特别清楚,那么它为什么能走到现在?从发展角度上看,是什么样的技术支撑走到今天?我们说就是面向互联网的联接计算。
这个联接计算包括什么呢?我概括了一下,包括联接软件资源技术、联接计算资源技术及联接智力资源技术。关于联接软件资源技术,在今天我们已经体会到了,是一个重要的联接的技术。从计算机技术、软件角度上来讲,有一个总线模型,有各种各样不同的实体,要联接起来,通常通过一个软件的标准联接到一个所谓的抽象的软件总线上,产生哪些标准呢?比如过去网络连接的TC包括软件技术领域里面的对象的远程对象连接的标准,以及后来我们联接网页的Http标准等等这样一些重要的技术。正因为有这样的技术,我们今天讲联接,包括做网上教育的实践才有了好的基础。
联接要关注什么呢?关注如何支持成长与演化,这个网络体系在了,我们需要的基础支持是什么呢?我们要重组,它既是一个变革的过程又是连续的过程,不是推倒重来的过程。我们需要这个联接,需要它进行变化。联接的这些成分是可以升级的,是可以有效地联接进来。这是我们今天需要的,所谓软件联接技术所要支持的。因此我们讲互操作,讲每个联接实体的自主性,是我们要支持的。
第二个重要的联接技术,就是计算资源的联接。这里面一个重要的概念就是抽象与绑定。今天,在计算机时代,计算机的资源为什么能够支持分布式应用而且越来越便捷和高效?是因为有了这样一个抽象的绑定系统。今天我们要抽象和绑定的是什么资源呢?不断成长的网络资源,如何有效地支持在这样一种平台上,开发包括在线教育的应用。我们也需要这样一种支持绑定和应用,我们讲的云操作系统、云的设计和运行管理环境。
在这个过程当中,我们最需要讲到这样一个资源,是以一种聚合和协同的工作,尤其是所谓的弹性的绑定。大家都知道,即便在云中心,它们在今天互联网服务当中,资源使用的频率和要求是不一样的。我们都知道,所谓的光棍节的抢购,那个时候的峰值和平时差十倍的差别。
在这个情况下,资源利用率要高已经形成一个突出的问题,因此就需要弹性的绑定,也就是适时感知需求,正确决策进行动态绑定。也就是在适当的资源粒度上,合适的调整时机,实现任务和计算资源的绑定。比如以华中师大为例,在需要的时候,可以在内部的数据中心或者它所指定进行资源弹性绑定。到一定程度以后,比如说为两岸三地提供服务的时候,可能需要两岸三地数据服务中心提供资源进行帮助,这样一种弹性的能力,今天我们讲计算资源连接,需要特别支持。
第三件事情,我们讲的是智力资源。智力资源的联接,我所关注的一个领域就是所谓的开源,开源计算领域是一个重要的范围,对于未来在线研究有很大帮助。我们知道过去的软件的开发平台是一个企业级平台,杨老师刚才讲了,按照工业化生产来做软件。它关注的是要出产品,满足用户需求。因此,它的支撑环境就是以质量控制为核心的一个协同生产环境。怎么把人控制住,这是过去我们讲的。
我们今天开源的环境是什么呢?是开发者、自由职业者和学生企业都可以参与的环境,在这里生长出很多重要的作品,这个作品是每个参与者灵感得以表现的环境。在这样的环境下,本质是支持分享和协同创作。我们今天看到,在网络层的一种环境,还有传统的环境。在大学教育当中,传统的教室和我们今天网络教育也是这样一种对比。这两种方式,不是彻底的替代。因此,如何把一个有效的作品变成产品,比如说我们说维基百科做好以后,我们怎么把它变成一个有效的服务,这两种机制是需要联接的,这个需要关注。
在这个领域我们讲智力资源联接,强调激发与汇聚,今天讲开源世界,已经给了很好的激发的模式,让大家都来参与现在这个激发模式。如何汇聚成有价值的成果非常重要,今天的学习者在网络上接受在线教育,已经有丰富的计算资源了。大家最关心的是怎么让我汇聚如此之多的东西,只有一个搜索引擎就够了吗?显然是不够的。因此在这个过程当中,我们要解决的是一个核心团队和互联网大众参与的自主是如何有效协同的。在整个过程当中,创作活动和生产活动如何有效协同,这里面涉及到大众的协同机制、开放工作机制和持续评估机制。这是我讲的第三个联接——智力资源联接,更加接近于我们在线教育层面。
下面,我讲一下分布式计算在我们这个时代的方位。信息化时代有两次浪潮,一次重要的浪潮是数字化,这个浪潮仍然在推进中。分布式计算是边缘化的,在这个数字化浪潮,又起一个浪潮,软件资源、未来资源、网络化时代,分布式计算处于中心的位置。第二个要回答的问题,在这个过程中,中国的支撑技术处于什么样的位置。在1.0的时候,我们计算技术是跟踪为主,到今天面临的是自主可控的挑战。到了网络时代,到了文化时代,我们已经从跟踪到并跑,已经解决比较好的网络可控的问题了。
最近看了一个材料,讲基础设施和应用,是在14年、15年前后的书。说1986年时候,互联网在美国学术界广泛发展的时期,中国互联网带宽是0。而到本世纪之初,中国互联网带宽就到世界第二了,到2014年中国互联网带宽的累计已经是世界第一而且两倍于美国。同时我们注意到,中国在互联网上的应用,以上市公司为例,15个当中有4个在15年的时候,在95年的时候,20年前的时候,上市公司一个都没有。联接资源的时候,中间这个层次,中国做的怎么样?我想说说中间层次,支撑技术模式,中国从跟踪到并跑,已经有了重要的突破。
关于这件事情,我们要历史地看,我们来说一说著名的信息技术发展的Gartner曲线。大家都很熟悉,早期发展,会有一个泡沫期,之后会有一个所谓的幻灭期,然后才会慢慢地走向成熟。我用中国的讲法,就是由生长期、青春期、而立期、不惑期和稳定期,这个是Gartner曲线基本的流程。还有另外一个解法,大家经常把而立期说成是幻灭期,把青春期说成泡沫期,这是消解的讲法。我的讲法是,有两个时期是势能的积聚期和动能的释放期。
我们首先要有一个能量积蓄的过程,之后这个过程不是破灭,而是一个势能得以释放的过程,我们必须有一个很高的势能积累,我对这个问题是这样的看法。所以在这个过程中,我们重要的是要解决好这个势能的快速积累和动能的有节奏的释放这样一种节奏的把握。我们过去在这个方面,分布式计算2.0这个领域,我们把握这个结构,在这个过程当中看到我们的国家的发展。下面举几个例子:
在软件资源联接方面,我们做了一个软件平台叫StarBus。在势能积累过程当中,研制我们中国的具有自主知识产权的中间件的平台。同时到了顶端的时候,我们就开始用这样一个平台来推动中国在这个领域中间件领域产业的发展,因此我们就有了对于技术标准、继续发展的认识和体会。来自中国的认识体会,推动中国的发展。不仅仅做到这里,我们还继续努力地行文制约,让这样一个势能得以持续释放。
特别是在过去我们做的两件事儿,第一件事在2001年的时候,我们用这样一个平台,做成当时在国际上失误处理能力最强的计费软件,在今天都认为不是事儿了,在云计算没有出来的时候,三千万用户的计费的一套系统是世界最高水平。同时在过去十年当中,把这些技术用于国防信息化建设,因此我们这个团队很自豪的是用我们的技术实现了国防信息系统的对象化、构建化、服务化。这个软件的技术过程,从势能的积累到动能的释放,我们已经推进了20年。把它应用于军队的信息化,我们也走了15年,因此我们走向前,不在于我们是不是势能积累过程当中,还要有动能释放过程当中的韧性和决心。
我们讲到,软件强调的是联接,最重要的是把资源高效地汇聚起来。实际上大家注意到时间,新世纪前后以及过去的一些年,网格计算、对等计算、普适计算、服务计算、云计算,还有边缘计算等等,在这个过程当中,我们做了一件事情,我们所做的原创核心概念。互联网计算当中,要按需聚合、自主协同,在这个概念当中,我们来推进国家互联网的治理。大家知道互联网需要治理,习主席提出了一个重要的概念,全世界越来越重要的国家、国际组织都认可这件事情。对于这个治理,我们要解决的是面对千倍速增值问题,还能够管住它。用互联网资源管互联网,才能管得住这个网。
第二件事情,我们跟阿里云合作,在资源利用率和系统可靠性方面怎么去做。因此在这个过程当中,我们已经开始做动能释放,同时还在鼓励坚持继续向前来推进。
第三件事情,所谓的智力资源的汇聚,我们做一个平台叫Trustie。这个是基于开源和众包的模式,怎么资源共享,而且把这个工作用于我们软件产业的开发平台改造,用于一些关键的航天领域关键领域的提高,运用于若干个软件园以至于用于教育领域。今天讲在线教育,我们认为不仅课程要在线,实践也要在线,实践在线依靠实验室。今天在信息技术过程当中,在线的实践领域培养已经具备条件,开源软件就是这样一个战略。我们应用于这个领域,这是我们提出的一个方法,这个方法在国际上形成的影响,到了从开始释放动能过程当中,我现在仍然在推动。
说了分布计算2.0,面向互联网联接技术的重要技术、软件的联接、计算资源的联接,我们国家做出自己的判断,从跟踪到并跑阶段发展,已经有了自主可控的能力。
再看今天,我们讲在线教育、讲MOOC,它的势能的积累的时间是2010年以前,它青春期爆发的时候,是在2011-2014年。目前有人说,MOOC泡沫破了,我说MOOC已经到了要释放动能的时候,我们要有这个耐心和智慧,要把这个过程中积累起来的势能有效地释放出来。使得我们这件事情,能够行稳走正。在这个过程中,需要继续投入能量,我们应该是信息化第三个阶段,叫智能化。刚才杨校长讲,在学校里进行教学评估,就是数据,这是我们数字化和网络化的发展,才能带来这个方面发展。在这个领域要继续向前发挥更大的作用。
第三个问题是面临的挑战。
刚才我谈到这个支撑技术,让我们看到非常复杂的网络信息系统。这个信息系统有什么特点呢?是持续演进的过程,是若干数量不断成长的异构系统相互耦合关联而成。联接成信息系统,而且这些系统要素还涉及到大量的联接人和物理世界社会系统和物理系统。第三个重要的特征,这些系统要素特征耦合关联关系是动态发展的变化,而且日趋复杂。我们可以看到这样一个历史进程。
最近我们和清华有合作,要基于今天世界上的优质资源,为军队提供终身教育服务。我们还在做新的联接,这种联接还在持续发展。因此对这个系统的行为,难以通过自治系统特征简单叠加加以刻画。我们刚才讲的联接计算三类技术,是术,是把系统联接起来的技术,这个系统什么样的特征,我们认识有限,因此我们已经到了,要问为什么会这样,将会怎样的这个问题。实际上我们已经面临这样一种挑战。
在人类知识进展过程当中,我们面临过这样的问题,比如说在公元80年的时候,建立了古罗马斗兽场,在公元605年有了赵州桥,但是当时说不清楚,我们后来有了牛顿力学,我们可以构造更大规模的人类的建筑。同样在计算领域里面,也有这个过程,有过算法,我们对于计算过程说不清楚,对于计算的装置说不清楚,后来我们知道有了图灵计算的理论,使得我们可以造出通用的计算机,可变的计算机。我们在网络信息时代,我们面临着,我们对这个东西做成这么大,它是怎么回事,我们不清楚,这是一个重要的挑战。
也就是说我们过去讲的理论的进展,实际上是基于还原论思想的分而治之的方法。今天在网络时代,我们需要面临系统论的方法和成长演化观点看系统,我们今天看到的网络系统,如此成长起来的,今天还在快速成长。我们说它是一个社区建城市,建社会的一个过程,用什么样的理论方法来认识和理解?
在过去发展过程当中,在人类认知自然和自身的过程当中,还原论的方法系统论,都起到进一步的推动作用。比如说还原论,我们说要把一个系统看成一个稳定和机械的系统,因此它的整体就等于部分之和。由因果确定的。系统论是看到开放成长的复杂系统,整体大于部分之和,强调的观点,没有那么简单的应用,因此我们需要是一个自下而上的联接演化。
而过去200多年,科学传统过程当中,还原论创造了辉煌,我刚才举到的,包括纽伦的物理学,乃至于图灵计算理论,都是还原论的主要成果。比如说图灵,计算不是很复杂,就是01,计算的形态,就是左1和右1,写01,就是简单的编码和操作的动作,把任何复杂的计算都能表达出来,是用还原思想表达问题,并且这样一种方法适合我们今天讲的传统的科学价值观,可观察可重复可预测可验证。我们经常有一个讨论,中医是不是科学,是不是伪科学,这里面讲的是不是自然科学的价值观。我们不能说自然价值的价值观,就代替所有的价值观,我这里讲的可观察、可重复、可预测、可验证,是自然的价值观。
我刚才讲到计算科学是可编程的,刚才我讲到,支撑我们今天讲的信息社会的分布计算2.0联接软件,联接计算、联接智慧的方法也是可操作的,但是我们看到网络的整体规律,尤其是我们说安全,这个系统一致了,这个系统可调控了,这些问题我们都回答了。这也是今天讲到的,建立起这样一个系统,我们说有多少学生完成在线学习,这个学习的学生帮助什么等等宏观性的问题,回答得非常有限。
怎么回答这个问题呢?在双螺旋的交互中,未来系统性和复杂系统,尤其在生态圈里面,对人脑的结构、对城市的发展、对社会经济发展这些研究对象,都需要用复杂系统进行研究。大家一说到复杂系统科学,这是可观察,可重复、可预测、可验证,这个方法可操作吗?这是现在这个学科面临的挑战,但是我们觉得有点曙光的是,基于大数据的复杂网络科学给了我们一种手段,也就是我们今天在构造这个复杂的网络系统。人造的,我们今天赖以生存的网络信息系统是内构造的,不仅体会了它的存在,而且体会了我们为这个变化存在做贡献我们要研究它,它产生的本身,也给了我们一个研究手段。就是它本身的数字化,它就是能够做它所有历史数据足够分辨率数据的沉淀,我们是可以根据这个数据的沉淀,通过这个网络平台上的计算能力,对它进行有效分析。因此它也给我们一种研究手段,实际上我们今天已经看到了,这个网络由于大数据和云计算,它变得可观察、可分析、可成长,而且我们可以设计若干个机制去干预这个系统,去观察、干预之后的变化和现象。这是我们未来这个领域要进一步发展,智能化领域进一步进展,在基础问题上,我们要有所突破。
最后,我想说一下,今天我们的话题叫连接-链接-联接。我们看到另外一个词是链接,我今天写的是联接计算,当时我也纠结起一个什么名字?我后来叫联接计算,为什么?我把前面这个连接两个食指连接起来叫连接,链接就是要把它连接死,不能动,让它不能变,不能轻易变的时候,那个两两连接,叫链接。当我们强调能够灵活变化,能够持续的连接,能够形成一个网,能够全通连接,我就用联接这个词。我讲的这个分布计算2.0,是讲的全通的联接,我用的联接计算的联接。这是我做的说明,也和大家交流和参考。谢谢!
5月10日,近千人齐聚清华大学大礼堂,共同参与并见证一场学术和思想的交锋—LINK2017在线教育论坛暨教育部在线教育研究中心在线教育奖励基金(全通教育)颁奖典礼。本次论坛由教育部在线教育研究中心主办,全通教育、学堂在线、《现代教育技术》杂志协办,中教全媒体承办。
LINK2017在线教育论坛现场
评论前必须登录!
注册