十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
王萍,王陈欣,朱璇
让客户满意是我们工作的目标,不断超越客户的期望值来自于我们对这个行业的热爱。我们立志把好的技术通过有效、简单的方式提供给客户,将通过不懈努力成为客户在信息化领域值得信任、有价值的长期合作伙伴,公司提供的服务项目有:域名注册、雅安服务器托管、营销软件、网站建设、霸州网站维护、网站推广。* 本文系全国教育科学“十三五”规划国家一般课题“优质慕课建设全程的多维质量保障体系研究”(课题编号:BCA190077)、上海外国语大学校级科研规划项目“对话式教育机器人辅助语言有效学习的自适应方法研究”(项目编号:2019114013)研究成果。
引用请注明以下信息:
王萍,王陈欣,朱璇.基于自动化方法的教育人工智能系统设计与应用[J].中国电化教育,2020,(6):7-15.
一、引言
作为科技进步的核心驱动力,人工智能对社会发展带来了深刻变革。教育领域也在积极探寻如何与人工智能深度融合,推动教育创新,构建智能时代下的教育新生态。但人工智能对教育的具体赋能并非是一蹴而就的,教育领域目前还面临着缺少成熟应用模式、缺少人工智能专家、缺少技术平台支撑等问题,人工智能尚未能够有效的支持构建教育工具和教育系统。如何推动人工智能的落地应用、实现人工智能系统的便捷开发将是教育人工智能发展道路上的重要环节。
自动化是人类文明进步和社会现代化的标志。伴随人类社会的进步,自动化技术在社会需求的推动下不断发展。当前,通过自动化方法构建人工智能系统是人工智能领域开始关注的一个重要方向。作为一种新的研究方法,自动化机器学习、自动化深度学习等人工智能方法使用“以人工智能训练人工智能”的设计思路,扩展人工智能研究和应用的范围,实现开放普惠的人工智能目标。使用者只需给出输入数据和任务类型,系统建模中的算法与模型构建等专业性任务由机器自动完成,从而有效降低人工智能应用与系统开发的门槛,推动人工智能应用的标准化、模块化、自动化。
当前教育人工智能的研究总体上呈现理论探讨多、落地应用少的现状,自动化人工智能方法为教育领域的人工智能研究与应用提供了思路。本文在分析教育人工智能系统设计与应用已有研究与问题的基础上,探讨基于自动化思想的设计方法,以期为探索教育人工智能的应用与实践提供参考。
二、相关研究分析
我们从文献分析、地平线报告分析、Gartner技术趋势分析三个方面,对教育人工智能的研究现状进行梳理,并重点分析人工智能在应用层面的研究与进展。
(一)国内教育人工智能研究现状
为了深入分析国内教育人工智能的研究现状,我们选取了国内教育技术领域7个主要CSSCI期刊中内容关于人工智能的论文,从2017年1月至2019年12月共369篇,对文章主题进行了归纳与分类。分析结果可以发现当前国内教育人工智能研究存在较为明显的“理论研究丰富,场景讨论充分,技术应用匮乏”的局面。
1.当前国内教育人工智能的研究主题主要有三大类。(1)理论探讨类。这类研究(174篇)主要从理论角度分析人工智能对教育、学习领域带来的影响,讨论智能化时代下对教育带来的冲击,具体又可分为综述类、文件解读类、理论分析类。这些研究为我们把握人工智能技术对教育的赋能,分析智能教育的内涵与定位,了解世界各国与相关机构的人工智能政策与规划,指导我国未来教育人工智能战略的制定等方面具有积极的意义。(2)应用场景类。这类研究(169篇)主要从人工智能技术参与构建的教育应用场景展开讨论。其中智慧课堂、智慧校园的内涵与建设研究重点分析智能技术对于课堂、校园等学习空间带来的变革。其他应用场景类研究,我们归为“智能+”类,主要是探索人工智能视域下相关研究的融合,包括对“智能+5G”“智能+云计算”“智能+慕课”“智能+STEM”等的讨论。人工智能技术融合其他信息技术正在构建全新的技术场域,从而赋能教育创新,构建新的智能应用场景。(3)技术开发类。当前,国内教育人工智能中具体的技术开发类研究明显落后于理论研究。在26项已有研究中,17项研究主题为智能系统设计类,9项研究探索了智能算法。这些研究基本上针对某一具体任务进行了教育人工智能系统的设计与算法设计研究。
2.通过对国内已有研究的梳理,可以发现当前教育人工智能在理论分析和潜在应用场景的讨论已较为全面,但具体应用实现和技术研究方面还较少,系统设计与算法研究还有待于深入。在教育人工智能的系统应用框架和实现流程方面,一些学者结合人工智能技术特征进行了分析,提出教育人工智能技术框架主要包括教育数据层、算法层、感知层、认知层和教育应用层[1][2]。但研究也还主要停留在框架的建构层面,对于如何应用框架中的模块和技术到具体的教育人工智能应用中,还缺少实践研究。虽然如何推动并实现有效的落地应用已经受到理论关注与讨论,但探索如何有效落地应用的机制和方法还较为匮乏。
(二)地平线报告对人工智能的分析
地平线报告从2014年开始持续关注虚拟助理、自适应学习、自然用户界面、机器人技术等智能技术在教育领域中的应用。2017年以来人工智能作为专项技术连续出现在地平线报告中。作为影响教育未来中长期发展的关键技术,智能技术的发展与应用成为地平线趋势预测的重要部分(如图1所示)。
图1描述了地平线报告中近年对人工智能相关技术的教育应用分析,呈现如下特点。
1.关注点逐步扩散和全面。从关注学习(2017),到关注研究与技术(2018年),到关注人工智能在教育领域的全面应用(2019年)。2017年地平线报告指出人工智能技术可以“深入理解学习者特征,学习者思维模式,从而提升在线学习和自适应学习系统的性能”[3]。2018年,在关注学习的基础上,地平线报告开始关注人工智能作为有效的研究手段与教学工具,“增强在线学习、适应学习软件和研究过程,与学生进行积极反馈与互动,是有效的教学工具和技术解决方案”[4]。2019年地平线报告分析继续指出,人工智能技术作用于教育教学的全过程,“可以提供个性化体验,减少工作量和协作分析大型数据集,以为教学应用程序提供借鉴。支持自适应学习等教学方法,满足个性化学习。通过数据建模分析辅助教学策略和教学管理”[5]。
2.关注教育人工智能的具体应用。地平线报告将人工智能作为支持教育的基础性技术和重大创新技术予以关注并重点关注人工智能的应用方式,即人工智能如何落地于具体的教育场景中,如何应用于教与学过程中。如近年地平线报告中关注的虚拟助理、自然用户界面等是对话式人工智能的典型技术,自适应学习则体现了智能技术在学习系统中的典型应用。因此,地平线报告的分析从底层支持层到教学应用层,围绕人工智能技术应用展开分析,体现了教育对技术的需求和技术对教育的支持。
(三)人工智能技术成熟度模型中的应用趋势分析
Hype Cycle技术成熟度曲线模型是由Gartner提出的一个应用广泛的发展周期预测模型,模型描述了一项技术从诞生到成熟,再到广泛应用的过程。作为近年科技领域的核心技术,Gartner连续三年发布了人工智能Hype Cycle成熟度曲线,对人工智能中的细分技术、应用领域、发展现状等项目进行分析与预测,为研究人工智能技术的创新和发展路径提供了评估标准和分析工具。
我们对20172019年Gartner的人工智能成熟度曲线模型进行了分析,重点筛选与“促进应用”相关的人工智能项目,结合教育领域应用,得到如下分析,如图2所示。
1.人工智能的应用落地需要从专家支持、技术支持和基础设施支持等维度展开探索,这些技术和服务正处于快速发展中。2017年AI咨询及系统整合服务(AI-related C & SI Services,ACSI)在技术成熟度模型中提出,旨在从专业人员支持的角度,为具有人工智能应用需求的领域提供咨询、软件实施及相关服务。人工智能开发工具包从技术支持维度,人工智能云服务从基础设施支持维度,分别在2018和2019技术成熟度曲线中提出,并迅速发展,为人工智能的落地应用提供支撑。人工智能开发工具包包括数据平台、框架和分析库、软件开发包等,能够支持人工智能应用程序的快速开发和部署。服务于人工智能的云服务为人工智能提供了硬件设施和算法软件层面的服务支持,帮助各种类型的应用者能够使用到人工智能所需的算力和算法。
2.人工智能中的机器学习和深度学习算法研究已经相对成熟,已经度过技术快速发展期的顶端,开始走向下降期,这个时期也是技术应用模式探索的关键时期。在应用的探索中,作为降低机器学习和深度学习技术门槛的有效方法,推动人工智能应用的AUTOML(自动化机器学习)在2019年得到迅速发展。
(四)研究评述
1.国内教育人工智能的研究需加强对人工智能落地应用的研究。当前对于如何将人工智能应用于教育场景的系统设计、开发和实现等研究还较少,包括人工智能技术的技术门槛、教育领域专业人工智能人才的缺乏、教育大数据的不足等。因此,需要我们探索有效的方法解决面临的问题,推动教育领域人工智能的落地应用研究。
2.地平线报告研究重点从技术维度对教育领域内人工智能的应用进行了分析,关注重点也在逐步扩散和全面,包含了学习支持、研究手段、教学工具、数据策略等方面。这也说明对教育人工智能的研究正在更多的关注实践。在人工智能应用落地的技术支持上,Gartner人工智能成熟度模型中对人员支持、软件支持、服务支持、云支持、自动化框架支持等的预测和分析,对于人工智能的落地应用有着重要的指导价值。
3.虽然“关注应用”是地平线报告的核心思想,也是技术成熟模型分析中的重要趋势,但人工智能在教育领域中的应用研究还是薄弱环节。“如何探索有效的教育人工智能系统的设计与应用方法”是需要解决的关键问题。本文旨在研究解决该问题、探索新的教育人工智能应用的设计模型与方法,为教育人工智能系统应用的开展和落地提供参考和借鉴。
三、教育人工智能应用系统的功能模块与问题分析
(一)教育人工智能应用系统的功能模块
在人工智能的发展过程中,有符号主义、连接主义和行为主义三个主要研究范式和学派。三种范式对智能的产生有着不同的解释与设计思想,也影响着人工智能应用的技术手段与设计模式。当前教育人工智能领域主要使用机器学习和深度学习算法构建系统应用,是一种基于连接主义的智能模型。基于连接主义模式的特点是:需要通过学习高维数据来获取高层语义表达;产生的是黑盒模型,通常具有较高的准确性,但模型的内部工作机制无法准确得知;难以估计每个特征对模型预测结果的重要性,以及不同特征之间的相互作用关系。
在大数据与超强算力的支撑下,机器学习、深度学习已在计算机视觉、语音识别、自然语言处理等方面达到甚至超过人类水平,是实现人工智能成功的重要推动力之一[6]。基于连接主义思想的教育人工智能系统的设计模型与过程如图3所示,可以分为教育需求、教育数据、教育特征、教育模型、教育应用五个主要功能模块。
1.问题定义与需求分析
问题定义与需求分析是教育人工智能系统开发的出发点。我们所要解决的教育问题和系统需求应当是人工智能可以解决的。人工智能应用于教育有其边界与定位[7],并非所有的教育问题都适合使用人工智能来解决。只有在恰当的教育场景与教学需求下,人工智能技术的应用才能产生正向的教育效果。我们需要明确人工智能适合解决哪些任务,哪些教育问题和需求适合人工智能解决。Science对适合机器学习和深度学习任务进行了总结,给出了关键评判标准,如需要有明确定义的输入和输出;存在或能够创建大规模数据集;任务能提供明确的反馈,具有明确的目标和指标;任务不需要依靠复杂背景知识的长逻辑链;允许容错性,不需要的解决方案;功能不会出现快速变化;没有特别的灵巧性、身体技能或机动性要求等[8]。这些标准在我们进行教育人工智能应用设计时可以进行借鉴和参考。在问题定义与需求分析阶段,需要教育工作者和技术人员的共同参与。人工智能技术与教育应用场景是相辅相成的,需要综合考量和分析人工智能技术的成熟度与教育场景的复杂度。
2.教育数据收集与处理
以深度学习为核心的人工智能算法需要大规模数据进行训练才能得到更好效果,基础数据服务是教育人工智能应用和智能系统开发的支撑。教育数据服务的发展要推动建设教育数据资源库、标准测试数据集、基础数据平台,并构建科学高效的数据管理机制。教育大数据来源包括Web数据、云端数据、可穿戴设备传感器数据等多种来源的学生学习数据、行为数据、教学管理数据等。在教育数据的收集过程中,需要考虑以下问题:智能教育系统的实现需要哪些数据?数据的存储形式和介质是什么?获取数据的成本和难易度如何?数据是否覆盖了应用的大部分情境?数据是否具有较高的可信度?当前大部分教育数据还处于数据碎片化、规则模糊的阶段,教育数据的采集和处理还存在技术处理方式、管理机制不成熟等问题。
3.教育特征选择与构建
在人工智能领域,特征是指使用领域知识对原始数据进行分析,从中抽取和构建有效的信息应用于智能算法的设计。在机器学习中,特征对于整个机器学习模型至关重要,并且有时会确定其性能的上限。教育特征工程是将教育数据与人工智能连接在一起的桥梁,是保证人工智能模型是否与教育目标问题匹配的关键制约因素。教育特征的好坏也直接决定了教育智能系统算法的灵活性和效果。如Gardner等通过数据与文献分析等,给出了慕课研究中的教育特征类型,包括:学习活动、人口学特征、文本特征、社会化、认知特征等,在此基础上构建了慕课学习者成功性的预测模型[9]。
当前机器学习系统主要采用传统方法构建特征,通过个人的专业知识和经验构建的特征。一般来说,这是一个繁琐耗时且容易出错的过程,造成了效果和效?实木窒扌裕⑶揖榈木窒扌允沟媚岩晕げ饽勘耆范ㄗ罹叽硇缘奶卣鳌I疃妊凹跎倭硕允止ぬ卣鞴こ痰男枨螅诮逃斯ぶ悄苎芯恐杏τ迷嚼丛焦惴骸?/p>
4.教育智能系统模型构建
人工智能教育应用的核心目标是通过机器学习的方式建立人类学习的规则[10],也即构建有效的智能模型。人工智能模型的构建包括模型训练与模型评估。教育人工智能系统中的模型一般结合问题和数据,大多选择当前通用的、成熟的机器学习和深度学习模型。机器学习模型根据可使用的数据类型可分为监督学习和无监督学习两类。监督学习主要包括分类和回归,无监督学习主要包括数据聚类、数据降维等。常用的深度学习模型有卷积神经网络(CNN)、回归神经网络(RNN)、深度信念网络(DBN)等。在模型选择后进行模型的评估,对模型的效率、正确率等进行评价。一般使用与训练数据集进行模型训练,并用不同的测试数据集进行模型验证从而明确模型在现实系统中的表现,最终给出应用模型。
5.模型部署与应用
在智能模型确定后,将其部署到实际的教育应用场景中。模型部署将训练的模型持久化,提供REST服务接口、设备端SDK等部署方式。模型部署的方式由教育应用的实际需求决定,根据系统应用规模的大孝性能要求等来综合确定。部署成功的模型即可进入到教育应用过程。
(二)教育人工智能应用系统的问题分析
结合对教育人工智能系统设计中主要功能模块的分析,一个成功的教育人工智能系统需要高质量的教育数据支持,优秀的数据预处理;合适的特征构建,恰当的模型结构和功能;优秀的训练策略,严格的结果分析与灵活的应用部署等。当前教育人工智能系统设计开发中面临的主要困难还较多,造成了教育人工智能落地难、应用研究落后的现状。
1.技术层面:特征与模型构建问题
教育领域应用场景对教育特征的构建与模型构建带来具体的要求。通常情况下,特征工程是一项复杂耗时的工作,需要经过特征构建、特征选择、特征压缩等多个步骤,并需要应用者具有领域专业知识和数据分析能力。当前教育特征的构建工作主要还是由缺乏领域知识背景的技术人员完成,并且存在传统特征构建的效率低,可移植性差问题。在智能模型的构建与优化上,还没有系统的方法进行模型选择和参数调节,基本是依靠人工调试和选择,所构建的模型难以进行衡量与对比。
2.人员层面:人员与复杂度问题
教育人工智能系统的构建过程是一个相对复杂的过程,较高的技术门槛使得大量一线教师难以直接运用人工智能到实际教学场景中。并且人工智能不仅仅只是技术问题,更面临复杂的教育领域的业务问题,需要多领域专家团队的合作参与,包括教学专家,数据工程师,算法工程师等,但教育领域匮乏的人才难以与教育大数据的快速发展与人工智能应用的要求相匹配。
3.成本层面:成本与效率问题
当前,构建优良的教育智能系统通常需要较长的时间和较为昂贵的成本。智能系统对算法算力的要求,需要一定的成本进行软硬件设备的购买与维护。在效率方面,即使是有经验的人工智能专业人员,通常也需要花费大量时间来构建合适的智能模型。如果目标、特征或数据发生变化,则系统的设计还需要重新进行。在教育领域,由于缺少成熟应用,以及领域人员与技术人员的割裂性,所以在成本与效率方面面临着更严峻的问题。
四、基于自动化方法的教育人工智能应用系统设计
在教育领域评判一项技术的价值,除了能够有效提升学习效果和教育系统功能外,技术是否具有普适性也是重要的方面。人工智能的快速发展与人工智能实际应用中面临的矛盾,需要我们探索有效的方法解决设计与开发过程中面临的技术、人员、复杂性等问题,在人工智能的设计过程中引入自动化方法是一个有效的途径。
如何以智能来设计智能,如何利用已有的机器学习知识和算法使人工智能能够实现部分处理过程的自动化,从而自主搭建适合教育领域应用场景的系统模型,是教育人工智能应用系统值得探索的领域。
(一)基本思想
1.自动化
自动化的概念跟随时代也在发展,从最初的机器代替人完成操作或复杂的任务等体力工作,到进一步代替或辅助人的脑力劳动,以自动地完成特定的任务。在人工智能环境下,以智能训练智能,是自动化思想的新发展。自动化人工智能,如自动化机器学习和自动化深度学习,是将人工智能应用中需要专家人工参与的特征提娶模型选择、参数调节、优化评价等重要步骤进行自动化实现,使得智能模型无需人工干预即可被构建并具有超过人类专家的优势。这是自动化方法在软件工程和人工智能领域的应用和发展,是将人工智能算法应用于问题解决的自动化过程,是探索人工智能的一种新的研究方法[11][12]。
2.人工智能即服务
“人工智能即服务”由谷歌公司最早提出,其目标是将人工智能的解决方案和计算能力以云服务的形式提供,使云平台承载人工智能的软硬件资源。使用者无需购买维护高成本硬件设备,无需学习复杂的算法和技术即可创建和使用智能应用。人工智能即服务为自动化人工智能的设计模式提供方向,自动化人工智能是人工智能即服务的重要应用形式。两者的目标都是为了更有效的降低人工智能的门槛,提高人工智能应用的便利与效率。
(二)学习理论基础
1.学习圈理论
让机器产生智能进行自动化学习的过程与人类思考学习的过程类似。美国社会心理学家、教育家库伯的学习圈理论认为,人类的学习过程是由四个适应性学习阶段构成的环形结构,包括具体经验,反思性观察,抽象概念化和主动实践,即通过经验反思得出理论,再用理论指导行动,进一步从行动中归纳经验[13]。人们在学习的“经验、反思、启示和行动”中达到学习的螺旋式循环进步,获取知识。自动化人工智能方法借鉴了人类学习的思想,从经验的升华和理论化中去获取知识,如图4所示。其中“具体经验”对应获得教育数据,自动构建教育特征;“反思观察”是智能模型训练的过程,形成的“抽象概念”是模型的构建,进行“实验和实践”则是模型应用的过程。自动化人工智能方法遵循了人类学习的基本规律,将人的思考学习过程应用于智能系统的流程设计。通过收集行为数据,得到反馈数据并自动构建特征,进行模型的自动化训练,然后将模型应用,模型应用后又可以收集数据,开始新的学习。
2.元学习
元学习起源于认知科学领域,比格斯(1985)将元学习定义为“意识到并控制自己的学习”[14]。在人类的学习中,每次学习无论成功失败,我们都收获一定的经验。人类之所以能够快速学习的关键是人类具备学会学习的能力,能够充分的利用以往的知识经验来指导新任务的学习。在构建自动化智能系统时,也应该考虑充分利用已有的每一次的学习经验,逐步改进,提升系统的有效性。在人工智能领域借鉴元学习的思想,使机器学习或深度学习算法“学会如何学习”,目标是设计出灵活的机器学习模型,它可以基于过去的经验与知识,通过少量的训练样本快速学会新概念和技能。元学习使机器具有学会学习的能力,从而在面对新的任务时,可以利用已有的知识来加速人工智能的学习速度。
(三)基于自动化方法的设计模型
1.模型结构
基于学习理论和自动化思想支持,我们设计新的教育人工智能应用系统模型如图5所示。在模型中,在教育业务领域只需要给出明确的教育需求,将教育数据提交到基于云端的自动化处理模块,即可完成数据清理、特征构建、模型构建、评估与优化的过程。这个过程对用户是透明的,由系统自动完成,并将得出的最优化模型应用提供给用户。
使用自动化模型方法,在教育领域,只需关注教育需求,给出教育数据,中间的过程由自动化过程处理。其中,自动化特征工程改进了传统手工特征工程的标准流程,从数据中自动构建新的候选特征,并选择的特征进行模型的训练,使得模型可以有最优的表现。这不仅减少了特征工程所花费的时间,还可以根据数据特征进行自动组合,有效解决了人为组合特征不全面问题,创建了可解释的特征,并且比手动特征工程更高效,可重复性更高。自动化模型构建可以基于数据集与自动化特征工程构建的特征,选择适用于该数据集的模型,对多个模型进行自动训练和调整,并对训练后的模型进行评估,输出效果的模型,从而实现人工智能工作的流程自动化。
自动化人工智能处理的整个过程,从导入数据到模型训练,可以通过拖放式交互界面完成。这种易用性、便捷性有效扩展了教育人工智能的应用场景和范围,使普通教育者也可以用人工智能技术解决现实中的教育问题,为缺少专业技术知识的人员快速的构建人工智能应用提供了有效途径。同时也有效缩短了智能应用的开发周期,推动教育人工智能应用的快速开发与迭代。
2.自动化人工智能平台
自动化人工智能平台是自动化系统的核心部分,目前正处于建设和发展阶段。在教育人工智能的研发过程中,选择适当的自动化平台进行系统设计与开发是有效提升教育产品研发效率和扩展教育产品功能模块的方式。当前自动化平台主要有两类,一类是主要科技公司提供的自动化平台支持,另一类为开源自动化平台。这些平台具有不同的特点,如表1所示。
在教育领域中自动化平台选用的标准应首先要遵循人工智能开发的普适原则,包括公平、可靠、安全、隐私、透明、责任等,在此基础上从教育系统的特点出发,考虑以下应用原则。
(1)服务于教育目标的整体性规划。教育人工智能系统的设计是一项系统工程,在进行自动化平台应用时,应从教育人工智能系统的整体设计角度出发。自动化平台是整个系统的一个组成部分,要在教育系统功能的问题分析与目标分析上,从教学角度、功能角度、技术角度、环境角度等方面进行综合考量,服务于教育目标,服务于教育应用的整体环境。
(2)服务于功能性的多维度分析。在自动化方法应用上,需要进行充分的调研分析,明确系统的功能模块。可优先选用现有成熟的技术模块进行教育功能的实现,并兼顾技术的成熟性和前瞻性。在扩展性上,可选用开源技术以保证后期的持续性。在界面支持上,可选用适当的可视化支持与交互支持。在标准化方面,尽量兼顾到教育系统标准、学习标准、平台标准等标准规范。
五、案例应用研究
(一)研究背景分析
慕课的应用产生了海量数据,为学习分析与人工智能研究提供了大数据基矗在慕课系统中,论坛数据中包含了大量的学习者学习过程、学习评价和学习体验数据,是一种典型的文本类教育大数据。对论坛数据进行分析将为慕课教学和管理提供有效的支持。吴林静等提出了慕课评论的语义分析模型,将慕课评论分为内容相关类、情感相关类和其他类[15]。Liu等提出了一个非监督模型,通过对论坛文本数据的挖掘,分析了学习者关注的论坛主题及学习者在学习过程中的情感状态[16]。Lan等使用概率模型对慕课论坛中的主题进行了建模研究[17]。这些研究对于论坛数据的处理是通过机器学习或深度学习算法实现与分析,需要具有一定的技术基础,由慕课教师和技术人员的合作完成。
本文作者担任了FutureLearn慕课平台的课程主讲教师和助教。在课程过程中,教师与助教与全球来自多个国家的慕课学习者进行了丰富的论坛互动,积累了大量的论坛文本数据。来自教师的实际需求是获得论坛文本内容所要表达的主题类别,以更好地对论坛文本进行内容理解和及时响应。本文在此背景下,我们探索使用自动化人工智能方法构建论坛文本的自动分类模型,进行慕课领域的实践应用。
(二)研究过程
文本分类是人工智能领域中自然语言处理的典型任务,目标是通过算法将文本映射到预先给定的某一类别或某几类别主题。本研究过程分为文本数据标注、自动化模型构建和应用部署等主要步骤。其中文本分类通过自动化深度学习方法实现,只需提交标注的论坛文本,即可通过自动化处理得到分类模型进行应用。
首先,文本数据标注由教师和和助教完成。由于教师和助教参与了讨论区互动的全部过程,对论坛内容文本标注具有高准确性。教师和助教两人独立进行了类别标注,并进行了最后统一。论坛文本分为了四个标注分类:课程问题、内容目标、学习评价和个人感触。
在分类模型构建上,研究选取了EasyDL平台进行模型的自动化处理。在平台的选用过程中,我们重点考虑了功能性、可视化、交互性的需求。EasyDL是一个专门针对深度学习模型训练与发布的平台,具有可视化界面、训练时间高效等优势。本次课程论坛数据共约5000条,将其中80%作为模型设计中的训练集,10%作为模型设计中的验证集,10%作为模型评估数据集。将训练数据提供给EasyDL进行了模型训练,通过测试集对于模型的验证取得了较好的效果。主要评价指标表现为:分类精度(Precision)78.6%,分类准确率(Accuracy)80.1%,分类召回率(Recall)77.4%和分类F值(F1-Score)76.2%。在对模型进行验证后,使用平台提供的API进行部署和应用。
(三)总结分析
本研究进行了一个基于自动化方法的教育应用探索,使教育应用更多的聚焦于教育需求,教师在智能应用中发挥着重要的作用。在本项任务的解决中,教师的主要工作为任务需求分析,数据分类标注。而系统中的特征构建、文本分类模型等借助自动化平台完成,这些对教师是透明的。自动化技术方案的使用,提高了系统开发的效率。流程的简化和图形化的界面,降低了建立分类预测模型所需的技术门槛,专业化平台的模型构建效果通常也优于自建模型,在自动化,可解释性,互动性,可导出等方面具有明显的优势。教师在了解基本步骤后,即可自行完成案例分析的实现,并可在后续的相关任务中应用。
我们本次对慕课评论的分类研究在进行分类标注时,仅从内容层面进行了标注,还没有从情感分类的角度进行细化。慕课论坛的发帖中蕴含着学习者对课程的看法、态度或观点,是学习者个人情感的表达和体现。下一步的研究将深入到情感分类的研究。
我们在平台选型上选择了可视化、交互功能较好的科技公司平台,在后期的研究和实践中,可以更多的从开源框架的角度展开,从而更好地促进教育应用的可扩展性。另外平台提供的部署方式是Restful API接口,在未来的应用中,如果教育系统需要更多的部署方式,则需要在平台选型时进行综合的考虑。
六、总结与建议
(一)价值分析
当前人工智能技术在推广到教育领域的普适应用时还面临着技术、人员等多方面的困难,自动化方法以低门槛的交互界面降低了技术应用门槛,以特征与模型的自动构建提升了系统设计效率和性能,对教育领域具有积极的价值。
1.教育人工智能落地应用的有效方法。通过自动化方法,可以降低人工智能产品的技术应用门槛。我们可以更集中关注教育的需求,而数据预处理、特征工程、模型选择、参数调节等交由自动化实现。借助自动化服务提供的交互式可视化界面,自动化地为新的教育应用场景开发机器学习模型,便利的设计开发教育人工智能应用。我们可以更多地关注问题而不是模型,使用人工智能解决现实世界中更多的教育问题。
2.加快教育人工智能系统的开发与更新效率。自动化方法通过自动实现特征工程、模型构建等任务,在提高性能的同时有效的提高了效率。普通的人工智能项目在进行特征构建、模型构建过程中,常需要专家耗费较多的时间,采用自动化方法,时间和效率可以得到量级上的提高。自动化方法还可以实现算法的自我更新和自我适应,从而达到人工智能产品真正的智能化和个性化。
3.促进智能教育生态系统构建。人工智能正在与教育深度融合,有望引领教育的系统性变革。构建我国面向智能时代的教育生态体系与新一代人工智能开放创新平台势在必行。自动化方法实现了教育流程化,有助于促进人工智能技术在教学、评价、管理等环节实现全方位、立体化的智能应用。通过平台助力,低成本、快速、可靠地衍生出适合更多适合教育的场景化应用,服务于教育生态系统的整体环境,构建“共生、互生、创生”的智慧教育多元化新生态。
(二)发展建议
1.关注自动化人工智能方法,熟悉主要平台和框架。自动化人工智能方法是人工智能迈向工业化大生产之间的重要环节。任何事物在当前时代的成功与普及,必然需要大规模生产的过程,即标准化、模块化、自动化。自动化方法已经成为人工智能研究与应用的重要思路,但当前教育领域的关注和应用还不足,教育界与产业界的壁垒还始终存在。结合自动化人工智能平台、软件包和自动化工具来实现教育人工智能的具体应用是推动教育人工智能发展的有效途径。对于教育领域研究者和实践者,关注、学习这种方法,掌握主要自动化人工智能平台与框架,有助于促进和推动教育人工智能真正从理论到应用。
2.提出自动化人工智能应用的有效指导方法与路径。当前教育人工智能还存在偏理论讨论,少实践应用的现象。自动化方法为推动教育人工智能的应用提供了方向。结合教育场景、教育需求,进行智能教育应用的实践应成为下一步研究的重点。成本、准确度、易用性、效率等都影响着人工智能能否落地融入教育场景中。我们在此次实践中发现,在自动化人工智能教育应用的过程中,如应用的设计、平台的选择等环节,还缺少教育场景下有价值的参考资源。如我们在平台的选型上,就付出了较多的时间和对比。因此,在教育领域中给出一个自动化人工智能方法应用的指导性手册、应用方法或路径,我们认为是必要且有价值的。通过制定科学、有效、务实的应用路径,促进创新的智能技术的教育应用。
参考文献:
[1] 杨现民,张昊等.教育人工智能的发展难题与突破路径[J].现代远程教育研究,2018,(3):30-38.
[2] 徐晔.从“人工智能教育”走向“教育人工智能”的路径探究[J].中国电化教育,2018,(12):81-87.
[3] NMC and EDUCAUSE.2017 Horizon Report [EB/OL]https://library.educause.edu/resources/2017/2/2017-horizon-report,2019-11-05.
[4] EDUCAUSE.2018 Horizon Report [EB/OL].https://library.educause.edu/resources/2018/8/2018-nmc-horizon-report,2019-11-05.
[5] EDUCAUSE.2019 Horizon Report [EB/OL].https://library.educause.edu/resources/2019/4/2019-horizon-report,2019-11-05.
[6] Lee K M,Yoo J,Kim S-W,et al.Autonomic machine learning platform [J].International Journal of Information Management,2019,49:491-501.
[7] 宋灵青,许林.人工智能教育应用的逻辑起点与边界以知识学习为例[J].中国电化教育,2019,(6):14-20.
[8] Brynjolfsson E,Mitchell T.What can machine learning do? Workforce implications [J].Science,2017,358(6370):1530-1534.
[9] Gardner J,Brooks C.Student success prediction in MOOCs [J].User Modeling and User-Adapted Interaction,2018,28(2):127-203.
[10] 郑勤华,熊潞颖等.任重道远:人工智能教育应用的困境与突破[J].开放教育研究,2019,25(4):10-17.
[11] Hutter F,Kotthoff L,et al.Automated Machine Learning:Methods,Systems,Challenges [M].Switzerland:Springer,2019.
[12] 王健宗,瞿晓阳.深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台[M].北京:机械工业出版社,2019.
[13] 库伯.王灿明,朱水萍译.体验学习让体验成为学习与发展的源泉[M].上海:华东师范大学出版社,2008.
[14] BIGGS J B.The role of meta learning in the study process [J].British Journal of Educational Psychology,1985,55(3):185-212.
[15] 吴林静,刘清堂等.大数据视角下的慕课评论语义分析模型及应用研究[J].电化教育研究,2017,38(11):43-48.
[16] Liu Z,Yang C,et al.Temporal emotion-aspect modeling for discovering what students are concerned about in online course forums [J].Interactive Learning Environments,2019,27(5):598-627.
[17] Lan A S,Spencer J C,et al.Personalized Thread Recommendation for MOOC Discussion Forums [A].Joint European Conference on Machine Learning and Knowledge Discovery in Databases [C].Cham:Springer,2018.725-740.
作者简介: