1、谈大数据的重要前提:先区分分体制内和体制外
今天和大家分享的主题是“教育领域的大数据应用”。在正式开始之前,想先和大家分享几个观点或者说事实。按照年龄的划分规则,我们一般把0-6作为一个阶段,小学到高中作为一个时段,成为K12,高中毕业之后作为一个时段。按照时间是一种划分,按照商业模式可以划分的更细。但是最重要的划分,按照中国特色,其实是体制内和体制外的划分,也就是我们常说的教育行业vs培训行业。其实这是两个不同的领域。在不同的领域里,数据运用的基础、现状和未来发展方向,都不尽相同,后面会展开说。
2、方法论:大数据的“场景”和“流程”
除了补充一下领域划分的背景,还需要探讨一下“场景”和“流程”这两个最基础的问题。流程其实很简单,就像把大象装进冰箱一样,分三步:
1.数据的获取(含数据整理和存储)
2.数据的分析
3.数据的呈现
每个步骤,在不同的场景下,都是不一样的。所以,这个事情挺复杂的,我试图尽量梳理清楚,但是有可能还是会显得零碎,等我讨论完一个章节之后,会给大家留交流的时间,到时候咱们再统一回答问题。
3、公办体制内K12无大数据可言
如果我们把场景设定在 1、公办 , 2、k12这个领域,那么可以说没啥大数据可言,甚至连基础数据都成问题。因为,在这个场景中,很少产生数据。我一开始准备分享的时候,做了一份提纲:
1.教育领域的原有数据模式简析
国家教育统计年鉴
各地市州的教育局
各个高校数据
国家教育研究机构的数据
2.对“官办教育体系”原有数据体系的一些点评
活性差:时间、粒度粗、没人用、体系不通,数据孤岛严重。原有的官办数据并不是“学习”数据,而是“教学”管理数据。在这个领域的数据,即无法保持“在线”,又缺少“活性”,最后,除了给领导做报告,教育部里做“规划”之外,很少有其他直接提升教学本身应用的有效数据。如果从这个角度来说,整个中国教育领域,其实是远没有IT化的,也就更谈不到互联网化。信息孤岛严重,各部门数据割裂严重。当然,现在也有一些有益的尝试,我举几个例子:
中小学生学籍卡管理系统:
这就是很大的一个工程。最早是上海在推,然后是北京推的,后来全国其他各大城市陆续上马。这个学籍卡基本上解决了中小学生转校时,成绩、学籍管理的问题。大家小时候每学期都要拿个小红本,让老师写评语吧。现在很多地方,这个已经电子化了,就算你转学走了,你的考试成绩和评语会被带着走。这对教育领域来说是个很大的进步。尽管在其它行业看起来这没啥难度。
这个小例子,就当做课前秀吧。基本上说明了现在教育领域的数据应用现状。我们最大一个数量的学习者,都被困在数字禁区,有些初高中为了保证成绩,是禁止孩子们用手机等电子设备的。
在这个领域想做出成果,首先还是要体制发生改变。当然,在体制不变的情况下,也有了不少有益的尝试。首先是刚才说的教育管理数据,这部分数据是由上层主管机构在推动的。
和学生学习相关的数据:
从刚才说的三点:获取、分析、呈现,这三个角度来说。获取的手段现在有所突破,主要的技术是各种传感器整合,有点像物联网,做成系统集成方案就叫“智慧教室”现在非常热的一个方向。
理论上说,未来的智慧教室,不但能从物理的角度方便大家自动分组——对应协作式学习,自动展示——翻转课堂。其实也就是桌椅板凳组合灵活,电子显示灵活等等,有点工程学的意味。除了这个,最重要的就是各种自从传感器记录学生的行为,并实时分析。
现在台湾有个教授研究的智能椅垫就比较有意思,学生坐在这个垫子上,就会自动记录他的压力分布,从而分析出他是否注意力集中等等。这是一个具体的应用,剩下还在研究的比如和模式识别相关的,通过摄像头和传感器的实施分析,捕捉每个孩子的学习状态。这些数据的分析,就涉及到我研究的课题:学习分析学了。
继续说数据获取这块,尤其是学习数据获取:
其实智慧教室获得的数据更多是生理数据,而真正的学习交互数据,更多的靠电子教材,电子题库等等。在这方面,苹果的研究已经很成功了。基于ipad的教学小组授课越来越多。我们北师大和人大附中的西山分校就曾经搞过一个苹果实验班。课件直接灌到ipad里,用小车放门口,孩子们进门的时候人手拿一个,现在还只存在教材上。未来如果把 考试、练习,这两个环节打通,把 考 学练,三点一线串起来,那么这个设备对数据的获取和呈现就很棒了。
智慧教室的成本目前来说还可以承受,硬件成本其实不高,但是系统集成成本高。设备都是原有哪些,比如电子白板,pad等。未来发展上,方向上是继智慧教室、电子教材之后,最后一点未来应用是可穿戴设备。
4、数据分析
说完了数据的获取,咱们再说说数据的分析。
现在学习分析学非常热,其实原理和Netflix生产纸牌屋差不多。对停留时间,反复程度做个简单分析,基本上就能定位一个学习难点。在这里我补充一点学习分析的“场景”依然很重要还是从“考学练”三字经上说,考试,这个场景是最准确的。学习分析学很热,但是没啥新东西,基本的就是BI以前用过的技术,还有语义分析,机器学习等等。大家都比较了解。但是他不同的是背后的学习心理学支撑,以及我刚才说的,“场景”,不同的场景,分析时参数设定也不同。
5、数据呈现
呈现这里面最重要的课题是“自适应学习”。其实这是和上面的学习分析学一脉相承的,也是就说,后台分析出来你那块需要加强,那么考学练配套的部分也就自动加强。
考:
这一部分还是最容易的,其实之前很多地方已经有这种技术,托福考试的机考某种程度上说也是自适应调整。
练:
根据之前的数据积累,以及对上一道题的分析,出下一道题。
学:
最难,涉及到学生综合素质评测的问题,是个综合结果。
6、评测系统
评测系统,目前的难点是数据收集,就像我说的,其实我们并不知道在课堂上发生了什么。目前来看,做考试类大数据应用和设备是最靠谱的。练习其次,学习最难,基本不靠谱。
7.体制外的大数据-K12碰不得。
接下来和大家说说体制外,也就是培训市场的。这里做的最好的是互联网教育机构。他们天生有数据基因,但是从投资人的角度来说,我看“培训”,注意,从这里开始,我都用“培训”二字。培训产业有几个比较确定的判断:
k12碰不得:因为孩子们根本没时间用各种互联网学习平台和学习app。这个领域,搞教育是会比较惨的,但是搞学习服务会比较成功。尤其是本质是“中介”这种商业模式的应用,都会很成功。从数据这个角度看培训行业,我们认为只有 2C 才有前途,做2B的只能“呵呵”了,做平台的更是打死也做不过BAT,可以洗洗睡了。所以又衍生了一个结论2B不投。
8、从学术角度,未来大数据在教育领域的几个方向及其判断
数据的收集:
——终端设备的应用、智慧教室、电子书包/电子教材、电子题库/自适应诊断 (学考练-打通——连通主义学习理论)、
数据的分析:
学习分析学、机器学习技术、文本语义技术
大数据聚类数据的呈现:
学生评价体系、练习、考试
9、从教学管理的角度-细分领域的大数据突破方向
幼教及低领儿童:
主要表现为家校互动
K12:
学校教学管理及教师管理:目标:将优秀教师的教学能力数字化后,得以复制和推广。远程教育解决偏远地区师资问题。
高等教育:
远程化,mooc化,优秀的人才向最优秀的教学资源剧集(低龄阶段教育的主要目标是公平,高教阶段教育的主要目标是质量)
职业教育:
贯通,定制化,一定是用人单位定制化管理教学。
其他中介性质教育:
如留学中介业务——携程化,管理模式是鼠标加水泥。
10.从产业角度,国内大数据现状
数据化程度低,各阶段发展不平衡,利益主体多元,复杂未来趋势。对中国来讲,先IT化,后互联网化,整体慢慢改,局部可突破。 难点:体制破局、教师改造。国外教育培训行业中数据技术应用的现状,基本面临同样的问题。最终动力只能依靠学习者本身的需求和习惯养成,以及新技术带来的真正便利。
11、大数据的机会点
从数据这个角度看,哪些点有机会呢?
020:
线下有实体,线上有2C的应用或者网站,尤其是这两条线还能产生某种形式的互动的话,“那是极好滴”。按照时间轴来分,幼教领域的培训业务,尤其是和数据相关的,并不多,这块其实最重要的是hold住家长。从培训角度说,幼教是有半径的,小孩子只能就近学习,再优质的资源也没办法,那他们的数据,只能通过线上这一块,由家长和学校互动。目前,A股上市的全通教育,主营业务“家校通”做的其实就是类似的生意,只不过他没做幼教,但是这个模式是成立的,他们平台上的数据,就非常有价值。目前我们还没有在幼教这块看到数据资产特别有价值的投资对象。但是,我坚信这块肯定会出来某个公司,而且他们一定是个纯线上的公司,同时是个“重数据”公司。 k12我说了不看了,但是对于课外辅导和培训来说,优质内容还是非常重要的。
在这里,大数据其实有两个切入点,一个是优质课程,一个是模拟考试。考试部分说过了,课程部分我想在这里说。优质的k12辅导课程,必须是和原有课堂学习不一样的。
我们现在犯得很多错误,是因为我们在照搬以前的经验,而互联网的出现,恰恰是要做出点颠覆性的东西出来,课程,这个领域是我们能遇见到的,最慢变化的领域。
高等教育、职业教育:
在这些领域,我认为职业教育最有可能成长起来,一是他有先天的付费基础,二是用户天生有在线能力。最近复兴资本投了慧科教育(开课吧)2000万美金的A轮,我觉得这个deal是明智的。他们主打泛IT,而且线下根基稳020基础好,同时线上做的很棒,可以说基本符合了我刚才说的选公司标准。而且这样的公司,他们的数据是非常有价值的。对一个客户的深度开发,会带来后端不断的续费。续单率高,持续收获,多种经营,这样的生意前端就可以玩互联网最擅长的免费,而后考后端赚钱。不管慧科未来会不会成功,这种商业模式的逻辑是成立的。
最后总结一下,在培训这个领域,数据资产,或者说大数据方法,比在教育领域要更有生命力。培训更市场化,也更容易被互联网化,因此也就更容易被数据化。但是反过来,在公办教育领域,机会也是巨大的,这个机会是教育管理的IT化机会,很多不懂教育的厂家会在这波浪潮里面起来,因为他们懂管理。
12、互动内容Q&A:
Q:您认为EDX模式,或苹果公司“iTunesU”、iBookstore系统会颠覆学校吗?
A:我不认为单一的技术会颠覆学校,其实ibookstore本身正是适应学校教学的产物,他不过是教材的电子化和2.0版本,还不是颠覆。颠覆教育的一定是从教学方法开始,从根基动摇。
Q:能不能说一下K12考试测试这部分,我觉得这个市场还是很大的。做好学校工作的话,o2o很现实.
A:我先回答冯达兄弟的问题。这是很好的问题,这块市场也超级大。但是有一个很严重的问题是标准。一旦涉及到考试,标准化是最重要的问题,k12领域的教材有多少,大家猜一下广东和广西的教材都不一样。因此,其实k12不存在标准化考试,这是个很头疼的问题,这个问题最早遇到的是好未来,也就是学而思。
Q:我目前觉得猿题库的思路很对,但是它渠道不对。
A:在没有互联网的时候,他们就想考教辅和教材来统一市场,结果,没做到。他们在线下都没做到的事情,我们在线上,一样做不到。回答完毕。补充最后一点,单一学科有可能突破。尤其是数学。因为他产品可以做的最标准化。
Q:投资教育大数据系统能否解决孩子课业负担重的问题,感觉学校这种填鸭式教育很悲催,学习源于情趣引导,或如何解决因人施教?
A:中国教育,一定是先释放制度红利,再释放技术红利。现在的中国教育,类比一下,还在改革开放前,这个时候需要的是邓小平这样的人物,通过体制改革,释放生产力。在这个方向,我坚定不移的相信,现在的美国,就是未来的中国。未来最好的教育,一定是私立教育机构提供的。石家庄有家企业,精英教育集团,就基本上具有了这种雏形,从幼儿园到大学,一手做了起来,而且都非常成功。我觉得私立办学的体制问题解决之后,真正的素质教育才能迎来春天。
Q:纯在线的职业教育怎么看,职业教育面向大学生,面向在职的,又分别怎么看?
A:职业教育我看好在职的培训,很简单,有钱,尤其是,按系统来分的话,我看好金融系统的在职培训。推荐易欢欢师兄开一个互联网金融班,肯定赚钱。在校生培训,最好解决消费者付费能力问题,具体可以参考 ATA 和 宜信 的互动,付费能力不解决,客单价上不去,真的做的太辛苦。大规模开放在线课堂平台,只会加剧教育向优质资源的集中。举个例子,哈佛大学最牛的模式识别课程在moocs上完成学业的都不是哈佛的学生,这些学生是来自全世界的牛人,之前只有哈佛的学生能听的课,他们现在可以听。如果花同样的时间,你可以学习哈佛和清华的课程,你选听谁的?所以我觉得moocs就像高铁,他没有从本质上改变铁路这种业态,但是他的确的改变了这个行业的面貌。
Q:教育就是投资于人才。就像mba,如果把4年的学费做投资,以后分红?
A:现在有金融机构是这么做的,只是这种模式一般要衔接后端的职业介绍,发展空间有限。最近上市的达内,就是这种模式的典范。
Q:从技术角度看,游戏化,可视化,分享,是可以有作为的,其作为点是“消除或者降低学习的痛苦”。
A:是的,游戏化学习是一个很重要的研究方向,但是最近一直难有突破,因为从哲学上来讲,这是矛盾的。最近的游戏学习基本变成了游戏式考试。也就是说基本上是在考试的形式上做文章。还没有特别触及“学习” 从学术角度来讲,根据布鲁姆的学习理论。1956年,本杰明·布鲁姆发表文章《教育目标分类:认知领域》,认为思维有六种级别。识记:对具体事实的记忆;领会:把握知识材料的意义,对事实进行组织,从而搞清事物的意思;应用:应用信息和规则去解决问题或理解事物的本质;分析:把复杂的知识整体分解,并理解各部分之间联系,解释因果关系,理解事物的本质;综合:发现事物之间的相互关系和联系,从而创建新的思想和预测可能的结果;评价:根据标准评判或选择其他办法。自此之后,这六种思维级别被广泛接受和使用。他给出的认知技能列表,是按照从最简单到最复杂的顺序排列的。最简单的认知技能是对知识的回忆,最复杂的认知技能是对观点的价值作出判断。越核心越本质,也就越难用工具触及。所以,从投资来讲,我们只看做游戏化考试的,比如最近很热的百词斩,我就很看好识记:对具体事实的记忆;——这是最浅的能力所以比较好工具化。
CIO之家 www.ciozj.com 公众号:imciow