《大数据实践课》开创实践教学新模式:清华大数据能力提升项目特色课程系列报道之一

《大数据实践课》开创实践教学新模式:清华大数据能力提升项目特色课程系列报道之一

清华大学数据科学研究院2017年10月27日

2014年4月,清华大学顺应时代潮流成为全国第一批成立大数据研究机构的高等学府。四年来,清华-青岛数据科学研究院(以下简称:数据院)与研究生院共同设计组织实施了以大数据能力提升项目为主的大数据人才培养体系。
清华大学大数据能力提升项目在“学校统筹,问题引导”的指导原则下,形成大数据思维与技能、跨界学习、实操应用相结合的课程体系,重点培养具有大数据思维和应用创新的“π”型人才。2017年7月,第一批129名清华大数据毕业生刚进入就业市场就被微软、亚马逊、BAT等互联网巨头“争相哄抢”。为何清华大数据人才如此炙手可热?数据院有独家特色教育“秘方”。
以问题为导向,教会学生用数据解决实际问题
《大数据实践课》是大数据能力提升项目中的精品特色课程之一。不同于传统的教学模式,该实践课将来自不同行业的数据资源应用于实践教学,让学生接触真实的数据,解决实际需求。同时开创从数据提供企业聘请企业导师,和课程授课老师团队共同指导课程的教学模式。
2017年夏季学期大数据实践课上,数据院共征集数据资源及企业实际需求共46项。同学结合自己学科背景和兴趣点,交叉混合组队,其中12个项目被选中作为本次实践课的实践项目,涉及经济金融、交通、工业、法律、医疗、营销、公共管理等多个行业。

以“大数据风控”项目为例,来自不同学科背景的五个同学组成一队,有的担任“产品经理”,有的出任“技术人员”,还有的负责行业研究与可视化。在三周的时间里,小组成员以项目制高效协作,梳理了公司的司法、工商、舆情、招聘信息等文本数据,通过数据清洗、文本处理、大数据建模等手段得出一套评价企业综合信用的模型体系。

以应用为抓手,汇聚高水平行业专家 

大数据能力提升项目拥有高水平的校内外导师队伍,其中包括40余位来自于校内不同院系的大数据技术与应用领域的院士、教授及专家学者,他们提供权威的学术和技术指导。同时,还包括20余位自国内外大数据领域知名企业和政府部门的行业专家,他们为大数据人才培养提供丰富的行业和实践经验指导。
课程要求学生们每周进行项目进度汇报并进行组内讨论、导师点评和互评。在结课时,每个项目小组需要在全班同学、校内导师和全部企业导师面前作现场结题答辩。导师们将从实践落地程度、与业务部门的沟通、技术实现能力等维度评价学生作业,为每一个项目打分,分数计入实践课程总成绩。
“这三个学分不好拿。《大数据实践课》是大数据能力提升项目的最后一门课,考核学生的综合素质。所有的数据来自真实场景,提出的问题是实际需求。学生们需要充分沟通了解需求,了解数据背后所隐藏的涵义,需要用数据思维来解决问题。同时,学生来自不同院系交叉混合,考验团队合作与沟通协作能力。最后如何通过可视化把成果展示给导师们,考验大家技术实现能力”,数据院教学组罗国荣老师表示。
 以效用为标准,实践项目解决行业真实痛点 

“学生用三周时间解决了我们一年来的困惑”,来自北京创智信科科技有限公司的企业导师胡继业感慨道。他指导的是“基站蓄电池大数据分析”项目,该公司之前是通过人工测评基站蓄电池充放曲线。此方法效率较低、标准难以掌握,并且难以处理急剧增加的业务需求,这是公司的痛点所在。将蓄电池的使用状态利用大数据技术进行采集、分析和可视化实时呈现,是该公司迫在眉睫的工作重点,为此公司团队已奋斗一年之久。
抱着试一试的心态,胡导师带着这个行业痛点和蓄电池数据加入了《大数据实践课》项目。张维、杨经纬等六位同学组成的项目团队通过对基站蓄电池充放电数据的技术处理,利用机器学习的方法实现了蓄电池鼓掌监测的自动化。胡继业说:“同学通过数据建模实现了蓄电池功能曲线阶段划分98%的正确率、故障识别92%的正确率。这个成绩可以说是非常优秀的。”更令人欣喜的是,在项目中学生们开发的模型准确预测了2017年7月湖南暴雨引起的基站供电中断,有效避免了企业损失。

联手校级实践基地,三地同步开展实践课程 
《大数据实践课》广泛与清华大学校级实践基地合作。2017年大数据实践课上,青岛、上海和北京三地同步开展实践,取得了可喜成果。
清华大学校级实践基地——中车青岛四方机车车辆股份有限公司,作为国家高新技术企业,拥有国家高速动车组总成工程技术研究中心拥有世界顶尖的工业制造水平,以及丰富的机车产品数量,机车产品下线运营积累的大量数据,给清华学子提供了优质的实践条件。由中车青岛四方检修服务事业部的企业导师吴臻易带队,与朱思南等同学组成的《动车组车载运行数据分析研究》小组,在暑期深入实践基地,接触了现有动车组故障诊断系统,基于地面检修中心常年积累下来的历史数据,利用数据分析、机器学习等技术优化了现有故障系统多采用人工设置经验式预警、报警逻辑,对某些特定故障是否发生做出更加合理、精确的判断。
由高润智、吴璐芸等5人组成的学生团队奔赴上海,在上海万得信息技术股份有限公司深入了解金融大数据相关业务。他们通过技术指标分析、算法设计、买卖点预测模型和买卖点匹配模型的构建,将证券股票神经网络涨跌预测模型的准确率由之前的不到50%,提高到了64.58%,上升了约14个百分点,大大增强了公司投资决策的精准度和有效性。

《大数据实践课》学生深入北京、上海、青岛等项目提供方参与实际工作

收获满满,老师与学生高度评价 
《大数据实践课》的授课老师徐葳总结道:“数据科学天生就是一个交叉学科,而且是个对于实践要求极高的科目。这对任何一名授课老师都是挑战。”针对于学生普遍的解决问题能力强、识别问题能力弱的特点,我们在整个大数据能力提升项目的尾端引入《大数据实践课》,就是为了用实践经验武装学科基础已经很扎实的学生,系统地接受项目训练,让他们从实践和数据中发现问题、解决问题。这些技能是学生们走出校园后马上将会接受考验的。

“通过实践课,我深刻地体会到光有技术是不够的,我们对数据的研究必须结合需求,才能最终发挥效果。我想这才是大数据实践课的真正目的”,参与大数据实践课的学生张维在实践总结中写道,“同学们日常在学校接触企业真实数据太难了。大数据实践课让我们亲身参与到企业的真实项目中,使用一手数据、感受真实的工作环境。这对我们的技术能力和职业素养的提升都带来了很大的帮助。”