2
点赞
0
评论
0
转载
我要入驻

【转载】新时代数字人才培养的底层逻辑和顶层设计 | CCCF精选

收录于合集: # 学术快讯

转载来源:中国计算机学会

在全国教育大会召开一周年之际,中央教育工作领导小组于2025年8月28日印发《高等教育学科专业设置调整优化行动方案(2025—2027年)》(简称“行动方案”),这是落实国家领导人在大会上提出的建设教育强国任务的重要举措,也是我国实施新的学科专业目录管理办法以来的具体行动。行动方案特别强调要开展急需学科专业的超常布局以及新兴学科和交叉学科的孵化。瞄准战略性新兴产业和未来产业,快速布局一批学科专业点;选准基础扎实和具有明显优势的方向,布局建设一批示范性学科交叉中心。

为贯彻中央教育领导小组的工作部署,国家数据局会同教育部、国家发展改革委和科技部等计划于2025年11月发布《关于加强数据要素学科专业建设和数字人才队伍建设的意见》。文件明确提出,数据要素学科专业建设和数字人才队伍建设(简称“两个建设”)在深化数据要素市场化配置改革、推动人工智能高质量发展中具有重大意义,是统筹推进数字中国、数字经济、数字社会规划和建设的重要基础工程。

笔者所在的华东师范大学是国内较早全面探索“数据科学与工程”学科专业建设和人才培养的单位。2013年9月,华东师范大学成立数据科学与工程研究院,率先开展了数据科学与工程的学科建设和硕士/博士研究生培养。起初,该学科作为软件工程一级学科下的二级学科,2022年经学校自主审核,升级为一级学科并纳入交叉学科门类。2016年9月,数据科学与工程研究院改制成数据科学与工程学院,随后招收了第一届数据科学与工程专业的本科生,这届本科生已于2020年毕业,迄今为止学院已经培养了6届本科生和10届研究生。经过十多年的实践和思考,特别是在国家人工智能相关行动计划、数字化转型和数字经济战略的推动下,我们更加坚定持续开展数据科学与工程学科专业建设和人才培养探索的信心。我们坚信,重视数据要素学科建设和数字人才队伍建设,既符合世界科技、经济和社会发展趋势,也是实现中华民族伟大复兴的迫切需求。

在本文中,笔者将结合对行动方案和两个建设意见精神的学习,分享关于数据作为第五生产要素、数据赋能人工智能(AI)高质量发展、数据要素学科专业调整的必要性和一体化推进策略等方面的理解和体会。

正确理解和使用数据

2020年4月9日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称《意见》)。作为我国最高级别的政策文件,《意见》明确提出,将数据视为与劳动力、土地、资本同等重要的生产要素。生产要素的核心作用就是要创造价值和参与分配。把数据定义为第五生产要素(第四生产要素为企业家才能),体现了我国对全球发展趋势的前瞻性洞察,也是马克思主义中国化的具体实践。马克思在1860年发表了《资本论》,党和国家的建设一直以来都是在马克思主义的指导下进行的。资本被视为第三生产要素,自新中国成立以来,在与资本打交道的过程中,经历了“割资本主义尾巴”的前30年,也经历了“释放资本威力”的改革开放40多年,直至如今进入到“发挥资本作为重要生产要素的积极作用”这一阶段,这是2022年4月29日第十九届政治局第38次集体学习的主题。这一过程不禁让人联想到,尽管有《资本论》作为理论指导,驾驭资本仍然经历了一个复杂的过程。那么,作为不代表互联网企业的我们,如何才能有效驾驭数据?这是我们当下需要思考的时代命题。数据作为第五生产要素,如果和资本结合,资本的逐利能力会得到数量级的放大。逐利是资本的本性,资本有了数据的加持,在资本主义国家一定会造成两极分化:掌握资本、技术和权力的极少数人(5%)会占有绝大多数(95%)的社会总财富,而绝大多数(95%)的普罗大众只占有极少部分(5%)的社会总财富。这种情况与奴隶制社会有着惊人的相似性,人类社会不可能回到斯巴达时代。正因如此,西方国家与我国在对待数据的态度上存在根本差异。这也表明,研究数据及其应用,西方发达国家没有可供参考的先例,我们必须走出一条具有中国特色的创新之路。

作为生产要素的数据已经超越了技术的范畴,在这样的背景下讨论数据相关的技术,需要突破传统的对数据的认知。数据库自诞生以来一直被认为是管理数据的基础设施,随着数据成为重要生产要素,数据库面临着前所未有的挑战与机遇。传统的数据理解方式是“以数为据”,即数据是做决定的依据,而这种理解与数据作为生产要素的概念有着本质区别。作为依据时,数据通常是副产品,越少越好;而作为生产要素时,数据当然是越多越好。在早期的联机事务处理(on-line transaction processing, OLTP)数据库中,存储的数据大多是作为副产品的依据。随着数据库的广泛成功应用,数据库领域发展出数据挖掘和商务智能等技术,从某种意义上而言,这是作为副产品的数据的“无意识的变废为宝”。五年前发布的《意见》及如今成立的国家数据局,实质上是希望实现数据“有意识的价值释放”。为了实现这一目标,我们必须突破传统的技术性数据认知,提升至经济学和哲学层面,重新审视数据的本质。这个问题,不仅涉及数据相关的技术,更深刻地关乎数据的权属、权利等根本性问题。

综上所述:中国的机遇就在于正确理解和使用数据。

数据是人工智能的前提

当前的人工智能本质上是数据驱动的人工智能,所以也被称为“数据智能”。从AlphaGo到ChatGPT,这些具有里程碑意义的应用充分展示了数据在人工智能发展中的基础地位。它们不仅在围棋和自然语言处理等复杂领域实现了突破,也验证了达特茅斯会议发起人约翰·麦卡锡(John McCarthy)在1966年提出的另一种AI解读——“智能的自动化(automation of intelligence)”。

人工智能自诞生以来出现了三大流派:符号主义、行为主义和联结主义。符号主义(symbolism)认为智能源于逻辑与符号操作,通过数学逻辑和规则系统模拟人类推理过程,其数学基础是一阶谓词逻辑。行为主义(behaviorism)认为智能产生于与环境的交互,通过反馈机制优化行为,强调“感知-行动”循环,而非内部推理数据智能,其数学基础是维纳的控制论。联结主义(connectionism)受生物神经元启发,主张通过神经网络模拟智能,强调从数据中学习模式,除了加权求和,还没有扎实的数学基础,但在大规模数据和计算资源支持下取得了突破性进展。

事实证明,当前的人工智能浪潮正是联结主义的成功。深度神经网络带来的“深度学习”改变了科学与技术发展的路径:过去是“科学引领技术”,而如今更多体现为“技术倒逼科学”。AlphaGo的胜利,并非源于我们已完全理解围棋机理;ChatGPT的成功,也并不依赖于对认知科学的根本突破。这些成就凸显了人工智能的核心逻辑——数据是前提,经验是基础。从本质上看,深度学习是一种“机器经验主义”。数据作为人类经验的表征,被输入人工神经网络这一“人工大脑”,从而实现经验迁移与知识生成。根据数据类型,可以将训练人工智能的数据分为两类:结果数据和过程数据。前者如ChatGPT,利用大量人类撰写的文本进行训练,属于基于结果数据的学习;后者如AlphaGo,基于人类下棋的过程数据训练人工智能模型,是基于过程数据的学习。因此,人工智能的快速发展,正是经验主义的胜利。但经验主义本身并不稳固,缺乏坚实的理论基础。当下的“新经验主义”正呼唤“新理性主义”的支撑。一个倒逼,一个呼唤,新科学呼之欲出,人类正处于新科学诞生的前夜。

从历史脉络来看,没有计算机(1946年的ENIAC)就没有互联网(1998年的Google),没有互联网就没有大数据(2012年的Hadoop),没有大数据就没有如今的人工智能(2016年的AlphaGo)。这条清晰的发展逻辑深刻揭示了:数据不仅是人工智能的前提,更是其持续演进的根本动力。数据是人的经验,深度神经网络是人工大脑,用数据训练人工大脑就是让机器学习人的经验。不同的深度神经网络就是模拟大脑的不同功能,训练不同功能的人工大脑需要不同的人类经验,也就是需要不同类型的数据。

数据是数字经济的动力

2016年9月3日,在杭州召开的G20峰会前夕的B20峰会上,国家领导人发表了题为“中国发展新起点 全球增长新蓝图”的主旨演讲,积极回应了国际社会对中国经济前景与发展方向的关切。针对世界经济面临的共同挑战,他提出了携手构建创新型、开放型、联动型和包容型世界经济的倡议,系统阐述了中国关于全球经济治理的理念与主张。同年,在杭州G20峰会上,我国主导起草了《二十国集团数字经济发展与合作倡议》,首次将“数字经济”纳入G20创新增长蓝图的重要议题,展现了中国在全球经济治理领域的引领作用与智慧贡献。自此,“数字经济”概念正式进入国际视野,并开启了全球数字化发展的新篇章。此后,“数字经济”成为一个热词,频频出现在联合国的各种文件和会议中,成为我国软实力增强的标志。在我国的发展实践中,数字经济不仅是一个经济学概念,更与社会转型紧密相连,其基本特征可以概括为:以数据资源为重要生产要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为推动力,促进公平与效率更加统一。数字经济会带来重大的时代转型:生产方式变革,生产关系再造,经济结构重组,生活方式巨变。

从文明演进的角度看,数字经济是继农业经济与工业经济之后人类社会的新经济形态。新一轮科技革命的推动,使世界进入百年未有之大变局,既为新兴市场国家提供了赶超机遇,也加速了全球产业链和治理体系的重构。中华民族正处于由工业经济向数字经济跨越的关键时刻,这也是历史赋予的重大机遇。

数字经济的核心在于数据作为“第五生产要素”的确立。早期常有人将数据比喻为“新石油”。然而,更为准确的类比是:数据如同电力,是推动社会发展的动力源泉。在人类文明史上:农业经济依赖马力(horse power);工业经济先后依赖蒸汽动力(steam power)和电力(electric power),分别引发了第一次和第二次工业革命;而在数字经济时代,数据正逐渐成为新的能源动力——data power,推动人类迈入数字文明。

纵观历史,动力的更替会带来世界中心的转移。农耕文明时期,也就是马力作为主要动力的时期,中国长期居于世界中心;蒸汽机推动英国崛起,英国成为“日不落帝国”;电力革命成就了美国在20世纪的全球霸主地位。正如“新质生产力”所揭示的那样,人类文明史上,每次动力的更替会带来生产力数量级的提升和放大。今天,数据这一新型动力的出现,正在孕育全球格局的新变化,数据作为新的动力将促使中国在新的文明阶段重新走向世界舞台的中心。

若将数据比作电力,那么数据治理与数据技术相当于电网建设,而人工智能则是由数据驱动的“数动机”,如同电动机之于电气化。正是通过电网与电气化装备的普及,第二次工业革命得以实现。同理,唯有让数据“好用”和“用好”,才能真正释放数据价值,推动智能化社会的到来。让数据好用,就像建电网;把数据用好,就像研发各自的人工智能模型,再装备到智能体上,把以前需要受过良好训练、经验丰富的人才能做的事情变成机器能做的事情(智能的自动化),这样会带来生产力极大的提升,这也是新质生产力的底层逻辑。数据之于数字化,正如电力之于电气化。这说明,数据赋能和人工智能助力是数字化转型的基本路径。数据将把人类带入数字文明。

当今时代很像100多年前尼古拉•特斯拉发明交流电的那个时代。我们不仅需要研究发电机和电动机,更需要研究电本身,如电的变压原理、电的传输,以及电的绝缘、继电保护和电网建设,等等。对于数据,这一类的研究刚刚起步。研究数据不仅要打通数据(这是大数据的本质),让数据好用,就像建电网;还要把数据用好,就像研究电动机和电气化装备;把数据技术装备化和大众化,就像当前人工智能所起的作用。

同时,数据不仅是一种动力,也引发了新的伦理与法律问题。数据是人对世界认知的结果在计算机中的表示,数据来源于人,数据为了人(data from human, data for human)。因此,如何在利用数据推动发展的同时,妥善解决隐私保护、信息安全与治理问题,是数字文明时代必须面对的重大挑战。设想一下,100多年前推广使用交流电时,如果因为交流电容易伤人而予以禁止,那将会是一个什么样的结局。道高一尺,魔高一丈,正是因为交流电容易造成触电,电力行业才发展出绝缘材料、熔断丝和变压器。纸币发明的时候也被人指责为不安全,容易仿照,之后却发展出了各种防伪技术。数据成为第五生产要素,对传统的伦理和法律体系提出了极大的挑战,需要我们认真思考和深入研究,并及时进行技术攻关,给出解决方案,回应各方关切。

综上,数据是数字经济的核心动力,它不仅驱动社会生产力的跃升,更深刻影响人类文明的发展方向。

数据是网信事业的根本

2023年,第二届全国网络安全和信息化工作会议在北京召开。会议旗帜鲜明地重申了“党管互联网”的基本观点,提出“网信为民”的根本宗旨,还提出要发展中国特色的治网之路以及统筹发展与安全两大网信主题。

网络安全和信息化是国家领导人念兹在兹的大事,网信领导小组组长是国家领导人十八大以后担任的第二个领导小组组长。回顾国家领导人对网信事业的指示,我们可以更加深刻地理解当下数字化的转型及其重要意义。2016年2月19日,国家领导人在党的新闻舆论工作座谈会上的重要讲话中指出:“过不了互联网这一关,就过不了长期执政这一关。”在2018年4月20日首届全国网络安全与信息化工作会议上,国家领导人指出:“信息化为中华民族带来了千载难逢的机遇。”数字化是信息化的高级阶段,是融入了互联网思维和数据思维的信息化。国家领导人反复强调的信息化是互联网时代的信息化,本质就是数字化,与传统信息化的根本区别在于数字化是惠及全体人民的,不只是管理的信息化。

2020年10月,十九届五中全会上提出的“中国之治”和“治理现代化”,被解读为第五个现代化,也是党中央在提出建设“四个现代化”的战略任务近60年之后提出的新的“现代化”建设任务,其根本任务就是将制度优势转化为治理效能。信息化是治理现代化的不二途径,信息化就是把制度和法律变成代码和程序,将管理工作流程化、自动化,这样就可以大幅度提高“为人民服务”的效率,也能极大压缩腐败空间,实现全民素质提升和社会现代化转型。

网信事业的发展事关国家和民族的未来,是“全面建设社会主义现代化国家,全面推进中华民族伟大复兴”这一伟大历程中至关重要的环节。这是因为信息化具有驱动引领作用,不仅引领数字经济发展和全社会数字化转型,也是我国在世界新科技革命浪潮中抓住机遇实现高质量科技自立自强的难得机会。面对以人工智能为代表的新科技革命这一世界潮流,我们和发达国家处于同一起跑线,只要解放思想、立足实践、崇尚科学,就有机会在未来几十年内实现在科学和技术上“为人类作出更大贡献”的崇高理想。

互联网的底层逻辑是数据,互联网彰显了数据的极端重要性。党管互联网就必然要求党管数据,这也是成立国家数据局的理论根据。互联网企业作为典型的大数据公司,其商业上的巨大成功突显了数据的商业属性;而数据本质上源于人类对世界的认知,是人与生俱来的权利与能力,因而也具有鲜明的人民属性。国家数据局的成立,正是要在制度层面保障并落实这种人民属性,使数据能够真正服务于国家发展和社会进步。

一体化是两个建设的路径

党的十八大以来,国家领导人多次提出要构建中国自己的学科体系、知识体系、技术体系和话语体系。2016年6月,他在哲学社会科学工作座谈会上明确提出了“构建中国特色哲学社会科学”的任务,指出了要“在指导思想、学科体系、学术体系、话语体系等方面充分体现中国特色、中国风格、中国气派”。

党的二十大报告进一步指出,“加快建设教育强国、科技强国、人才强国,坚持为党育人、为国育才,全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之。”报告将教育、科技、人才三位一体安排部署,赋予了教育新的战略地位、历史使命和发展格局,明确了实施科教兴国战略的目标要求,为新时代高等教育改革发展指明了前进方向。

要想在这场以人工智能为代表的新科技革命中抢占先机,必须坚持“应用场景+科技创新+产业发展”一体化部署和整体性推进。以大学和科研院所为代表的学术界不能满足于“两头在外”的科学研究,必须立足于应用场景,以产业发展为目标,只有这样才能完成真正的科技创新。以企业为代表的产业界若只关注短期问题与利润获取,而忽视总结与反思,则无法形成技术体系与理论沉淀,也难以实现长期创新。真正有竞争力的创新型企业,应当具备学术情怀,善于总结实践经验,并积极传播与推广。

无论是国家层面的教育、科技、人才三位一体战略,还是具体实践中应用场景、科技创新、产业发展一体化推进,其核心都在于:共同聚焦一件事,从不同侧面解决不同问题,而非将各自为政的事务简单合并。也就是说,一体化是指做一件事,不是做几件事。

回顾国家战略转型,2014年“创新驱动发展”被正式确立,标志着发展动力从“三驾马车”(投资、消费、出口)转向创新引领。实践证明:创新往往来源于应用。谷歌搜索问题的解决催生了Hadoop等大数据系统;AlphaGo的出现得益于围棋这一场景的驱动;ChatGPT的诞生源于人机问答的需求。这些案例形成了清晰的链条:场景驱动应用,应用驱动创新,创新驱动发展。这一逻辑不仅符合“知行合一”的哲学思想,也契合马克思主义认识论的基本观点。

开展数据要素学科专业建设和数字人才队伍建设是当前的重要战略任务,在国际上没有可资参考的先例。这不仅是因为我国把数据定义为第五生产要素,在开展数据基础制度和基础设施建设方面,走在世界的前列;更深层次的原因是社会制度的不同造成了对数据的认知有很大的不同。对待西方在数据方面的研究成果,我们应该秉持海纳百川、博采众长的态度,同时更要坚持以我为主,为我所用,构建具有中国特色的数据要素学科知识体系。

在研究数据方面,西方发达国家没有可参考的方法和成果,我们必须走出一条中国特色的创新之路。此外,研究数据是典型的交叉学科,哲学、经济学、计算机科学、各应用领域相关的学科深度融合才能推动该学科发展。同时,研究必须坚持“应用先行”:通过数据之用,发展数据之术,锻造数据之器,进而真正理解数据之道。数字化转型不仅是技术革命,更是一场深刻的思想革命,需要从小处做起、从自我革命开始。正如孙中山先生所言:“知难行易”,数字化转型需要认知上的突破。

为此,我们拟在国家数据局的指导下,发起成立数据科学与工程学科自主知识体系联盟,目的是通过多学科的深度交叉融合,吸纳数据企业、数据产业园区、政府数据行政部门参加,结合产业发展和人才培养实践,探索数据学科相关的完整知识体系的建设。

数据要素学科的建设和数字人才的培养是我国数据事业发展的关键所在,关乎我国数字经济发展和各行各业数字化转型,关乎中华民族复兴伟业,是一件开创性的事业,长途漫漫,任重道远。正如苏轼所言:“犯其至难而图其至远。”惟有攻坚克难,才能实现长远目标。路虽远,行则将至;事虽难,做则必成。

周傲英

CCF会士、常务理事、数据库专委会主任,上海市计算机学会理事长、《计算机学报》副主编。华东师范大学教授。主要研究方向为数据库、数据管理、区块链、数字化转型、金融科技、教育科技等。

ayzhou@dase.ecnu.edu.cn

本文来自基金项目:国家自然科学基金国际(地区)合作与交流项目(项目批准号:62461146205)。

 

-----------------------------------------------------------------------------------------------------------------------------

关于学讯通
学者网官方学术媒体,聚焦学术动态、政策解读与资源分享,支持关联学者主页,是科研信息高效获取与交流的平台。

关于机构号
学者网为学术团队、实验室等机构提供的专属账号,可发布科研动态、会议/招聘等内容,支持多管理员协作,助力机构链接学界资源、扩大学术影响力。

点击前往入驻学者网机构号

编辑:陈映欣  审核:常超、李若琳


学者网消息官方发布号
返回顶部