坚守一份育人初心,计算机科学技术学院教授黄萱菁躬耕讲台二十余载。她心目中的好老师标准可以用32个字概括:格物穷理,知行合一;学高为师,身正为范;循循善诱,明辨笃行;传道授业,薪火相传。
在黄萱菁的实验室里,既有从本专业继续攻读研究生的学生,也有来自电子信息、物理、化学等基础学科背景的同学,更有打破学科壁垒、从“文”转“理”的“跨界者”。在她的指导下,学生正探索着属于自己的无限可能。
科研需要多样性
作为研究生导师,黄萱菁注重培养学生主动发现问题、解决问题的能力,尤其注重培养跨学科人才,指导多名具有中文、外文、哲学背景的研究生。毕业于复旦大学中国语言文学系的钱鹏,是第一位“吃螃蟹”的人。
大一、大二的通识课程启发了他的跨学科新视角,“通过计算方法了解语言的本质、信息的处理,激发我对人工智能领域的兴趣”,了解了黄萱菁的研究方向后,他产生加入自然语言处理实验室的想法。
起初,黄萱菁感到有些惊讶,通过几次深入恳谈,她决定给这位吃螃蟹者提供跨界机会。随后,她给钱鹏提出了专业上的建议,要求他必须过“数学关”和“编程关”,并尝试给他布置实验室的工作。
从最基础的标注任务到更进阶的内容,钱鹏的完成度总会超出她的预期。最后,钱鹏顺利进入她所带领的自然语言处理实验室。
在黄萱菁的培养下,钱鹏在攻读硕士期间不仅发表了多篇高水平学术论文,还获得不少荣誉,成为实验室最优秀的学生之一。
招收和培养钱鹏起到“实验性”的效果。今年,我校中国语言文学系2022届本科毕业生徐凝雨被录取为本校计算机科学技术学院人工智能方向的直博生。她坦言,进入黄萱菁的实验室,不仅有来自黄老师的方向性指导,更得益于钱师兄给予的宝贵经验。
大胆招收跨专业学生,黄萱菁的考虑是:“科研需要多样性,需要不同学术背景、思维方式的交融,这能给实验室带来很多活力。”
这种开放包容的思维也渗透在实验室的方方面面。
她鼓励学生们参与项目研发,“不明确规定学生该达到的目标,只要选题足够新颖、态度足够认真、过程足够努力即可”。不论是科研、生活还是未来规划的问题,她都毫不吝惜地为同学们提供各方面的帮助与资源,细致耐心地给予建设性的意见。在指导学生的过程中,她常常觉得自己也能够收获知识,从学生身上学会很多。
实验室合照(二排右六为黄萱菁)
师生相济、教学相长的氛围让学生们的学术成果不断涌现。她的学生中,有人获得复旦大学研究生学术之星,有人获得百度奖学金、微软学者奖学金、IBM博士生英才奖、腾讯人工智能奖学金等面向全球计算机专业博士生的重要奖项,更有多名博士和硕士毕业生入选华为天才少年、百度AI度计划、美团北斗计划、腾讯大咖、小米未来星等企业人才计划。
“学习新东西的时候,我会觉得很快乐”
“我喜欢拥抱未来,拥抱未知,所以喜欢探索前沿课题”,黄萱菁说。
在复旦求学期间,她师从吴立德教授,吴立德是国内最早一批从事计算机视觉和自然语言处理研究的学者。学术生涯开启之际,正逢自然语言处理研究的范式发生重大变革,在吴立德的建议下,她结合自己的兴趣和导师的研究方向选择“自动文摘”这个前沿方向,作为研究课题。
过去,学术界试图让自然语言处理算法像人类一样理解与推理,而黄萱菁探索“自动文摘”方向,希望利用统计方法,在海量数据上发挥机器的计算能力,为机器阅读、文本搜索等具体任务提出实现方案,减轻人类负担。
循着这条路径不断探索,此后,黄萱菁又开启了新方向——“信息过滤”。所谓“信息过滤”,即是根据少数信息建立个性化模板,进行相关信息过滤与推送,其效果类似于如今众多软件上的“猜你喜欢”功能,这些在当时看来的小众方向,如今已普遍应用在人们生活中。
初为人师之际,经吴立德的鼓励和推荐,她带着“信息过滤”方向的前沿研究成果,与团队参加信息检索领域的权威国际评测--文本检索会议。当时,该评测的参加者主要来自国际知名大学或者国际科技企业,作为为数不多的国内参加者,她和团队在评测中获得不错成绩,并申请到国家自然科学基金以及相关国家专项计划的支持。
黄萱菁于世界人工智能大会
此后,她长期从事自然语言处理、信息检索和社会媒体分析研究,在高水平国际学术期刊和会议上发表百余篇论文,形成一系列国际领先研究成果,成为人工智能、自然语言处理学科方向带头人。在她和众多科研人员的努力下,我国自然语言处理领域的国际学术地位正在逐步提升。
在黄萱菁看来,是导师吴立德对选题的敏锐性,让自己少走了很多弯路,这让她意识到创新选题对研究的重要性。
近年,应国际计算语言学协会执委会邀请,黄萱菁代表亚洲自然语言处理界担任2021年国际EMNLP会议程序委员会联合主席,通过组织投稿、评审、录用和会议的全流程,对相关领域的前沿热点和方向进行引导、引领学术价值判断、促进国际学术交流与合作。
这意味着,在自然语言处理领域,她逐渐从“运动员”成长为“裁判”。作为“裁判”,她看重的是“运动员”是否带着创新选题而来,而她的使命,则是与学界同仁一起发现好选题,推动重要研究方向发展。