9月24日,上海交通大学语言学及应用语言学专业副教授、硕士研究生导师郭曙纶应邀做客我院“人文大讲堂”,为我院师生带来了一场题为“字词统计及字词用法的定量研究”的精彩讲座。讲座由我院宗守云教授主持,讲座采取线上会议形式举行,百余名师生参与。
郭曙纶副教授以其发表于《语言文字应用》的重要文章《汉语语料库大规模统计与小规模统计的对比》为例,具体分析了如何基于语料库数据库数据开展定量研究。报告首先介绍了作者以自建的上海市中小学语文教材语料库以及两年的“中国语言生活状况报告”数据为样本作对比分析,用客观、可信、科学的数据分析对“认识500多个汉字就能认识文本中80%的汉字”的说法进行了科学回应和验证。其次,报告重点介绍了论文如何从覆盖率和分布率进行对比统计的研究过程和计算方法。报告尤为精彩的地方在于理论与操练相结合,采用了大家普遍常用的金山WPS为例进行详细的操作演练,每一个步骤都清晰明了。
报告互动环节,郭曙纶对师生提出的问题给予了细致、圆满的回答。宗守云教授对讲座做了总结和点评,指出本场报告虽因疫情防控要求调整为线上讲座,但郭教授的报告形式,通过易操作、可复制的程式化运算模型让聆听报告的师生们现场互动、实际操练,向大家展示了定量研究的可学性、科学性和魅力,对如何更好地开展语法研究具有重要的方法论价值。