标题:从 DeepSeek 的兴起看深化推理模型的必要性
报告时间:2025年4月24日 (星期四) 10:00-11:30
报告地点:净月大街校区传媒科学学院西楼201教室
主讲人:张锦
报告内容简介:
近年来,大语言模型(LLMs)的发展迅猛,而 DeepSeek 作为新兴的 AI 研究团队,以其高效的模型架构和强大的推理能力迅速获得关注,与大多数依赖人类示范的监督学习不同,DeepSeek-R1使用强化学习(Reinforcement learning) 使其自身有机地发展出推理能力。本讲座注重分析 DeepSeek 由技术突破带来的推理革命,与现有的其它大语言模型对比的优势,及其对深化推理模型的重大影响。我们还深入探讨了大语言模型从知识模型(Knowledge Model)到推理模型 (Reasoning Model)的发展进程和主要的推理方式及推理模型在未来的发展方向。
主讲人简介:
张锦博士,曾任浙江大学心理与行为科学系全职兼任教授;美国杰克逊维尔州立大学(Jacksonville State University,USA)特聘客座教授;现任东北师范大学讲座教授。近年来,主要研究方向包括:心理学与人工智能、认知科学与人工智能、大语言模型测试与评估和大语言模型对语言智能的影响与促进等前沿科学领域。并曾在浙江大学,复旦大学和东北师范大学等高校讲授:心理学与人工智能;情绪智能科学:理论与实践和机器人心理学及其概念模型等通识课程和学术讲座。
