MLNLP
社区是国内外知名自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。

社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流,特别是初学者同学们的进步。
MLNLP 2023学术研讨会 是由 MLNLP社区 中国中文信息学会青年工作委员会 联合举办的学术活动。 社区会定期举办学术研讨会并邀请国内外机器学习与自然语言处理领域知名青年学者进行报告交流,旨在加强国内外同学们之间的交流。
MLNLP社区将在12月31于线上举办第二十二次学术研讨会,由MLNLP学术委员会委员东北大学副教授刘正皓博士和莱斯大学助理教授陈涵洁博士共同担任本期程序委员会主本期研讨会以线上报告的方式进行,分为上下两半场:上半场由刘正皓主持;下半场由陈涵洁主持。具体而言,社区很荣幸邀请到北京理工大学副教授高扬老师担任大会主席,并做开场致辞;阿里巴巴高级算法专家林俊旸,香港中文大学博士生王鸿儒,香港中文大学博士生彭昀,加州大学洛杉矶分校博士生洪逸宁做专题报告。
1
会议概况
  • 召开时间:
    • 2023年12月31日 9:00-12:00(北京时间)
  • 主办单位:
    • MLNLP社区
    • 中国中文信息学会青年工作委员会
  • 大会主席:
    • 高扬:北京理工大学副教授
  • 程序委员会主席:
    • 刘正皓:东北大学副教授
    • 陈涵洁:莱斯大学助理教授
  • 组委会:
    • MLNLP社区秘书处(刘洪宇、段然、陈麒光、张钰迪、周璟轩)
  • 社区支持 :
    • 智源社区
  • 直播平台:
    • 哔哩哔哩:http://live.bilibili.com/23872620
    • 微信视频号:请点击下方卡片预
    1
    会议概况
3
嘉宾介绍
一、主持人:
刘正皓
东北大学副教授
嘉宾简介:刘正皓,东北大学副教授,硕士研究生导师,清华大学自然语言处理实验室客座研究员。CCF信息系统专委执行委员,中文信息学会青工委委员,中文信息学会信息检索专委通讯委员,MLNLP社区学术委员。他的主要研究方向为自然语言处理、信息检索,于2021年毕业于获得清华大学工学博士学位并通过人才引进加入东北大学从事科研、教育工作。他在ICLR、ACL、EMNLP、NAACL、SIGIR、WebConf、IJCAI、CIKM等会议和期刊上发表论文30余篇。承担顶级会议COLING的领域主席;ICLR、NeurIPS、ICML、ACL、EMNLP以及AAAI的程序委员会委员;CCL 2024 网络主席;MLNLP大会领域主席。现主持国家自然科学基金青年科学基金项目、北京智源人工智能研究院悟道项目,作为核心成员参与国家自然科学基金面上项目以及上海市科委项目等。
陈涵洁
莱斯大学助理教授
嘉宾简介:陈涵洁,莱斯大学(Rice University)计算机科学助理教授(2024年秋季开始),目前在约翰霍普金斯大学语言和语音处理中心担任博士后研究员。她于2023年5月在弗吉尼亚大学(University of Virginia)获得计算机科学博士学位,研究兴趣包括可信赖的人工智能,自然语言处理,可解释的机器学习。其研究工作多次发表于人工智能及自然语言处理顶级会议(ACL, AAAI, EMNLP, NAACL)。博士期间曾在艾伦人工智能研究所(Allen Institute for AI),微软研究院(Microsoft Research),IBM Research研究实习。曾获UVA Outstanding Doctoral Student Award (2023), John A. Stankovic Graduate Research Award (2023), Carlos and Esther Farrar Fellowship (2022-2023), Graduate Teaching Awards (2022)等。个人主页:https://hanjiechen.github.io/
二、大会主席:
高扬
北京理工大学副教授
嘉宾简介:高扬,北京理工大学计算机学院副教授,现从事语义深度理解与可解释推理、大模型训练、文本自动生成技术,促进信息检索、文本摘要、智能问答等系统应用。主持国家自然学基金重大研究、青年项目,主要参与科技部重点研发,北京市重点项目等。在NLP, AI领域发表50余篇论文,包括CCF A类会议、SCI Top期刊论文,谷歌被引用1200余次。主持训练和开发MindLLM系列明德大模型,推进大模型国产化工作。出版2本专著《智能摘要与深度学习》与《可控自然语言生成研究》。担任Web Intelligence期刊的咨询主编,NLP期刊编委;EMNLP与CCL会议领域主席,多次担任高水平国际会议程序委员会委。作为参与人获得中国电子学会科技进步奖一等奖,国防科技进步二等奖。中文信息学会自然语言生成与智能写作委员会副秘书长,CCF-NLPCC委员,中国中文信息学会CIPS青工委委员。
三、分享嘉宾:
林俊旸
阿里巴巴高级算法专家
嘉宾简介:林俊旸,毕业于北京大学,阿里巴巴高级算法专家,目前为通义千问开源负责人。他的研究领域包括自然语言处理和多模态表示学习,研究兴趣集中于大规模预训练,在NeurIPS、ICML、ACL等多个顶级会议发表多篇论文,Google Scholar引用量3000+。近期工作为领导研发通义千问大模型,包括大规模预训练和对齐,多模态大模型,以及大模型与外部系统的结合等,同时主导大模型开源及积极参与开源生态建设,推动大模型的落地应用。
报告题目:通义千问系列大模型
报告简介:自今年四月通义千问正式推出以来,通义千问系列大模型持续升级,并推动大模型开源在近四个月内陆续开源了参数规模分别为1.8B、7B、14B和72B的大语言模型Qwen,多模态大模型Qwen-VL及Qwen-Audio。本次分享将整体介绍通义千问系列大模型,其中包括大语言模型的预训练和对齐,视觉-语言模型及语音语言模型的算法方案,以及工具调用和Agent相关的技术实现,同时还将分享团队未来的技术探索方向。
王鸿儒
香港中文大学博士生
嘉宾简介:王鸿儒,香港中文大学系统工程与工程管理学院博士研究生,师从Kam-Fai Wong (黄锦辉教授)。研究方向包括对话系统(Dialogue System),大语言模型 (LLMs),智能体 (Language Agents), RLAIF等。个人主页:https://rulegreen.github.io/
报告题目:综述 | 大模型对话系统前世今生与未来
报告简介:每一次语言模型的更新,都代表一次计算架构和学习范式的迭代,也给对话系统的发展与演变带来了深刻的影响。从 NLM(e.g., LSTM, GRU)到 PLM(e.g., BERT, GPT),再到如今几乎统治一切自然语言处理任务的LLM,对话系统的研究都经历了哪些演变?未来的发展趋势如何?本次Talk将以语言模型与对话系统的相互演变与进化为眼,希望通过一个新的视角,试图解答基于大模型的对话系统从哪里来,又到何处去的问题。具体来说,本次Talk内容包括对话系统的分类与历史、随着语言模型的进化对话系统的演化、大模型对话系统的优势、大模型对话系统内部外部能力以及未来发展趋势,我们希望本次Talk能够帮助大家全面了解基于大模型的对话系统的演变与未来方向。
彭昀
香港中文大学博士生
嘉宾简介:彭昀,香港中文大学ARISE Lab四年级博士生,导师为Prof. Michael R. Lyu,2020年毕业于中国科学技术大学少年班学院计算机科学与技术专业并获得荣誉学位。研究领域为软件工程,研究方向为智能化代码分析和软件可靠性,包括类型推断,软件漏洞修复,软件生态研究等。他在软件工程领域顶级会议和期刊ICSE、ESEC/FSE,ASE,IEEE TSE上发表了多篇论文,并获得了ASE 2023的杰出论文奖和ICSE 2022的杰出论文奖提名。他同时担任软件工程领域顶级期刊IEEE TSE和ACM TOSEM的审稿人。他的个人主页是https://www.yunpeng.site
报告题目:大模型时代下的智能化代码分析与修复
报告简介:代码分析自编程语言被发明一来就引起了学术界广泛的兴趣与研究。传统的基于规则的代码分析技术(如静态分析)取得了巨大的成功并被广泛的应用于软件开发。在深度学习技术,尤其是大语言模型(Large Language Model)发展迅速的今天,智能化代码分析较传统的代码分析技术取得了较大的性能突破。在本报告中,讲者以目前流行的编程语言Python为例,介绍基于大语言模型与传统程序分析技术相结合的Python类型推断(ASE 2023)和Python类型错误修复(ICSE 2024)。
洪逸宁
加州大学洛杉矶分校博士生
嘉宾简介:逸宁,UCLA博四计算机专业博士生以及MIT-IBM Watson Lab的研究人员,师从淦创教授,朱松纯教授和吴英年教授。此前为上海交通大学本科生,师从王新兵教授和张伟楠教授。研究方向包括具身智能,3D大语言模型,机器推理。在NeurIPS, CVPR, ICCV, AAAI等会议发表一作论文十余篇。2022年度百度奖学金获得者。
报告题目:构建三维具身基础模型
报告简介:尽管最近的大语言模型和视觉语言模型非常强大,但这些模型并不像人类那样立足于三维物理世界,更不用说在更丰富的三维具身环境中探索和互动。洪逸宁的工作主要关注三维具身基础模型的发展,致力于构建能够主动探索和与三维物理世界互动的通用智能体,并在具身环境中进行常识推理。这些模型促进了与三维空间的动态互动,融合了空间关系、可供性、物理、布局、多感官学习等基本具身概念。洪逸宁的研究特别强调在构建此类通用具身智能体方面的三个关键视角:构建三维世界模型;具身基础模型和常识推理。

4

直播平台

视频号
B站
5
会议报名
会议报名可以直接扫描下方二维码进入交流群。 会议的观看地址等信息都会在群里通知。 已经加入MLNLP交流群的同学请 不用重复添加
扫描二维码进入MLNLP交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。
继续阅读
阅读原文