直播预告 | 8月10日 长序列建模技术
长序列建模技术在自然语言生成领域具有重要意义,对于需要参考较长对话历史信息、处理复杂问题的大语言模型来说更是如此。传统序列建模技术在处理超长序列时,往往面临难以捕捉长距离依赖关系、内存消耗过大和计算效率低下等问题,而长序列建模赋予模型理解较长上下文的能力,进而生成更加连贯且合理的内容。在大语言模型时代,哪些长序列技术经受住大模型的考验成为领域的常青树?又有哪些新的长序列技术涌现而出?
本期报告将围绕上述问题展开,介绍长序列建模技术的发展历程和关键技术,思考长序列技术在大语言模型发展过程中的应用与挑战。首先,我们将介绍长序列建模的主流技术方法和思想。其次,详细介绍大语言模型采用的长序列建模相关技术,并思考其未来的发展与挑战。本次报告例举了建模超长序列的主流技术,旨在为大语言模型的研究者带来些许启发。
本期报告将于8月10日线上举办,届时由来自东北大学自然语言处理实验室的刘新宇为我们带来《长序列建模技术》报告,具体流程如下:

本次直播将分为两部分进行,第一部分为报告分享环节,第二部分为Q&A环节。在直播过程中,小伙伴可以把问题发送到直播间中,并在Q&A环节与本期嘉宾深入探讨;未被回复的问题也可私信留言,在直播结束后我们会进行解答。
本系列直播作为公益知识分享活动,由东北大学自然语言处理实验室、小牛翻译联合推出,感谢AI科技评论、PaperWeekly、机器之心、并行科技对本次直播的大力支持,本次直播向所有听众免费开放,无需注册和报名缴费。参会观众可以在【视频号(ID: 小牛翻译云平台)、微博(ID:小牛翻译)、哔哩哔哩(ID:小牛翻译)、知乎(ID:小牛翻译云平台)、机器翻译学堂(https://school.niutrans.com/live)】观看直播,关注【机器翻译学堂、小牛翻译云平台视频号】即可观看直播回放。
诚邀所有关注自然语言处理与大模型技术发展的朋友走进直播间,2023年8月10日(周四)18:30,我们期待与您的相遇!
