精彩回顾|上海交大管新潮:Python与语料库如何深度结合
10月23日晚,翻译技术名师课堂专题讲座“语料库与术语库技术工作坊”第二期如约而至。在大家热切期盼中,上海交通大学管新潮老师接续主讲本次讲座。管老师由浅入深,从语料库基本概念入手,通过丰富实例和专业分析,向大家展现了Python与语料库如何深度结合,打造个性化工具来解决翻译实践和学术研究中的具体问题。
管新潮老师深谙Python与语料库融合之道,此前曾出版《语料库与Python应用》《Python语言数据分析》《基于Python的语料库翻译》等三部著作,系统概述了Python在语料库研究、翻译实践和数据分析等方面的实践应用,广受读者喜爱。
管新潮老师是上海交通大学外国语学院副教授,MTI导师。主持国家级项目3个,发表论文20多篇,出版专著5部、译著10部,拥有专利2项、软件著作权2项。长期从事德英汉翻译实践,至今已累计翻译和审校德英汉字数达3000万(包括审校);主要翻译领域涉及海洋工程与船舶制造(英语)、医学(英语)、法律(德语+英语)、机电(德语)等;建有各类相关语料库,如英汉医学平行语料、英汉海洋工程平行语料库、英汉法律平行语料库等。
本期讲座主要内容包括:
1. 多语平行语料库之构建;
2. Python语言基础性代码;
3. Python语料库文本处理;
4. Python语料数据可视化;
5. Python语料库科研应用;
一、多语平行语料库之构建
作为语言学研究和翻译实践等领域必不可少的工具,语料库内涵丰富、种类繁多。管老师从翻译学和语言学角度分别阐释语料库概念,继而引出WordSmith 、 AntConc 、 Python等研究工具。相比于专业工具,在平行语料库建设过程中Python能实现同样功能,而且过程透明,个性化程度更高。管老师还为大家推荐了自己研发的AntConc with Python, Version 1.0小工具。
获取链接:
https://mp.weixin.qq.com/s/vlEr8-FSPOIijzWfpa5ZFQ
二、Python语言基础性代码
语言专业出身、编程技术小白如何掌握高深莫测的Python代码?其实只需一套三层次学习体系!从基础入手,活学活用,用简单代码解决复杂问题。无需死记硬背,借助Python丰富代码库,即可提取术语、分析语篇特征。
三、Python语料库文本处理
语言数据的千变万化使得语言数据清洗变得异常复杂,有别于大数据清洗,Python数据清洗更加细腻多样,可实现数据个性化、工具个性化和解读能力个性化。无论是词性还原、情感分析,Python都能轻松handle。
四、Python语料数据可视化
本环节,管老师通过具体案例,展示了如何使用Python代码绘制基于词频和主题词权重的词云图,实现句长分布可视化和网络可视化。数据可视化后隐藏在海量文本后的规律顿时显现。
五、Python语料库科研应用
在最后一部分,管老师就Python在科研领域应用做了详细分析。无论是话语分析、数字会话分析等语言学研究还是著作权法英译风格研究等翻译学研究,Python无不涉及。
以上就是管新潮老师本期讲座分享的精彩内容,管老师在Python与学术研究、翻译实践结合等领域打开了一个新的世界。讲座现场气氛热烈,学员受益匪浅。更多精彩,敬请持续关注“翻译技术名师课堂”。
编辑:王琳