RMBS 碩博 本科 BBA MBA EMBA 高管教育 MPAcc MIB MV
快速導航

EMAIL

VRUC

OA

English

明商雲智學術系列講座第八講:Python文本數據分析與自然語言處理應用

來源:大數據商業分析研究平台 編輯:宣傳信息事務辦公室 發布時間:2019-07-16

2019年7月3日,中國人民大學商學院大數據商業分析研究平台在明德商學樓舉辦明商雲智學術系列講座第八講。

北京大學外國語學院外國語言學及應用語言學研究所、北京大學信息科學技術學院計算語言學研究所雙聘副教授、博士生導師蘇祺應邀做了“Python文本數據分析與自然語言處理應用”的主題報告。人大商學院會計系吳武清副教授主持講座,財務與金融系李焰教授、會計系系主任張敏教授等學院師生共40余人全程參與講座。

作爲語言學和計算機科學領域專家,蘇祺副教授在上午環節介紹了自然語言處理相關理論基礎,包括機器學習與深度學習技術,以及相關技術在金融文本挖掘實踐中的應用等。下午的講座內容則聚焦如何對商業文本數據進行操作、統計及可視化處理,以及文本分析中常用的Python庫、技術和方法。

 1563244615311248.jpg

蘇祺副教授

蘇祺副教授以谷歌流感趋势、利用推特数据预测美国总统大选结果为例,令参会者领略了数据分析的魅力。她还介绍了实体识别、关系抽取等信息抽取的相关技术,并以谷歌搜索为例介绍知识图谱、以AI机器人诗歌创作为例介绍了文本生成,展示了信息数据抽取和转化的现实意义。关于自然语言的处理与应用,蘇祺副教授利用机器学习和深度学习的方法,通过主题模型、语言模型等经典模型,对语言特征进行提取与整合、进行数据训练和学习,最终实现对语言的模拟和预测。最后,她使用Python进行语言处理操作,详细演示了操作过程,并回答相关问题。

整場講座內容妙趣橫生又富含科學性,令參會師生感受了數據分析的魅力,並對在未來研究中掌握和改善對于文本分析方法的使用頗有益處。

人大商學院新聞網版權與免責聲明:

① 凡本网未注明其他出处的作品,版权均属于人大商学院,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:人大商学院”。违反上述声明者,本网将追究其相关责任。

② 凡本网注明其他来源的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网对其负责。

③ 有关作品内容、版权和其它问题请与本网联系。

※ 联系方式:中國人民大學商學院宣传信息事务办公室 邮箱:media@rmbs.ruc.edu.cn

中國人民大學商學院 rmbs@rmbs.ruc.edu.cn 86-10-82509171 官方微信

MBA、EMBA和高管教育(EE)項目全部進入
《金融時報》全球50強

人大主頁回到舊版

?中國人民大學商學院 版权所有 京ICP备05066828号-1