报告题目:文本机器学习入门指南
报告人:胡贤良 (浙江大学)
报告时间:2022年4月26日(周二)下午15:00
报告地点:勤园21号楼306室
报告摘要:文本数据是一类典型的非结构化数据,从文本数据预处理到语言模型的建立,是当代自然语言处理所研究的基本对象。近年来,机器学习和深度学习技术的快速发展为文本数据分析提供了众多优秀的工具。这次报告面向初学者,将概要地向听众介绍文本分析中所包含的众多内容,包括:文本数据的收集、预处理、文本特征工程、自然语言处理中的基本任务以及前沿领域所关注的语言模型等。最后,我们将以互动形式探讨如何具体开展一个具有指定任务目标的文本分析工作。
个人简介:浙江大学数学科学学院副教授,博士生导师,浙江大学科学与工程计算研究所副所长。于2007年取得浙江大学计算数学博士学位。在加利福尼亚理工学院、中科院计算数学研究所、密歇根州立大学等地从事博士后、访问学者等。自2012年起任浙江大学数学科学学院副教授。 研究兴趣包括自适应有限元方法、人工神经网络算法以及他们在科学计算、数据分析中的应用,并发表相关SCI论文近30篇。