报告题目:Unsupervised Feature Representation Learning via Random Features for Structured Data: Theory, Algorithm, and Applications(结构化数据的非监督特征学习:理论,算法,及应用)
报告人:吴凌飞 研究员
单位:IBM全球研究院总部(IBM T.J. Watson Research Center)
报告时间:2018-11-12(周一)上午10:00
报告地点:翡翠湖校区翡翠科教楼A座909会议室
摘要:大部分的机器学习算法只专门设计给模型输入是向量的情况。对于结构化数据比如文本和图,因为没有显示的特征矩阵输入,许多工作都是为了从这些复杂数据中提取有效的特征矩阵。尽管现在深度学习已经能够学习很多特征表示,但依赖基于标注数据的监督学习。本讲座主要介绍如何从没有标注的数据中提取特征表示。报告包括两个部分。在第一部分介绍D2KE,一个通用的机器学习新算法来学习怎么从一个距离函数来学习一个核函数和对应的特征表示(ICLR'19 submission)。第二部分主要介绍如何把D2KE应用到时间数据和文本数据来有效提取特征表示(AIStats'18, oral paper)(EMNLP'18)。
讲者简介:吴凌飞,IBM全球研究院总部(IBM T.J. Watson Research Center)研究员 , 威廉玛丽大学计算机系博士,主要研究方向为机器学习,深度学习,表征学习,自然语言处理,大数据。吴博士已经发表20几篇顶尖杂志和会议,包含KDD, ICDM, AISTATS, EMNLP, AAAI, ICASSP, SC, SIAM Journal on Scientific Computing, IEEE Transaction on Big Data, and Journal of Computational Physics。吴博士同时也是13项美国专利的发明人。吴博士长期担任其相关研究领域多家国际顶尖杂志的评审,比如SIAM Journal on Scientific Computing, SIAM Journal on Matrix Analysis and Applications, IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Big Data, ACM Transactions on Management Information Systems, Data Mining and Knowledge Discovery, Pattern Recognition, and Future Generation Computer Systems。吴博士同时担任了 IEEE Big Data'18 Tutorial Co-Chair (讲座主席), 并长期担任AI/ML/DL/DM国际顶会的TPC (技术委员会委员), 如ICML'19, ICLR'19, WSDM'19, ACML'18, NIPS'18, ICML'18, IJCAI'18, KDD'18, ICDM'18, ICASSP'18, AAAI'18, WSDM'18, ICDM'17, IJCAI'17, BigData'17, KDD'17, AAAI'17, ICSSAP’17, and BigData'16。