| January 19, 2019
为期六天的南大-集智-腾讯研究院一起组织的计算社会科学寒假课程今天结束了;接下来三天遴选出来的成员将参加腾讯研究院资助的计算社会科学冬令营,同样在本院硕士之家举行。
- 2019年1月14日(周一)到1月19日(周六)全天 9:00-17:00
- 南京大学(仙林校区)新闻传播学院 紫金楼309
吴令飞,博士。2016年至今,他在芝加哥大学的知识实验室从事博士后研究工作,从2018年开始兼任南京大学新闻传播学院研究员(非全时)。他的主要研究兴趣是团队合作与知识的生产。在研究中,他使用数学建模和机器学习的方法来研究Web of Science,美国专利数据库,Stack Exchange,GitHub 等知识生产系统的大规模数据。他的研究成果发表在Scientific Reports,Physical Review E,PloS ONE等期刊上,并被New Scientist和Science Daily等科学杂志介绍。
本寒假课程(2学分)为任选课,选课对象限定为南京大学研究生,也欢迎其他人旁听,通过知乎答题的形式选拔。课程旨在提高学生的计算能力,帮助传播学研究者在大数据和人工智能时代中生存和发展,以回答有关人类传播和互动的基本问题,并探索与新媒体和社交网络相关的应用。此外,本课程还将介绍网络科学和机器学习技术在人类集体行为方面的理论和应用。通过课程学习:学生可以获得Python编程语言实践经验,应用计算技能收集和分析大规模数据集;探索关于人类传播行为的研究问题,设计和实施关于它们的研究项目;展示复杂网络理论和机器学习技术的知识,理解这些工具所提供的研究机会,在新媒体的背景下使用和发展经典传播理论。
从复杂网络到图模型的计算社会科学
研读营是由集智俱乐部主办,腾讯研究院资助的系列活动的第一期。我们计划将于2019年1月20号-23号举行的为期3天的前沿文献研读、讨论的活动,主题聚焦于促成从复杂网络到图神经网络(Graph Neural Network)的方法论转型、并讨论这种方法论转型对社会科学研究的影响。特别是这种方法论转型如何能帮助我们理解人性、理解机器、理解当代社会。
更多信息见这里
大目标
希望通过此研读营,理解机器正在如何理解和思考人性与社会。 [《理解人性,理解机器,理解当代社会:第一性原理们》 , https://shimo.im/docs/NdTn2LVJooIvyhFA/ ]
具体目标
整理大数据时代社会科学的典范研究,特别是发掘带有“第一性原理”色彩的研究(社会科学领域的伽利略)。
深入讨论最新的关于图神经网络方面的文献。每个参与者根据自己长期以来的科研积累,列出打算在研读营期间完成的项目。
将想法以代码实现,暂定使用Python作为通用语言。
本期研读营中,我们建议每位核心成员在入营之前,围绕主题思考出一到两个研究命题, 并需要在开营的第一天介绍。选题建议有想象力,大胆提问,与自己长期追逐的想法有关联,但可以落实到具体项目上。
我们强烈提倡每个人完成自己项目时,鼓励营员之间的合作,沟通,分享代码。希望每位核心营员都持开放的态度,没有资历等级之分,也能接受不一样的声音。如果研究主题有关联,鼓励结对/组队,一起讨论研究计划,所需的代码结构,做简要的文献综述,并能和其他营员分享讨论。
个人研究项目
- 王成军 虚拟空间的网络嵌入
- 刘河庆 国家政策语义图谱研究
- 李铁薇 知乎问答中的知识梯度
- 王冠宇 会话的生命周期
- 吴令飞 Job and worker recommendation based on skill graph
- 徐绘敏 The shape of stories
- 李睿琪 风险投资公司VC的投资策略演化
- 崔浩川 基于图深度学习预测科学团队的长期影响力
- 陈金燕 在华外国人的社会适应——基于某线上论坛文本的分析
- 王婷 文章标题的重要性
- 林意灵 科普文章类比探究
- 贾小双 Social Dynamic of Urban Life
- 王呈伟 动态语义网络中的社会运动过程
- 张洪 留学归国人员在中国劳动市场状况研究
- 吴友钦 网易云音乐评论的文化维度研究
文献与背景
将相关文献列于此。
社会科学背景
For individuals
No Country for Old Members: User Lifecycle and Linguistic Change in Online Communities—–“People get stuck in the past.”
For groups
Evidence for a Collective Intelligence Factor in the Performance of Human Groups—-“The performance of agent (individuals, groups, etc) across different tasks defines general intelligence, yet in reality, group/institution intelligence develops at the cost of individual general intelligence”.
“Every civilization was built off the back of disposable workforce” —-Blade Runner 2049
Small Teams Disrupt—–“Forgetting is the way to science. Small teams remember; large teams forget.”
For countries
The Product Space Conditions the Development of Nations—–“Knowledge is sticky.”
For society
The Future of Employment: How Susceptible Are Jobs to Computerisation?—–“AI bottlenecks: creativity, social intelligence, and perception and manipulation.”
工程背景
- Pytorch Word2vec Tutorial: https://pytorch.org/tutorials/beginner/nlp/word_embeddings_tutorial.html
- Intro to Deep Learning with PyTorch: https://classroom.udacity.com/courses/ud188
- 集智AI学园 http://campus.swarma.org/gpac=120
- Graph Convolution Network
- Graph Neural Networks: A Review of Methods and Applications
- pygcn代码
- 图注意力网络 Velickovic, P., Cucurull, G., Casanova, A., Romero, A., Lio, P., & Bengio, Y. (2017). Graph attention networks. arXiv preprint arXiv:1710.10903. 代码 https://github.com/PetarV-/GAT 主页 http://petar-v.com/GAT/
Scholars to watch
Maximilian Nickel: Geometric representation learning https://mnick.github.io/
Douwe Kiela: Geometric representation learning https://douwekiela.github.io/
Adriana Romero: Graph attention network https://sites.google.com/site/adriromsor/home
Petar Veličković: Graph attention network https://www.cl.cam.ac.uk/~pv273/
THOMAS KIPF: GRAPH CONVOLUTIONAL NETWORKS https://tkipf.github.io/
参加人员
每个人简历如下
- 吴令飞,芝加哥大学计算中心知识实验室博士后,集智俱乐部核心成员、集智科学家,社会科学背景但自我定位成物理学家。研究兴趣:注意力动力学和知识生产(Attention dynamics and knowledge production)。目前在研究的项目是科学家的跨学科注意力流动。
- 王成军,南京大学新闻传播学院副教授,集智俱乐部集核成员,集智科学家,集智俱乐部南京读书会成员、奥美数据科学实验室主任、计算传播学实验中心成员、香港城市大学互联网挖掘实验室成员,对复杂性科学和可计算方法(如机器学习)感兴趣,现在的研究主要集中于采用网络科学方法分析计算社会科学的研究问题,例如,采用重整化方法分析手机用户的注意力网络和移动网络。
- 徐绘敏,现为南京大学新闻传播学院传播学硕士。计算传播学实验中心成员。对数据科学和机器学习感兴趣。研究方向是采用计算社会科学的研究视角分析人类传播行为,开展数据驱动的计算传播研究,例如用户的手机使用行为和计算叙事。
- 吴友钦,现为南京大学新闻传播学院传播学硕士。计算传播学实验中心成员。对数据科学和机器学习感兴趣。研究方向是采用计算社会科学的研究视角分析人类传播行为,开展数据驱动的计算传播研究。
- 王婷,现为上海财经大学应用统计专业硕士,集智俱乐部核心志愿者。对数据科学和机器学习、计算社会学感兴趣。同时也是本次研读营活动的组织者之一。
- 李铁薇,现为南京大学新闻传播学院硕士,计算传播学实验中心成员。对计算社会科学、数据科学感兴趣。目前的主要研究兴趣点为knowledge hierarchy 及Science communication。
- 崔浩川,现为北京师范下大学系统科学在读博士。对计算社会科学、机器学习感兴趣。目前的主要研究兴趣点为Science of Science,Complex network,human behavior。目前在研究的项目是利用结构信息和元信息预测科学团队合作影响力。
- 李睿琪,现为北京化工大学信息学院副教授,组建城市网络实验室,本科在计算机学院做复杂网络研究,博士在系统科学学院、市政环境工程系、物理系做城市研究。研究兴趣:城市系统建模与计算、风险投资公司社会网络分析 。
- 王呈伟,现为上海大学社会学系研究生。研究兴趣:语义网络,话语与社会变迁。
- 王冠宇,现为武汉大学新闻与传播学院研究生。研究兴趣:the life circle of conversation
- 张洪,现为中山大学社会学与人类学学院副研究员。主要研究兴趣是劳动市场中的性别不平等、性别与移民以及国际移民。目前在研的项目是使用计算社会科学的方法和视角研究留学归国人员在中国劳动市场的状况。
- 陈金燕,现为中山大学社会学与人类学学院研究生。研究兴趣:计算社会学中的文本分析。
- 林意灵,现为集智俱乐部核心志愿者。对自然语言处理在社会科学当中的应用,学科之间的类比科普感兴趣。