理解人类个体移动的模式
与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。
与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。
与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。
本文主要针对的是无监督的聚类算法,包括K-means聚类、谱系聚类和LDA主题建模。
LDAvis 是一个交互式的主题模型可视化包,可以将主题模型建模后的结果,利用D3.js封装好的一个可视化模板,制作成一个网页交互版的结果分析工具。
与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。
本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。
I predict that sociologists will have to choose between story telling and science. Turco and Zuckerman, in contrast, predict that no such choice will be forc...
We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...
本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。
On the other hand a single high impact paper is worth many low impact papers, so from a career perspective it’s not necessarily a waste of time to devote a y...
Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...
In spite of many thousands of published papers, there’s been surprisingly little progress on the “big” questions that motivated the field of computational so...
I argue that one way for social science to make progress is to adopt a more solution-oriented approach, starting first with a practical problem and then aski...
去年我参与翻译了《社会网络分析:方法与实践》一书,其中,我负责翻译4,5,6三章。今天收到了一封来自台湾大学的一个读者的来信,提出了书中的一个问题,如下:
本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。
Journalists look for the unusual handful of individual items that might point toward a news story or an emerging narrative thread.
Source code and materials for the tutorial ‘Introduction to Simulation: Complex social dynamics in a few lines of code’. The tutorial was held on 11th July, ...
在使用python读取一些数据的实际应用当中,我们总会遇到各各种各样的encoding的问题,一般会使用utf8,中文常用的是gb18030和gbk。有时候这种问题非常令人头痛,有没有一种终极的解决方案?采用二进制的方法就可以读取,然后需要将二进制的字符串进行相应的decode,并忽略出错的地方。
I’ve always felt a bit nervous about using them (ERGM), though, because I didn’t feel confident I really understood how they worked, and how they were being ...
This post aims to analyzing networks with ERGMs using PyMC in python.
本文主要针对的是无监督的聚类算法,包括K-means聚类、谱系聚类和LDA主题建模。
本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。
Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。
在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...
在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...
本文主要针对的是无监督的聚类算法,包括K-means聚类、谱系聚类和LDA主题建模。
Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。
本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。
在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...
问题 小可老师给我提了一个问题:为什么一个微博扩散网络的平均最短路径长度是0.001?
一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。
指数截尾的幂律分布如何拟合?本文介绍使用scipy的解决方案
幂律分布的存在非常广泛, 对于很多科学研究问题具有重要意义。但是,因为幂律分布的长尾具有很大的波动,因而确定长尾的范围尤为复杂。最小二乘方法估计幂律分布会有很大的误差,即使没有误差,也并未能确定这一分布是否幂律分布,因为没有同其他的分布的形式做比较,比如指数、对数正态、截尾的幂律。Clauset等人2009年发表...
I’ve always felt a bit nervous about using them (ERGM), though, because I didn’t feel confident I really understood how they worked, and how they were being ...
This post aims to analyzing networks with ERGMs using PyMC in python.
幂律分布的存在非常广泛, 对于很多科学研究问题具有重要意义。但是,因为幂律分布的长尾具有很大的波动,因而确定长尾的范围尤为复杂。最小二乘方法估计幂律分布会有很大的误差,即使没有误差,也并未能确定这一分布是否幂律分布,因为没有同其他的分布的形式做比较,比如指数、对数正态、截尾的幂律。Clauset等人2009年发表...
Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。
本文主要针对的是无监督的聚类算法,包括K-means聚类、谱系聚类和LDA主题建模。
本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。
本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。
在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...
问题 小可老师给我提了一个问题:为什么一个微博扩散网络的平均最短路径长度是0.001?
本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。
Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...
本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。
Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...
I predict that sociologists will have to choose between story telling and science. Turco and Zuckerman, in contrast, predict that no such choice will be forc...
We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...
On the other hand a single high impact paper is worth many low impact papers, so from a career perspective it’s not necessarily a waste of time to devote a y...
In spite of many thousands of published papers, there’s been surprisingly little progress on the “big” questions that motivated the field of computational so...
I argue that one way for social science to make progress is to adopt a more solution-oriented approach, starting first with a practical problem and then aski...
这个网站使用Jekyll构建。Check out the [Jekyll docs][jekyll-docs] for more info on how to get the most out of Jekyll. File all bugs/feature requests at [Jekyll’s GitHu...
Latora(2001)的主要贡献 对于小世界网络的描述,可以简化为efficiency(记作E)一个变量即可,且efficiency本身有其物理意义。efficiency衡量了网络信息交换的效率。
WebGL Globe是一个地理数据可视化的Javascript。我将尝试使用WebGL Globe来可视化社会企业家的全球分布。
今天上午在朋友圈读到了《12行Python代码,自在随心应付微信拜年群发》一文,非常简单,主要是借助于两个python的包 itchat和pillow,可以使用pip安装。
本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。
人类动力学(human dynamics)研究者习惯于从系统的角度来分析问题;社会科学家则强调个体作为基本研究单位的重要性。系统的特性会作用于个体,个体的行动汇总起来可以塑造系统的全局特性。
与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。
网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。
网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。
演员网络是一个被广泛研究的网络数据。这个数据的规模很大,分析起来并不如想得那么简单。我们首先读取数据。
1970年至1990年20年间,东德的恐怖袭击事件一直保持着低水平的平稳趋势,但在1990年东西德统一后,德国的恐怖袭击事件激增。而前苏联在这20年间,国内恐怖袭击事件一直保持着递增的平稳趋势,1989年苏联解体,恐怖袭击事件在1990年突然上升,虽略有波动,但一直稳健增长。
由武汉大学媒体发展研究中心、财新网和中美教育基金联合主办、镝次元数据新闻研究中心承办的第三届数据新闻比赛现在开始接受报名。本次大赛将通过奖励最出色的数据新闻报道或数据研究报告来促进中国数据新闻行业和专业人才培养的发展。
网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。
12月22日上午九点三十分,南京大学新闻传播学院计算传播实验中心第四次讲座如约开讲,本次应邀前来为大家做讲座的是来自亚利桑那州立大学的博士后研究者吴令飞博士。吴令飞博士毕业于香港城市大学媒体与传播学系,曾在百度做算法工程师,主要研究方向为注意力动力学。
12月22日上午九点三十分,南京大学新闻传播学院计算传播实验中心第四次讲座如约开讲,本次应邀前来为大家做讲座的是来自亚利桑那州立大学的博士后研究者吴令飞博士。吴令飞博士毕业于香港城市大学媒体与传播学系,曾在百度做算法工程师,主要研究方向为注意力动力学。
人类动力学(human dynamics)研究者习惯于从系统的角度来分析问题;社会科学家则强调个体作为基本研究单位的重要性。系统的特性会作用于个体,个体的行动汇总起来可以塑造系统的全局特性。
演员网络是一个被广泛研究的网络数据。这个数据的规模很大,分析起来并不如想得那么简单。我们首先读取数据。
在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...
‘信息扩散作为一种普遍存在的现象,在人类生活中扮演着重要角色。伴随着Web2.0的兴起,信息共享网站(Information Sharing Website,ISW)已经成为互联网信息扩散的新平台。信息共享网站通常以社交网络服务(Social Networking Service,SNS)、信息聚合器(infor...
‘《中国网络传播研究》计算传播专刊 的征文方向包括(但不限于):计算社会科学、计算传播学、传播网络分析、新闻文本挖掘、传播计算方法、数据新闻、计算广告、新闻推荐系统等方面。截止时间为2019年11月1日’
TrueSkill算法是Elo排名方法与贝叶斯规则的结合,可用于计算竞赛选手的能力排名。Dangauthier2007提出了这个方法 ,Liu2013创造性地建议使用这方法来计算问答类社区问题的难度。
我给本科生上课的时候,推荐了datacamp的cheatsheets,具体内容可以参见课程的Github页面。
中国新闻史学会计算传播学研究委员会2018年大会(简称“计算传播学年会2018”)由中国新闻史学会计算传播学研究委员会主办,北京师范大学新闻传播学院承办,南京大学新闻传播学院、香港城市大学传播研究中心/互联网挖掘实验室协办,百度赞助。会议旨在探索并推进计算传播学的发展,促进传播学与其它领域以及其他学科的对话和合作...
熟悉计算社会科学研究范式并掌握基本的计算技能,是传播学者进入计算计算传播学领域的基本条件。基于此,南京大学新闻传播学院、百度、社会媒体处理专业委员会以及香港城市大学传播研究中心/互联网挖掘实验室拟共同举办2017年计算传播学年会暨工作坊(南京,9月22-9月24日),包括一天半工作坊 + 一天会议。
A Special Issue of Asian Journal of Communication on Introducing Computational Social Science for Asia-Pacific Communication Research, deadline May 15 2017
在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...