Posts by Tags

Barabasi

理解人类个体移动的模式

3 minute read

与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。

Human Mobility

理解人类个体移动的模式

3 minute read

与列维飞行和随机游走模型预测相反,人类的实际移动轨迹显示出高度的时空规律性,个体特征可以用一个与时间无关的特征移动距离和一个优先返回概率来刻画。在校正行进距离的差异和每个轨迹固有的各向异性之后,个体行进模式转变成单个空间概率分布,这说明尽管他们的旅行历史具有多样性,人类的移动轨迹遵循简单的可再现模式。

LDA

R

使用R模拟网络扩散

2 minute read

与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。

SNS

从概念到真实:SNS的形式蜕变

less than 1 minute read

本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。

Watts

VERSTEHEN FOR SOCIOLOGY: COMMENT ON WATTS

44 minute read

We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...

社会传染动力学:阈值模型及其扩展

less than 1 minute read

本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。

Duncan Watts’ AMA Interview

18 minute read

On the other hand a single high impact paper is worth many low impact papers, so from a career perspective it’s not necessarily a waste of time to devote a y...

Common Sense and Sociological Explanations

88 minute read

Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...

book

译稿勘误:有向三元组的类型

less than 1 minute read

去年我参与翻译了《社会网络分析:方法与实践》一书,其中,我负责翻译4,5,6三章。今天收到了一封来自台湾大学的一个读者的来信,提出了书中的一个问题,如下:

cascade

社会传染动力学:阈值模型及其扩展

less than 1 minute read

本文回顾了社会传染的经典模型之一阈值模型的相关内容。并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型。该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。

computational journalism

Computational Journalism

21 minute read

Journalists look for the unusual handful of individual items that might point toward a news story or an emerging narrative thread.

culture dynamics

encoding

解决python读取文本数据中的encoding问题

1 minute read

在使用python读取一些数据的实际应用当中,我们总会遇到各各种各样的encoding的问题,一般会使用utf8,中文常用的是gb18030和gbk。有时候这种问题非常令人头痛,有没有一种终极的解决方案?采用二进制的方法就可以读取,然后需要将二进制的字符串进行相应的decode,并忽略出错的地方。

ergm

Implementing an ERGM from scratch in Python

10 minute read

I’ve always felt a bit nervous about using them (ERGM), though, because I didn’t feel confident I really understood how they worked, and how they were being ...

gensim

ggplot2

使用ggplot2可视化多主体建模结果

less than 1 minute read

本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。

hits

理解HITS算法

9 minute read

Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。

human mobility

思考真实熵

3 minute read

在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...

真实熵与人类行为可预测性

3 minute read

在Limits of Predictability in Human Mobility一文(Song, 2010, Science)当中,Song等人提出人类移动行为的可预测性问题。强调了采用香农熵或随机熵不能捕捉到移动位置的时间序列特点,主张采用一种真实熵(the actual entropy)的测量方式,表示...

k-means

networkx

理解HITS算法

9 minute read

Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。

在线扩散的结构性病毒特征

1 minute read

本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。

网络增长动力学:BA模型

2 minute read

在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...

pagerank

PageRank算法浅介

1 minute read

一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的超链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。

power law

powerlaw

使用powerlaw拟合重尾分布

2 minute read

幂律分布的存在非常广泛, 对于很多科学研究问题具有重要意义。但是,因为幂律分布的长尾具有很大的波动,因而确定长尾的范围尤为复杂。最小二乘方法估计幂律分布会有很大的误差,即使没有误差,也并未能确定这一分布是否幂律分布,因为没有同其他的分布的形式做比较,比如指数、对数正态、截尾的幂律。Clauset等人2009年发表...

python

Implementing an ERGM from scratch in Python

10 minute read

I’ve always felt a bit nervous about using them (ERGM), though, because I didn’t feel confident I really understood how they worked, and how they were being ...

使用powerlaw拟合重尾分布

2 minute read

幂律分布的存在非常广泛, 对于很多科学研究问题具有重要意义。但是,因为幂律分布的长尾具有很大的波动,因而确定长尾的范围尤为复杂。最小二乘方法估计幂律分布会有很大的误差,即使没有误差,也并未能确定这一分布是否幂律分布,因为没有同其他的分布的形式做比较,比如指数、对数正态、截尾的幂律。Clauset等人2009年发表...

理解HITS算法

9 minute read

Hits算法通过迭代的方法来计算权威度a和导航度h。其中: 1. 节点i的权威度$a_i$利用指向它的节点的在上一轮的导航度hlast和链接的权重来决定。 2. 节点i的导航度$h_i$利用指向它指向的节点在这一轮的权威度$a_i$和链接的权重来决定。

Python中的统计可视化库Seaborn

less than 1 minute read

本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。

在线扩散的结构性病毒特征

1 minute read

本文以《The Structural Virality of Online Diffusion》一文为基础,介绍了The Structural Virality在当下在线信息扩散中的特点。

网络增长动力学:BA模型

2 minute read

在 1999的 一篇文章里, Barabasi 和 Albert 提出了网络增长的优先链接(preferential attachment)模型.他们假设新节点每次携带常数m条边,且每条边链接到老节点的概率与老节点的度成正比。为了获得度分布的解析式,他们在论文原文中用的是平均场方法(mean-field anal...

r

使用ggplot2可视化多主体建模结果

less than 1 minute read

本文将介绍如何使用R软件中的ggplot2展示不同参数条件下多主体建模的数据,主要包括数据读取、数据清洗和数据可视化三个环节。

science

Common Sense and Sociological Explanations

88 minute read

Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...

seaborn

Python中的统计可视化库Seaborn

less than 1 minute read

本文主要介绍使用seaborn可视化单变量、可视化双变量、可视化多对关系、可视化线性关系、绘制函数、适应各种模型、控制图片大小和格式、分类数据画图等内容。

social

Common Sense and Sociological Explanations

88 minute read

Sociologists rely on common sense more than they realize. Moreover, this unacknowledged reliance causes serious problems for their explanations of social act...

social science

VERSTEHEN FOR SOCIOLOGY: COMMENT ON WATTS

44 minute read

We seek only to demonstrate that his observations do not imply that the pursuit of verstehen is a diversion for the field. To the contrary, we argue that the...

Duncan Watts’ AMA Interview

18 minute read

On the other hand a single high impact paper is worth many low impact papers, so from a career perspective it’s not necessarily a waste of time to devote a y...

update

Welcome to Jekyll, Markdown, and Atom!

2 minute read

这个网站使用Jekyll构建。Check out the [Jekyll docs][jekyll-docs] for more info on how to get the most out of Jekyll. File all bugs/feature requests at [Jekyll’s GitHu...

watts

小世界网络的输运效率

1 minute read

Latora(2001)的主要贡献 对于小世界网络的描述,可以简化为efficiency(记作E)一个变量即可,且efficiency本身有其物理意义。efficiency衡量了网络信息交换的效率。

webGL

wechat

12行Python代码回复微信拜年

less than 1 minute read

今天上午在朋友圈读到了《12行Python代码,自在随心应付微信拜年群发》一文,非常简单,主要是借助于两个python的包 itchat和pillow,可以使用pip安装。

互联网

从概念到真实:SNS的形式蜕变

less than 1 minute read

本文载于《数字媒体阅读报告》。本文是作者从技术和资本角度对于SNS浪潮的反思。其中部分内容取自作者硕士毕业论文,虽然名为《正在爆发的互联网革命》一书的读书笔记,但并不限于此。

传递性

社交网络演化中的局部传递性

less than 1 minute read

人类动力学(human dynamics)研究者习惯于从系统的角度来分析问题;社会科学家则强调个体作为基本研究单位的重要性。系统的特性会作用于个体,个体的行动汇总起来可以塑造系统的全局特性。

信息扩散

使用R模拟网络扩散

2 minute read

与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。

关系

网络残缺度:共同好友间可否两步到达?

less than 1 minute read

网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。

嵌入度

网络残缺度:共同好友间可否两步到达?

less than 1 minute read

网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。

度相关

恐怖主义

恐怖袭击距离中国有多远?

less than 1 minute read

1970年至1990年20年间,东德的恐怖袭击事件一直保持着低水平的平稳趋势,但在1990年东西德统一后,德国的恐怖袭击事件激增。而前苏联在这20年间,国内恐怖袭击事件一直保持着递增的平稳趋势,1989年苏联解体,恐怖袭击事件在1990年突然上升,虽略有波动,但一直稳健增长。

数据新闻

2017数据新闻比赛

less than 1 minute read

由武汉大学媒体发展研究中心、财新网和中美教育基金联合主办、镝次元数据新闻研究中心承办的第三届数据新闻比赛现在开始接受报名。本次大赛将通过奖励最出色的数据新闻报道或数据研究报告来促进中国数据新闻行业和专业人才培养的发展。

残缺度

网络残缺度:共同好友间可否两步到达?

less than 1 minute read

网络是由节点和关系构成的,而对于关系的描述是社会网络的关键。我们已经知道对于节点的网络特性可以从中心度、近度、介度、特征度(eigenvalue centrality)等方式描述。那么对于关系呢?最简单的就是直接关系的强度了。

注意力

注意力流网络分析的三个维度

less than 1 minute read

12月22日上午九点三十分,南京大学新闻传播学院计算传播实验中心第四次讲座如约开讲,本次应邀前来为大家做讲座的是来自亚利桑那州立大学的博士后研究者吴令飞博士。吴令飞博士毕业于香港城市大学媒体与传播学系,曾在百度做算法工程师,主要研究方向为注意力动力学。

流网络

注意力流网络分析的三个维度

less than 1 minute read

12月22日上午九点三十分,南京大学新闻传播学院计算传播实验中心第四次讲座如约开讲,本次应邀前来为大家做讲座的是来自亚利桑那州立大学的博士后研究者吴令飞博士。吴令飞博士毕业于香港城市大学媒体与传播学系,曾在百度做算法工程师,主要研究方向为注意力动力学。

社交网络

社交网络演化中的局部传递性

less than 1 minute read

人类动力学(human dynamics)研究者习惯于从系统的角度来分析问题;社会科学家则强调个体作为基本研究单位的重要性。系统的特性会作用于个体,个体的行动汇总起来可以塑造系统的全局特性。

网络

探寻社交网络中的关系: 统计网络模型初探

9 minute read

在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...

计算传播学

王成军副教授专著《跨越网络的门槛》出版

less than 1 minute read

‘信息扩散作为一种普遍存在的现象,在人类生活中扮演着重要角色。伴随着Web2.0的兴起,信息共享网站(Information Sharing Website,ISW)已经成为互联网信息扩散的新平台。信息共享网站通常以社交网络服务(Social Networking Service,SNS)、信息聚合器(infor...

《中国网络传播研究》计算传播专刊2019征稿通知

less than 1 minute read

‘《中国网络传播研究》计算传播专刊 的征文方向包括(但不限于):计算社会科学、计算传播学、传播网络分析、新闻文本挖掘、传播计算方法、数据新闻、计算广告、新闻推荐系统等方面。截止时间为2019年11月1日’

使用Python来实现TrueSkill算法

4 minute read

TrueSkill算法是Elo排名方法与贝叶斯规则的结合,可用于计算竞赛选手的能力排名。Dangauthier2007提出了这个方法 ,Liu2013创造性地建议使用这方法来计算问答类社区问题的难度。

使用python读取关系数据库

less than 1 minute read

我给本科生上课的时候,推荐了datacamp的cheatsheets,具体内容可以参见课程的Github页面。

中国新闻史学会计算传播学研究委员会2018年大会通知

1 minute read

中国新闻史学会计算传播学研究委员会2018年大会(简称“计算传播学年会2018”)由中国新闻史学会计算传播学研究委员会主办,北京师范大学新闻传播学院承办,南京大学新闻传播学院、香港城市大学传播研究中心/互联网挖掘实验室协办,百度赞助。会议旨在探索并推进计算传播学的发展,促进传播学与其它领域以及其他学科的对话和合作...

2017年计算传播学年会暨工作坊

1 minute read

熟悉计算社会科学研究范式并掌握基本的计算技能,是传播学者进入计算计算传播学领域的基本条件。基于此,南京大学新闻传播学院、百度、社会媒体处理专业委员会以及香港城市大学传播研究中心/互联网挖掘实验室拟共同举办2017年计算传播学年会暨工作坊(南京,9月22-9月24日),包括一天半工作坊 + 一天会议。

探寻社交网络中的关系: 统计网络模型初探

9 minute read

在上一章当中,我们对于网络的基本知识进行了介绍,这些知识构建起了网络科学的基础,同时也孕育着巨大的潜能。社会科学追求理论的建构,但疏于思考理论层次的丰富性。以社会学为例,一度在宏大理论和抽象实证主义之间摇摆(参见米尔斯所著《社会学的想象力》)。大数据时代的到来,再一次使得少数人开始对理论的认识产生动摇,以为只要把...