作者 | 法纳斯特

责编 | 郭芮




最近正值复联4上映,笔者也发现了一个有趣的网站,主要是关于漫威人物、漫威电影的图谱。







https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html




其实之前笔者也利用了有关Graph的库实现了一波人物的关系分析,只不过分析结果比较粗糙而已~下面是网站的概况,网站是基于Graph技术开发的。,大家可以一览。









那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?本文就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。









获取分析








人物及人物关联信息从网站上获取,具体接口如下:









数据为json格式,分别在「characters」和「relationship」中。









这里的信息是分别指托尼·斯达克,关系「0」为朋友,斯蒂文·罗杰斯。













数据获取







具体代码如下:







import json
import requests

headers = {
    'user-agent':
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}

url = 
'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'
response = requests.get(url=url, headers=headers)
result = json.loads(response.text)

num = 0
names = []
item = {0: 'friend', 1: 'enemy', 2: 'creation', 3: 'family', 4: 'work', 5: 
'love'}

for i in result['relationship']:
    subject = result['relationship'][i]['id']
    object = result['relationship'][i]['target_id']

    if subject not in names:
        names.append(subject)
    if object not in names:
        names.append(object)

    relation = int(result['relationship'][i]['relationship'])
    with open('relation_message.csv', 'a+') as f:
        f.write(subject + ',' + object + ',' + item[relation] + '\n')

for j in names:
    num += 1
    with open('names_message.csv', 'a+') as f:
        f.write(j + ',' + str(num) + '\n')

for k in result['characters']:
    id = result['characters'][k]['id']
    name = result['characters'][k]['name']
    status = result['characters'][k]['status']
    species = result['characters'][k]['species']
    with open('message.csv', 'a+') as f:
        f.write(id + ',' + name + ',' + status + ',' + species + '\n')







最后成功获取数据。









人物名为简称,共计182个人物。









1144条人物关系数据,4大类型,下面是182个人物的一些详情信息:









包含了人物的名字及简称,存活状态,人物属性。









数据可视化







下面通过Neo4j对人物关系进行可视化,Neo4j的安装这里就不细说了,大家可以自行百度。




开启Neo4j服务后,登陆Neo4j网站,初始化界面如下:









先加载第一个文件:









具体代码如下:




LOAD CSV  WITH HEADERS FROM 'file:///names_message.csv'
 AS data CREATE (:people{name:data.name, id:data.id});





下面加载第二个文件:









具体代码如下:







LOAD CSV  WITH HEADERS FROM "file:///relation_message.csv" AS relations

MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})
CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)





点击1144按钮处,取消限制数,再点击全屏。













这里大致能看出来漫威的人物聚集情况,第一大反派灭霸(thanos),原来这么孤立的。




这里由于人物太多,造成观察不便,所以对结果进行一些筛选,比如筛选托尼·斯达克的朋友,运行下面的代码。




match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]->() return p;





得到下图结果:










其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。




下面再来看一下美队的女友吧。









佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。









总结







本次只是对Neo4j的一些简单操作,后期或许会去深入了解。此外漫威的这些人物信息,还可以玩出很多花样的。




也希望大家能去动手尝试尝试,做一枚硬核铁粉~

作者:法纳斯特,Python爱好者,专注爬虫,数据分析及可视化。

声明:本文首发个人公众号法纳斯特,作者投稿,版权归其个人所有。

【END】




作为码一代,想教码二代却无从下手:


听说少儿编程很火,可它有哪些好处呢?

孩子多大开始学习比较好呢?又该如何学习呢?

最新的编程教育政策又有哪些呢?

下面给大家介绍CSDN新成员:极客宝宝(ID:geek_baby)

戳他了解更多↓↓↓




 热 文 推 荐 




☞ 大疆前员工泄露源码入狱;阿里巴巴普惠字体发布;谷歌搜索加入灭霸彩蛋 | 极客头条
<http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650719185&idx=1&sn=560e4b1d8628bd5e804c29a7766dc5e9&chksm=bea6b20289d13b14f73196f4b0bf62054996466b35f7c3e48c027707c853c2743ecd8641dc16&scene=21#wechat_redirect>


<http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650719074&idx=3&sn=fd56d2f3379ff706f68359ad5d76a1e2&chksm=bea6b2b189d13ba7cb43bba91d380dbadce5839f4a54af56922d5e2ec1256c7415db72067d57&scene=21#wechat_redirect>
 拿什么重建你,巴黎圣母院?
<http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650719185&idx=2&sn=b18947253d59cf04d38801c4cc5d8d90&chksm=bea6b20289d13b14199be73ddc29663bb6ba97555a44c839e8fa2e7f47ee45e204f1aa2b6714&scene=21#wechat_redirect>



<http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650719074&idx=3&sn=fd56d2f3379ff706f68359ad5d76a1e2&chksm=bea6b2b189d13ba7cb43bba91d380dbadce5839f4a54af56922d5e2ec1256c7415db72067d57&scene=21#wechat_redirect>
 @程序员,你的技术为啥十年八年也没有进步?
<http://mp.weixin.qq.com/s?__biz=MjM5MjAwODM4MA==&mid=2650719185&idx=3&sn=e6392a54d81b055fb610cff253ca76c7&chksm=bea6b20289d13b14e4bc3c2f0ef90a6c10fe2128afdee5ab201e6c03b1131018ca96ad45f1fc&scene=21#wechat_redirect>


☞厉害了!超越 Google,16 岁少女发明眼疾诊断 AI 模型!
<http://mp.weixin.qq.com/s?__biz=Mzg3MDA4NDkxMQ==&mid=2247483898&idx=1&sn=393249c9415cd68ad0419916b58eeb11&chksm=ce9279baf9e5f0aceccf2d68fc34859293629b4789dfaeb80471dd778a2fd0e091f02c9b2e06&scene=21#wechat_redirect>

☞ 和 996 对着干的百亿巨头:不打卡,不设 KPI,福利好到爆,却称霸行业 20 年!
<http://mp.weixin.qq.com/s?__biz=MzA5MzY4NTQwMA==&mid=2651010564&idx=1&sn=bd6a56282c0c4962d8f382bbfbc29f39&chksm=8bad85f3bcda0ce5bcd6226e8885846de94816406d953b52293f5f5fe0b492ff46a42ded67b8&scene=21#wechat_redirect>

☞ 回报率29%! 大神用情感分析创建一个比特币交易算法, 原来交易玩的是心理战
<http://mp.weixin.qq.com/s?__biz=MzU2MTE1NDk2Mg==&mid=2247494769&idx=1&sn=abb7bfed45ee3f260bbf1ef3bd3076f1&chksm=fc7fb28ccb083b9a75bef05479cf2f00a63de95a28c488d373e2e48745d3d5bc8bb1a1fed836&scene=21#wechat_redirect>

☞ 开发者如何写好技术简历?
<https://blog.csdn.net/FL63Zv9Zou86950w/article/details/89629600>

☞ 写代码这条路,能走多远?阿里算法专家告诉你
<http://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247504685&idx=1&sn=809459a58b1aed8a085e6f9ef547ce36&chksm=e99ee0d4dee969c2fa6edc341c0a6deadcb2d03ad76add56c1425c2f40642274e56ec4751f1e&scene=21#wechat_redirect>

☞ 她说:为啥程序员都特想要机械键盘?这答案我服!

System.out.println("点个在看吧!");
console.log("点个在看吧!");
print("点个在看吧!");
printf("点个在看吧!\n");
cout << "点个在看吧!" << endl;
Console.WriteLine("点个在看吧!");
Response.Write("点个在看吧!");
alert("点个在看吧!")
echo "点个在看吧!"
你点的每个“在看”,我都认真当成了喜欢

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:637538335
关注微信