Informal's blog

重叠社区检测

背景 同构图是指每个节点的类型相同,那么其他属性的数据只能通过人工刻画的方式融入到节点特征或边的信息中;而异构图能把其他属性的数据直接定义到图结构中,不依赖人工,更好地刻画实际情况。 但在异构图中做社区检测时,同一个节点可能属于不同的社区,就要用到重叠社区检测算法,本文简单介绍下。 举例 LinkComm Linkcomm 是边划分(Link partition)方法中的代表,以边而不是...

人穷极一生到底在追求什么

听播客,嘉宾提到,人都想在财富自由之后出去旅游、打游戏、看电影,做任何自己想做的事情,但真辞职了之后,并不能每天都做这些,日常还是需要做一些自己觉得有价值的事情,就像你不能每天都吃牛肉,但可以每天都吃米饭。 那么人财富自由之后,每天做的事情并不是旅游、打游戏,是这样一件事,每天做完并不会立即感到开心,但这件事做了一年,获得了你当初想要的价值,会让你感到愉悦,这种愉悦感是这一年的坚持带来的,...

重拾生活规划

坚持 2022.1月开始我会给自己制定生活计划,每天每个时间段计划要做什么,比如是否按时睡觉、什么时间看论文、看电影、健身之类的,周末和月底会统计完成率,维持生活规律,这个记录从一月坚持到了六月。 放弃 七月份工作和生活突然都有点忙,之前的规划完成率也很差,只有40%左右(不过睡觉也不会晚太多),感觉记录起来有点麻烦,也感觉习惯应该形成了,放弃了应该也没啥影响,多个原因叠加,就想放弃一下试...

路在何方

互联网增速大跌,未来路在何方? 百度,从市值从全国第一到20名开外,肯定是有大失误的,但反过来说,他依然有400多亿的市值,头条、微信、搜狗的搜索依然没有威胁百度的份额。为什么?因为搜索技术存在壁垒,门槛高,后来者很难超车。 微信、淘宝、美团、滴滴:这些产品上技术壁垒不高,但先入为主,生态做好了壁垒就建起来了。 互联网经历了2000-2015年的飞速发展,现在的增速已经大不如以前,计算机...

社区发现算法 - Louvain

概述 图是由节点和节点之间的边构成的一种结构,比如社交网络中人与人之间的关系、全球各个城市的交通连接情况,都可以表达成一个图结构。 社区发现是指图结构中存在聚集的一个节点集合,比如社交网络中的一个个人际圈子会组成一个个社团,在交通的图结构中,每个国家的城市集合就可以表达为一个社团。 社区发现发现算法就是依据图结构数据,来寻找聚集性社区的算法,正确的社区划分对下游业务应用有重要意义。lou...

《幸福的方法》

很多事情都很重要,但要抓到重点,重要性排序可能是下面这样: 做自己想做的事儿。1)找自己能做 2)从里面挑想做的 3)挑非常想做的 4)挑最想做的 获得快乐、幸福、意义 获得金钱、别人的认可 大多事情只能短暂影响生活节奏,比如晋升涨薪、工作不顺、感情不和。更要关注的是能长期提升幸福值的事情,比如1 有具体的方法可以帮助提升幸福感 每天记下来让自己快乐的事和不快乐的...

读《人类简史》有感

缘由 偶尔听同事提起来这本书,就买来读了读。 物种灭绝的罪魁祸首 读了大概1/4的样子,读到人类才是导致物种灭绝最严重的罪魁祸首,当人类踏足了澳大利亚,美洲,都在同时间内发生了大量的物种灭绝,比如双门齿兽、地懒、长毛象,这一类生物体型庞大,生育周期长,只要定期猎杀就能导致出生率>死亡率,几千年后避免不了物种灭绝。 物竞天择 仔细想想,其实这也是物竞天择、适者生存的结果,当人类和长毛...

妙峰山骑行

缘由 买公路车一个月了,只骑过一次,第一次去了故宫,来回70公里并不觉得特别累,想挑战下妙峰山,就约朋友上路了。 出发 从住的地方到妙峰山单程57公里,但妙峰山路段本身单程21公里,主要是离得太远了。 9.30出发,在公司碰头出发,骑20公里的时候遇到了爬坡,曾一度以为我们已经在上山了,因为那个路段的坡太像爬山了,爬的途中差点中暑,眼前的东西一片模糊,已经看不太清楚了,还产生了掉头回去的想法...

黑客帝国

在公司专心工作,面对27寸大屏一顿操作,突然觉得做的事情似曾相识,以前做过类似的事情,但又实在想不起来了,脑子中突然蹦出了黑客帝国电影,如果我们都是机器人,那我此时此刻就是发生了内存泄露类的错误,赶紧记忆下来,防止这段记忆消失。以后会不会有一天,以人类的能力也能创造出类似地球似的一个生态,生态里的”人类”再不断进步、成长,创造出新的地球生态……。 那么,我们所在的世界,可能真的是一个别人普通...

特征交互

介绍 特征交互是要衡量两组特征之间的相关性,即在特征1 和特征2 分别取某个值时,对模型结果是否有特殊的影响。 基本假设:当两个特征完全独立,即没有任何相关性时,我们认为$PD_{jk}(j,k)=PD_j(j) + PD_k(k)$,特征有一定相关性时,等号不成立。那么就可以用等号前后的两个函数的差异,衡量特征之间的相关性。 那么就可以用一下公式来衡量两个特征的相关性: \(H_{j,...