《随椋鸟飞行》

目录 Life

这本书从关于椋(liang)鸟的飞行开始介绍,穿插进作者科研生涯的一些感悟。

书摘两则:

相互作用几乎只发生在相邻最近的个体之间。

鸟阵边缘的密度与中心的密度相比, 几乎高了30%。椋鸟越是靠近鸟阵边缘 就互相离得越近,越接近中心则离得越 远。这有点像在拥挤的公共汽车上,越是靠近车门,乘客就越密集,刚上车的 人、要下车的人,甚至连要继续留在车上的人都挤在车门旁边。

滴水穿石

目录 Life

投了一年多的工作,总算接收了。经历了改实验,改写作,继续改写作,等等。

做扎实的工作,这个初衷幸好坚持下来了。我也会一直坚持下去。

好的坏的都看过

目录 Life

把硕士遗留下来的两份工作的 camera ready 提交完,感觉一个阶段彻底结束了。

硕士三年半,多出来的半年是大四下,那时候已经在实验室。最开始不知道做什么,懵懵懂懂地,老师给安排了一个方向。可惜老师自己并没在那上面投入很多,本来准备带我投一篇,结果中途夭折,后面就都是一个人来了。很长时间里,研究都进展不顺利。磕磕碰碰地走着,我在这个过程中涉猎广泛。虽然没做出什么东西来,讲过的几次组会中,有两次组会对同学们的工作有比较大的启发,实验室投出去的工作中,或多或少可以看到那两次组会的影子。对此,我还是很欣慰的。

到了研二的某个时间,必须得做出什么来,才好去申学校。在迫切的需求下,我才做出了第一份很垃圾的工作。现在看,还觉得惨不忍睹。投出去后,觉得不够,得再来一个,又是一个拼凑出来的工作。这两份工作遗留至今,才勉强被接受。看了这么久的论文,自己心里大概有杆秤,第一篇最多只是 C 会的水准,第二篇可能达到一般的 B 会。而论文是否能被接受,和当前的学术潮流,以及审稿人的品味,与很多不可控的因素都有关系,俗称看运气。

真正做得开心的工作,是为了给硕士论文凑工作量,然后突然有天蹦出来个好的问题和一个可能好的解决办法。那个问题只有一份工作做过,但做的一般,我有比较大的可能去更好地解决它。那时候,要弄申请,还有各种杂事,所以拖到硕士毕业都没完成。来到慕尼黑之后,头几个月在想新的点子,硕士的点子,如果现在发出来,也只属于硕士的工作,所以我开始并不积极。在挣扎了几个月,没想出新点子,在老师的催促下,我决定优先把那份工作完成。于是,接近两个月的时间里,对之前的算法进行了非常多的改造,加了很多新东西,最后成稿里大部分的内容是之前点子里不包括的。投出去的时候,自己并没有很大的期望,因为时间缘故,论文里有一个地方没能用实验验证,这是个 bug,如果还有机会,我想解决。意想不到的是,rebuttal 的时候,审稿人的意见普遍正面:对一个比较新的问题,提出了一个较全面的解决方法,对这个解决方法的流程中可能存在的问题,都做了说明并且提出了相应的解决策略,所以整篇论文没有明显的漏洞。再后来,这份工作幸运地一投即中。

博士第一年结束了。大部分时间都在刷论文,仿佛回到了研一那时候,都没什么成果。做科研是个厚积薄发的过程。对于数据挖掘这个领域而言,找一个好问题,相比起对一个经典问题提出新颖的解法,可能更容易发论文一些。但从贡献上来说,二者并没有高低。最优的是,对一个好问题,提出新颖的解法。这是我现在的目标。目前没有博士新工作,我还撑得住,不去灌水。能撑多久,走走看。

心情压抑的时候,我应该做什么

目录 Life

德国疫情开始的那段时间,戴口罩的义务并没有普及,为数不多的亚洲人,戴着口罩反而会引人侧目。那时候,没买到口罩的我就已经放弃公共交通了,徒步往返实验室,但时间花太久。再后来,慕尼黑大学的计算机学院开始远程办公,至今都未恢复正常工作:学院的开放时间只到下午 5 点,只在工作日开放,规定每个房间最多只有一人,食堂不开门。

种种因素的交织下,我在宿舍已经待了大半年。除了去超市买菜,周末偶尔会找一处慕尼黑的景点转转。心情愉悦的时候,大部分都是因为出了门,吹着风,晒一晒自己,或者感受一下袭面的雨水。绝大部分在宿舍的时间都是很压抑的。

日复一日的,自己做饭,独自工作的生活。因为工作没有进展,心情更加的压抑了。剖析一下自己,现在这种情况的表面原因,是因为一个人宅着太久,缺乏外界的刺激;深层原因还是因为工作不顺,负反馈加剧了内心驱动力不足,效率更低,负负没有得正。

我能做什么呢?负反馈的链条很难一下子打断,从小处来讲,活出新鲜感,增强外界刺激,是两个可行的策略。

活着,除了盲然对着电脑的时间,再就是一日三餐。

饮食方面,超市能买到的蔬菜,牛肉猪肉鸡肉,香肠,超市里有的几乎都尝试过,哦,没有自己做过沙拉,之前在食堂吃过的沙拉给了我不好的印象。目前我的做菜风格是偏辣,接下来尝试一下做淡一些、偏甜的东西。

只能在宿舍工作吗?目前是,实验室不方便去,宿舍附近也没有自习室,似乎没有公共场所可以工作。我已经接受了这个事实,但还是要想想,怎样创造一个可能提高创造性的工作环境。

增强外界的刺激,主要通过与同学的交流。实验室的两个德国人不会主动和我交流问题,我有问题会主动找相关领域的人。但更多时候,我的问题是找不到人交流的。在这里,并没有像阿邵那种思维特别发散,能融会贯通各种问题的人。再去找阿邵交流交流?看了这么久论文,也做了这么多笔记,是时候整理出一个 report,找人叨叨了。

除了学术上的交流,还是可以找朋友聊聊生活的。我也是惭愧,虽然朋友不少,但大部分都是安静躺在聊天列表里,偶尔在朋友圈互动互动。这样不行。

来慕尼黑快一年了,纪念一下没有博士新工作的一年。

哪种聪明

目录 Life

和朋友的交流,让我想到一些很有意思的事情。这些事情的核心,大概就是哪种聪明。

我做事情,是不是一定要符合自己的美学?比如:做一项工程,我是不是要做到没有一点冗余代码,写很规范的注释还有文档。这是我的美学,这样的美学有人会关心吗?客户懂吗,他只会关心我实没实现他的需求,并不关心代码的规范性。如果是正式公司,提交这样的代码,可以吗?可以呀,只要加上文档注释就好了,小公司可能到这个程度就可以了。那么冗余代码能不能去掉呀?朋友语:不能,现在软件的逆向工程这么厉害,没个准公司做的产品发布后没多久就被剽窃了,所以加点别人看不懂的制造点难度也是需要的。大公司还是很注重代码质量,所以注意分清 私活 还有 主要工作。

如果是私活,需要做的很完美,很容易维护,代码很清晰吗?这样的美学可不可以带给我很大的经济效益呢?如果我接到一个私活,写的东西只有我自己能看懂,不加注释,难以维护,但能很好的实现功能需求,一般不会出现问题。出问题的时候,用户只有找我,这样是不是能有更多的经济效益呢?

之前没仔细想过这些,我也没有在公司真正工作过,朋友说的这些引人深思。朋友是很聪明的那种,工程能力很强。他说的这些常人很难做到。

聪明是要建立在能力的基础之上:如果写个东西,三天两头出问题,谁敢找你;写个东西,可以长时间稳定运行,具有很高的容错能力,用的人才会放心。 建立在能力基础上的聪明才有价值。

当行业规范,知识产权保护等越来越完善,也许这些小聪明就没有用武之处了。当然,聪明的人总会有合适的地方释放自己的才华,而踏实,是作为普通人的我们的最大的聪明。

这些年看过的韩剧

目录 Life

关于爱情

半之半 春夜 当你沉睡时 杀了我治愈我 天气好的话,我会去找你 治愈者 匹诺曹 城市猎人 德鲁纳酒店 W-两个世界 她的私生活 经常请吃饭的漂亮姐姐 阿尔罕布拉宫的回忆

犯罪题材

信号 武法律师 监视者 浪客行 赤月青日 隧道 杀之 特殊案件专案组TEN 1&2 特殊失踪专案组:失踪的黑色M 秘密森林

关于职场

心里的声音 Life 辅佐官1&2 囚犯医生 未生 棒球大联盟 我的大叔

Workshop in Vienna

目录 DM, Life

最近一个星期在维也纳大学,参与导师与师母组织的两个组之间的交流活动,感触挺多的。

国外的学生,在文献阅读方面,并不充分;但相比起来,他们的基本功更加扎实,遇到问题,可以更快做出demo;而我可能会提出很多思路,但在有限的时间里,很难做出demo。

想到了套瓷时候的经历,一个导师提供了面试机会,给了一个问题一天的时间,我列了三个思路,但并没有实现,然后就GG了。

国外导师,某种程度上,更注重demo?idea不一定靠谱,demo至少看上去有用。

或许,我需要转换一下研究思路了。

现在至少有5个一般的点子在堆着,积极合作,尽快做点东西出来。

德国留学记 之三

目录 Life

最近发生了一件很让人失望的事情:DHL把快递送到邻居那儿了,只留下一个名字,没有留房间号,回来后,几乎敲遍了周围所有邻居的门,都没有人知道那个名字;同样,在群里问,在零层入口的住户名单上,都没有找到。往好处想,是邻居收了我的东西,然后忘记拿给我了;往坏处想,是邻居提供了一个假名给快递员,而这个马虎的快递员没有提供房间号,导致没法找到人。

有些生气。因为病毒疫情,所以我买的是口罩。现在在线下店里已经买不到口罩了,线上买,我可能也是购买的最后一批。想再买也很难了。

想到还有一次被骗的经历:在食堂给别人刷卡,留了联系方式说用PayPal转账,后面对方并没有转。

在国内这么多年,碰到过态度差的人,不文明的人,满嘴跑火车的人,但像这种不诚信的,挺少。

见识了德国和德国人的各种不靠谱,失望挺多。希望是自己给自己的,好好加油。

德国留学记 之二

目录 Life

前段时间,科研有了一些进展,参与了小伙伴开启的事业。不愿让时光虚度,仍需砥砺前行。

记录一些碎碎念:

唯有发展,只有发展,才能获得更多理解与认同。

何为公民,何为公民精神?

因为参与的事业,产生了很多的碎片化思考过程,这个情况很不利。怎么应对?

在德国看到的,有些人,一辈子都在做同一件事,开公交车,一辈子在开公交车,做秘书,一辈子都在做秘书。职业的流动性相比国内,很小很小。所谓专业,所谓工匠精神,固然与这长年累月的积累有关。但它是否真的适合社会的发展?学习的广度与深度,如果不可兼得,是否应优先学习的深度?

德国留学记 之一

目录 Life

从9.1下飞机,在慕城已两月有余。除去最开始上语言班的一个月,后续的工作生活都有些艰辛。

组里做的东西很传统,近两年并没有顶会发表。独立选择的方向,是硕士研究的延续,虽然已经可以勉强自力更生,在没有思路的时候,还是很痛苦。

我太急切了,看到身在美国、新加坡和香港的同学都已经有顶会发表,羡慕之余,内心的自我驱动在一点一点加强。

沉住气。

纽约时间比加州时间早三个小时,
New York is 3 hours ahead of California,

但加州时间并没有变慢。
but it does not make California slow.

有人22岁就毕业了,
Someone graduated at the age of 22,

但等了五年才找到好的工作!
but waited 5 years before securing a good job!

有人25岁就当上CEO,
Someone became a CEO at 25,

却在50岁去世。
and died at 50.

也有人迟到50岁才当上CEO,
While another became a CEO at 50,

然后活到90岁。
and lived to 90 years.

有人依然单身,
Someone is still single,

同时也有人已婚。
while someone else got married.

世上每个人本来就有自己的发展时区。
Absolutely everyone in this world works based on their Time Zone.

身边有些人看似走在你前面,
People around you might seem to go ahead of you,

也有人看似走在你后面。
some might seem to be behind you.

但其实每个人在自己的时区有自己的步程。
But everyone is running their own RACE, in their own TIME.

不用嫉妒或嘲笑他们。
Don’t envy them or mock them.

他们都在自己的时区里,你也是!
They are in their TIME ZONE, and you are in yours!

生命就是等待正确的行动时机。
Life is about waiting for the right moment to act.

所以,放轻松。
So, RELAX.

你没有落后。
You’re not LATE.

你没有领先。
You’re not EARLY.

在命运为你安排的属于自己的时区里,一切都准时。
You are very much ON TIME, and in your TIME ZONE Destiny set up for you.

近期思考-20190129

目录 Life

回家刚好一周了,写毕业论文也一周了。硕士论文是关于 多标签学习与度量学习,问题比较传统。写前面部分的时候,发现自己对多标签学习还是不够了解,或者说是没有形成系统,写着写着,自己大概理出了几条线,对这个研究方向的认知也更加深刻了。

以上还是比较常规的,可以预想的东西。没有预想到的是,我之前认为的夕阳研究方向,可以从一些新的视角看待。

印象最深刻的是“SGM: Sequence Generation Model for Multi-label Classification”,COLING 2018的best paper,通过序列生成模型做多标签分类。之前思考深度学习和多标签分类这样的传统研究方向结合,主要和CNN相关,如TextCNN,做多标签文本分类问题。直到看到了这篇用Seq2Seq来做多标签分类的工作,感觉又打开了一条新的道路。

思路都不够开阔了,加油,少年,做最前沿的研究!

Some thoughts about PhD/Job Application

目录 Life

A friend of mine invited me for an internship in Tencent today. The job is about data mining. As I was busy preparing for my PhD application, I thanked him.

I heard the news that Tencent Corporation decided to change its structure, to make the company flatter, as Alibaba did in 2015 (news said the idea was coming from Supersell, after a visit of Jack Ma to that north Europe company). What I did not anticipate was that change came so fast. They build a new department and many people are needed, so my friend told me that it’s a good chance. When everything is new, there is a higher chance to make a difference.

It was a pity, for I decided to follow my heard, to be a researcher. First, to be a PhD student.

Between the conversation, my friend said he wanted to learn some knowledge about DM/ML. From my perspective, he is a very good engineer, to be a specialist in the algorithm is not a wise choice for him. Maybe a system architect is better, where algorithm design is needed but not the core part. He agreed with me on that. Another reason is there are too many youths coming to the AI industry. It has been a boom since 2017. Some students from EE or even arts learned some algorithms, like SVM, decision tree, then they began to apply for AI jobs. Can you see bubbles flying? So terrible.

As I learned from industry friends, recommendation system, graph mining (i.e. mining on social network, knowledge graph search), CV and NLP, are what the industry generally needs, and streaming data mining would be a hot area. As a researcher, I always want my research to be useful. I am delighted for what I am doing.

Hope everything is OK.

太子岭滑雪

目录 Life

这趟旅行有点出其不意,很久前和好友约好,冬天去滑雪,可16年的那个时候在准备KDD,给耽搁了,今年投完IJCAI还有十多天的时间。那几天生活上恍恍惚惚,满脑子只有工作的事情,还是好友提醒,他做规划,在论文投完后的周末就出发。生活总是很戏剧化,IJCAI的提交网站出了bug,截止时间延后两天。在尽量完善那份工作后,不等投稿时间截止,在最后一天的中午,起意,还是和好友一起出发了。从天灰灰的成都,到了不仅天灰灰还要被冷风吹的山上。

住宿是在山上酒店的阁楼,建筑面积利用的特别充分,功能也很完善。虽然是阁楼,但也有地热供暖,可以透过天窗往外看,晚上睡的很好。
第二天早上,落雪了。好久不见。

乘车到太子岭滑雪场,它在成都周边是最大的了,比之前去过的西岭雪山滑雪场要大很多,高级道和中级道的坡度目测都有45°,只是高级道是弯曲的,这些我们暂时肯定是不考虑的啦!初级道比较缓,20°的样子,分为两段,加起来300多米。感觉不太够。上去10分钟,下来1分钟。大概是第一次滑雪摔够多了,这次没。从山坡上冲下来的时候,雪打在脸上有点疼,很开心。下午雪渐渐变大,开始看不清,人少了一些,所以冲下来的速度反而加快了。连日来工作的疲惫,被风雪反复地冲刷,留下的只有悸动。
下次会和谁一起?

结尾放一首我喜欢的诗,有些改动。

我像冬天里的落木 你像飞鸟掠过蛮荒
你微笑的脸映着飞扬的光彩 期盼的目光穿越了许多年
风吹着不知迟暮的年华 青春的花凋了不开了
岁月的霜刀刻下生命的年轮 记载着幸福的永恒
你游荡在他乡的风风雨雨 是我寂寞抽屉里的字字句句
我期待着我们某天能相遇 再去看看那些老去的诗

我的宿命分两段,未遇见你时,和遇见你以后。
你治好我的忧郁,而后赐我悲伤。
忧郁和悲伤之间的片刻欢喜,透支了我生命全部的热情储蓄。
想饮一些酒,让灵魂失重,好被风吹走。
可一想到终将是你的路人,
便觉得,沦为整个世界的路人。
风虽大,都绕过我灵魂。

写在除夕夜之前

目录 Life

憧憬

科研上开始有些起色了。虽然一个人做一个方向的感觉实在是不太好,但在找到长期的合作伙伴前,就再坚持一会会儿吧!

回家

父母安康,弟弟在成长。给弟弟的衣服买小了很多,小孩子长个的速度实在是太快。
来年也要这样啊!

201711月记

目录 Life

又是一年双十一,花了大概一下午的时间整理出了自己想买的东西。其中有些并不是想,是因为需要。数买衣服最麻烦了。到了一定年龄,有社交的需要,不能穿的那么随意,现在开始习惯了。想给家里买些东西,爸妈总说不需要,只好给弟弟买了些吃的,兄弟二人一人一份。

《基地》,《三体》,《新人来自火星》,《莫洛博士岛》,加上“多少个未解之谜”这样的科普(灵异?)读物……小时候读科幻小说,沉迷的是宏大的构想和星空之下的迷惘,幻想着各种飞船,外星人,冒险,像在海边捡贝壳的小孩;大一点的时候,对书中所描述的文明的起源、进化和终结,有了些自己的思考,可以窥见了历史的侧影,如《基地》中对几种社会形态的描写,其中也有对现实的放大。现在看,科幻作品的核心,逻辑和想象力同等重要,希望能看到更多智商上线的作品。

朋友因为家里的事情不得不提前自己的规划,休学参加工作,希望做到小公司的技术leader后再跳槽到大的公司。然而,他发现在小公司做到技术leader很容易,但公司对技术的不重视和野路子的技术路线让他很痛苦。为什么不一开始就去大公司?按照他的实力并不难。朋友说自己还没准备好。理解他的想法但不认同,85分的时候不满意,但一定要准备到95分才开始行动吗?还是把他的简历发出去了。既然你和我说无路可走,那踩出一条前进便是。

满足了我长期以来想在宿舍打地铺的愿望。稍微坐起一点,看对面楼栋的灯光渐灭,沉入梦乡。

最近的几件事情很让人失望,三色黑、D等?一直不敢妄信媒体的报道,可有些事,即使不信,却已是心寒。为天地立心,为生民立命,为往圣继绝学,为万世开太平。能做的还只有锤炼自身。

解一个优化问题,用了大概一周才理清思路,从鸭梨贼大到心死如灰,再到看到丝丝曙光,反复几次心里已经逐渐平静,终于和晨晨讨论出解法,幸甚至极。

最优化,贝叶斯,深度学习,是我们头顶的三座大山。

第一次给论文作者发邮件,一天内收到了回信,很感谢@KuanLiu

201710月记

目录 Life

十月,秋风秋雨瑟人的季节,日常仍在继续。

记一些碎碎念
  • 把Need4Speed跑到了45级
  • 重读了心水的小说
  • 生活作息恢复正常,可以早上第一个到实验室了
  • 有了一个每天都聊天的好朋友
  • 用英文讲了一次组会
  • 在做实验与刷论文之间来回切换,加上项目,之后是这仨了
  • 发现那家郡肝串串真不错,去了两次
  • 送走了一位去藏传佛教地区追随自我的好友
  • 入手ikbc,茶轴的,不是很吵,机械键盘敲着好爽
长一点的碎碎念

好久都没联系的高中同学,因为代码问题突然联系上了,才知道,谁谁谁工作了,谁谁谁在读博,又是一阵唏嘘。高中班上的同学,现在有物理博士,生物博士,医学博士,经济学博士,也许再过不久会多出一个计算机博士。高中时的偏好,对未来的影响太大了。我怎么就不明不白地选了计算机呢?还好喜欢。

我是谁,我从哪来,我到哪去。目前层次不够,觉得它们只是在启发自己对生活的思考。朋友说:世界很虚伪,人类很无聊,作为个体,还是先做到人类的标准之后,再去否定这样的行为。我说:人活着的时间太短了,还是去做有探索性的工作有意思一些,虽然大部分的探索都是失败没有价值的,得益于人类社会的延续性,这样的经历也会聚沙成塔。

希望能一点微小的贡献。

规则学习

目录 Life

去华为成研所做交流,发现一个很有意思的问题。

blokus,也就是角斗士棋,给定一定量的真人比赛棋谱,不能使用蒙特卡洛搜索或者其它的暴力搜索,也不能在代码中加入任何角斗士棋的规则(同色对角等),通过程序学习出该比赛的规则,且具有获胜能力。

打卡与“本质安全设计”

目录 Life

显式打卡
* 纸质签到表
* 指纹打卡/人脸识别 etc..
* 微信扫码打卡
* wifi强制认证登录,打卡
* web登录打卡

隐式打卡
* 路由器记录wifi在线时长

实验室最近在执行打卡制度,目的是提高实验室成员的出勤率。实际上是在纸质签到表上签到。然而大家都没有什么积极性,签到表上经常是空的。或者在某一天,比如,组会前,刷刷刷地打上。这没有什么意义。

开了下脑洞,上面是从技术层面想到的打卡的一些解决方案。但有没有一种类似的“本质安全的设计(采铜那本书里面提到的,通过某种更有价值的设计,可以让人连犯错的机会都没有,这是一件很有意思的事情)”,可以达成最终的需求?

引入其它的鼓励机制?像之前在票圈看到的,腾讯早班有公司的公交,晚上到几点后打车免费。如果用在实验室,即使回报丰厚,效果也是因人而异。

果然还是有些奇怪,打卡真的是起到正反馈的作用么?个人还是倾向于通过写周报作总结来督促自己。

打卡与本质安全设计

目录 Life

打卡的目的是提高出勤率。从技术层面打卡有很多种解决方案,但有没有一种类似的“本质安全的设计(采铜那本书里面提到的,通过某种更有价值的设计,可以让人连犯错的机会都没有,这是一件很有意思的事情)”,可以达成最终的目的?