链接 | https://www.zhihu.com/question/50973300
博士生如何进行文献阅读和文献整理?
https://www.zhihu.com/question/50973300/answer/737010046
篇幅有限,单就如何阅读文献谈一谈,从“过来人”身上汲取经验!先寄出滑铁卢大学教授S. Keshav经典的阅读论文“三步法”值得收藏!
来自滑铁卢大学教授S. Keshav的论文《How to Read a Paper》中提出的阅读学术论文的三步法是人们比较认可的阅读技巧。图为该论文信息
虽然这篇文章在2007年便发表了,有些作者也许还阅读过,不过,正如S. Keshav在该文开篇所说的那样,无论是审稿人还是研究生、博士生在面对每年需花费几百个小时去阅读论文的现实情况,学习有效阅读论文的技巧非常重要。因篇幅有限,小编将归纳出S. Keshav三步法阅读论文的精华部分,会在文末放上英文原版论文下载链接,供作者深入阅读。
S. Keshav看起来比较低调在其主页上只有自画像
三步法也可说是三个阶段, 拿到一篇文章,我们该如何入手呢?S. Keshav告诉我们只需三步阅读全文,每一步都有其目标。大抵是,第一步要弄清论文的大概思路;第二步要抓住论文的主要内容;第三步从细节上深入了解论文。
快速浏览整篇论文,对其有个大概的了解。你也可以自己决定是否需要进一步阅读。该阶段分下面的几个步骤组成:
-
-
-
-
-
类别:这篇论文是什么类型?测试类?对现有系统进行分析的?对原型系统进行描述的?
-
内容:在你读过的论文中与其相关的有哪些?使用哪些理论基础来分析文章?
-
-
-
回答出以上问题,你便清楚是否有必要继续阅读该论文,这也许与你的兴趣或研究领域有关,也可能是作者的结论不正确使之没必要再继续阅读。这也再次提醒你,在你写论文的时候,希望有人看你的论文,那么简明扼要的标题及摘要是非常重要的,无论是读者还是审稿人在用五分钟过一遍你的论文后,看不到文章的亮点也就对你的论文失去读下去的兴趣了。
第二步要仔细阅读论文,但忽略掉诸如证明之类的细节。阅读过程中做好笔记记录重点,或在论文空白处标注出来,
-
仔细阅读论文中的数字、图表和其他插图。尤其要注意图表:轴标签是否正确?标示的结果是否有误差线?这些常见的错误能区分出该论文是粗制滥造的还是经过尽心做研究后的结果。
-
为了了解更多关于该论文的背景,记得要标记未读过的参考文献供进一步阅读。通过第二步的阅读,你应该能够掌握论文的主要内容。你也应该可以把论文的主旨及论据总结给别人。对于你感兴趣的论文,读到这个程度就可以了,但是对于那些在你研究领域内的论文来时,还远远不够。
有些情况你在读到第二步结束时仍然难以理解论文,可能的原因是主旨对你来说是全新的,还有不熟悉的术语和缩略词。也可能论文作者使用您不明白的论据或实验技术,导致大部分论文内容无法理解。除此之外,有些论文可能写得很差,也导致你无法理解该篇论文。亦或者可能是深夜,你很累了。如果是这样,你可以选择:(1)把论文放到一边,期望着在你走向事业成功的路上不需要理解它,(b)在了解了相关背景知识后,过段时间再回头读,或者(c)坚持不懈继续阅读。
要充分了解一篇论文,尤其你是审稿人时,需要进行第三步。第三步的关键是:在脑中勾勒出整篇论文,作出与作者相同的假设,重新创作。通过将这种重新创作与实际文章进行比较,您可以轻松地验证出论文的创新之处,也可以轻松找出一些不易察觉的缺陷和假设。
这一步需要读者精读论文,完成这一步读者便可验证论文中每一个假设是否成立,并且同时思考如果自己是本文作者的话会如何去体现自己的idea ,这种假设自己是作者的方法可以加深你对该论文论据及表述技巧上的理解,并且能从中学到这些技巧。在完成第三步的过程中,你应该时刻留意对于未来研究工作的新想法。
第三步是最耗费时间的,对于初学者来说可能要数小时,即便是有经验的学者也至少要一两个小时。当完成这一步后,你应该可以在脑海中重现构造论文的整个架构,同时能确定论文中哪些是好的,哪些是一般的论点。特别地,你也应该能明确指出论文中不清晰的假设、漏掉引用的相关工作以及论文中试验和分析的手段潜在的缺点。
https://www.zhihu.com/question/50973300/answer/680667537
序言
文献阅读和文献整理,我认为整理甚至比阅读重要,因为很多时候不是我在做实验的时候读不进去文章,而是我不知道我之前看过了哪些,有哪些遗漏。
之前师兄有句话,文献是读不完的。与其陷入到无边无涯的文献海洋里,还不如找准方向,知道哪些要读,哪些可以忽略。
*文献整理我用的是Endnote, 因为真的很好用。不过里面PDF的编辑功能我要实名吐槽,还有就是文中搜索功能,让我蛋疼不已,然鹅么有办法,大部分的功能还是很给力的。
所有的经验真的很有帮助,如果我能做任何的补充的话,我会补充一点:
怎么样找到最新的相关文章?怎样知道前沿是什么?
很多PI能够通过各种会议中的networking了解到领域里的前沿,可是我们学生们似乎没有这个luxury。
做理工类的科研的一大梦魇就是,在某杂志上已经发表了我快要收尾的项目的结果,而我后知后觉,完全蒙在鼓里。想想都觉得心塞啊...不知道多少人因为这个不得不临时修改方向。
然而很多时候每天早上打开电脑输入各种网址看最新的abstract又不是很现实
一个领域里至少有10个journal是你要follow的,再加上Nature,Nature子刊,Science乱七八糟,说不定哪天就忘记了。
后来我发现了一个工具,叫做“Feedly”,这是一款综合各种杂志的RSS feed到他们这里,并且能够显示abstract和TOC的软件和网站。
这个网站使用起来非常简单,你只需要搜索你想关注的杂志,或者把想关注的杂志的RSS链接加入到你的账号里就可以了。
然后就会出现你想要看的杂志的所有最新内容的题目和摘要。
我本身是做高分子化学的,所以我会关注Nature, Science和ACS关于材料和材料化学的杂志,欧洲的就会去看Royal Chemical Society和Wiley的一些杂志。
这样我每天只需要打开一个网站,就能看到有那些杂志有新的文章发表了。
系统会自动标记你看过的文章,如果你有没有看过的,系统会提示你有几篇新发表的文章你还没有看过。
这个网站的更新还是很迅速的,基本上是实时更新,不会出现lag。
同时对于你觉得有用的文章,你可以先收藏或者留着之后再看,或者下载到你的很多其他客户端上看。
我觉得这个软件真的在我读书的时候帮了我很多忙,省了我很多时间,我养成了基本每周至少浏览一次的习惯。
希望这个对众多在奋斗的学友们能起到一些帮助,如果有任何问题请随时来问。^_^
https://www.zhihu.com/question/50973300/answer/612021949
博士在古代指专精某种技艺的人,而“博”字又有渊博、丰富的意思。
同样,我们不仅要关心学习的深度,还要注重学习的广度。
一件事情做到了“精”,找到了事物的一般发展规律,那其他事情也很容易“通”,反之亦然。
所以在文献阅读方法上,结合Stephen D. Krashen博士关于第二语言习得的理论,通过无限制输入来解决广度的问题,然后通过限制输入与实践(剔除无限制输入中的噪声,迭代优化理论)来解决深度的问题。而贯穿始终的是下文会讲的i+1理论(文献选择)。
一、关于文献整理
我自己是把一篇文献的信息分为13类,记录在excel表格中(按自己习惯调整)。
1)序号:当前文献的编号。在原文件头上也加上相应序号,以方便查找。
2)RM:阅读方式,包括粗读,精读(实现算法)和挑读
3)挑读内容:如果阅读方式是挑读,则记录挑读的内容
9)基本流程及评估方法:记录论文用到的算法以及对该算法的评估方式
10)信息:记录论文中自己不知道或对自己有用的信息
11)分类:总结、分类该领域的所有方法,提供一个广阔的视野。这一信息在博士、硕士毕业论文中比较常见,也可以自己总结,以后写国内外研究现状时应该会有用。
二、关于文献阅读方法
1 .无限制输入
广泛地阅读文献,可以是与专业相关的,也可以是与专业无关的,具体视自己情况而定(当然与专业相关的更重要,所以可参考二八定律)。
我们知道放射性思考是人类大脑的自然思考方式,每一种进入大脑的资料都可以成为一个思考中心,并由此中心向外发散出成千上万的关节点,每一个关节点代表与中心主题的一个连结,而每一个连结又可以成为另一个中心主题,再向外发散出成千上万的关节点,呈现出放射性立体结构(思维导图,知乎)。
现在专业划分的越来越细,学科门下设一级学科,一级学科下设二级学科……
但反过来看,各个专业就像思维导图中那成千上万的关节点,这些关节点都汇聚到一个中心主题(以下称思维导图原理)。
换句话说,各个专业之间都可以通过一个中心主题建立联系。
所以,看似与专业无关的内容,其实是有一定借鉴价值的。
无限制输入的优势
结合最优化问题的思想,无限制输入可以避免局部最优。
一般的启发式算法、贪婪算法或局部算法都很容易产生局部最优,或者说根本无法查证产生的最优解是否是全局的,或者只是局部的。这是因为对于大型系统或复杂的问题,一般的算法都着眼于从局部展开求解,以减少计算量和算法复杂度(局部最优,百度百科)。
a. 随机搜索,对机理不明的问题,解的搜索越随机陷入局部最优的可能性就越小——无限制输入。
b. 深入研究问题的机理,对问题的机理研究的越透彻,就能更准确的找到全局最优,或划定全局最优可能的区域——见限制输入与实践。
2 i+1
我们看到的,基本都是早已知道的,而对于不熟悉的、没有认知的东西,大脑是会直接忽略掉的。比如,朋友让你帮忙找东西,在他把这个东西的位置、具体形态特征描述给你之前,你基本“看不到”它;比如,在我开始用牙线棒以后,才经常在生活中(舍友的桌子上、路上、垃圾堆旁)看到它,而在这之前它从未出现在我的视野中,尽管就在身边。
如果大脑把看到的、听到的、闻到的、触到的所有信息都处理一遍,那很快就会因为信息量过大而死机。
融合语言学家Stephen D. Krashen博士第二语言习得的i+1假说。
i指学习者现有的水平,+1指在现有水平基础上增加一点点难度。
具体来说,就是选择的文献等级要略高于你目前的水平,这就是我在开头说的,没什么深度的“垃圾”文献。
如果一篇论文的等级是i或i-1,那你大致浏览一遍,就清楚它讲的是什么,知道怎么实现。
如果一篇论文的等级是i+10,可能文中的每个字都认识,但就是不知道他在说什么,看过一遍后再回头想,什么也没记住。其实主要是因为信息量过大,这也是为什么一本书看完很快变成过往云烟。
如果想要读懂一篇i+10的文章,需要查阅大量的等级为i+1的参考文献,一点点突破。
值得一提的是,i是一个变量,你的水平是在慢慢提高的,而你选择的论文也要在你目前水平的基础上,再高一个等级。
3.限制输入与实践
通过无限制输入,看了各种各样的文章,但是怎么判断一篇文章是否有价值,是否灌了水,是否是噪声?
1)去噪思想
噪声一般是无规则的,出现频率比较低。所以数据越多,持续时间越长,越容易判断噪声。
通过无限制广泛地阅读,由于思维导图原理,你会发现某种方法出现的频率很高,这些方法通常都是一些经典算法。
对于一种全新的算法,很难验证其准确性,即使它是由权威团队研究的。
对于一种经典的算法,它的流传时间久,引用次数多,说明它的准确性比较高;而引用次数的增加也会提高作者的权威性;一种方法存在的时间越久,那它将继续存在的可能性也越大(《反脆弱》,纳西姆·尼古拉斯·塔勒布)。
2)信息价值判断
如果把科研论文当做一种经验总结,或者一种信息,结合信息价值判断的思想,对于获取的信息,可以从准确性、权威性、时效性、适应性等方面,综合判断论文的价值。
指内容是不是真实有效的,通常可以从信息是否符合事物发展的一般规律,是否具有内在逻辑性,是否与其他信息矛盾或冲突等角度来考虑信息的准确性。
指内容是否具有令人信服的力量和威望,信息提供者的专业背景、资质、工作经验等均可作为衡量信息权威性的参考指标。
指信息在某段时间或某一时期是否有效,一般通过考察信息内容的发布是否及时、是否最新、是否客观和准确来加以判断。
指信息对于问题的解决是否有用以及作用大小,一般可以从信息是否能达到使用者对信息的要求和信息对于解决问题的作用大小这两方面来进行判断。
3)实践
作为一个马克思主义者,我们都知道,实践是认识的来源,是认识发展的根本动力,是检验认识正确与否的唯一标准。
通过上面两步,可以剔除掉很多没有实践价值或无法判断其实现价值的文献。
但为了避免眼高手低,忽视一些细节,还是需要对算法进行实现与验证,可以是经典算法,也可以是自己感兴趣的算法。
实践过程中,一定会遇到问题,为了解决问题,也一定会有新想法,这就需要限制输入,只选择与算法或新想法相关的文章。
这样不断地迭代限制输入与实现,直到达到自己想要的结果。以上。
https://www.zhihu.com/question/50973300/answer/815093563
即:读哪些论文(对象),读论文的目的是什么(目标),怎么读(方法)
读论文,需要读经典的专业基础论文、survey(概述)论文,及5-10篇左右读新的高质量的专业论文。
好的论文怎么找?首先找专业领域中好的会议、期刊;其次,经常访问专业领域有名的实验室、研究员的主页,关注其发表的论文方向及内容;50-100篇,半年;就可以开始动手写论文了。
二是在了解过程中,产生自己的idea,进入这个领域。
三是学习论文写作方法,熟悉论文制作流程,了解常用词汇、句子和篇章文体。
什么是idea?怎么样产生?idea一般是在读论文的过程中产生的,给出三种比较简单产生idea的方法。
(1)第一种弥补缺陷法。即去发现别人论文中的weakness(缺陷)。你在读很多个论文时候,就会逐渐发现,每一篇论文都不是完美的,解决的都是某一方面的问题。很多论文,尤其是经典论,都有很多论文跟着去提高和改善原来论文的效率、方法什么的。因此,你可以根据这个特点,去找你感兴趣的论文的weakness,你提出相应的弥补缺陷的解决方案;用审稿人的眼光看他。他有那些可取之处,哪些不好。我们也不能极其推崇一个观点,要思考一下为什么有人支持另外的观点。
(2)第二种新型方案法。就是提出与论文不同的解决方案,你觉得你在性能、方法、效益等方面有新的方法,那就产生了新的idea,不断地磨合,修正,完善你的idea,就慢慢成为一篇比较好的论文;
(3)第三种减少约束法。即减少论文中的assumption(假设),一般来说,所有的假设都是约束条件,去除约束条件就是形成新的方法的过程。
这三种方法是比较简单的、操作性比较强的方法,比较有针对性的产生idea,避免看论文中的茫然状态。值得注意的是,在产生idea过程中,不要想着憋大的idea,不要试图完全推翻或者建立自己的体系。在目前阶段,对大多数人来说,这是不可能的。好高骛远,往往会半途而废。你有一点点的贡献就好。没有一篇论文是完美的,而任何人的工作都必须在其他人工作基础上进行的。
读题目,根据题目读出解决的问题与基本思路,在已知问题和基本思路的前提下构建自己的方案,
读摘要,摘要中会明确要解决的问题和基本思路,读摘要可以判断自己的思路与本文思路的融合程度,其次在已知问题和解决思路的基础上,进行问题分解,即该问题在如此一条解决思路下可能会面临的小问题,同时要给出每个小问题的基本思路。
读介绍,明确解决了什么问题?解决这个问题有什么意义?该问题在该领域中处于什么样的位置?其他位置是什么样的问题?该问题可以提升为什么问题?该问题可以分解为什么问题?
读结论,对文章所解决的问题到了什么程度,是否提到了自己设计的小问题,里面的小问题是否得到了解决。
读相关工作,整理历史的过程,从别人的角度去理解不同的文章解决问题的不同思路,可能存在相同的文章不同的作者认为解决思路并不相同的问题。读相关工作是帮助建立文献分析的步骤,根据相关工作,构建出文献的基本分类。
读解决思路,进一步理解核心思想,找出和自己所设计的具体思路不同的地方,比较这些不同,并找出理由。分析解决思路可能存在的问题与优势。
读讨论,同自己对解决思路所提出的问题进行对比,进一步从讨论中挖掘解决思路的利弊。
对文章中提到的在该领域重要的文章进行回溯,同时对正在读的文章进行引用情况跟踪,进一步明确该文章在整个研究领域的位置。
总结的过程是一个从下向上和从上向下的反复过程。首先针对领域内具体的文献,给出解决的具体问题与解决思路,分别根据解决的问题与解决思路进行归类,并抽象问题与思路;其次对解决思路进行类内与类间的比较,从不同的层次分析解决思路的优劣。同时从时间上进行对某一问题进行跟踪,一方面是跟踪对问题本身的认识,随着时间的发展对问题认识的提高,进一步抽象问题;另一方面是跟踪问题的解决方法,分析技术的发展脉络,预测新的技术发展。
分析的目标应该有两个,一个是提出新的问题,一个是提出新的解决思路。分析的过程应该是自上而下的,首先从问题的最顶端实现问题的进一步抽象化,其次通过不同的角度考察问题,发现是否仍然存在没有被注意到的角度,然后对问题从不同的角度进行分解,分解为更小的问题,然后再次进行问题的多角度分析与分解。
1、阅读题目和摘要,文章摘要一般会对全文的实验data有一个总结,对照摘要中列出的data,我就会琢磨,作者用这几个结果能得题目中的结论吗,如果自己觉得没有,那么留下疑问,在讨论里面再琢磨作者有没有说明和拓展;如果想挑战一下,理解文章标题之后,就可以先不看摘要自己试着去想需要多少个data来支持这个标题,这样对训练科研思路很有帮助,不过比较难坚持。
2、阅读introduction,这部分得到的主要的课题的背景和由来。我会思考一个问题,作者做这个课题的主要目的是什么,也就是说作者是如何想到这个课题的。
3、实验结果部分就像陈列馆,作者把Data一个一个亮出来,作者一般不会按照做实验的时间顺序组合Data,而是会根据自己讲故事的逻辑将Data依次递给我们。在这里我也会琢磨一些问题,如作者会给每个Data一个小标题,那么,作者会用什么实验方法来证实这个这个小标题,还有其他什么实验能满足这个标题?这个是我学习实验方法的主要方式,证明一个结论需要用什么实验,最经典最直接的实验是什么。这些Data的安排是不是符合逻辑,完成这篇文章需要最少的Data,哪些Data是作者对文章的引申或者锦上添花,等等。之后,我也会试着装一装艺术家,大BOSS,对Data的漂亮程度,实验工作的难易程度,实验思路的奇特程度做一番评论,呵呵,也确实有些文章读了之后会让你有一种看惊悚片般的感觉,“诶呀,原来是这样,作者到底是肿么想到的”发出这样情不自禁的感叹。
4、最后是Discussion了,这部分内容最能体现作者对文章的理解与写作功底。一般会涉及到文章结论的扩展和引申,追踪作者提供的参考文献,可以恶补相关知识,如果Data中有诡异的现象出现或者文章逻辑上有解释不通的地方,作者还会进一步做预测和假设,还有就是文章发现的重大意义啦,等等。记得曾经有一位大牛说过,没有哪一篇文献是完美的,哪怕是CNS的文章,不管作者关注点有多小,文章逻辑有多么的严密,故事情节这个圈画的有多么的圆润,总有地方是可以加工开口的,这就给我一个提示,读懂文章内容,看清作者思路后,就可以站在作者的肩膀上开拓我的故事了
5、我自己读完一篇文献后,要写一个小总结.把该篇文章的主要内容、难点、创新点等用简短的话描述出来,然后把文章中采用的实验方法、手段以及最后的得到的结果也分析一下,用自己的话总结,最后把自己的想法,以及值得自己借鉴地方,存在的问题总结出来,那么这篇文章才算真正意义上的读懂了。做这些工作有很大的好处,一是提升自己的总结概括和写作能力,在经过一段时间的锻炼后,你就会不知不觉得到提高,另外一个好处是积累,有了这些文字性积累,以后你自
然后做一下笔记,写好心得!不要相信自己的记性,好记性不如烂笔头。如果一篇文献你不做标记,不写点自己的心得,那么用不了多久,你再打开该文献,因为该文献上也是很干净的,因为你没有留下任何标记,你可能会忘得很干净,到时候不得不重新再从头阅读,浪费了大量的时间。如果你再第一次阅读的时候,稍微花点时间,把重点句子标记起来,把文章的大致内容和自己的想法写出来,那么下次再看到这篇文章,只需重点的看一下自己标记的句子和写得心得体会,马上就会了解文章的大致内容,节省了时间,提高了效率!
文献阅读我觉得还可以从两个层面来做,第一纵向层面,什么意思,解决相同性质的问题从不同领域的应用来查阅,比如数据稀疏性,用在数字图像处理,通信信道估计,接收机信号处理等。通过阅读文献找出应用的相同和异同之处,找出为什么可以应用的根源,如此思考,才会有所斩获,有所启发。
另一个层面,横向层面,针对同一问题的解决方案或者算法来查阅大量文献,大多数时候我们都是这样从这个角度来做。就拿弱信号的卫星导航系统的信号捕获来说,解决的方法就是各种各样,从目的,方法,结果来思考似乎么有错,但最重要的是看到所有解决的目的都是能量累积的过程,提高信噪比。回过头来,再想想在纵向问题中是否有类似思路,或许突然之间会有惊喜。
文献浩如云烟,不可穷尽,一方面我们需要追最新的研究理论成果和应用,另一方面需要思考你需要解决的问题是什么,有没有联系,关联性在哪里!还要明白读文献的发散和收敛,要扎的进去,也要出的出来,沉醉与文献阅读的同时一定要懂得探出头来,思考你需要什么!否则会迷失在文献的海洋。
3、接手新课题时,对相关文献、背景、研究进展的检索与阅读。
4、学习论文写作方法,熟悉SCI论文制作流程,了解常用词汇、句子和篇章文体。
5、借鉴方法:通过查阅文献,了解他人采用了什么方法,从什么角度对该问题进行研究。
7、通过阅读文献了解世界上本专业领域的内容和发展情况;并产生自己的idea,进入这个领域。这是我们在写作SCI之前大量阅读文献的主要目的。
https://www.zhihu.com/question/50973300/answer/721776751
比如文献管理工具,Mendeley就很不错,除了内置的pdf阅读器不支持修改背景色之外,其它都很好,不过右键菜单中可以选择外部文献阅读器,并且Mendeley可以把文献分享给指定的人的帐号,很方便。友情提示:文献管理工具尽量不要选择国产的,某国产文献管理器不能支持开放的期刊引文格式库,而其自带的缺不少期刊,还有些提供的格式和期刊现在的已经不同了,自己改还是很费事的,曾经就吃过这样的亏。
再比如pdf阅读器,以前一直用金山的pdf阅读器,可以改背景,可以做批注,可以把边框缩得很小,还有内置的翻译,体量也比foxit和adobe小很多。但是后来金山将它整合进WPS套件了,广告满天飞,默认上传文档到金山的云......于是放弃了。后来用chocolatey安装了okular,非常强大,除了不能翻译外,似乎其它都满足需求,不过翻译功能可以用copytranslator这个软件来替代,反而比金山方案更好。但是,自从某次升级后,不知道是新版okular的问题,还是win10的问题,每次启动时它都没在屏幕中间,而是处于屏幕右下角,没找到解决办法,最终放弃。现在采用的是Emacs+pdf-tools,pdf-tools需要自己编译一下,要msys2+mingw64环境,和okular一样,也是基于poppler的方案,所以特点也相近,不过它修改背景色的filter只有一个去色的,使用这个方案后,pdf中所有的彩色图都会变成单色的,有时会造成麻烦,而okular有两个,另一个不会影响彩色图,但是对于图片扫描的pdf无法更改背景色。还有,pdf-tools对于没有内嵌字体的中文文档支持不好,打开的时候基本上是满篇白、没有字,某些使用方正xxx_GBK字体、却又没有内嵌进pdf的期刊在这个软件下完全无法阅读,好在自己很少读这类文章。
我习惯于在elsevier和web of science上定期搜索特定的关键字组合,大概每月一次的样子,然后按时间排序,把最新的和最旧的各取10篇,然后花一周来阅读,在这一周内记下它们引用的文章中我感兴趣的、或必须要看过才能读懂的,再进行搜索,搜索引用文献的深度最多到3层就停止,但会记下认为重要的文章。这一个月剩下的时间则用来干活儿,下个月根据前一个月的情况调整关键字再这么操作,其中,最新、最旧的文章肯定都有重复的,就跳过它们,分别按时间新旧往中间数,保持相同的篇数即可。这么做的好处是读的时间长了,对领域的发展脉络会清楚一些。
文献整理也比较头痛,目前感觉比较适合我的做法是设置类似于标签之类的东西。
首先是根据领域发展来组织,中间某一类重要见解或学派相关的赋予相同的标签,这些标签根据代表作的发表时间编号。
然后是根据实验、理论、计算来粗分,每一类中又根据用的方法、设备、算法设置标签。这些标签用数字表示,形如1021235这样的,第一位是粗分,1表示实验,2表示理论,3表示计算,4表示1-2结合,5表示2-3结合,6表示1-3结合,7表示1-2-3结合。紧接着两位表示用到的方法,方法也有一个自己的列表,其它的以此类推。如果楼主相关领域用到的东西更多,也可以把数字的位数增加,涉及到的更少,也可以减少位数。
最后是文献的同步问题,之前用国产的文献管理器,还攒了一堆文献,没有去特意清理,租了个vps来存放它们,用nextcloud同步到手机、笔记本、台式机中,后来读的文献,都用mendeley进行同步,省心一些。
最后,建议文献能打印出来看还是打印出来,这样看文献效率会高很多,但是打印出来的文献不便于保存和后期搜索,所以电子版本也不要丢掉。
https://www.zhihu.com/question/50973300/answer/638819107
作为一个博士,任何人告诉你的现成的答案,都应该抱有存疑的态度批判的看。作为一个博士,你首先应该摈弃学术以外的途径去获取与学术相关的知识。我并不认为这个答案下的任何一个高赞能够比得上一篇高引论文。
推荐你检索Systematic Literature Review (SLR) guideline。SLR是一种研究方法,它被广泛应用于医药学领域,2004年被Kitchenham引入到软工之后,截止目前已经有超过1000篇采用该方法发表的论文了。这种方法产出的成果和大部分研究者所熟知的文献综述很相似,但并不相同。
如果你想知道如何阅读文献并整理成果,你需要知道的绝大部分内容都在guideline中详细介绍了。即使你的目的可能并不是做一个SLR,作为一个方法论,它依然适用于你的目的。另外,最好的整理结果本就应该是一篇综述性质的论文,最不济也应该是你下一篇论文的background和related work。
最后补充,正如我开头说的,每一篇论文都应该批判的看。从审稿人的角度去阅读文献,训练自己也是必要的。
时间有限,先答这么多。如果觉得有帮助,我将非常荣幸,如果阅读了我提到的guideline有困惑,我回尽力解答。
检索综述: 直接搜索你目标主题的综述可能是最快了解这个主题的方法。如果你在的领域有slr,或者mapping study等研究那是极好的,直接主题+这些关键词,如果没有,就加review,survey等关键词,但需要注意辨别,比如survey也可能是一个问卷调查的研究。也有可能需要搜索state of the art之类的,如果你发现都没有,恭喜你,你可能发现了一个新题目(如果你们学科没有综述类论文,本条不适用)。
注意发表在哪(venue): 其他学科不了解,软工不建议检索或完整的看中文文献,因为大部分时候都是在浪费时间,一定要看,就以学科命名的那个学报能看。对于英文文献,你应该知道它是会议还是期刊,它是什么级别,软工计算机参见ccf列表。这很重要!
https://www.zhihu.com/question/50973300/answer/797999392
目前博士在读,我并不是什么大牛,只是一个科研小白一个。仅说一下个人之谈。
阅读文献
一开始,我也是拿到一篇论文从头到尾的读,感觉如果漏下某一部分,感觉心里特别不舒服,总感觉哪里不对劲,感觉有什么地方自己没有理解到,尽管遗漏的这一部分是无关紧要的,尽管就算一点都不漏,也照样不理解。
到后来,我也慢慢的探索新的读文献的方法,目前大部分是着重读abstract和intro,以及related work。主要去理解作者的动机和解决方案,至于具体怎么做的,我并不关心,也就是model部分我读的比较少,除非这篇论文写的很顺,让我停不下来。其实,好的论文是经得起反复阅读的,只读一遍是获取不到你想要的所有的信息。所以很多论文在第一遍之后,常常会因为想了解某个问题再去读相应的部分去寻找答案。(值得注意的地方是,读的时候记得做标记,注释之类的,对以后重新梳理论文的idea很有帮助)。最后,我会把相似的论文进行一个归纳和总结,表述一下自己的看法(比如按照时间线,自己梳理一遍,思考一下,每次的改进之处或者创新之处在哪里?解决了什么问题,用的什么方法!)。类似于自己写一段综述分析,我觉得最后这一步全是画龙点睛之笔吧。
整理文献
首先按照细分支的研究点建立文件夹,然后再在每个文件夹中建立已读和未读两个文件夹,每个文件夹中的文件用统一的命名方式,比如,年份_发表期刊名或者会议名_题目.pdf。最好再根据论文内容和研究点的相关程度,标注一下,比如,1_年份_发表期刊名或者会议名_题目.pdf,前面的数字1代表最相关,数字越大越不相关(因为1会使得当论文按名称排序的时候排在最前面)。这样会有助于你日后重读重要的论文。
之我见
其实,每个人的阅读方法都是不一样的,类似于学习方法,每个人都有一套适应自己的方法。关键是在借鉴他人方法的基础上加入自主的成份,最终形成一套自己的阅读技巧,生搬硬套是不可取的。值得注意的地方是,在形成专属自己的阅读方法前,是需要是个过程的,这个过程可能有一点点不适应,但是贵在坚持,厚积薄发。这只是我个人经验,仅供参考。
<pre style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><p style="max-width: 100%;min-height: 1em;letter-spacing: 0.544px;white-space: normal;color: rgb(0, 0, 0);font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;widows: 1;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong>完<strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong></span></strong></span></strong></p><section style="max-width: 100%;letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;widows: 1;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><p style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></p><section style="margin: 5px 32px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;">一份来自亚马逊工程师的Google面试指南,GitHub收获9.8万星,已翻译成中文<br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;" /></section><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(87, 107, 149);font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;">MIT最新深度学习入门课,安排起来!</span></p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(87, 107, 149);font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;">有了这个神器,轻松用 Python 写个 App</span></p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(87, 107, 149);font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;">「最全」实至名归,NumPy 官方早有中文教程</span></p><section style="margin: 5px 32px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;">Manning大神牵头,斯坦福开源Python版NLP库Stanza:涵盖66种语言</section></section></section></section></section></section></section></section></section>
本篇文章来源于: 深度学习这件小事
内容反馈