PyPubMed|一款进行文献检索的工具
写在前面
其实这个工具在年初的时候使用过,最近翻看自己以前的笔记时候又看到了。
我觉得这款工具是很不错的文献检索工具,具体的操作以及参数也比较简单。
搜索指定关键词就可以查到相关的文献名称、摘要(CN/EN)以及DOI号等信息。
对于了解相关领域/关键词的文献还是很有帮助。
安装 PyPubMed
1 | # 要求Python环境 Python3.6+ |
安装后,测试一下安装是否成功,输入下方命令行:
pypubmed
出现如下提示,表示安装成功:
1 | # 查看当前版本: |
添加 API_KEY 参数
为了提高访问频次限制,首次使用推荐添加 API_KEY 参数。
API_KEY 生成方法:注册 NCBI 账号并登录,然后访问下方链接,点击生成你的API_KEY。
链接:
https://www.ncbi.nlm.nih.gov/account/settings/#accountSettingsApiKeyManagement
输入命令:
1 | pypubmed -k YOUR_API_KEY search -h |
文献检索功能
关键词/ PMID 检索
首次使用,可先输入使用帮助命令行
pypubmed -h
查看常用命令和使用说明。
这里介绍几个常用命令:
1 | pypubmed search |
查询示例
需要检索标题或摘要中包含关键词 genome 和 assembly,并输出前5个文章,指定输出文件名:genome_assembly.xlsx。
我们可以先使用PubMed高级检索功能,得到字段:
genome[Title/Abstract] AND assembly[Title/Abstract]
然后输入如下命令即可:
1 | pypubmed search "genome[Title/Abstract] AND assembly[Title/Abstract]" -l 10 -min 10 -o genome_assembly.xlsx |
高级检索
输入下面命令行:
1 | pypubmed advance-search |
从上面动图可看出有51种方式进行检索可以同时选择多个检索内容
如,想要检索基因组组装方面的文献,按提示进行选择:
最终得到的检索字段如下:
1 | query box now: ("genome"[Title/Abstract]) AND ("assembly"[Title/Abstract]) |
得到的检索文献数量如下:
1 | final query box: ("genome"[Title/Abstract]) AND ("assembly"[Title/Abstract]) |
如果需要下载的话,可继续后续操作,但在文献数量较多时,不建议用这种方法下载,更推荐使用前述方法。
文献引用格式批量生成
1 | pypubmed citations -h |
1 | Options: |
查询示例:
导出2个 PMID 的参考文献引用格式(在前面xlsx文件输出的第一列):34914854、34914839,输入如下命令即可:
pypubmed citations 34914854 34914839 -f apa