查看原文
其他

Bioconductor注释专题:MeSHDb

qians 生信菜鸟团 2022-06-07

MeSH(Medical Subject Headings)是一个生命科学领域综合的vocabulary,美国国家图书馆用来手动索引MEDLINE/PubMed文章,一共包含了19个目录,MeSH.db包含了其中的16个,详细信息见下图。

Mesh term通过三种方式与Entrez Gene ID相互关联:

MeSH.db提供了MeSH ID 和 Entrez Gene ID两者之间的联系

安装MeSH.db包

 ## try http:// if https:// URLs are not supported

  1. source("https://bioconductor.org/biocLite.R")

  2. biocLite("MeSH.db")

  3. library(MeSH.db)

调用查看MeSH.db包

  1. library(MeSH.db)

  2. dbInfo(MeSH.db)

这里告诉了我们包的时间和来源等信息

在bioconductor搜索包MeSHDbi,可以看到MeSH.db类型的包有80个,每一个都代表MeSH.xxx.eg.db都代表一个物种的Mesh包,对应的物种和缩写可以查阅:http://www.genome.jp/kegg/catalog/org_list.html

MeSH.db用法

MeSH.db主要包含了四个函数 : columns, keytypes, keysselect .

columns,keytypes可以查看列名:

  1. cls <- columns(MeSH.db)
    kts <- keytypes(MeSH.db)

下面会介绍每列代表的含义。

keys用来提取MESH中某一列的信息:

  1. kt <- kts[2]

  2. kt
    ks <- head(keys(MeSH.db, keytype=kts[2]))

select可以查看所有列

  1. res <- select(MeSH.db, keys=ks, columns=cls, keytype=kt)

  2. head(res)

这里显示了MESH.db每一列的内容,我们可以看看MESH.db中包含了哪16类CATEGORY,可以查询第一张图,比如“D”就表示

Chemicals and Drugs

MeSH中MeSHID和qualifierID转换

假设我现在有100个MESHID如下,要转换为 qualifierID

  1. ks$QUALIFIERID <- res[match(ks$MESHID,res$MESHID),"QUALIFIERID"]

  2. head(ks)



参考资料:

http://www.bioconductor.org/packages/release/data/annotation/manuals/MeSH.Hsa.eg.db/man/MeSH.Hsa.eg.db.pdf

http://mp.weixin.qq.com/s/NzXxCZBYXuZm7eEC_QRJyQ



猜你喜欢

生信基础知识100讲

生信菜鸟团-专题学习目录(5)

生信菜鸟团-专题学习目录(6)

还有更多文章,请移步公众号阅读

▼ 如果你生信基本技能已经入门,需要提高自己,请关注下面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

▼ 如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。




      


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存