专栏名称: 生信杂谈
生物信息学;生物信息;计算机辅助药物设计;测序分析;Python;R;机器学习;论文写作;网站制作;LOL;dota2。
今天看啥  ›  专栏  ›  生信杂谈

使用R语言爬取DailyMed药物信息

生信杂谈  · 公众号  ·  · 2018-03-31 22:00
之前介绍过如何批量爬取NCBI中基因详细信息,今天介绍爬取DailyMed指定药物的数据。点击查看:R语言批量爬取NCBI基因注释数据根据指定药物药物及其ID列表(由ID可以获得该药的网页链接)爬取这些药物在DailyMed中的相关信息:DailyMed中对药物的描述如下:我们提取每个药物的下列信息: MarketingStatus, Activeingredient, WARNINGS和 Stopuseandask a doctorif。#####先载入所需要的包并读入上面的列表:library(RCurl)library(rjson)library(stringr)library(XML)library(openxlsx)rm(list=ls())setwd("D:\\ding")#读入xlsx文件,第一列是Drug名,第二列是DailyMed ID:Dailymed_file read.xlsx("./data/OTC_2017_Ding.xlsx","Sheet2")根据药物ID获得该药所在网址:Dailymed_file$Dailymed_url paste("https://dailymed.nlm.nih.gov/dailymed/drugInfo.cfm?setid=", ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照