青菜

注册

 

发新话题 回复该主题

rvest网络爬虫初步使用CSS选择 [复制链接]

1#

网络爬虫就是从网页上批量提取相应的信息,主要原理就是利用一定的规则进行信息定位。tidyverse系列工具包中的rvest工具包可以快捷实现这一功能。下面代码就是使用rvest中的相关函数进行爬虫的一个简单的例子:

library(rvest)library(tidyverse)#豆瓣新片榜网址html-read_html("

分享 转发
TOP
发新话题 回复该主题