网络爬虫就是从网页上批量提取相应的信息,主要原理就是利用一定的规则进行信息定位。tidyverse系列工具包中的rvest工具包可以快捷实现这一功能。下面代码就是使用rvest中的相关函数进行爬虫的一个简单的例子:
library(rvest)library(tidyverse)#豆瓣新片榜网址html-read_html("