老狗啃骨头
@Veiking
2020-12-18
老狗啃爬虫-图片下载之Pipeline
WebMagic框架的使用中,Pipeline组件完全是插拔式的,即我们根据功能需要,可以随意增加组合实现。事实上WebMagic框架所有的功能组件都是如此,Spider是一个队列总线,所有的组件都通过接口的实现,参与到整个数据抓取处理流程的工作中来,分工合作,按需定制,这种设计思想也是以后我们在程序设计上非常值得借鉴的
WebMagic框架的使用中,Pipeline组件完全是插拔式的,即我们根据功能需要,可以随意增加组合实现。事实上WebMagic框架所有的功能组件都是如此,Spider是一个队列总线,所有的组件都通过接口的实现,参与到整个数据抓取处理流程的工作中来,分工合作,按需定制,这种设计思想也是以后我们在程序设计上非常值得借鉴的
在爬虫框架WebMagic中,用于保存结果的组件叫做Pipeline。在WebMagic已经实现了的Pipeline接口中,如果我们仅仅是想把抓取数据进行控制台输出,我们可以借助它的ConsolePipeline;如果我们想将数据以文件的形式进行存储,即可借助它的FilePipeline。如果我们想实现自己想要的具体功能,我们就得定制我们所需的Pipeline