W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
scrapy.spiders.
CSVFeedSpider
[源代碼]這個spider與xmlFeedSpider非常相似,只是它迭代行,而不是節(jié)點。在每次迭代中被調(diào)用的方法是 ?parse_row()
? .
parse_row
(response, row)[源代碼]接收響應(yīng)和dict(代表每一行),其中為csv文件的每個提供的(或檢測到的)頭文件都有一個鍵。這個蜘蛛還提供了超越的機會 adapt_response
和 process_results
用于預處理和后處理目的的方法。
我們來看一個類似于前一個的例子,但是使用 CSVFeedSpider ::
from scrapy.spiders import CSVFeedSpider
from myproject.items import TestItem
class MySpider(CSVFeedSpider):
name = 'example.com'
allowed_domains = ['example.com']
start_urls = ['http://www.example.com/feed.csv']
delimiter = ';'
quotechar = "'"
headers = ['id', 'name', 'description']
def parse_row(self, response, row):
self.logger.info('Hi, this is a row!: %r', row)
item = TestItem()
item['id'] = row['id']
item['name'] = row['name']
item['description'] = row['description']
return item
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: