指定網站滾動采集教程
快捷導讀:
隨著移動互聯網的到來,滾動加載更容易給予用戶無縫閱覽體驗,因此容易沉浸其中,替代了傳統意義上的“下一頁”數據加載,下面就給大家介紹一下滾動采集的配置方法。
我們軟件針對不同的網站展現類型,都有對應的采集方式,傳統的“下一頁”我們選擇列表類型,這次的目標站是滾動加載數據所以我們選擇【滾動頁面類型】。
我們只需要在分頁設置里填入我們需要采集的鏈接,軟件將自動向下滾動加載出更多的新數據便于我們采集。
根據自身的需求去點選我們需要采集的字段,也可以隨時對這些字段進行修改、刪除!
當我們點擊列表頁標題后,軟件會自動識別該網頁下的所有標題,我們只需要點擊預覽并設置內容進入下一個界面采集需要的數據(注:未識別網頁下的所有標題,我們可用CSS選中器來識別網頁下的所有列表標題)
參考資料【CSS選擇器寫法案例教程】
只需要點選我們設置的字段即可,點擊【已選標簽】可再次點選對應的數據。點選內容時我們需觀察觀察內容是否全部包含,未全部包含時盡量點擊空白處讓所有的段落包含其中(注:部分網頁不規范導致點選內容不全面或標題內容連在一起,我們可用CSS選擇器精準識別網頁中的標題和內容)
參考資料【CSS選擇器寫法案例教程】
保存好后我們將會進入批量采集管理任務界面,找到配置好的任務點擊開始采集,我們也可以實時預覽采集的內容。