wordpress采集插件-147SEO
wordpress采集插件,可以讓站長把自己任意喜歡的網站里面的內容自動采集的文章發布到自己的wordpress博客上,自帶功能的wordpress有類似CMS的自動采集。wordpress采集插件可以滿足剛建的wordpress站點內容比較少,希望盡快有比較豐富的內容;熱點內容自動采集并自動發布;定時采集,手動采集發布或保存到草稿;css樣式規則,能更精確的采集需要的內容。wordpress采集插件的偽原創與翻譯、代理IP進行采集、保存Cookie記錄;可采集內容到自定義欄目。
WordPress多站點站群雖不會內置集成采集器,但由于其良好的兼容和擴展特性,wordpress采集插件就有與之匹配的接口。wordpress采集插件要求的話,最好是使用PHP 7,如果網站的PHP版本小于PHP7, 可能會出現兼容性的問題,wordpress采集插件的系統要求如下:PHP >= 5.6,QueryList v4 版,Mysql 無要求,Nginx 無要求。
wordpress采集插件主要功能有哪些呢?可以列表頁面文章批量采集,詳情頁面文章采集、分頁爬取、歷史數據, 也不放過,可以全部采集到想要的文章。wordpress采集插件可以實現自動采集、自動發布、文章自動添加動態內容,并且加入了非常多的功能,這樣就能夠最大程度的優化SEO。自動打標簽Auto Tags、文章過濾 、自動特色圖片 ,內容關鍵字過濾替換,wordpress采集插件的偽原創、自定義采集任何網站。
wordpress采集插件可能會遇到點擊調試、采集按鈕出現404錯誤,那么修改插件的wordpress采集插件文件中的代碼,簡單就是把兩行代碼前面的注釋符號去掉,大約在260、261行。
function jpost_plugin_rules() {
add_rewrite_rule('^jpost/?([^/]*)', 'index.php?wordpress=wordpress&$matches[1]', 'top');
add_rewrite_endpoint( 'wordpress', EP_PERMALINK );
// 重置規則請刪除一下2行的注釋
global $wp_rewrite;
$wp_rewrite->flush_rules();
wordpress采集插件的如何添加采集任務?
抓取目標網站域名(網址以/結束)
這里填寫目標網站首頁的地址,以/結束。
抓取目標網站列表頁,列表頁一般都是二級頁面,是欄目的具體展示頁,一般是用頁內跳轉的鏈接。
入庫目標分類ID,WordPress后臺,文章分類目錄,編譯網站想入庫到的分類,然后查看瀏覽器地址欄的地址。
這里的tag_ID=38,這個38就是我們需要填寫的值。
WordPress入庫時,寫入文章的標簽值。多個標簽請使用,分割(英文狀態的逗號分隔)
目標網站a鏈接元素,列表頁中到二級目錄的鏈接地址,同wordpress采集插件選擇器方法。
分頁格式,列表頁中第二頁區別列表頁的地方。例:
翻頁后變成:/group/meituikong/discussion?start=8850
那么這里就填寫:discussion?start={page}
這里的 {page} 就是翻頁變化的地方。
分頁最大值,這里填寫翻頁后最后的page值。
獲取單頁標題、目標單頁獲取元素 :title內容頁中標題、內容的標簽值。同wordpress采集插件方法。下面我們具體得講述一下怎么選擇元素。首先我們需要使用瀏覽器,瀏覽器都具有調試等功能。
首先分析代碼,以下元素標簽可以是div , h3 ,title ,span , p 等。
例:<元素標簽 class=”classname”>…</元素標簽>,那么我們應該則填入:元素標簽.classname。
例:<元素標簽 id=”classname”>…</元素標簽>,那么我們應該則填入:元素標簽#classname。