WordPress已成為網(wǎng)站建設(shè)者最常用的平臺之一,其強大的擴展性能夠滿足用戶的各種需求。其中,插件就是其最大的亮點之一。利用插件,可以輕松實現(xiàn)各種功能,其中就包括采集文章。下面就為大家介紹一下具體的操作步驟:
1.首先,在WordPress后臺找到“插件”選項,并點擊“新建插件”。
2.進入新建插件頁面后,輸入插件名稱,并在代碼編輯區(qū)輸入如下代碼:
```
/**
* Plugin Name: 采集文章插件
* Plugin URI: https://github.com/
* Description: 利用WordPress采集文章的功能插件
* Version: 1.0
* Author: WP
* Author URI: https://wordpress.org/
**/
?>
```
3.在代碼編輯區(qū)后面,輸入以下代碼:
```
function crawlnet_get_contents ($url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
$output = curl_exec($ch);
curl_close($ch);
return $output;
}
function crawlnet_save_image($imgUrl,$savePath){
$img = crawlnet_get_contents($imgUrl);
$fp2 = @fopen($savePath, "w");
fwrite($fp2,$img);
fclose($fp2);
}
add_action('init','start_crawl');
function start_crawl()
{
$url = 'https://www.example.com';//輸入要采集的網(wǎng)址
$html = crawlnet_get_contents($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$as = $xpath->query('//a');
foreach ($as as $a) {
$title = $a->nodeValue;
$link = $a->getAttribute('href');
$content = crawlnet_get_contents($link);
$dirname = './images';//定義存儲圖片的目錄,可以自定義
$imagepath = $dirname.'/'.$title.'.jpg';
if(!is_dir($dirname)){
mkdir($dirname);
}
$doc2 = new DOMDocument();
@$doc2->loadHTML($content);
$xpath2 = new DOMXPath($doc2);
$ps = $xpath2->query('//img');
foreach($ps as $p)
{
$imageUrl = $p->getAttribute('src');
crawlnet_save_image($imageUrl,$imagepath);
}
$content=$doc2->getElementsByTagName("body")->item(0)->nodeValue;//獲取文章內(nèi)容
$my_post = array(
'post_title' => wp_strip_all_tags( $title ),
'post_content' => $content,
'post_status' => 'publish',
'post_author' => 1,
'post_category' => array( 8,39 )
);
wp_insert_post( $my_post );//將內(nèi)容插入到WordPress中
}
}
?>
```
4.保存插件后,進入插件管理界面,激活插件即可。
總結(jié):
利用WordPress可以非常方便地進行文章采集,不僅可以幫助網(wǎng)站管理員節(jié)省大量時間和精力,還可以增加網(wǎng)站的內(nèi)容豐富度,提高網(wǎng)站的用戶黏著度。希望本文能夠?qū)Υ蠹伊私馊绾卫肳ordPress進行文章采集有所幫助。