采集規則
采集規則,當網站需要持續內容更新以及達到整體飽滿程度,會利用采集來填充我們的網站,批量自動采集,不是單純的復制粘貼。而是通過工具來實現,這里就會說到采集規則這個概念,如何寫,怎么用,是很多站長不清楚或者是壓根就不知道的。那么本文就主要給大家說下關于采集規則的一些知識點,忽略后面的文章內容,直接看圖,更加簡單明了。【看圖一,采集規則,永久免費采集發布】
其實采集規則并不難,只要站長能看懂一點HTML就行了。采集的時候以某個目標站為目標,添加所屬分類:選擇所要添加到的欄目。其他的不用管,點下一步,直接看列表文件的采集代碼:在目標頁面空白處點右鍵,點”查看源文件”調出列表頁面的源代碼,根據列表頁面很容易看出。【看圖二,采集規則,一鍵批量自動采集】
文章列表的開始部分就在,<div align=left class=title14>,假如這個還不是很清楚的話,我們可以加上<!--開始列表-->,那么完整的別表開始代碼就可以寫成:【看圖三,采集規則,采集效率高效簡單】
第一步,<div align=left class=title14>
<!--開始新聞列表-->
再來看獲取列表結束代碼:
<!--結束新聞列表-->
</div>
獲取連接開始代碼:
<li><a href=
獲取連接結束代碼:
TARGET=_blank>【看圖四,采集規則,網站站長優化必備】
接下來,我們來看文章頁面的規則。在寫的過程中一定要注意“代碼的唯一性”。
點開內容頁面,同樣的方法調出內容的“源文件”。獲取文章標題開始代碼:<title>
獲取文章標題結束代碼:_新聞中心_新浪網</title>
獲取文章內容開始代碼:
接下來,<!--正文內容開始-->
<div class="artibody" id="artibody">
獲取文章內容結束代碼:
<!--正文內容結束-->
<div align="center">
采集規則在網站后臺,采集管理的規則管理中,會看到多條采集規則。這些采集規則的歸屬欄目都默認為網站id為1的欄目,默認設置為保存遠程圖片到網站的服務器上。采集規則歸屬欄目設置為其它的欄目。
關于采集規則的分享,如果有不懂的,可以直接看圖片中的內容,這樣會更易于站長對于采集規則的理解。其實現在對于采集規則的方法很多都是通過內嵌采集規則的形式,避免讓站長來直接操作,畢竟大多數站長是不懂代碼和技術的,要自己寫的話無疑是增加了工作難度,也無法對網站內容采集達到有效的效率值。