新版帝國CMS采集分享,完全免費(附下載)
本文主要是給站長們分享帝國CMS采集,關于帝國CMS采集的一些功能知識。無需看全文,直接閱讀本文文章圖片,即可了解帝國CMS采集相關。【圖片1,帝國CMS采集重點1】
帝國CMS采集系統很好用,無需會任何程序,只需在相應的采集內容加上相應的標簽即可。
本系統無論是內置的系統模型還是用戶自定義的模型都有自己相應的采集。自動化內容采集的支持,大大降低了內容維護的工作量,并讓網站管理系統與企業的其它信息化系統無縫集成,提高了信息的利用率。【圖片2,帝國CMS采集重點2】
使用簡單:無需會任何程序,只需在相應的采集內容加上相應的標簽即可。
多重過濾:同一鏈接可設置不重復采集;設置采集關鍵字(不包含不采集);內容字符替換;廣告過濾;整頁代碼過濾;過濾相似信息;過濾標題相同信息;設置采集記錄數。
采集區域更準確:整體頁面區域正則+信息鏈接區域正則。
支持多種頁面編碼轉換:支持GB2312、BIG5、UTF8、UNICODE編碼轉換。【圖片3,帝國CMS采集重點3】
效率更高:采用分組采集與入庫;支持多線程(節點)采集。
方便性:采集可選是否馬上入庫(特別對于掛機采,非常方便);填寫采集正則后可預覽采集結果,可驗證采集正則的正確性;復制、清空節點;可選擇“選擇式”與“全部式”入庫;對采集的臨時數據進行管理。【圖片4,帝國CMS采集重點4】
遠程保存文件:支持遠程保存圖片/FLASH/附件,圖片加水印。
采集規則導出與導入功能。
支持驗證字段內容為空不采集:支持自定義字段設置,并且支持多個字段同時驗證。
支持采集時間和入庫時間間隔設置:可防止過度采集被封。
其它特性:支持多列表采集、內容分頁采集。
采集關鍵的幾個步驟
一:先建好欄目
二:增加采集節點(需要選擇欄目)
三:錄入節點名稱
四:如果有很多頁,只需錄入采集頁面地址方式二中的內容新聞標題
很多站長想要了解正則相關問題,簡單說一下,建議直接看圖片,簡單方便,不需規則復雜配置,完成帝國CMS采集。
正則:<td>標題:<strong>[!–title–]</strong></td>
新聞內容正則:<td>內容:<font color=”#FF0000″>[!–newstext–]</font></td>
“[!–title–]”與“[【如何提高百度排名】!–newstext–]”分別為“標題”字段與“內容”字段的正則變量。用于指定我們要采集的內容位置。
(3)、由上面我們得出了,帝國CMS采集正則是把正則變量替換要采集內容后的代碼內容。格式:
識別代碼頭部[!–變量名–]識別代碼尾部
注意:上面的“識別代碼頭部”一定是要唯一的標記。
2、帝國CMS正則還有表示任意內容的字符:“*”
如果“識別代碼頭部”中有內容是變化的,那么我們可以用*代替它。如頁面源代碼為如下,我們要采集下面的鏈接地址:
<a title=”任意可變內容” href=”鏈接地址”>標題</a>
通過使用“*”任意內容表示字符,我們可以用下面的正則忽略可變內容,獲得地址:
<a title=”*” href=”[!–newsurl–]”>
附加說明:[!–newsurl–]為頁面鏈接地址的正則變量。
147SEO » 新版帝國CMS采集分享,完全免費(附下載)