藍天采集器免費下載,藍天采集器規則配置詳細教程
藍天采集器規則,什么是藍天采集器?藍天采集器采用的php+mysql開發可部署在云端服務器,實現電腦端、移動端使用瀏覽器即可采集數據,,藍天采集器的規則相對于來說也不是這么簡單的。今天給大家分享一款免費萬能的采集器,只需要輸入關鍵詞就能采集全網文章,或輸入域名指定采集網站文章。還支持批量關鍵詞采集(詳細參考圖片一、二、三、四、五、)萬能采集器可對接任何cms系統,免登錄實時發布數據。
藍天采集器的規則介紹:
“規則”支持:(*)(通配符)、正則表達式,使用[內容](通用匹配)或捕獲組(正則捕獲組)將匹配的數據保存為標簽,在“拼接內容”中引用[內容N]標簽組成結果
[內容]和捕獲組的區別:[內容]會自動轉換成固定格式捕獲組:(?
而捕獲組:(?,可以編寫任意正則表達式
[\s\S]*?)
[內容]適用于精準度不高的通用匹配,捕獲組適用于精準匹配
默認為單個匹配,多個匹配可勾選“允許匹配多個元素”
藍天采集器的規則分類介紹:
public function param_option_category(){
$catsDb=$this->db()->table('__TERMS__')->select();
$catList=array();
foreach($catsDb as $cat){
$catList[$cat['term_id']]=$cat['name'];
return$catList;
藍天采集器的規則配置介紹
//CMS全稱必須與你插件的cms程序名一致,$cmsPath為cms的根目錄路徑
public function cms_db_CMS全稱($cmsPath){
//請讀取cms的配置文件并將數據庫保存為以下數組形式后返回,可參考BaseCms.php中的其它cms_db_方法
$cmsDb=array(
'db_type' => 'mysql',//數據庫類型
'db_user' => '',//用戶
'db_pwd' => '',//密碼
'db_host' => '',//數據庫主機
'db_port' => 3306,//端口
'db_name' => '',//數據庫名稱
'db_charset' => 'utf8',//數據庫編碼
'db_prefix' => '',//表前綴
return$cmsDb;
藍天采集器發布數據介紹
* 導入數據
* 必須以數組形式返回:
* id(必填)表示入庫返回的自增id或狀態
*target(可選)記錄入庫的數據位置(發布的網址等)
*desc(可選)記錄入庫的數據位置附加信息
*error(可選)記錄入庫失敗的錯誤信息
* 入庫的信息可在“已采集數據”中查看
*return array('id'=>0,'target'=>'','desc'=>'','error'=>'');
public function runImport($params){
print_r($params);die();
returnarray('id'=>0,'target'=>'','desc'=>'','error'=>'');
$params數組即參數值列表,打印出來可發現,鍵名就是參數的變量名,值是最終處理后的結果,直接調用$params[變量名]便可得到參數的值
runImport方法必須返回數組,可以做網址排重、數據記錄等作用
應用創建好后可在“后臺?云端?已下載?應用程序”中看到,創建的文件則在“根目錄/app/標識名”中
注意:應用目錄下的index.php為入口文件請勿修改,標識名.php為應用配置文件(建議不要直接修改,而是在“應用?管理?開發應用”中編輯)
應用偽靜態配置文件在藍天采集器根目錄:nginx.conf(nginx),.htaccess(apache),web_config(iis)