當前位置：首頁 > 编程语言 > php >内容正文

php

织梦php 文章采集规则,织梦输入网址采集单个网页功能发布不需要写采集规则一键采集...

發布時間：2024/8/1 php 33 豆豆

生活随笔收集整理的這篇文章主要介紹了织梦php 文章采集规则,织梦输入网址采集单个网页功能发布不需要写采集规则一键采集... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

夢搏網絡一鍵采集不需要寫采集規則，系統自動識別文章正文內容和標題，現已經集成到織夢cms，使用織夢cms的站長有福了，完全可以替換織夢后臺自帶的“輸入網址采集單個網頁>>”的功能，首先分析對比下織夢系統自帶的“輸入網址采集單個網頁>>”和夢搏網絡一鍵采集有什么區別？

1、織夢自帶的“輸入網址采集單個網頁>>”需要在采集前些每個采集網站的采集規則，而且如果采集網頁布局不同也無法公用，這樣就導致了，采集網頁非常麻煩，還有很多站長并不會寫規則，這樣也就無法使用這個采集單個網頁的功能，編輯發布文章都需要復制標題，在復制內容來人工發布。

2、夢搏網絡一鍵采集主要功能是，改善織夢自帶的“輸入網址采集單個網頁>>”改善之后，只要輸入網址就可以采集，支持95%以上的網頁，尤其是文章類型的網站，不需要寫采集規則，采集前不需要寫規則，一切都是系統自動完成。采集的字段包含：標題、縮略圖、簡介描述、文章正文內容。

下面看下如何修改，只需要在系統的兩個文件上面加幾行代碼就可以，絕不影響系統以后升級。

打開織夢cms的后臺目錄文章發布文件，默認是：dede/aticle_add.php?和?dede/templets/aticle_add.htm

dede/aticle_add.php增加如下代碼/獲取文章最大id以確定當前權重

$maxWright = $dsql->GetOne("SELECT COUNT(*) AS cc FROM #@__archives");

//新增加夢搏網絡一鍵采集

$url="http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key";

$caiji=json_decode(file_get_contents($url));

$caiji_lead_image_url= mb_convert_encoding($caiji->{'lead_image_url'},'gbk','utf-8');//圖片

$caiji_word_count= mb_convert_encoding($caiji->{'word_count'},'gbk','utf-8');//字數

$caiji_title= mb_convert_encoding($caiji->{'title'},'gbk','utf-8');//標題

$caiji_content= mb_convert_encoding($caiji->{'content'},'gbk','utf-8');//內容

$caiji_description=preg_replace("//si","",$caiji_content);//過濾html標簽

$caiji_description = mb_substr($caiji_description,0,80,'gbk');//簡介

include DedeInclude("templets/article_add.htm");

dede/templets/aticle_add.htm?文件修改如下代碼

?采集單個網頁-URL：?文章標題： ?縮略圖：

?內容摘要：

<?php echo $description.$caiji_description; ?>

GetEditor("body",$body.$caiji_content,450);

代碼中http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key?請聯系http://www.sinmeng.net/?獲取你的key

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。