伊人久久大杳蕉综合丁香五月,久久久91亚洲视频,亚洲综合天堂Av网站在线观看,欧美亚洲中文高清

      • 云南網(wǎng)站建設(shè)創(chuàng)新企業(yè) 昆明多彩網(wǎng)絡(luò)公司

        用php實(shí)現(xiàn)的小偷程序原理

        來(lái)源:昆明網(wǎng)絡(luò)公司 日期:2010-09-15 閱讀: 發(fā)表評(píng)論

        很多站因?yàn)闊o(wú)法及時(shí)更新網(wǎng)站信息,所以都采用了程序自動(dòng)采集網(wǎng)絡(luò)新聞的做法,這里我們來(lái)說(shuō)一下php的自動(dòng)采集原理。

        1、確定采集的網(wǎng)站目標(biāo)。

        2、使用file_get_contents來(lái)獲取遠(yuǎn)程網(wǎng)站的內(nèi)容存儲(chǔ)到某個(gè)變量當(dāng)中。

        3、構(gòu)建正則表達(dá)式,提取需要的內(nèi)容,并循環(huán)存儲(chǔ)到數(shù)據(jù)庫(kù)中。

        該任務(wù)的主要技術(shù)難點(diǎn)有以下:

        1、正則表達(dá)式的構(gòu)建,需要重復(fù)測(cè)試并且試驗(yàn)一段時(shí)間。

        2、對(duì)方采取一些了防采集的措施,比如,網(wǎng)頁(yè)內(nèi)容規(guī)律的刻意打亂,服務(wù)器端的檢測(cè),對(duì)內(nèi)容讀取時(shí)間頻率的控制等等。

        發(fā)表評(píng)論評(píng)論列表(有 條評(píng)論)