国产睡熟迷奷白丝护士系列精品,中文色字幕网站,免费h网站在线观看的,亚洲开心激情在线

      <sup id="hb9fh"></sup>
          1. 千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

            手機站
            千鋒教育

            千鋒學習站 | 隨時隨地免費學

            千鋒教育

            掃一掃進入千鋒手機站

            領(lǐng)取全套視頻
            千鋒教育

            關(guān)注千鋒學習站小程序
            隨時隨地免費學習課程

            當前位置:首頁  >  技術(shù)干貨  > ?Python簡單兩步實現(xiàn)天氣爬蟲采集器

            ?Python簡單兩步實現(xiàn)天氣爬蟲采集器

            來源:千鋒教育
            發(fā)布人:xqq
            時間: 2023-11-06 03:54:15 1699214055

            說道爬蟲大家或許感覺非常神秘,其實它沒有我們想象的那么神奇(當然,google和baidu的爬蟲是一場復雜和強大的,它的強大不是爬蟲本身強大,而是后臺的數(shù)據(jù)處理和數(shù)據(jù)挖掘算法非常強大),今天我們就來揭開它神秘的面紗。呵呵,簡單兩步就可以實現(xiàn)一個網(wǎng)頁天氣爬蟲程序。。。

            爬蟲簡單說來包括兩個部分:1.獲得網(wǎng)頁文本信息。2.數(shù)據(jù)分析,獲取其中我們想要的數(shù)據(jù)。

            1、獲得網(wǎng)頁文本信息。

            python在獲取html方面十分方便,有了urllib庫的幫助,只需要幾行代碼就可以實現(xiàn)我們需要的功能。

            #引入urllib庫

            importurllib

            defgetHtml(url):

            page=urllib.urlopen(url)

            html=page.read()

            page.close()

            returnhtml

            這里返回的就是網(wǎng)頁的源代碼,也就是html代碼。

            那我們?nèi)绾螐闹械玫轿覀兿胍男畔⒛?那就需要用到在網(wǎng)頁分析里面最最常用的工具-正則表達式了。

            2、根據(jù)正則表達式等獲得需要的內(nèi)容。

            使用正則表達式時需要仔細觀察該網(wǎng)頁信息的結(jié)構(gòu),并寫出正確的正則表達式。

            python正則表達式的使用也很簡潔:

            #引入正則表達式庫

            importre

            defgetWeather(html):

            reg='(.*?).*?(.*?).*?(.*?)'

            weatherList=re.compile(reg).findall(html)

            returnweatherList

            說明:

            其中reg是正則表達式,html是第一步獲得的文本。findall的作用是找到html中所有符合正則匹配的字符串并存放到weatherList中。之后再枚舉weatheList中的數(shù)據(jù)輸出即可。

            這里的正則表達式reg有兩個地方要注意。

            一個是“(.*?)”。只要是()中的內(nèi)容都是我們將要獲得的內(nèi)容,如果有多個括號,那么findall的每個結(jié)果就都包含這幾個括號中的內(nèi)容。上面有三個括號,分別對應城市、最低溫和最高溫。

            另一個是“.*?”。python的正則匹配默認是貪婪的,即默認盡可能多地匹配字符串。如果在末尾加上問號,則表示非貪婪模式,即盡可能少地匹配字符串。在這里,由于有多個城市的信息需要匹配,所以需要使用非貪婪模式,否則匹配結(jié)果只剩下一個,且是不正確的。

            以上內(nèi)容為大家介紹了Python簡單兩步實現(xiàn)天氣爬蟲采集器,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓機構(gòu):千鋒教育。http://parentadvocate.org/

            tags: python培訓
            聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
            10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
            請您保持通訊暢通,專屬學習老師24小時內(nèi)將與您1V1溝通
            免費領(lǐng)取
            今日已有369人領(lǐng)取成功
            劉同學 138****2860 剛剛成功領(lǐng)取
            王同學 131****2015 剛剛成功領(lǐng)取
            張同學 133****4652 剛剛成功領(lǐng)取
            李同學 135****8607 剛剛成功領(lǐng)取
            楊同學 132****5667 剛剛成功領(lǐng)取
            岳同學 134****6652 剛剛成功領(lǐng)取
            梁同學 157****2950 剛剛成功領(lǐng)取
            劉同學 189****1015 剛剛成功領(lǐng)取
            張同學 155****4678 剛剛成功領(lǐng)取
            鄒同學 139****2907 剛剛成功領(lǐng)取
            董同學 138****2867 剛剛成功領(lǐng)取
            周同學 136****3602 剛剛成功領(lǐng)取
            相關(guān)推薦HOT
            Python標準庫中自帶的單元測試框架

            Unittest是Python標準庫中自帶的單元測試框架,支持自動化測試,測試用例的初始化和關(guān)閉測試用例的聚合等功能。有一些類似于Java中的Junit單元...詳情>>

            2023-11-06 06:57:52
            有Java基礎(chǔ)的學習python應該注意些什么

            首先,對于具有Java編程基礎(chǔ)的人來說,學習Python的初期并不會遇到太大的障礙,但是要結(jié)合自己的發(fā)展規(guī)劃來制定學習規(guī)劃,尤其要重視學習方向的...詳情>>

            2023-11-06 06:25:27
            Python 定時修改數(shù)據(jù)庫

            當需要定時修改數(shù)據(jù)庫時,一般我們都選擇起一個定時進程去改庫。如果將這種定時任務(wù)寫入業(yè)務(wù)中,寫成一個接口呢,定時進程顯得有些不太合適?如...詳情>>

            2023-11-06 06:03:51
            Python有哪些常用函數(shù)?

            Python常用函數(shù)有哪些?我想大家都比較好奇這個問題,今天小編特地整理了一篇有關(guān)Python常用函數(shù)的相關(guān)內(nèi)容,接下來我們一起來看看具體的內(nèi)容介...詳情>>

            2023-11-06 05:49:27
            Python常用的三大開源框架

            眾所周知,Python是一種腳本語言,具有易學、語法清晰、易維護等優(yōu)點,而且具有豐富和強大的庫,被稱作為膠水語言。Python語言誕生較早,經(jīng)過多...詳情>>

            2023-11-06 05:35:03