国产高清网站_亚洲一区二区综合_成人久久18免费网站_国产成人久久精品激情

您現在所在的位置:首頁 >學員就業 > 學生感言 > Python1707A學員感言:寫爬蟲很簡單又很難

Python1707A學員感言:寫爬蟲很簡單又很難

來源:奇酷教育 發表于:

 通過這次做項目,使我對項目開發有了進一步的認識。做項目的時候,最重要的不是自己如何快速地將自己分配的任務做完,而是要注重團隊合作

 通過這次做項目,使我對項目開發有了進一步的認識。做項目的時候,最重要的不是自己如何快速地將自己分配的任務做完,而是要注重團隊合作。一開始組內必須對這個項目的數據庫的命名進行討論,定義表的屬性的數據類型,表與表之間會有關聯,所以有的屬性的類型與長度必須定義一致,這樣訪問數據庫時才不會出錯。如果一開始不將這些步驟統一下來的話,就會給后面的編程帶來一系列的問題。
 
    整個一周的項目,第一天我們就對項目的數據庫以及數據表有了初步的建立,然后后面還有許多模塊需要分工,當然,有些具體的模塊需要完成的功能,都還不甚清楚,因此我們第一天就針對這個web項目做了一個簡單的Django框架的搭建,以及前期項目比較依賴的登錄注冊部分給完善了出來。
    整個項目包含了有:購物車,商品列表頁,商品詳情頁,訂單頁面,支付頁面,個人用戶信息完善頁面,首頁的完善展示和一些小功能,然而我們組有5個人呢,我有身為組長,其中最重要的一部分,商品數據的獲取部分就是由我來做的。
    從第二天開始,我們就開始按照各自的分工開始寫自己的項目了,但是,一旦開始些項目之后,隨之而來的各種問題就出現了,例如商品列表頁面需要一些基礎的數據部分,這些數據是需要我來爬取,具體的商品需要分類,這些商品類型也是需要我首先爬取一部分基礎的測試數據的,還有一部分商品詳情頁的內容也是需要我先爬取一部分基礎測試數據的,因此,我就開始了我的基礎測試數據的爬取。
    我選擇的是爬蟲,因此為了起初為了效率,我是選擇的比較高效率的scrapy框架來爬取數據的,但是,當寫了一段時間代碼之后,發現自己對著一套框架并不熟悉,底層封裝的各種代碼,的用途都不是很熟悉,感覺就是寫代碼根本就是不可控制的,這就很難受,幾經猶豫,最終我轉回了基本的requests模塊,雖說比較基礎,但也還沒到了urllib2的那種程度,因此寫起來也就比較得心應手了,同時感覺可控制性也比較強,一天下來,商品列表的爬取代碼也寫的差不多了,到了爬取數據的時候終于還是出了不少問題。
    比如,再匹配頁面數據的時候,我選擇的是使用Xpath來匹配頁面數據,明明在網頁上使用的xpath查詢工具能夠匹配到數據,可是寫在代碼里面就是匹配不到數據,這個問題一直困擾了,我很長時間,直到我上網百度之后,才發現,有些問題還是自己的問題,當順利解決之后,最終還是選擇了使用正則與Xpath的混合使用完成了商品類型列表的爬取部分。當然,這也是我第二天完成了自己爬取組內基礎測試數據部分的爬取。
    由于我寫的是爬蟲,當項目的數據模型類基本定下來之后,就只需要關心自己的數據問題與數據庫的數據的對應問題就可以了,可是,身為項目小組中的組長,我還是要肩負一部分的責任的,一天下來,組內成員也積累了不少問題,比如,白天在代碼同步的時候,總會有些人因為在提交之前沒有更新,其他人再更新的時候,就會莫名的有一部分代碼被刪掉,這些都是更行代碼不同步的問題,當然,其他問題也在討論的時候得到了一一的解決。
    到了第三天,真正需要完整的爬取整站的數據的時候,終于還是出了不少問題,例如:這次我們的模板是個全英文的電商網站模板,因此,我在爬取國內網站的中文數據,放在一塊就會顯得非常的不倫不類的感覺,在幾經權衡之下,我選擇了爬取國外同樣的一個大型電商網站。
    又經過了一天的奮斗之后,寫完了一套代碼,問題總是在不經意間到來,由于爬的是國外網站的數據,因此爬取數據的時候,效率就異常的低,幾乎是兩三秒爬取一條的商品數據,然而整站的數據算下來幾乎能達到40000條數據,這樣肯定是不行的,何況還要保存,入庫,如果整個爬下來之后再入庫肯定是不行的,首先內存就會不支持,因此,不得已我就考慮會不會是我的代碼的性能問題。
    于是乎,又接下來的一天我就對代碼做了大量的修改,完全改成了多進程多線程式的操作,可是結果仍不盡如人意,效率不見提升,反而又降低了不少,經過跟組員門的討論之后,考慮應該是數據量是固定的,多線程爬取的話,就會造成并發量過大,同時發送的請求量占用了大量的帶寬,導致了下行數據的速度非常緩慢。
    不得已,我又對代碼做了大量的修改,于是乎,第三個版本就是,單純的雙進程,一個寫入數據,一個爬取數據,這樣下來,效率倒也還好,但是也就跟剛開始差不多,就這樣爬取了一整天,期間跟其他組員共同完成了許多其他難以解決的問題。
    問題的出現總是不可避免的,出現了就要解決,這次的問題就是,爬了整天的數據,到最后,一直只是寫入,卻并沒有保存,因此到了最后需要加快進度,于是就又一次修改代碼,在爬取數據 的時候,沒爬取一類自動保存一次,當然,為了不重復爬取,同時增加了指紋集合的功能,這次總算能有一部分數據了。
    當然,最后肯定不能就這樣草草結束,項目還并不完整,結束以后,一些細節以及數據,仍然需要完成。總體來說,在此次項目中,我們小組雖說經歷了各種困難,但我們都憑借各種途徑解決掉了,增加了項目協同開發的經驗的同時,我也覺得這就是一種自我提升的手段,相信對以后自己的工作中會有很大的用處的。
国产高清网站_亚洲一区二区综合_成人久久18免费网站_国产成人久久精品激情

    <sup id="ys8cw"><kbd id="ys8cw"></kbd></sup>

    <sup id="ys8cw"><font id="ys8cw"><output id="ys8cw"></output></font></sup>

    免费观看日韩电影| 日韩一区二区三区在线观看 | 欧美另类z0zxhd电影| 欧美国产视频在线| 狠狠色丁香九九婷婷综合五月| 欧美老肥妇做.爰bbww视频| 一区二区在线免费观看| 91小视频在线免费看| 中文字幕欧美一区| 成人精品免费看| 久久精品一区蜜桃臀影院| 精品一区中文字幕| 制服丝袜日韩国产| 蜜桃av一区二区在线观看| 欧美丰满一区二区免费视频 | 日韩精品一区二区三区四区| 视频一区视频二区中文字幕| 欧美系列在线观看| 亚洲va欧美va天堂v国产综合| 91精品福利在线| 性欧美大战久久久久久久久| 欧美男男青年gay1069videost| 亚洲图片自拍偷拍| 3atv在线一区二区三区| 久久精品av麻豆的观看方式| 2021中文字幕一区亚洲| 成人午夜在线播放| 亚洲免费观看高清| 欧美欧美午夜aⅴ在线观看| 日本午夜精品视频在线观看| 欧美精品一区男女天堂| 国产精品综合在线视频| 亚洲天堂av一区| 欧美日韩日日摸| 国产一区二区在线观看免费| 中文字幕一区二区三区色视频| 欧美亚男人的天堂| 美女视频免费一区| 国产精品久久久一本精品| 日本丶国产丶欧美色综合| 免费黄网站欧美| 国产日韩av一区| 欧美视频在线播放| 国产在线播精品第三| 亚洲欧美偷拍另类a∨色屁股| 91.xcao| 国产成人av网站| 亚洲成av人片一区二区三区| 久久精品这里都是精品| 欧美系列亚洲系列| 国产精品123| 性做久久久久久久久| 久久中文字幕电影| 欧美亚男人的天堂| 国产99久久精品| 日韩精品一二区| 18欧美亚洲精品| 精品国产欧美一区二区| 欧美午夜电影一区| 成人深夜视频在线观看| 久久国产乱子精品免费女| 亚洲一区二区三区四区不卡| 久久久.com| 91精品国产91综合久久蜜臀| 97久久精品人人做人人爽50路| 理论电影国产精品| 亚洲主播在线播放| 欧美经典一区二区三区| 日韩一区二区三区电影| 欧美日韩综合一区| 99久久er热在这里只有精品66| 国产做a爰片久久毛片| 日韩主播视频在线| 亚洲精品乱码久久久久久黑人| 国产网站一区二区| 精品国产一区二区三区久久影院| 欧美日韩成人综合天天影院| 91网址在线看| 成人一区二区三区| 国产东北露脸精品视频| 国产一区二区三区高清播放| 日韩国产欧美在线观看| 亚洲一区二区三区爽爽爽爽爽| 国产精品蜜臀av| 国产欧美一区二区在线| 精品盗摄一区二区三区| 精品久久人人做人人爱| 欧美一区二区网站| 欧美一级欧美三级在线观看| 欧美精品在线观看播放| 欧美电影影音先锋| 91精品国产综合久久婷婷香蕉| 欧美精品久久99久久在免费线 | 中文字幕在线观看一区| 国产喷白浆一区二区三区| 国产欧美一区二区精品婷婷| 国产视频亚洲色图| 中文字幕+乱码+中文字幕一区| 日韩精品一区二区三区视频在线观看 | 91小视频在线观看| 色综合久久久久久久| 在线免费不卡视频| 欧美日韩一区二区在线观看视频| 欧美日韩卡一卡二| 欧美一卡2卡3卡4卡| 精品va天堂亚洲国产| 久久婷婷一区二区三区| 国产欧美日韩卡一| 国产精品国产自产拍高清av王其| 中文字幕一区二区三区蜜月| 一区二区三区四区中文字幕| 亚洲第一搞黄网站| 免费成人在线影院| 国产99久久精品| 在线免费观看日韩欧美| 7777精品伊人久久久大香线蕉| 精品成人在线观看| 综合久久久久久| 亚欧色一区w666天堂| 国产一区二区三区最好精华液| k8久久久一区二区三区| 欧美日韩三级在线| 久久综合久久综合久久综合| ...xxx性欧美| 日韩精品色哟哟| 国产精品一区在线观看乱码| 一本到一区二区三区| 欧美大片一区二区| ...xxx性欧美| 五月开心婷婷久久| 成熟亚洲日本毛茸茸凸凹| 精品视频免费看| 国产三级精品三级在线专区| 亚洲香蕉伊在人在线观| 国产黄色精品视频| 欧美日韩在线电影| 中文字幕精品一区二区三区精品| 亚洲不卡在线观看| av电影在线观看一区| 欧美一级二级三级蜜桃| 亚洲女与黑人做爰| 国产成人超碰人人澡人人澡| 欧美精品少妇一区二区三区| 国产精品灌醉下药二区| 麻豆国产一区二区| 欧美伊人精品成人久久综合97| 国产欧美日产一区| 日韩不卡一二三区| 在线观看日产精品| 国产精品进线69影院| 国产综合一区二区| 91精品婷婷国产综合久久竹菊| 亚洲欧美一区二区三区久本道91| 韩国精品免费视频| 91精品国产aⅴ一区二区| 一二三四社区欧美黄| 波多野结衣一区二区三区| 欧美精品一区二区三区高清aⅴ| 亚洲高清免费视频| 91丝袜国产在线播放| 中文字幕巨乱亚洲| 国产在线乱码一区二区三区| 69堂国产成人免费视频| 亚洲国产精品一区二区www | 亚洲一二三专区| 91麻豆国产精品久久| 国产精品青草久久| 国产乱子伦视频一区二区三区| 日韩欧美一级片| 热久久久久久久| 69堂成人精品免费视频| 视频一区视频二区中文| 欧美日韩黄色一区二区| 亚洲免费大片在线观看| 色婷婷精品大在线视频| 亚洲美女区一区| 97久久人人超碰| 一区二区在线免费观看| 在线免费观看日本欧美| 亚洲少妇最新在线视频| 一本色道a无线码一区v| 亚洲女人的天堂| 色综合天天在线| 亚洲综合999| 欧美精品一二三区| 久久se精品一区二区| 精品国产精品一区二区夜夜嗨| 精品一二三四区| 久久一二三国产| 成人黄页在线观看| 依依成人综合视频| 777午夜精品视频在线播放| 日韩电影一区二区三区| 精品国一区二区三区| 国产成人免费在线视频| 自拍av一区二区三区| 欧美日韩精品欧美日韩精品| 日韩不卡在线观看日韩不卡视频| 亚洲精品一区二区三区蜜桃下载| 国产福利91精品一区二区三区|