pos機系統(tǒng)數(shù)據(jù)字典,萬條拼車數(shù)據(jù)背后的春節(jié)遷徙地圖

 新聞資訊  |   2023-04-23 10:32  |  投稿人:pos機之家

網(wǎng)上有很多關于pos機系統(tǒng)數(shù)據(jù)字典,萬條拼車數(shù)據(jù)背后的春節(jié)遷徙地圖的知識,也有很多人為大家解答關于pos機系統(tǒng)數(shù)據(jù)字典的問題,今天pos機之家(m.shineka.com)為大家整理了關于這方面的知識,讓我們一起來看下吧!

本文目錄一覽:

1、pos機系統(tǒng)數(shù)據(jù)字典

pos機系統(tǒng)數(shù)據(jù)字典

今天是正月初九,春運返程也已過半。這篇文章,作者對北京、上海、廣州、深圳、杭州等地 1萬多條出行數(shù)據(jù)進行分析,得出了一些有意思的結(jié)論,并且繪制了這幾個城市春運的遷移圖。雖然數(shù)據(jù)在取樣公平性上不能完全符合標準,但是思路還是值得大家學習參考的~

目錄

前言統(tǒng)計結(jié)果爬蟲思路統(tǒng)計思路后記

前言

很早之前發(fā)過一篇關于某拼車平臺爬蟲的文章,因為工作比較忙,一直沒有下文。最近年底稍微空了些,加上碰上春節(jié)返鄉(xiāng)大潮,剛好再拿過來寫一下數(shù)據(jù)分析的思路。

本次數(shù)據(jù)樣本共13041條,本別采集了北京、上海、廣州、深圳、杭州的某一天出行數(shù)據(jù),由于手動操作難以保證取樣的公平性,所以不能對全部數(shù)據(jù)結(jié)果的準確性做保證,本文以提供思路參考為主,先放一張路線圖:

統(tǒng)計結(jié)果

好了知道大家比較關心結(jié)果,所以先把結(jié)果放一放,后面再接著講分析過程。

乘客性別

先單獨把性別拎出來看一下,后面再根據(jù)城市進行分析,結(jié)果顯示,拋開未設置性別的乘客不論,總體來看順風車的用戶群中,男性(占比 49.39%)還是多于女性(占比 31.55%)的。畢竟跨城順風車,大過年的,女性乘客對于安全性的憂慮還有要有的。

城市訂單

真實數(shù)據(jù)的話訂單數(shù)量應該是深圳 > 北京 > 廣州 > 上海 > 杭州,但是同一個城市內(nèi)的乘客性別比例應該還是具有一定的參考價值的,可以看到北京、上海、深圳的女性乘客數(shù)量占比都是高于男性的。

客單價

原本是想比較一下平均路程長度,但是想想這個事情太折騰了,由于平臺主要還是依靠路程來計算拼車費用的,所以通過計算客單價的話大概也能反映一下平均形成長度(我猜的,然后結(jié)果是這樣的,沒想到廣州是最高的,也可能是我統(tǒng)計錯誤。

哪里乘客最壕

有時候有些偏遠地區(qū)訂單或者順路司機少,乘客會加價希望司機接單,于是統(tǒng)計了一下各城市加價訂單的占比和平均的加價額度,得出如下結(jié)果:

占比最高的城市是深圳,平均加價額度最高的城市也是深圳,看來深圳的小哥哥小姐姐們的確出手闊錯,然而加價比例最低的是北京,不過這也不能說明帝都人民不壕氣,可能就是人家繁華,司機多。

返鄉(xiāng)路線圖

最后放幾張返鄉(xiāng)的路線圖

北京

上海

廣州

深圳

杭州

杭州明顯有別與其它幾個城市,一個是杭州的數(shù)據(jù)樣本多,另外一個平臺上杭州黃牛多,那些最遠的單子就是黃牛廣告單。

爬蟲思路:注冊成為司機,利用 mitm 抓包存儲拼車單

統(tǒng)計思路:數(shù)據(jù)的話我是通過本地 Mongodb 存儲,所以直接用 Python 操作 Mongodb 數(shù)據(jù)

Pymongo:關于 Mongodb 數(shù)據(jù)庫的連接,直接上代碼:

client = MongoClient(\'mongodb://localhost:27017\')spring = client.springcollection = spring[\'orders\']

以上代碼的意思就是連接本地 Mongodb-spring 數(shù)據(jù)庫 -orders 文檔集合

Pyecharts:是大名鼎鼎的 Echarts 的 Python 可視化圖表庫,用起來挺順手的,而且文檔規(guī)范,基本上可以零門檻入門,具體實現(xiàn)請移步文檔。

Pyecharts(http://pyecharts.org)

這里介紹一下關于 Pyecharts 的圖表樣式配置,為了保持各圖表的樣式統(tǒng)一(偷懶),Pyecharts 提供了一個 Style 類,可用于在同一個圖或者多個圖內(nèi)保持統(tǒng)一的風格。

rom pyecharts import Style,Geostyle = Style( title_color="#fff", title_pos="center", width="360px",height="auto" />

代碼解讀

因為全部代碼有點長,所以抽了一段舉個例子,主要思路就是從 Mongodb 取出指定數(shù)據(jù),或者通過 $group 管道對數(shù)據(jù)進行處理,最后通過 pyecharts 生成相應的圖表,呈現(xiàn)

from pymongo import MongoClientfrom pyecharts import Style,GeoLinesdef getLines(self): # 連接數(shù)據(jù)庫 client = MongoClient(\'mongodb://localhost:27017\') spring = self.client.spring collection = self.spring[\'orders\'] # Mongodb的操作,$match-篩選出\'from_poi.city.city_name\'為\'杭州\'的文檔, # 再通過$group管道,按照目標城市統(tǒng)計出匯總數(shù)量 line_hangzhou = collection.aggregate([ {\'$match\': {\'from_poi.city.city_name\': \'杭州\'}}, {\'$group\': {\'_id\': \'$to_poi.city.city_name\', \'count\': {\'$sum\': 1}}} ]) # 按照Geolines圖表的數(shù)據(jù)格式格式化數(shù)據(jù) line_hangzhou_ = [] for line in line_hangzhou: line_hangzhou_.append(["杭州", line[\'_id\'], line[\'count\']]) # 創(chuàng)建一個GeoLines圖表 citylines = GeoLines("春節(jié)遷移路線圖", **style.init_style) # 添加數(shù)據(jù)以及樣式 citylines.add("從杭州出發(fā)", line_hangzhou_, **geo_style) # 生成html文件 citylines.render("results/citylines.html")

后記

這是一篇遲到很久的文章,本來沒打算再寫,但是總覺得下半部分沒寫完心里有個結(jié),所以還是抽時間補上。另外作為一個非專業(yè)技術人員,多記多練免得過幾天自己就忘了。

源碼地址附上:

https://github.com/bkidy/Dida_spider

以上就是關于pos機系統(tǒng)數(shù)據(jù)字典,萬條拼車數(shù)據(jù)背后的春節(jié)遷徙地圖的知識,后面我們會繼續(xù)為大家整理關于pos機系統(tǒng)數(shù)據(jù)字典的知識,希望能夠幫助到大家!

轉(zhuǎn)發(fā)請帶上網(wǎng)址:http://m.shineka.com/news/24026.html

你可能會喜歡:

版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 babsan@163.com 舉報,一經(jīng)查實,本站將立刻刪除。