pandas 是 python 資料分析中資料前處理的神器
1. 資料 NA 值統計
2. 去除 NA 值
3. 資料自動填補 NA 值的操作
4. 時間序列解析度操作
5. 資料分割選擇與合併
x = np.arange(0,5,0.1)
y = np.square(x)
解釋:
np.arange(start, stop, step) 是 NumPy 用來產生一個等間距的數列的函數。
start = 0:從 0 開始。
stop = 5:到 5 結束(不包含 5)。
step = 0.1:間距為 0.1。
所以這行會產生一個從 0 到 4.9 的數列
x = [0.0, 0.1, 0.2, 0.3, ..., 4.9]
總共會有 50 個元素。
np.square() 是 NumPy 中對每個元素進行平方的函數。
drinks.groupby('continent')
.spirit_servings.mean()
.sort_values(ascending=False)
.rename('spirit_servings_mean')
對資料表進行資料分組、計算平均值、排序並重新命名欄位。查詢洲別平均消耗的啤酒量
程式,終於下到又臭又長了
Python資料數據視覺化應用
01:12 01. 折れ線グラフ
03:27 02. 散布図
04:53 03. ヒストグラム
08:33 04. 棒グラフ
09:18 05. タイトルとラベル
10:29 06. 軸範囲
11:46 07. 対数軸
12:55 08. 凡例
15:45 09. マーカの種類・サイズ変更
17:35 10. 注釈
21:10 11. 目盛り
22:47 12. グリッド線
23:09 13. 複数グラフの表示
25:43 14. ヒートマップ
27:13 15. 3次元グラフ
30:28 16. 円グラフ
32:06 17. GUIウィジェット。
autopct='%.1f%%') # %.1f%% 表示顯示小數點一位的浮點數,後方加上百分比符號
自動計算百分比 ,預設無,可使用函式產生和組合。
%matplotlib inline 這行主要讓你可以在Jupyter Notebook 上畫圖表