close

其實用到的也不多,就全部列下來吧,中文就是註解

 

套件

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from cycler import cycler


函數

input("輸入")
print(輸出)
mean(取平均)
count(取次數)
min(取最小值)
max(取最大值)

 


方法

數據結構 = pd.read_csv('檔案加附檔名')
數據結構 = pd.read_csv('檔案加附檔名', encoding='big5')
數據結構.dtypes
數據結構.shape
數據結構.info()
數據結構.describe()
數據結構.columns = ['更換新標頭甲', '更換新標頭乙']:
數據結構.sort_values("依據排序欄位",ascending=False)
mount = 數據結構['計算該欄不同資料出現次數'].value_counts()
新數據結構=pd.DataFrame(數據結構,index=[1,2,3,4,5,6,7,8,9,10,11,12]).reset_index().rename(columns={'舊標頭甲':'新標頭甲','舊標頭乙':'新標頭乙'})
數據結構.head(預設顯示5筆)
數據結構.tail(預設顯示5筆)
cols = ['甲欄', '乙欄', '丙欄']
新數據結構[cols] = 數據結構[cols].replace(',', '', regex=True移除千分位逗號).astype(float)將結果轉為浮點數
新數據結構 = pd.melt( 數據結構 , id_vars=['不變變數名'],
value_vars=['參數甲', '參數乙'], var_name='參數甲或乙',value_name='參數甲或乙的數值')
新數據結構['甲欄']=數據結構['甲欄'].astype(int) 
數據結構.isnull().any()檢查是否有選填
數據結構.drop_duplicates(subset=['指定判斷重複的欄位'],  
                                            keep='last',            # 保留最後一筆重複資料
                                         inplace=True)           # 直接修改原 DataFrame
新數據結構 = 數據結構.size().reset_index(name='命名')
新數據結構['日期標頭'] = pd.to_datetime(數據結構['日期標頭'])
新數據結構= 數據結構.drop(['甲欄', '乙欄', '丙欄'], axis=1) 0是刪列 
新數據結構 = 數據結構.groupby("分組的判斷內容")
新數據結構 = 判斷布林值的新數據結構[作為判斷內容]
新數據結構 = (數據結構["標頭"]=="作為判斷的內容")
新數據結構 = pd.concat([df1, df2, df3, df4])
數學函式庫.mean
plt.rcParams['font.sans-serif'] = ['設定字體']


圓餅圖

labels = ["甲名稱","乙名稱","丙名稱"]
圖示內容 = [甲數據,乙數據,丙數據]
colors = ["甲顏色","乙顏色","丙顏色"]
plt.pie(圖示內容,labels=labels,colors=colors,autopct="%1.1f%%")
plt.axis("equal正圓")

多條柱狀圖

sns.countplot(x='橫軸標題',hue='橫軸的多項參數',data=數據結構,palette=sns.color_palette("漸層色系"))

兩組數據水平長條圖

x = [1,2,3]
x2 = [0.8,1.8,2.8]
h = [10,20,30]
h2 = [20,10,40]
plt.barh(x,h,color='b',height=0.4, align='edge對齊指定的 X 軸位置')  
plt.barh(x2,h2,color='r',height=0.4)              
plt.show()

多條摺線圖:

x = [1, 2, 3, 4, 5] 
y = [10, 20, 15, 25, 30]  
y2 = [5, 15, 25, 20, 10]
plt.plot(x, y, label='線A')
plt.plot(x, y2, label='線B')
plt.legend()
plt.show() 


字符串格式化(String Formatting)

print(f"Hello, {姓名}! You are {年齡} years old.")
print("Hello, {}! You are {} years old.".format(姓名, 年齡))
print("Hello, %s! You are %d years old." % (姓名, 年齡))

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 ky0dd 的頭像
    ky0dd

    阿京小站

    ky0dd 發表在 痞客邦 留言(0) 人氣()