トップ 一覧 検索 ヘルプ RSS ログイン

PRG-PY-coronaの変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
!!兵庫県のエクセルファイルから発症日のリストを抽出する

PRG-PY-pandasで書いてみる

**[数値モデル|https://qiita.com/kotai2003/items/d74583b588841e6427a2]
**[数値モデル1|https://qiita.com/kotai2003/items/3078f4095c3e94e5325c]
**[数値モデル2|https://qiita.com/MuAuan/items/88d5d0c416abb9e9915e]
**[数値モデル3|https://www.fttsus.jp/covinfo/pref-simulation/#28]
**[数理モデル|https://qiita.com/kotai2003/items/d74583b588841e6427a2]
**[数理モデル1|https://qiita.com/kotai2003/items/3078f4095c3e94e5325c]
**[数理モデル2|https://qiita.com/MuAuan/items/88d5d0c416abb9e9915e]
**[数理モデル3|https://www.fttsus.jp/covinfo/pref-simulation/#28]
https://qiita.com/MuAuan/items/88d5d0c416abb9e9915e

Roを求める::PRG-PY-sir


! コード データをプロット
 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-
 
 import pandas as pd
 import matplotlib.pyplot as plt
 
 df = pd.read_excel('corona-kanjajokyou(1).xlsx')
 
 dt = df[['発症日','発表日','年代','性別']]
 
 print('dataframeの行数・列数の確認==>\n', dt.shape)
 print('indexの確認==>\n', dt.index)
 print('columnの確認==>\n', dt.columns)
 print('dataframeの各列のデータ型を確認==>\n', dt.dtypes)
 # 発症日の抽出
 dh = pd.DataFrame(dt['発症日'].value_counts())
 dh2 = dh[dh.index != '症状なし']
 dh2 = dh2[dh2.index != '調査中']
 dh2.index=pd.to_datetime(dh2.index,format='%Y-%m-%d')
 # 発表日の抽出
 dh3 = pd.DataFrame(dt['発表日'].value_counts())
 dh3.index=pd.to_datetime(dh3.index,format='%Y-%m-%d')
 # 男女別の抽出
 dh4m = pd.DataFrame( ds.groupby(['発症日'])['性別_男性'].sum() )
 dh4m = dh4m[dh4m.index != '調査中']
 dh4m = dh4m[dh4m.index != '症状なし']
 dh4m.index=pd.to_datetime(dh4m.index,format='%Y-%m-%d')
 dh4f = ds.groupby(['発症日'])['性別_女性'].sum() 
 dh4f = dh4f[dh4f.index != '調査中']
 dh4f = dh4f[dh4f.index != '症状なし']
 dh4f.index=pd.to_datetime(dh4f.index,format='%Y-%m-%d')
 # 発症日不明の抽出
 ck_date =['症状なし','調査中']
 dh5 = ds.query('発症日 in @ck_date' )
 dh5e = pd.DataFrame(dh5['発表日'].value_counts())
 dh5e.rename(columns={'発表日': '不明'}, inplace=True)
 # 年代べつの抽出
 dh6 =pd.get_dummies(dt[['年代']], columns=['年代'])
 dh6s = dh6.sum()
 
 
 dd =pd.concat([dh3,dh2.reindex(dh3.index)],axis=1)
 
 print(dd.sort_index())
 
 dd.plot()
 plt.show()


! 結果
             発表日   発症日
 2020-03-01    1   4.0
 2020-03-03    2   4.0
 2020-03-05    1   3.0
 2020-03-06    4   6.0
 2020-03-07    2   5.0
 2020-03-08    2   6.0
 2020-03-09    4   5.0
 2020-03-10    9   8.0
 2020-03-11   12   9.0
 2020-03-12    9   3.0
 2020-03-13   10   2.0
 2020-03-14   11   4.0
 2020-03-15   11   NaN
 2020-03-16    4   NaN
 2020-03-17    4   3.0
 2020-03-18    5   6.0
 2020-03-19    2   7.0
 2020-03-20    8   2.0
 2020-03-21    6   6.0
 2020-03-22    4   1.0
 2020-03-23    2   7.0
 2020-03-24    5   4.0
 2020-03-25    1   5.0
 2020-03-26    1  12.0
 2020-03-27    3  13.0
 2020-03-28    3  11.0
 2020-03-29    7  13.0
 2020-03-30    4  13.0
 2020-03-31   11  11.0
 2020-04-01   14  10.0
 2020-04-02    7   6.0
 2020-04-03    6   5.0