2020-12-01から1ヶ月間の記事一覧

pythonでカンマ入りの数値の修正

pythonのデータ解析をやっていた時 ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). のエラーがでたので、 np.where( np.isnan(X) ) ひとまずNaNの場所を確認。値を参照したところ、数値データのハズなのにカンマ入り…

VIFによる変数選択

重回帰分析をやっていると、多重共線性(マルチコ)ので変数選択が必要になりますが、評価指標として分散拡大係数:Variance Inflation Factorというものがあるそうで。 numpyで直接計算する。 corr_mat = np.array(df.corr()) inv_corr_mat = np.linalg.inv…