2020-12-01から1ヶ月間の記事一覧
pythonのデータ解析をやっていた時 ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). のエラーがでたので、 np.where( np.isnan(X) ) ひとまずNaNの場所を確認。値を参照したところ、数値データのハズなのにカンマ入り…
重回帰分析をやっていると、多重共線性(マルチコ)ので変数選択が必要になりますが、評価指標として分散拡大係数:Variance Inflation Factorというものがあるそうで。 numpyで直接計算する。 corr_mat = np.array(df.corr()) inv_corr_mat = np.linalg.inv…