pandas_UnicodeDecodeError_python

 

次のコードでエラーが発生する。

import pandas as pd
data_frame = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/data_temperature.csv')
data_frame

 

読み込んだのは、気象庁からダウンロードした気温データ。

 

 

 

 

次の方法で解消できるとのこと。

qiita.com

with codecs.open("file/to/path", "r", "Shift-JIS", "ignore") as file:
    df = pd.read_table(file, delimiter=",")
    print(df)

 

withの中では、ファイルを

1. 開いて

2. 処理して

3. 閉じる

のうち、1と3を自動でやってくれる。

上記コードは、ファイルを”file"として開いて、

 

codecsはpythonの標準ライブラリ。

ignoreは変換できない文字を読まないオプション。

replaceやnamereplaceがある。

どれが読めないのか確認したい場合、replaceで任意の文字列(x)に置換したらよさそう。

 

 → 試したところ、できなかった。

 

pandasだし、最終的に次の形で読み込めた。

import pandas as pd
data_frame = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/data_temperature.csv', encoding='cp932')
data_frame