#'DataFrame'オブジェクトに'append'属性がないエラーの解決

問題

pandas DataFrameに対して.append()メソッドを使用した際に、AttributeError: 'DataFrame' object has no attribute 'append' エラーが発生します。具体的には以下のようなコードで問題が起こります。

python

import pandas as pd

df = pd.DataFrame()
new_row = {'column': 'value'}

# 以下の行でエラーが発生
df = df.append(new_row, ignore_index=True)

このエラーはpandasバージョン2.0以降で発生します。原因は以下の通りです：

重要な変更点

DataFrame.append() メソッドはpandas 2.0で完全に削除されました
pandas 1.4以降では非推奨警告が表示されていましたが、2.0で廃止
Pythonのlist.append()と異なり、pandasのappendは非効率であることが理由

解決策

適切な代替方法①: `pd.concat()`を使用する

python

# 新しい行をDataFrameに変換
new_row_df = pd.DataFrame([new_row])

# concatで結合
df = pd.concat([df, new_row_df], ignore_index=True)

適切な代替方法②: `loc`を使用する（条件付き）

python

# インデックスがRangeIndex（デフォルトの連番）の場合のみ有効
if isinstance(df.index, pd.RangeIndex):
    df.loc[len(df)] = new_row  # 新しい行を追加

注意事項

locを使用する場合：

インデックスタイプがpd.RangeIndexの場合にのみ安全
列順序を明示したい場合は辞書よりもpd.Seriesの利用が適切
パフォーマンス上、ループ処理での多用は非推奨

ループ処理での行追加ベストプラクティス

python

# 非効率な例 (避けるべき)
df = pd.DataFrame(columns=['A', 'B'])
for i in range(1000):
    df = pd.concat([df, pd.DataFrame([{'A': i, 'B': i*2}])])

python

# 効率的な代替方法 ✅
rows_list = []
for i in range(1000):
    rows_list.append({'A': i, 'B': i*2})

# 最後にpd.DataFrameを使う
df = pd.DataFrame(rows_list)

パフォーマンス比較

各種手法の速度比較 (相対処理時間)

手法	10行	100行	1000行
`concat` ループ内実行	1.0x	50x	800x
`loc` ループ内実行	1.5x	100x	1600x
リスト収集→一括生成	1.0	1.1	1.5

パフォーマンスの要点

append/concatのループ内使用はO(n²) の時間複雑度
リスト収集方式は線形時間 (O(n)) で処理可能
データサイズが10倍になると、非効率な方法では100倍以上の時間がかかる

データ拡張手法のパフォーマンス比較

非推奨／危険な手法

`_append()` メソッドの使用は避ける

python

# 絶対に使用しないでください！
df = df._append(new_row, ignore_index=True)

DANGER

_append()はpandasの内部用プライベートメソッド
公式ドキュメントに記載されておらず、将来のバージョンで変更・削除される可能性
外部コードで使用すると突然動作しなくなるリスクあり

なぜ`append`は削除されたのか

パフォーマンスの問題: DataFrame.append() は各呼び出しで新しいオブジェクトを作成
誤解を招くAPI: Pythonのlist.append()（インプレース操作）と動作が異なる
代替手段の存在: concat()やリスト収集方式などのより効率的な選択肢がある

pandasコア開発者によれば：

「DataFrame.appendはlist.appendとの類似性でよく使用されるが、実際には非効率な操作である。ユーザーは代わりにリスト収集→一括処理を行うべき」

結論

単発の行追加 → pd.concat()を使用

python

df = pd.concat([df, pd.DataFrame([new_row])], ignore_index=True)

RangeIndex環境での行追加 → loc[len(df)] = ...を使用可能
python
```
df.loc[len(df)] = {'column': 'value'}  # RangeIndex限定
```

ループ内での複数行追加 → リスト収集→一括生成

python

data_list = []
for item in items:
    data_list.append(process_item(item))
df = pd.DataFrame(data_list)

パフォーマンスクリティカルな処理においては、ループ内でappend/concatを繰り返す操作は厳密に避け、事前リスト収集＋一括DataFrame生成を常に選択してください。

問題 ​

解決策 ​

適切な代替方法①: pd.concat()を使用する ​

適切な代替方法②: locを使用する（条件付き） ​

ループ処理での行追加ベストプラクティス ​

パフォーマンス比較 ​

各種手法の速度比較 (相対処理時間) ​

非推奨／危険な手法 ​

_append() メソッドの使用は避ける ​

なぜappendは削除されたのか ​

結論 ​

問題

解決策

適切な代替方法①: `pd.concat()`を使用する

適切な代替方法②: `loc`を使用する（条件付き）

ループ処理での行追加ベストプラクティス

パフォーマンス比較

各種手法の速度比較 (相対処理時間)

非推奨／危険な手法

`_append()` メソッドの使用は避ける

なぜ`append`は削除されたのか

結論