皆さんこんにちは機械学習チーム YAMALEXチームの@tereka114です。最近、寒いので、鍋を中心に食べて生きています。 検証段階でも、規模の大きなデータを扱う機会が増えてきて、Pandasのメモリ消費量が厳しいと感じてきたので、その削減や効率化のテクニックまとめたいと思いました。 有名なものからマイナーなものまで、思いつく限り書いてみます。 そもそもなぜ、Pandasのメモリ削減技術が必要なのか 準備 Pandasのメモリ削減 1. 型修正 2. 逐次読み込み 3. 読み込み時の型指定 4. 逐次読み込み&集約 5. 不要なものを読み込まない 6. 不要なカラム/DataFrameを消す 番外編:そもそもPandasを利用しない 最後に そもそもなぜ、Pandasのメモリ削減技術が必要なのか Pandasで扱うデータの多くのファイルはCSV,Parquet, JSON(JSONL

[janome 開発日誌] v0.4.0 をリリースしました(メモリ使用量の削減やPython2.7 サポート停止などなど) 久し振りの,大型アップデート報告となります 🙌 v0.4.0 をリリースしました。今回はいくつかのBreaking changes と Behavior changes を含むため,マイナーバージョンを 0.4.0 に上げています。アップグレードの際は下記変更点の確認をお願いします。Breaking changesPython 2.7 サポートの停止Python 2.7 サポートを停止しました。v0.4.0 ではPython 3.6 以上のみサポートします。 またこれに伴い,種々のリファクタリングを実施しました。ユーザーサイドでは,PublicAPI に Type Hint を導入したことで,開発時に IDE やエディタの型サジェストを受けられるように
はじめに 2020/8/12に発売されたImpracticalPython Projects: PlayfulProgramming Activities to Make You Smarterの日本語訳書である、「実用的でないPythonプログラミング」をひょんな事から献本していただく事になった。(訳者が同僚である) 実用的でないPythonプログラミング: 楽しくコードを書いて賢くなろう! 作者:ヴォーン,リー発売日: 2020/08/12メディア: 単行本 ありがちなプログラミング初学者向けの本から1段上がった中級者向けの良い本だと感じたので、当ブログでたまにやっている筆者、訳者に媚びを売るシリーズの一貫として、感想を記す。 書籍の概要 「実用的でないPythonプログラミング」は、想定する中級レベルのアルゴリズムの問題を例に取り、Pythonでの美しいコードの書き方や、コンピュ

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く