MarkItDownとは? MarkItDownは、Microsoftが開発したPythonライブラリで、さまざまなファイル形式をMarkdownに変換することができます。 リリースされてからわずか2週間でGitHubで25k以上のスターを獲得し、急速に人気を集めています!🤯 なぜMarkItDownはこんなに人気なのか? MarkItDownは以下のような幅広いファイル形式に対応しています: Officeドキュメント:PowerPoint、Word、Excel リッチメディアファイル: 画像(EXIFおよび画像説明付き)、音声(文字起こし付き) ウェブ・構造化データ:HTML、CSV、JSON、XMLアーカイブ:ZIPファイル WordやExcelなどの一般的な形式に対応しているだけでなく、OCRや音声認識を活用してコンテンツを抽出することで、マルチモーダルなファイルにも対応し

チューリングのE2E自動運転チームの岩政(@colum2131)です。 2024年8月20日にuvのマイナーバージョンが0.3.0にアップデートされました。元々、pipの代替として設計されていたuvが、Pythonのバージョン管理からパッケージ管理まで行えると発表されました。 以前の2024年7月にまとめた記事では、 将来的には、uvがRyeに代替されるよう と書きましたが、実際、RyeやPoetryなどの代替としてuvのみでPythonのプロジェクト管理が可能になりました。Ryeで行っていた操作同様にuvで実行できるようになった印象もあります。 チューリングのメンバーでも熱心なuvファンがいるため、本記事では、uvの基本操作や、便利な機能をまとめます。 1. uvの基本操作 uvの公式ドキュメントはuvで整備されています。 1.1 uvのinstall 公式のuv - Getting s

ソーシャル経済メディア「NewsPicks」で推薦や検索などのアルゴリズム開発をしている北内です。Pythonは頻繁に新機能や便利なライブラリが登場し、ベストプラクティスの変化が激しい言語です。そこで、2024年2月時点で利用頻度の高そうな新機能、ライブラリ、ツールなどを紹介したいと思います。 この記事では広く浅く紹介することに重点を置き、各トピックについては概要のみを紹介します。詳細な使用方法に関しては各公式サイト等での確認をおすすめします。なお、本記事ではOSとしてmacOSを前提としています。 環境構築Pythonの環境構築はpyenvとPoetryの組み合わせがもっとも標準的でしょう。 以下の手順でpyenvとPythonをインストールできます。 brew install pyenv # Bashの場合 echo 'eval "$(pyenv init -)"' >> ~/.ba

みなさんこんにちは、電通総研コーポーレート本部システム推進部の佐藤太一です。 この記事では、VS CodeのDev Containerを使ってOSに依存しないPythonの開発環境を構築する方法をステップバイステップで丁寧に説明します。 VS Codeの利用経験があり、またPythonによるアプリケーション開発に興味のある方を想定読者として記述しています。Pythonの初心者から中級者向けを意識して書いていますので、意図して冗長な説明をしています。 すでにPythonによるアプリケーション開発に十分に詳しい方は、まずはまとめだけ読んでみてください。私自身それほどPythonのエコシステムに詳しいわけではありませんので、知識の抜け漏れは恐らくあるでしょう。そういった事に気が付いたら、XなどのSNSでこの記事のURLを付けてコメントをしていただけると幸いです。 はじめに 事前の準備 最小限のD

You will be automatically redirected to the new location of this page.
みなさん、こんにちは!みやしんです。 今回は、PyCaretについてご紹介します。 PyCaretとは、データの前処理自動化、モデルの比較自動化、チューニングの自動化などを行ってくれる、とても便利なライブラリです。 PyCaretは、scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Rayなどのいくつかの機械学習ライブラリとフレームワークをまとめたPythonラッパーです。 Classification(分類)、Regression(回帰)、Clustering(クラスタリング)、Anomaly Detection(異常検出)、Natural Language Processing(自然言語処理)、Time Series Forecasting(時系列予測)のような処理をたった数行で実装できてしまうので、過去に機械学習

Python3.10で追加された型ヒント関連機能から、 PEP 647 User-Defined Type Guards を解説します。 型の絞り込みと型ガード¶mypyなどの静的な型チェッカが型を推論する時、プログラムの処理を参考にして、可能な型の種類を絞り込んでいます。 例えば、 というプログラムでは、変数 var1 の型は、 int または None のどちらかです。var1 が int の場合は var1 + 1 を正常に計算できますが、 None の場合には None + 1 という計算になってしまうため、型チェッカはこの行をエラーとします。 しかし、このプログラムを修正して、次のように isinstance() を使って明示的に型チェックを行う処理を追加すると、None + 1 という計算が行われる可能性がなくなるため、エラーとはなりません。
近年、ビジネスにおける数学の重要性が認識され始めています。その背景にはAIの台頭も当然ありますが、そればかりではありません。デジタルトランスフォーメーション(DX)をはじめとする今後求められる変革には、数学的な素養がキーになると気づき始めたからです。 しかし、数学と言われても、社会人になってから全く疎遠であり、そもそも苦手意識がある場合に、これから学び直すのは一筋縄にゆきません。 そんな時にオススメなのが、Pythonでプログラミングしながら「高校数学」を学ぶことです。数学だけの本を読んでも、さっぱり頭にに入らなかった方でも、実際に手を動かしてプログラミングしてみると「あっそういうことか!」と腑に落ちる体験ができます。 幸いにも、現在ぴったりの良書が2冊刊行されています。両方ともPythonで高校数学をプログラミングしながら学ぶことができます。今回はこのオススメの2冊をご紹介します。 Py

なお、distrolessのイメージは2種類(3通りの名前)がありますが、Python 3.5はバグ修正はせず、セキュリティ修正のみでサポート期限が2020/9/13というステータスなので、本エントリーでは3.7の方のみを扱います。 gcr.io/distroless/python3:Python 3.5.3 gcr.io/distroless/python3-debian9:Python 3.5.3(上のイメージと同一) gcr.io/distroless/python3-debian10:Python 3.7.3 一応サンプル等もありますが、どれも1ファイルで構成されたサンプルスクリプトばかりです。前回のsite-packagesにコピーする方法を軽く試したところうまく動かず、シェルもpipもensurepipもないため、ビルドイメージにすることもできません。いろいろ調べた結果、

OpenEDGPython Institute Certifications ThePython Institute is committed to the development of an independent global standard inPythonprogramming certification, which will allowprogramming specialists, software developers, andIT professionals from all over the world to assess and document theirprogramming skills objectively, and to gain recognition for their expertise. OpenEDGPython Institu
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く