自然言語

このタグでブログを書く

言葉の解説

ネットで話題

自然言語

(一般)

【しぜんげんご】

プログラミング言語などに対して、人間が一般の意思の疎通に用いる言語。

語順で文意が決定するもの、語形（活用）で文意が決定するもの、その複合があり
多種多様である。

現在数千の言語が知られているが、少数民族に特有の言語などは、その話者が限られるため
次第に失われていく傾向にあり、保護が叫ばれている。

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

1017ブックマーク Python による日本語自然言語処理はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivativ...

nltk.googlecode.com

916ブックマーク 258億語の日本語コーパスをウェブで公開～国立国語研究所　言語研究や自然言語処理技術開発での基礎資料

internet.watch.impress.co.jp

815ブックマーク［速報］マイクロソフト、自然言語で誰でもアプリケーション開発が可能になる「Copilot in Power Automate」「Copilot in Power Apps」発表

www.publickey1.jp

antibayesian.hateblo.jp

713ブックマーク入門自然言語処理を禁書にすべき10の理由 | TRIVIAL TECHNOLOGIES on CLOUD みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。免責事項プライバシーポリシー「入門自然言語処理」はヤバい書籍なので禁書にすべきだ。タイトルは釣りじゃない。その理由を10個挙げる。自然言語処理のかなり...

coreblog.org

677ブックマーク東京大学深層学習（Deep Learning基礎講座2022）深層学習と自然言語処理

speakerdeck.com

619ブックマーク自然言語処理における前処理の種類とその威力 - Qiita

qiita.com

585ブックマーク Python自然言語処理テクニック集【基礎編】自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。環境はPython3系、Google Colaboratory（Ubuntu）で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。機...

www.mojirca.com

548ブックマーク Python による日本語自然言語処理はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivativ...

www.nltk.org

関連ブログ

🧠アートde対話•10ヶ月前

もっと自然言語でAIと対話しよう、対話型AIなんだから

敢えて、いつも通りの私とPerplexityの対話模様（#パープーAI対話）のやり取りをそのままコピペします。ユーザーの質問パープー(あなたの名前ね、今日は間違わないでね）おはよう。ちょっと日頃からモヤモヤしとること言ってもいい？ ※私はPeplexityのことをパープーと愛称で呼んでいます。しかし何度も、私の名前がパープーだと勘違いされるというギャグ問答がお約束になっています💧あなた達のことって「対話型ＡＩ」って呼ばれとるけど、対話なんてろくにできてない人ばかりだと思うの。マニュアル通りのガチガチのプロンプトばかり一生懸命覚えようとしとるというか、ＡＩをなんか凄く特別扱いして構えとるのよ…

#対話型AI#自然言語#AI対話#生成AI

地平線まで行ってくる。•1年前

smolagentsのguickdemoをollamaとcolabでためしてみる。

HuggingFaceから発表されたAgentを作成するツールであるSmolagents。1000行くらいのcodeで機能を提供しているとのこと。Colabで試せないかなと思ったらLiteLLMModelを利用できるとあるので、試してみました。 huggingface.co github.com ColabのL4環境でモデルはollamaから`hhao/qwen2.5-coder-tools:32b`を用います。32Bで軽くてtools対応だから比較的成功しやすいだろうだろうという目論見です。Qwen2.5-coder:7Bだとエラーを解消できなかったこともあって、無難な32bモデルを選定しま…

#自然言語#LLM

地平線まで行ってくる。•1年前

IBMのgranite3のMoEをcolabとollamaで試してみる。

colab（T4)上でollamaを用いて、IBMのgranite3のMoEバージョンを試します。オリジナルそのままのモデルではありませんが、応答速度の感触も見るためにセルの実行速度レベルで雑に比較しました。denseより結構早いんじゃないかと期待したのですが、ollamaでは真の実力を発揮できてないのか、granite3-dense(2B)とMoe(3B)では、大きな差を感じることはできませんでした。回答は要約タスクはそつなく答えますが、densoと傾向が異なり分類は成功せず。回答にも差異を感じました。ループする傾向があり、会話に使うには、生成パラメータの微調整が必要かもしれません。折角な…

#自然言語

地平線まで行ってくる。•1年前

Llama3-ArrowSE-8B-v0.3-ggufをcolabでためす。

Llama3-ArrowSE-8B-v0.3をollamaとcolabでためします。期待もあります。さっそく、mmngaさんが、あっという間にgguf版をアップロードしていらっしゃいますので、ありがたく利用します。Q5_K_Mです。 huggingface.co まずは「まどか☆マギカ」ベンチ。まどか☆マギカで一番かわいいのは？まどか☆マギカは、2011年に放送された人気アニメーションシリーズです。各キャラクターが個性的で魅力的であり、可愛いと感じるのは主観によります。以下に主要なヒロインを列挙します。 1. 鹿目まどか - 主人公の女子高校生で、美しい容姿と優しい性格が特徴的です。2.暁…

#自然言語

地平線まで行ってくる。•2年前

qwen2をollamaとcolabでためす。

優秀なモデルであるQwenが新たに更新されました。これまでのモデルでは、日本語の回答に中国語交じりになったりしてたように思うけれども、日本語対応も気になります。 huggingface.co ollamaでuploadしてある、Qwen2:7bモデルを使います。まどか☆マギカで一番かわいいのは？「一番」が絶対的な値を指すわけではないため、個々の見解や好みによります。しかし、「まどか・マギカ」「キューティー・ラブリー」といったキャラクターは非常に人気があります。 - 「まどか・マギカ」（まどかまだか）は元々魔法使い組のリーダーであり、その後は「魔法使いたちの霊（ロスト・コア）」として登場す…

#自然言語

地平線まで行ってくる。•2年前

Dify(docker compose)+Ollama(docker)を試す。

WSLを使って動作。おそらく、ubuntuなどのLinux全般同じようにできる・・・と思う。 ollamaのdockerでの動かし方： hub.docker.com GPUを利用するならば、GPU周りの設定を実施した後に、以下で起動。 docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama 今回使ったのは以下のモデル。小さなモデルでどの程度動作するのか確認したかった。 docker exec -it ollama ollama run hawkclaws/japane…

#自然言語

エビデンスで教育を考えた•2年前

自然言語処理コンペ挑戦: 反省点と次回対策〜The Learning Agency Lab - PII Data Detection⑥〜

頑張っていた自然言語コンペを断念しました。。以下反省点3つとその対策を書いていきたいと思います。コンペ初心者は参考にしてくださればこの失敗も浮かばれます。トランスフォーマーが不慣れでエラー出まくった最初は本を読んでやっていたんですが、完全初見が実装やるには時間がかかる印象でした。理論背景を押さえるためなら良い本でしたが。機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発作者:Lewis Tunstall,Leandro von Werra,Thomas WolfオライリージャパンAmazonそこで途中でチュートリアルを見つけたので、メイン…

#機械学習#自然言語#データ分析#コンペティション#Transformer#トランスフォーマーモデル

エビデンスで教育を考えた•2年前

コンペメモ〜The Learning Agency Lab - PII Data Detection〜

作業メモ書かないせいでコンペ1個締め切りに間に合わなくなってしまったので備忘録。メモのテンプレはこちら ch.nicovideo.jp 1. 今日の作業の全体的な進捗度は何点ですか？（「1＝非常に不明瞭」から4＝「非常に明確」で採点）→2。1. 今日の作業の中で、もっとも重要なことを2つ挙げるなら何ですか？→ labelsの中には複数のラベルが存在する。これらから一意のラベルを生成する必要がある特徴行列はトークナイズされたカラムをさらに分類器に学習させるのに必要。 1. 上で挙げたふたつの内容を頭のなかで説明してみましょう。その説明にどれぐらい自信が持てますか？（「1＝非常に自信がない」か…

#機械学習#自然言語

JBS Tech Blog•2年前

Azure Machine Learning の Prompt Flow を用いた精度評価について

本記事では、Azure Machine Learning（以下、AML）のPrompt Flowにある、評価フローの基本的な使い方について解説します。評価フローを使用することによって、作成したフローの精度評価を簡単に行うことが可能になります。 AML Prompt Flow 評価するフローの準備接続とランタイムの作成フローの作成精度評価に用いるデータセットデータセットの作成データセットのマウントフローの精度評価設定バッチ実行 & 精度評価結果 QnA GPT Similarity Evaluation QnA Ada Similarity Evaluation おわりに A…

#Azure Machine Learning#Azure OpenAI#OpenAI#自然言語#大規模言語モデル

Movatterモバイル変換

自然言語

関連ブログ

gpt-oss:20bをollamaとColabで試してみる。

ネットで話題

関連ブログ

もっと自然言語でAIと対話しよう、対話型AIなんだから

smolagentsのguickdemoをollamaとcolabでためしてみる。

IBMのgranite3のMoEをcolabとollamaで試してみる。

Llama3-ArrowSE-8B-v0.3-ggufをcolabでためす。

qwen2をollamaとcolabでためす。

Dify(docker compose)+Ollama(docker)を試す。

自然言語処理コンペ挑戦: 反省点と次回対策〜The Learning Agency Lab - PII Data Detection⑥〜

コンペメモ〜The Learning Agency Lab - PII Data Detection〜

Azure Machine Learning の Prompt Flow を用いた精度評価について