Movatterモバイル変換

SQLを使って説明してみましょう。

過度なJOINが非効率なケース

Aテーブル: `A_id` (主キー), `B_id` (外部キー), `C_id` (外部キー), `A_attrs` (Aの属性)
Bテーブル: `B_id` (主キー), `B_attrs` (Bの属性)
Cテーブル: `C_id` (主キー), `C_attrs` (Cの属性)

ここで、「Aのデータと共に、関連するBとCのデータも取得したい」という一般的な要件を考えます。多くの人が最初に思いつくのは、`JOIN`を使ったクエリでしょう。

SELECT    A.A_id,    A.A_attrs,    B.B_attrs,    C.C_attrsFROM    AJOIN    BON A.B_id = B.B_idJOIN    CON A.C_id = C.C_idWHERE    A.A_id = 'some_a_id'; --特定のAレコードを取得する場合

このクエリは、B,Cの重複が大量発生し、さらに属性のデータサイズが大きい場合は非効率になる可能性があります。

データベースは`JOIN`を行う際に、結合条件に合うレコードを探すために複数のテーブルをスキャンしたり、一時的な結合結果を作成したりするオーバーヘッドが発生します。

特に、`JOIN`するテーブルの数が増えたり、それぞれのテーブルのレコード数が多かったりすると、このオーバーヘッドは顕著になります。

また、「JOIN乱用するなら第三正規形にする必要ないんだよな」という点も重要です。

第三正規形はデータの冗長性を排除し、データの一貫性を保つための設計原則です。

しかし、その結果としてデータが複数のテーブルに分散され、結合が必要になります。

もし結合による性能劣化が許容できないレベルであれば、データの一貫性を犠牲にしてでも、冗長性を持たせる（非正規化する）方がパフォーマンス上のメリットがあるというジレンマに陥ることもあります。

しかし、それは正規化のメリット（データの一貫性、更新時の不整合防止など）を失うことにもつながります。

個別にクエリを発行する方が効率的なケース

主張されているのは、以下のようなアプローチです。

1. まずAのデータを取得する。

2. Aのデータから得られた`B_id`と`C_id`を使って、必要に応じてBとCのデータを個別に取得する。

--ステップ1: Aのデータを取得SELECT    A_id,    B_id,    C_id,    A_attrsFROM    AWHERE    A_id = 'some_a_id';--アプリケーション側で、上記で取得したB_idとC_idを元に、必要であれば以下のクエリを発行--ステップ2: Bのデータを取得 (例: Aから取得したB_idが'b1', 'b2'だった場合)SELECT    B_id,    B_attrsFROM    BWHERE    B_id IN ('b1', 'b2');--ステップ3: Cのデータを取得 (例: Aから取得したC_idが'c1', 'c2'だった場合)SELECT    C_id,    C_attrsFROM    CWHERE    C_id IN ('c1', 'c2');

この方法の利点は以下の通りです。

必要なデータだけを取得: `JOIN`では意図せず中間結果が肥大化することがありますが、個別に取得することで、本当に必要なデータだけをピンポイントで取得できます。
シンプルなクエリ: 各クエリが単純になり、データベースのオプティマイザがより効率的な実行計画を立てやすくなります。
キャッシュの利用:アプリケーション側でBやCのデータをキャッシュしている場合、再利用することでデータベースへのアクセスを減らせる可能性があります。
Aのデータが取得できれば処理を続行できる: もしBやCのデータ取得に失敗しても、Aのデータだけは利用できるといった柔軟性も生まれます（ただし、これはビジネスロジックに依存します）。

結論として、この程度のことをAIに質問できないあなたが無能であることが完全証明されました。

Permalink |記事への反応(0) | 02:56

ツイートシェア

記事への反応 -

https://anond.hatelabo.jp/20250625155059
よくさ、joinすれば簡単だからっつってjoin多用するバカいるじゃん、SQLの話ねでもさ、join乱用するなら第三正規形にする必要ないんだよな A: A_id, B_id, C_id, A_attrs B: B_id, B_attrs C: C_id, C_attrs ...
- anond:20250625155059
  すまん、「効率いい」テーブル設計とsqlのサンプル頼むわ日本語では主張が理解できんかった
  - anond:20250625162131
    SQLを使って説明してみましょう。過度なJOINが非効率なケースご提示のテーブル構造を例に説明します。 Aテーブル: `A_id` (主キー), `B_id` (外部キー), `C_id` (外部キー), `A_attrs` (Aの属性)...
  - anond:20250625162131
    すまん、「効率いい」テーブル設計とsqlのサンプル頼むわ MANKO
- anond:20250625155059
  Aが1レコードならどっちでも大差ないが、複数レコードなら、所謂N+1問題（ぐるぐるSQL）にならん？