という式で係数bが正か検定します。具体的には、統計プログラムなどでbを推計して推計値 b ^ を得ます。推計値 b ^ が正だったとしても、誤差で正になっている可能性もあるので、誤差を考慮しても正か、つまり、真の値bが統計学的にゼロと違うと判断できるか検定します1。なお、以下では本文は日常用語表現に努め、より正確な表現は脚注に記すことにします。 この統計学的推論では、 b = 0 が正しいと想定し、得た推計値 b ^ が( b = 0 からすると)どれだけ極端かを問います。真の値が b = 0 の場合に推計値 b ^ 以上の値を観察する確率が分かれば、得た推計値 b ^ がどれだけ極端かの判断材料になります。この「 b = 0 が正しいときに、得た推計値 b ^ 以上の値を観察する確率」をp値といいます2。p値が小さければ、
本投稿は、財務省主計局が公表した資料において、統計的な不備が存在するにもかかわらず結論を導いていると考えられる点を、事実ベースで指摘・説明するものです。 あくまでも事実に基づいた指摘を行っているものであり、陰謀論を助長する趣旨ではありません。根拠のない憶測や陰謀論には強く反対いたします。 1. はじめに昨今、103万円の壁引き上げで財務省に対して 「積極財政をすべきだ」「緊縮財政をすべきだ」などの議論が盛んに行われています。 今回の問題の本質はそこではありません。 財務省主計局がIMFの一次データを用いて相関関係を分析する際に、 適切な統計処理を行わないまま結論を導いています。 積極財政・緊縮財政を語る以前の不適切な統計処理の問題です。 では、なぜその不適切な統計処理が問題になるのでしょうか。 それは、誤った処理によって可視化されたデータやグラフを使って議論しても、 妥当な結論を得ることが
「アセトアミノフェン / ほらお薬だよ / ああキミったら」 ―― The WhiteStripes 大きな吉報がやってきた.何十年も手が付けられないほど上昇を続けた末に,ついにアメリカの肥満率が下がりだしてる.国民健康栄養調査(医師の診察にもとづくすごく信頼できるデータソース)から得られたデータをジョン・バーン=マードックが分析したところ,2020年以降に肥満率が下がってきているのがわかった: Source: John Burn-Murdoch このグラフにはひとつ問題点があるのには留意したい(折れ線の末尾に矢印を描くと誤解を招くのにいまだにジョンが矢印をつけてるのとは別の問題点だ).実際の国民健康栄養調査データは2年の時間をかけて収集されている.だから,バーン=マードックが「2023年」とラベルを貼ってるデータは,実のところ2021年8月から2023年8月までのデータだ.このちょっと
「67.2歳で未婚男性の半分は亡くなっている」「有配偶男性より14年以上も早い」2022年に公開された記事(※1)にこのような文章があり、インターネット上で継続的に話題になっている。もし、本当にそうであれば、原則65歳から支給開始となる公的年金を、未婚男性は平均して2年程度しか受け取らずに亡くなっている計算になる。この記事をもとに、未婚男性にとって公的年金制度は払い損であるとか、60歳からの繰り上げ受給をした方がよいなどとする言説もインターネット上によく見られる。 公的年金制度は長生きすることで所得が不足するリスクを社会で支えるものであり、結果的に短命に終わった者(老後の所得不足が生じなかった者)が受け取る年金が、その者が支払った保険料を下回るのは制度の必然だ。しかし、もし本当に未婚男性が極端に短命なのだとしたら、公的年金制度に不満を持つのも当然だろうし、年金の受給開始時期の選択の際にも
こんにちは。コグラフ株式会社データアナリティクス事業部の塩見です。 私は「カイ二乗検定」に対して、当初は納得できない部分がありました。やりたいことに対して、必要以上に複雑な手法のように感じたからです。同じような疑問を持つ方も多いのではないでしょうか。この記事では、私が「カイ二乗検定」を理解し納得するまでの過程をお伝えします。 結論から言いますと、一度頻度論を離れてベイズ統計の視点で考えてみたところ、実は非常に単純なことを行っていると気づきました。その後、カイ二乗検定を再び考え直すと、すんなり理解できたというお話です。 カイ二乗検定の手順まず、サイコロを何度も投げ、出た目の回数(実測値)を記録します。偏りのないサイコロでは、全ての目が均等に出るはずです。この理論的な回数を理論値と呼びます。 次に、実測値と理論値の差を計算し、その差を二乗してから理論値で割ります。この計算結果を「ズレ」と呼びま
因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ 作者:金本 拓オーム社Amazon 著者の金本さんからご指名でご恵贈いただいたのが、こちらの『因果推論 ―基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ―』です。正直に白状しますと、因果推論とタイトルにつく技術書はここ数年でゴマンと出版されており、本書も紙冊子で頂戴したものの僕はあまり期待せずにページをめくり始めたのでした(ごめんなさい)。 ところが、ほんの数ページめくっただけでその内容に僕は仰天しました。グラフィカルで実務家にとっての分かりやすさを重視した因果推論の解説と実践にとどまらず、現代的なマーケティング分析では必須の種々の手法についてまで懇切丁寧に解説とPythonによる実践例が付された本書は、文字通り「マーケティング分析実務家にとってのバイブル」になり得る素晴らしい一冊だと直感し
去年1年間の働く人1人当たりの実質賃金は前の年と比べて2.5%減少しました。現金給与の総額は増えたものの物価上昇に追いつかず、実質賃金は2年連続でマイナスとなりました。 厚生労働省は従業員5人以上の事業所3万あまりを対象に「毎月勤労統計調査」を行っていて、6日、去年1年分の速報値を公表しました。 それによりますと、基本給や残業代、ボーナスなどを合わせた働く人1人当たりの現金給与の総額は月の平均で32万9859円となり、前の年に比べて1.2%増え、3年連続でプラスになりました。 内訳では、フルタイムが43万6849円、パートタイムが10万4570円で、いずれも統計を取り始めた平成5年以降最も高くなりました。 しかし、物価の上昇率が3.8%と42年ぶりの高い水準となり、物価変動を反映した実質賃金は前の年に比べ2.5%減少しました。 実質賃金が前の年を下回るのは2年連続です。 去年12月分の速報
性犯罪は再犯率が著しく高いので、こういう対応は必要。他の犯罪には被告の社会復帰のために不要 こういうの。 まず性犯罪者の再犯率が著しく高いと聞いて想像するのは、同一人物が何度も性犯罪を犯す、また性犯罪を犯すのではないかという懸念ですよね? それなら再犯率を参照するのは適切ではないのです。 再犯率では最初の引用のように、性犯罪で服役し出所した人が社会復帰できず困窮し窃盗で有罪になっても再犯としてカウントされてしまいます。 性犯罪→窃盗→窃盗→窃盗でも累犯性犯罪者とされてしまいますが、心配していたことと少し違いますよね? なので見るべきは同種再犯率です。こちらは読んで字のごとく同じ犯罪、同じ種類の犯罪を繰り返す人の割合です。 http://www.jcps.or.jp/publication/1903.html 同種再犯に絞って,70万人初犯者・再犯者混合犯歴を分析した結果を述べる。1犯目の罪
「底辺や低学歴はゲームが好き」これって社会科学の分野ではよく知られた概念だけど、何で炎上してるんだ?教職課程とかでもやるじゃん という元増田と、 誰か統計データで本当かどうか確かめてくれない?令和 3 年社会生活基本調査に「男女,教育,趣味・娯楽の種類別行動者数」とか「年間収入・収益,趣味・娯楽の種類別平均行動者数(有業者)」とかある。たのみます。 - hevohevo のブックマーク /はてなブックマーク というブコメを見て、 社会生活基本調査 令和 3 年社会生活基本調査 調査票Aに基づく結果 生活行動に関する結果 生活行動編(地域)趣味・娯楽 | ファイル | 統計データを探す | 政府統計の総合窓口 にある、 社会生活基本調査 令和 3 年社会生活基本調査 調査票Aに基づく結果 生活行動に関する結果 生活行動編(地域)趣味・娯楽 98-8男女,仕事からの個人の年間収入・収益
(Image by Thx4Stock/Shutterstock) 2016年から2020年までに全国で発生した交通事故のデータをもとに、高齢運転者が事故を起こすリスクを検証しました。その結果、事故リスクは、中年期以降、高齢になるにつれて高くなっていましたが、若年運転者と比べると、高齢運転者の事故リスクは低いことが分かりました。 高齢運転者には、免許更新時に高齢者講習と認知機能検査が義務付けられる一方で、免許返納が奨励されています。運転をやめれば、事故を起こすリスクはなくなりますが、移動手段が限られることで生活に支障を来し、健康を損なうリスクが生じます。従って、高齢運転者対策は、事故を起こすリスクと健康を損なうリスクの双方に配慮する必要があります。本研究では、高齢運転者が事故を起こすリスクを検証するため、2016年から2020年までに全国で発生した交通事故のデータをもとに、免許保有者数当
今日の東京新聞ウェブサイト (TOKYO Web) にこんな記事が載っていた:少子化対策の重要な指標の一つ「合計特殊出生率」の公表値が、実態より過大であることが分かった。基となる厚生労働省の統計の対象が「日本における日本人」で、外国人の女性は計算に入らないのに、国際結婚で生まれた日本人の子は入っているためだ。 ――――― 東京新聞「合計特殊出生率 実態は公表値よりもっと低かった…専門家が「信じられない」統計手法とは」(TOKYO Web2023年7月2日 06時00分) https://www.tokyo-np.co.jp/article/260366 うん。まあそれは専門家なら誰でも知ってる話である。そういう計算式であることは以前から公表されていて、この50年間一貫してるのだから、それで計算した結果が何を意味してるかについてちゃんと議論すればよかろう。 これ自体はそういうことなのだが
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに統計検定準1級は(一財)統計質保証推進協会が実施、(一社)日本統計学会が公式認定する「2級までの基礎知識をもとに、実社会の様々な問題に対して適切な統計学の諸手法を応用できる能力を問う」試験です。現在はCBTでの実施となっています。 主観を込めて言いますと、2級と準1級では難易度に雲泥の差があります。 強調して言っておきます。まったく違います! 準1級では統計的推定や検定に加えて、多変量解析(重回帰、PCA、主成分分析、数量化)、時系列解析、マルコフ連鎖、確率過程、分散分析、ベイズ統計、MCMC...と範囲が広いのが特徴です。
棒グラフと折れ線グラフは似た表現方法です。しばしば交換可能なものとして使われる両者ですが、使うべきポイントには違いもあります。 代表的な例が気温です。気温は棒グラフではなく、折れ線グラフで表現するのが正しいです。 そもそも棒グラフは、棒の長さ(≒ 棒部分の面積)の比率と数値の比率を対応させることで視覚的に数値を比較するものです。したがって、数値が2倍なら棒グラフの長さも2倍になります。棒グラフにおいて、縦軸を省略してはいけないのはそのためです。 しかし、気温において「X倍」に意味はありません。気温が10℃から20℃に上がっても「10℃上がった」とは言いますが「2倍の暑さになった」とは言いませんよね。気温とは、水が凍る温度を0℃、水が沸騰する温度を100℃とする相対的な指標です。気温がマイナスになることはしばしばありますが、これは本当に何かがマイナスになっている、失われているのではなく、水が
先日開催された厚生科学審議会において、日本における抗体陽性率の最新の調査結果が報告されました。 この結果からは、日本に住む約4割の人がすでに新型コロナに感染しているということが分かりました。 今回の調査結果からは他にどのようなことが分かるでしょうか? 「抗体調査」とは?S抗体とN抗体の違いは?S抗体とN抗体(DOI:https://doi.org/10.1016/j.tibtech.2022.07.012より筆者作図) 抗体とは、免疫システムによって作られるタンパク質のことであり、新型コロナウイルスに感染したりワクチン接種をすると、種々の抗体が作られます。 測定されることの多い新型コロナの抗体としてはS抗体とN抗体の2種類があり、S抗体はワクチンの標的である「スパイク蛋白(S蛋白)」の抗体でありワクチン接種をした人と感染した人のいずれも陽性になるのに対し、N抗体はウイルス遺伝子を包み込んで
売春禁止はレイプ率を大幅に増加させ自由化は減少させると判明!売春禁止はレイプ率を大幅に増加させ自由化は減少させると判明! /Credit:Canva売春を禁止すべきか自由化すべきかについては、古くからさまざまな国や地域で大きな議論になっています。 アムネスティ・インターナショナルやヒューマン・ライツ・ウォッチをはじめとした著名な人権団体の多くはすべて、人道の観点から成人売春が非犯罪化されるべきだとの声明を発しています。 人権団体の多くはその理由として、非犯罪化されることで、売春にかかわる人々が公に警察の保護を受けられるようになり、安全が増すと述べています。 売春を禁止してしまえば、セックスワーカーが虐待を受けたとしても相手を訴えることが難しくなる一方で、自由化されていれば虐待者は容易に告発され、セックスワーカーたちが自らの待遇改善を求めて団結することも可能になるからです。 実際、複数の明
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く