
はてなキーワード:生データとは
おっ、ナカーマ
Freestlye Libre 使いのテック系患者仲間としてもう一つ面白い情報を投げておくぜ。
Libreでデータ取得するやろ?
さらにLibeview と言うWebアプリでレポートが落とせるよな。
だけどあれ、2週間程度のデータしか分析できないじゃん? また、学術的にまだ試験中だけど色々なリスクを分析する計算法が提唱されているんだけど、ここでは見ることができない。
そこで、CSV生データを落としてきたら、以下のサイトをつかってみて
https://glyculator.btm.umed.pl/
無料で利用できる。また、内部ではPythonが動いていて、そのコードもGitHubにあるので、自分で環境を作ることも可能。
これを使うと、TIR,CV,推定A1Cなどの他に、血糖値の乱高下度を表す値や、より厳格な計算値、提唱されているリスク指数なども計算させることができる。
なんかこう、「魔法少女」っていう邪悪な響きから連想するものから比べると、大分大人しい結末だったよな。
「自分は昔から魔法少女が苦手で、それと同じ感覚を共有する人が他にもいることが分かった。そのひとは更に自分がどこで覚えたのかも忘れた歌を知っている。調べた限りだと、魔法少女を名乗って動画配信をしていた怪しい男に行き当たる。もしかしたら、自分はこの男の授業を受けたのかもしれない。そして何かが起こりそのことがトラウマになっている」
って言ったらさ、もうちょっとまさかーなもの考えちゃうじゃん?
俺がクソホラー見過ぎなんですかね?
魔法少女ってもはや、ピエロに変わる邪悪の象徴みたいな地位獲得してるじゃん?
じゃあなんかこう、魔法少女の格好したバケモンが子供の前で大虐殺したとかさぁ。そんなの思い浮かべるじゃん?
流石にそれだと無理あるか。そんな事件起こってたら普通にニュースになってるわな。
でもなー、魔法少女山田が首吊り自殺してそれがトラウマになってた…まああり得なくは無いがなんかインパクトにかけるな。
て言うか、園内で首吊り自殺しておいてそれを園長含め職員が「心不全で死亡」って偽装できるモンなの?
死亡診断書出したのどこよ?
ていうか、作中作の「魔法少女山田」自体が時系列弄って編集された作品って考察もあるし、
更にここまでの魔法少女恐怖症の語り部の映像資料やなんか自体が「魔法少女山田2章」って言う作品に使われていて、さらにそちらも編集や監督の意向で追加追加されたものが有るらしいじゃん。
えー?そこ要るの?みたいな気がしない?
いやもうそこ入れると「ドキュメンタリーと言いつつ売れるため面白くするため、自分の意向を反映させるためなら時系列変更やら印象操作やら何でもするクソ監督」っていう別な意味でのホラー出てきちゃうじゃん?
ホラー?ホラーかなこれ?単なる人間性の腐った糞ってだけでは?ていうかそこは多少なりとも見てる側は気づいてることなんだし今更…。ていうかドキュメンタリー系での編集されてない生データなんか見ようが無いんだから、見る側は作り物として意識するしかないんじゃない?みたいな
なーんか、こうなるともうただの見る側のリテラシーとかいう説教じみた話になってジャンル変わってくるじゃん?いや変わってもいいけどね。ホラーで道徳の授業やってもいい。面白いならね。
あー、どうせなら、監督が実は謎の宗教団体員とか、冷戦時のソ連の元工作員とかで、実際に起こった組織の実験を隠蔽するためのカバーストーリーとして「魔法少女山田」を作ったみたいな落ちになんねーかな。
なんかそういうの期待しちゃうジャン、これまでのQとかみてると。
ある意味で「記憶力の良さ」が他人の変化に抵抗する一因になり得ます。
記憶力が高い人は、他人に貼ったラベルや過去のエピソードを強く保持するため、それと矛盾する「他人の変化」を受け入れにくくなる傾向がある。
つまり、よく覚えているがゆえに「更新」が難しいということです。
記憶力が高い人は「過去のエピソード」を詳細に覚えているため、「アイツは昔こうだった」→「今は違う?いや、きっと表面だけだ」と思いがち。
記憶は「生データ」ではなく「意味づけ(スキーマ)」と結びついて保管されます。
「いじめっ子=攻撃的」「自己中」などのラベルは、再会時にスキーマとして即座に発動されます。
記憶力が高いと、このスキーマが豊富かつ詳細に張り巡らされており、修正に時間がかかる。
変化を認識するには、「前の評価を書き換える」という認知的コストが必要。
記憶力が高い人ほど、「書き換える情報量」も多くなり、心理的負荷が高い。
一方、記憶力が低い人は、過去の詳細な記憶を保持していないため、他人の今の状態を素直に受け取りやすい。
極端に言えば「昔なんかやってたっけ?」となれば、現時点での印象が主導権を握る。
この傾向は「忘れっぽい人のほうが対人関係が柔軟」という観察と一致します。
他人の変化を受け入れられる人とは、記憶を「再構成可能なもの」として扱える人(=柔軟な意味更新能力を持った人)
そのためには過去の自分の記憶や評価が絶対だという信念を緩める、人は変わるというメタ認知を持つ、「記憶と現実のズレ」を許容する感性が必要です。
記憶力の高さは、他人の変化に対して「過去のスナップショット」を強く保持しやすく、その更新を心理的に困難にする。ゆえに、変化の受容には記憶の再編集能力が鍵を握る。
おそらくこれは自身が周りからどう見えるのかを認識して知覚して記憶したいという欲求に近い。
この欲求は多分に内向的であり、インターネットに日記を書くことと、瞑想と違わないことを示している。
私は承認欲求でインターネットに日記を書くのではなくて、唯々鏡を見たくて、自分の考えたことを野に放つのである。
ああ、それなのに、ちょっとインターネットでつぶやいたくらいでわーっと炎上するのが世の中。
私はそういうのが嫌になって、ツイッターをやめたときからずっとインターネットで日記を書くことを躊躇してきた。
昔のツイッターは気軽で良かった。
そりゃ確かにインターネットで書いていいことと悪いことがある。その区別がつくかどうかは実際にブログをやるかどうかの判断の分かれ目だろう。
私は表現方法に自信がない。プロじゃないんだから。間違うこともある。いや、プロだって言い方間違って会社に謝罪文出させてるのが現実。
それで自分がもし間違えたら…という心配もあるし、将来的に指摘されるのも嫌である。鏡自身が正しく現実を映して、正しいからこそ嫌なことを思わせることもあるし、これはモノのたとえだけれども、鏡を見た人が心無いことを悪意なく、あるいは正義感から言ったり迷惑だから失せろと言ったりしてくるかもしれない。ああ。やめようかな。どうしようかな。でも一回やってみようか。
ここで有名な『嫌なら見るな』論というものを少し擦ってみる。少なくともここでこれを今書いてるワタシ自身については、お金もらってるわけじゃないし、ただオノレの外界に吐き出したものをしげしげと見たいだけなんだ。そういう飾らない人間自身は、虚飾のないと言ったら聞こえは良いが、そもそも見目のよいものではない。人の吐瀉物なぞそもそも汚いモノなので嫌なら見にいかない方がいんじゃないだろうか?ザッピングという活動にもそれ相応の覚悟が必要なんじゃあないだろうか。困ったことに私は私の出力した生データが見たい。出力しないと見れない。こっそりと出力させてほしい。他人の排出物(創作物ともいう)に価値を見出した人だけ、どうぞその解釈にご自身の時間を使ってほしくて、それが自己体調管理であり、取捨選択であり、自由意志であり、素晴らしい生き方なのではなかろうか。他の生物のニオイを嗅いで情報を取得するまでは本能かもしれなくて、それでも脊髄反射あるいは自由選択によるモノで誰かに強制されたわけではないのだから、その後のことは自分で責任を取ったら良いのでは?他人の屁を臭い臭いと言ってる時間があれば即離脱してもっと有意義なことに貴重なお時間を使ってみるのはいかがですかと誰か言っていなかったっけ?
荒らしよくないって話もある。こないだとあるマイナーなSNSを試してみたらいきなりテンプレ的な荒らし画像が出てきて即アンインスコしたんだよ。悪意を持ってヘイトを叫ぶために投稿したりとか、他人にショックを与えるために荒らすのは良くないと思うんだ。普通に考えたら規約違反だし。そのSNSは通報機能とか規約とかブロック機能とかないやつだった。規約があるのは大事。規約を読むのも守るのも大事、通報するのも大事。でも、どこからが荒らしで、何から通報なの?それはもしかすると白黒つかなくて、テンプレ的な荒らしではない、新しいタイプの荒らしと思われるのも本当に嫌だなあと思って。なぜかというと、自分の吐き出したものを書き出してマジマジと見ないといけない、そうしないと超絶個人的な瞑想ができないんだってことはきっと他人(ソーシャル)には理解されないからなんだよね。ソーシャルでそれをするのかっていう議論になってくるよね。誰も傷つける意図がないので、してもいいはずなんだけど。理解できないことは恐ろしいもんなあ。
話がどんどん横道に逸れる。
こういうことを頭の中でぐるぐる考えている。少しは助けになったかな?
裏が白いチラシの入手ができない状態が10年以上続いているから文字通りのチラ裏ができないよ。でも言いたいことわかるよ。実際今日も安いペラ紙を買おうかなと思って通販サイトを見ていた。
ただ、紙に書きたいけど書けない。書いたらゴミが出る、大量のゴミが。学生時代に書いた大量の紙ゴミを実家に帰るたびにシュレッダーにかけているが全然終わらない。あまりにもプライベートなことを現実の紙に書くのはどうもよろしくない。体力もかけたくない。マジでごめん。信じられないだろうけど腱鞘炎になりそうなので勘弁してほしいんです。
あと、自分しか見ないというのはチラ裏とインターネット日記とでは本質的に異なる。チラ裏は感覚の鏡にはなり得ない。
たぶんすぐ消すけどありがとう。
でもやっぱりこのあれだな、意識の違いというか、期待値の違いというか、無意識的なリスペクト(配慮)要求というか、マナーというかなんというかそういう中身とは遠く離れた皮革的なものへのリアクションの情報を広く浅く求めたいところが全ての答えなんだと思う。できるだけ自分へのダメージを避け、他人への直撃を避け、トイレの壁に落書きをするようなそんな心配性で人でなしのやり方を求めて悩んでいる時点で…
でもこのやり方はきっと間違っていなくて、ソトガワに対するソーシャルリアクションは人として多分に追求するべきで、不健全でもなくて、こういうのもありなんじゃないかなあって。甘えなのかなあ。どうなんだろう。
業務で機械学首(データマイニング)、Web(業務システム)、組み込み(産業インフラ設備)の経験があるので、分野ごとの相違点と発生しがちな軋轢を書いておく。
| - | 機械学習 | Web開発 | 組み込み開発 | 発生する軋轢 |
| コードの寿命 | 半年間 | 20年間 | 40年間 | 組み込み開発er「産業系の組み込みは発売から40年後にアップデートするケースもあるので、ドキュメントは、開発担当者が全員退職して誰も残っていなくても理解できるように書いてください!」 |
| コードのアップデート頻度 | 試行錯誤しつつ随時 | 2週間に1回 | 半年~5年に1回 | Web開発er「組み込みはどうしてそんなに時間がかかるの?アジャイルを導入してください。ウォーターフォールは硬直的でデメリットばかりですよ」 |
| アップデートの提供方法 | -(コードは少人数の同僚だけで使用) | サーバに自動デプロイ | 技術者が現地訪問してアップデート | 組み込み開発er「アジャイルだから最初は若干のバグを残して発売し後日アップデートするって?グローバルで既にXXX台受注しているけど、誰が現地に行くの?費用を負担する部署はどこ?」 |
| 開発者の属性 | 数理系の修士~博士、少数精鋭 | 専門学校~修士、文理混在、大人数 | 電気系、機械系、情報系の修士~博士 | 機械学習er「数式で表現できない知識は民芸品です。エンジニアを名乗っちゃダメでしょ」 |
| 関係部署 | マーケティング・企画 | 顧客 | ハード開発・工場 | 組み込み開発er「納期3カ月前なのにソフトが完成していないの?生産立ち上げを工場に相談していない!?スケジュールをゴールから逆算できなかったの??今回は船便での輸送になるけど、それも計算に入れてあるよね?」 |
| 計算資源 | 潤沢 | 予算次第 | 貧弱 | 組み込み開発er「データマイニングやってたKさんがOSSを使うらしいけど、サイズが5MBあるんだぜ。5MB全部必要なのか聞いたら一部機能しか使わないんだって。で、他チームとの容量調整は丸投げされたの。感覚を破壊されるよな。」 |
| 3rdパーティライブラリ | OSS | OSS | 買ってくる | 組み込み開発er「OSSに不具合があったらどうやって修正して顧客にデリバーするつもりなんだろう?リスク移転の考えで、不具合の補償契約込みで買えばいいのに」 |
| 通信プロトコル・データフォーマット | 生データが王様なので、生データに従う | 最新のものを取り込む | 実績重視 | Web開発er「HTTPの実装がないの?TCPを直接使う!?暗号化や認証はS社の独自プロトコル?古いプロトコルを使い続けているから開発効率が低いんだよ」 |
| 電源OFFタイミング | 任意にコントロール可能 | 定期メンテナンス | コントロール不可 | 組み込み開発er「ファームウェアアップデート中に電源OFFしたらどうなるの?ファイル書き込み中の電源OFFは?状態遷移図って知ってる?」 |
| 性能 | 出来高 | 顧客要件、常識、予算に従う | ミリ秒~マイクロ秒単位のタイムスライスで管理 | Web開発er「性能改善でXX関数の10ミリ秒を1ミリ秒以下に短縮するために2週間も試行錯誤したって?プロパ社員の人件費は7万円/日だから70万円を消費したね?AWSでEC2の性能を調整すれば2000円/月で解決だよ。損益分岐点は350カ月だけど顧客のこれまでのリプレース実績から判断してこのシステムはそこまで長期間使われない」 |
| 学会発表・特許 | 結構ある | ほぼなし | 年1件の特許出願ノルマ | 組み込み開発er「学会発表も特許出願もなく、何を開発したの?ドメイン知識をソフトウェアに翻訳してAWSでポチポチやっただけなの?開発行為ではなく作業だね」 |
分野ごとに要求される製品特性が異なるから、異分野に移ると文化摩擦が起きるという話だと思う。製品特性の違いを理解し自らの行動に反映できるようになるには、ベテランでも数年かかるケースがある。開発期間10年のテーマを経験したことがあるが、そうした場合だとワンサイクルを経験するのに10年かかるので。経験から学ぶのが愚者、歴史から学ぶのが賢者ともいうが…。
無能のデスクにどんどん仕事が溜まっていくので仕方なく一部の仕事を肩代わりすることにした
1000枚くらいの伝票からPCにデータを起こす作業なんだけど
「この①Excelファイルにまず伝票番号と種別を打って、次にもう一回伝票を見て②Excelファイルに日付と数量を打って、
最後にもう一度伝票を見ながら③Excelに数量と種別を打ってそれぞれ間違いがなければExcel内の集計結果が一致します」
こんな新人とかバイトにでもやらせた方がいいバカ向けの作業をそのまま実行するほど暇ではないので
まず生データのExcelファイルを作り伝票番号、数量、種別、日付を一通り入力してそこから3つのExcelにデータを転記するPythonを書いて仕事の手順を簡略化した
これで無能が1週間かけてやっていた作業が1日で終わるようになったが、一通り処理して伝票と集計結果を無能に渡したところ
「引き継ぎの時に言わなかった自分も悪いが伝票は役所に提出する関係でこういう順番に並び替えて持ってきて」と鼻で笑って突き返してきた
専門外なので教えていただきたいのですが
https://media.rakuten-sec.net/articles/amp/43634
これとかで出てきている株式の「インフレ調整後の」平均リターンが年7%って本当ですか?
実際に生データから計算されているかたの計算ではそうでもないような気がしますが…
https://shotaro37.com/inflation-adjusted-return/
たまにSP500銘柄で外挿しているときがありますが、それはインデックス開始まで生き残った銘柄をチェリーピックすることになるので嘘インデックスになりますよね…
増田はマテリアルインフォマティクスや超伝導の専門家ではないんだけど。
専門家からすると、常温ながら高圧下で超伝導の存在ですら怪しいのに、高圧ですらない報告は眉につばも付けたくなるだろう。(LK-99は本当に常温常圧超伝導を達成しているのか - 理系のための備忘録)
Cu_2S の一次転移を常温超伝導と見間違えたのでは?との報告が上がっている。(https://twitter.com/tjmlab/status/1689076343114493957])
LK-99に関連して、常温超伝導を示す物質を機械学習を使って見つけられないのかという疑問をはてなブックマークやTwitterなどで見かけた。
端的に述べると、機械学習を用いた物質探索は既に広く行われているが、今回のような未知の性質を有する物質の探索には不向きである。
物質探索で機械学習が注目されるようになったのも最近のことだ。
2019年には選択性の高い触媒を機械学習で予測する研究がScience誌に投稿されている。(高選択的な不斉触媒系を機械学習で予測する | Chem-Station (ケムステ))
物質の探索の他にも、生データの帰属やそこから得られたデータ同士の解析などにも機械学習が用いられている。
機械学習によって、経験によると勘とマンパワーと一握りの運で支えられていた「予測→合成→測定→解析」のサイクルを早められるようになった。
その一方で、より広大な未踏の探索領域が存在し、さらなるマンパワーが必要であることが明確化された。
HUNTER×HUNTERで暗黒大陸が明かされた状況に似ている。
機械学習は暗黒大陸の道案内役になりうるが、より効率的な探索のために実験や測定の自動化も必要となり、そのような研究も始められている。
機械学習が様々な物質を予測しても、その合成できるかは別問題だ。これは機械学習に限った話ではない。
理論的にすばらしい性質が予想された物質であっても、技術的に合成できない、合成できても予想された性質を示さないことは科学の世界ではあるあるだ。
原因は様々であるが解決のためには、技術の進歩とブレイクスルーが必要となるし、そもそも予想が間違っている可能性だってある。
たとえば、2000年にノーベル化学賞を受賞したポリアセチレンは、古くから量子化学的に導電性を持つだろうと予想されていたが、合成する方法がなかった。
1958年にナッタらが開発した触媒によって初めて合成されるが、粉末しか得られず電気特性を測定することができなかった。得られた粉末は溶媒にも溶けず熱で溶融もしないためフィルムにできなかったのである。
その後の1967年に白川らがフィルム化に成功し金属光沢を示すもののほぼ絶縁体であった。電気を流すにはドーピングという更なるブレイクスルーが必要だった。
機械学習は、目的とする性質を持った物質を探索することは可能だが、全く新しい性質を示す物質の予測には向いていない。
過去の結果から高い転移温度を有する物質を類推可能だが、これまでの超伝導とはメカニズムが異なるであろう常温超伝導を示す物質を予想することはできない。せいぜい異常な振る舞いを予測するくらいだ。
超伝導の恐ろしいところは2000年以降も様々な性質が予想され発見されていることだ。
例えば、ワイル半金属(1937年予想、2016年発見)、トポロジカル絶縁体(2005年提唱、2007年確認)、ネマティック超伝導(2016年発見)などなど。
全く新しいメカニズムによる性質に関するデータが無い以上、このような性質を示す物質を機械学習で探索するのは無謀だ。
もちろん、既存のデータをよくよく洗い出してみると、新しいメカニズムで上手く説明できるケースもあるが、それを機械学習へ利用するには・・・・・・。
今までは「俺の作品に金払ってもいない奴にケチつけられたくね~~~。つうかケチ付けるやつはどうせ金出さないから金出してるかどうかで作品鑑賞の権利を打ち切りて~~~」を実現するための舞台が無かったから、仕方なく同人誌を印刷していたというだけ。
ネット初期も個人が自分の作品を見たければお金払ってくださいをするのは簡単じゃなかった。
コミケを介さなくても結局通販とかになって、CDのプレス等が必要だった。
でも今はDL販売やサブスクで場所を借りることで「ここから先はお金払ってください。クソみたいなケチつけるならせめて金払って買ってからにして」が出来るようになった。
むしろ即売会で同人誌を売るほうが立ち読みでペラペラめくっただけの奴に意味不明なケチをつけられるリスクが増えた。
これは本当に大きい。
即売会で丸一日椅子に座ったり売り子を頼むのに比べれば手間もかからない。
圧倒的なメリットがある。
売るものの形式も自由で、今まで通り漫画で売っても良いし、イラストだったら相手側モニターの質にもよるけど印刷よりも鮮明かも知れない生データをぶん投げることだって出来る。
逆に言えばわざわざ印刷するという手間をかけて得られるものが圧倒的に少なくなった。
この状況でまだ同人誌に固執しているのは、「オタクは同人誌を売るもの・買うもの」という古い習慣への固執が抜けてないだけの人達。
言ってしまえば老害、もしくは初期の憧れに対して現実を知る前のニワカ。
オタクの全世代化と一般化の一般化(ニコニコ黎明期から数えてもう10年以上経つ)が進んだことでそういった層も決して多くなくなってきている。
こうして同人誌文化は「オタク活動の頂点」から、あくまで手段の一つとなった。
それだけの話しだ。
玉座からの転落というよりも、最終的な出力方法が複数に増えたというハッピーな状況だな。
飯を摂取できる可能性が増えれば手段も経緯もどうでもいいと考えるよりピュアなオタクにとってはいい状況だ。
「俺たちオタク極めてるフッッフ~~~」したい括弧つけでオタクやっているよく分からん連中にとってはネガティブなニュースなんだろうが、そんな奴ら知ったことかよと多くのオタクは思ってる。
暗黙的にJSTとして時間を使ったせいでUTCで作った場所で盛大にバグる
応急処置でバグったところを+9とかやってしまうと、それ以降に逆に誰も気付かずに更に影響範囲が拡がったりする
海外展開しようとしたときにバグに気付くがどうしようもなくなって途方にくれて海外だけは別アプリになったりする
UNIXTIMEを使えば楽なんだけれど、そうすると生データぱっと見で時間を判別できないので困ることも多い
素直にUTCでISO8601が良い
とりあえずUTF-8にしとけば大丈夫、ってことで実装を進めた結果、Mac/Winでハマる
他にもBOMでハマったりして、むしろSJISの方が良かったんじゃ無いか、とか言い出す
DBが統一的になっている場合はまだ後からどうにかできるが、変なところでキャッシュされてたりすると凄い困ることになる
MySQLなりPostgreSQLなりでUTF-8を正しく扱う方法はいろんな記事があるのでちゃんと読んでおけば問題無い
とかよく分からないことを言い出して価格を浮動小数にしてしまう
確かに米国なら$2.43みたいな感じで価格を使ったりするし、むしろ小数点以下が無い通貨の方が珍しいのだけれど
丸め誤差を考えないで作ってしまってバグが見つかりめちゃくちゃ揉める
何が書いてあるか、誰が書いているか、の違いか|文学作品ならそら後者やろうけど、技術書や理論論文で後者重視したら権威主義への傾倒でしかないな
いや、文学研究でも「何が書いてあるか」です(「何が書いてあるか」を解釈する上で「誰が書いたか」という情報が必要な場合があるだけ)。たとえば、ピケティが英語で書いた論文なら英語から訳すべきで、ピケティがフランス人だからといってフランス語から重訳するのはおかしい。逆に、仮に著者がイギリス人でも、フランス語で書かれた本ならフランス語から訳すべき、そういう話です。文系が大事にしているのは「文章それ自体」であって、文章それ自体を忠実に原語から訳すことが重要である、というのが文系の考え方。
(だって、「オリジナルの文章」こそが我々にとっての生データですからね。もちろん完全にオリジナルなのは難しい場合が多いけど、なるべくオリジナルに近づける努力をすることは必要で、原文にあたるのはその基礎的な作業であって学部生とかの未熟な人でない限りは省くべきではないプロセスですよね、ってこと)
さえぼう氏側は「間違いが起こり得る」としか言わず、具体的にどこが「間違いだった」という指摘がないから、屋上屋を架す空論でしかない。具体的に誤訳だったという指摘、出版から随分経つけど今までにあった?
これはもう「具体的に間違いがあるから問題だ」ではなくて「重訳なのがけしからん」という話なので……具体的な実害の問題じゃなくて規範の話をしてるんですよね。ただ、その規範が他の分野の人たちに受け入れられていない、という状況。
たとえば増田は、ちょっとマニアックな事柄についての論文を有名な査読誌に投稿したことがあるんですけど、「よく調べてあるけど学術的インパクトが足りない(要は面白くない)。却下」という趣旨のやり取りを何度かして、もういっか、めんどいから載るとこに載せよ、って思って当時所属してた機関の紀要に無査読の論文書いたことがあるんですよ。業績欄には当然その論文を載っけてます(もちろん査読の有無は明記した上で)。で、この論文が形式上査読なしであることに特段の問題はないですよね。だって研究結果が間違ってるわけじゃないもの。ただ有名な雑誌に載るほど面白くないだけ。それでも、論文には査読がついていて当然、という人たちは「いや、査読なしだと間違った論文が載るリスクがあって、だから査読がないものは論文と認めるべきではなく……」って言いたくなるんじゃないですか? 「重訳だと誤訳のリスクが……」ってのもそういうことですよ。
物理学そのものではないですけど、いちおう、文系には科学史という分野もあり、そこでは物理学の歴史について原語を使った研究がされてます。たとえば、isbn:4486021746 なんかは、ソ連時代の物理学をめぐる論争について研究した本で、がっつりロシア語の文献を読み込んでます(ネットで読める論文だと、DOI:10.34336/jhsj.47.248_193とか)。外国の学者が書いたこの本isbn:4815808090 も、英語以外の文献も読んでたような(この本は面白いので超オススメです)。アインシュタインはドイツ語で相対性理論の論文を書いたわけですからね(DOI:10.1002/andp.19053221004)。もちろん、繰り返すようにこれらはあくまで「物理学を対象とした文系の学問」であって、物理学そのものではないので、「物理学では基本的に英語版からの翻訳」というのはそうなんだろうなぁ、と思いますが。
これ、医学系が人文系にIF要求するような無理筋を感じる 読者がやるのはピケティの研究じゃなくてピケティを踏まえた研究では
これメチャクチャ思いました。過去の査読云々の論争を思い出しちゃいましたよ(anond:20181009070341 とか、anond:20181011090428 とか、このへんの話ね)。「翻訳するときは原典から訳すのが当然だろ!」「いや、別に重訳でも意味が取れてればそれでいいじゃん……」「出版のスピード感も大事だし……」っていうやり取り、まんま過去の「論文は全部査読するのが当然だろ!」「ええ、別に無査読で載せても、後続の論文でしっかり吟味されてればそれでいいじゃん……」「出版のスピード感も大事だし……」っていうやり取りとソックリというか。増田は「なんで原典にあたるという当然のことを重要視しないんだろう……」って思っちゃうんですけど、理系や経済学の人たちも「なんで査読という当然のことを重要視しないんだろう……」って思ってたわけですよね。まあだから、あんまり自分野の基準で他分野にケチつけるのはよろしくないなぁと、自戒を込めて。
増田に書いたことは原文ママじゃなくて要約です。当たり前でしょ……(ほんとはきちんと細かく落とす理由を書いてあったけど自分の専門分野も出した雑誌の名前も言いたくない)。まあ「大意」とか「趣旨」とか書いておくべきだったかもしれないけど流石にこの文面見たら要約だとわかるっしょ? って思ったんですけど伝わらない人もいるんだなぁと新鮮な驚きを感じたので「趣旨」って付け足しておきましたわ。要約を鉤括弧で括ったこちらにも非はあるし。
だから丁寧に「有名な査読誌に出して面白くないからと蹴られた」話をしたんですけど伝わりませんでした? 間違いがあるとかじゃなくて、マニアックすぎてうちの雑誌に載せるには面白くない、っていう理由で却下されたんですよ。まさかそこに引っかかる人が出てくるとは。ちゃんと経緯は書いてあるでしょ。
でもまあ、反射で「査読ついてないなんてけしからん」って思っちゃうってことですよね。重訳もそういうことです。反射で「直訳しないなんてけしからん」って思っちゃう、っていう話。
わざと言ってます? それとも本当に読めてない? 「よく調べてあるけど」と前置きしたでしょ? 研究成果それ自体への疑義は査読者からは呈されていません。むしろ称賛されてます。その上で面白くないから書き直せってやり取りを何度もしたの(再投稿を可とするリジェクトだった)。何度か書き直して、ああこれは先方が求める「面白さ」と増田がこの研究に感じている「面白さ」が噛み合うことはないな、と思ったので再投稿せずに無査読紀要に載せることにしました。自分にとっては自明なことなので説明不足になっていたきらいはあり、そこは申し訳ないけど、もとの文章ちゃんと読んでくれませんか?
だいたい、研究成果の正しさはディジタルじゃなくて、「部分的には正しいが、しかし……」みたいにグラデーションがあるものでしょ。査読で100%の正しさが保証されると考えているならそれは大間違いですよ。増田の研究だって、研究手法と結論的に「正しいか、間違いか」なんてディジタルに言えるような研究じゃないっす。なので査読で「間違いだとわかる」なんてこともほぼあり得ない(資料の読解間違いとかはあるかもしれないけど、増田の論文が総体として「間違い」であることを示すには増田の論文と同程度以上の調査をし論文を書く必要があるんで、普通の査読じゃ「間違い」とか言えないはず。関連する資料を全部諳んじてる大家なら別だけど)。
そもそもピケティ先生は狭い学術ギルド内論文として書いたんじゃなく経世済民の書として世に問うたわけだから増田の話(や一部ブコメ)は大分ズレてるのでは。例えば「翻訳とか無駄で原本を参照汁」的な暴論との文字数
学術業界だけじゃなくて、一般書の方でも最近は「原語から訳すべき」という流れが定着しつつあったじゃないすか。スタニスワフ・レムも昔はロシア語からの重訳だったけどポーランド語からの新訳が出てるし、昔はフランス語経由で訳されてたイスマイル・カダレも今はアルバニア語から訳されてるし、バスク語やチベット語やイディッシュ語の文学が翻訳されてきたでしょう? そういう流れが出てきてたのに有名なフランス語の本を英語から重訳するなんて、というショックは当然ありますよ(だから私は『三体』も相当ガッカリしましたよ。中国語版には検閲が入ってる、と聞いて納得したけど。エーレンデュル捜査官シリーズの方は、重訳自体はもう仕方ないけど、頼む~~~せめて著者の名前がおかしいのくらいはどうにかしてくれ~~~って感じ。重訳のせいで著者の名前すらおかしな表記がされてるんですよね……)。時代を巻き戻す気か、と反射で思っちゃうのも無理はないです。
偉い人の思いつきでDX予算が着いたらしく、流行りのビッグデータによるデータサイエンスやAIを駆使した販売促進システムの開発プロジェクトに巻き込まれてて月曜の出社が苦痛すぎて辛い。
詳細はぼかすが、店舗でのポイントカードの購買履歴に基づいてAIがリアルタイムで自動的に販売動向をチェックし、効果的な販促(アプリからのプロモーションとか)ができるシステムを作ろうとしてるんだけど、仕様を決めてる偉い人のセンスが壊滅的で盛大に炎上している。
何がヤバいかっていうと、元々のポイントカードの購買データがAIによる処理に向いていないと言うところだ。ポイントカードには年齢、性別、職業とかのデータが紐づいているけど、そのデータが登録時から更新されることはまれである。なんで素のデータをそのままAIに渡して処理するのは危険だったりする。
例を上げると、全国的に30代独身女性がアンパンマンのおもちゃ付きのお菓子を好んで買うというデータがあったとして、それは実態を表していない可能性が高いと言うことがあったりする。
人間の目でデータを分析して見ると彼女たちがポイントカードを作ったのは20代の独身の時で、今アンパンマンのおもちゃ付きのお菓子を買っているのは結婚して子供ができてその子供にねだられて買っている(=商品が刺さる層は小さい子供で母親が買っている)という仮説を容易に立てられるわけだけど、機械はそうじゃない。
なんで、こういうデータを扱うときは人力で生データを加工して使えるデータに補正しないといけないわけだけど、補正の手間って思っている以上に大変なのだ。例えばアンパンマンならまだ判別ルールを組み込みやすいが、実際に30代独身女性が自分用に買っている可能性が考えられる、すみっこぐらしのおまけ付きお菓子とかならどうするかとか悩ましい問題があって、人手と現場のノウハウが要求される泥臭い要素が結構あったりする。
だけど、口の回るコンサルやSIerに乗せられた偉い人は完全に自動でできると思ってるし、システムが稼働したら運用コストはサーバー管理費用程度だろうくらいに考えているんで、理想と現場の現実との板挟みでマジで辛い。実際にシステム構築する側からすれば、常に人力でのデータ加工が必要な筋が悪いシステムで、そんなシステム作ってもまともに運用できないと思ってるんだけど、俺の考え間違ってるかな?
別部署の上司「ワイ君、ここの画像なんかぼやけてない?こないだslack経由で上げたの使ってよ」
ワイ「すんまへん、でも使っているのがそれです。」
ワイ「すんまへん、頂戴した画像が小さいんですわ」
別上司「……わかった。少し待ってろ」
====3日後====
有能別上司「ワイ君、上司。販促用の資料根こそぎ奪(と)ってきたぞ!(画像生データ、販促用動画etc)」
上司「うえ、これどうしたんですか?」
別上司「審議中のものも含めて、交渉してもらってきた。修正あったら交換するって条件でな!お得意様の特権だ!」
ワイ「うわぁ仕事を増やしやがりましたな(増やしやがったな)」
別上司「よ・ろ・し・く・ね」
ワイ「ぐぬぬぬぬ」