似てる似ていない、は主観だけでなく客観的に判断することもできる
たとえば編集距離という方法がある。発明者であるロシアの数学者レーベンシュタインにちなんで、レーベンシュタイン距離ともいう
https://ja.wikipedia.org/wiki/レーベンシュタイン距離
これは簡単に言うとスペルミスを修正する手数を数える方法である
たとえばSOBA と SORA
これはSOBAのBを消して(1手目)、BがあったところにRを入れる(2手目)、つまりSOBAは2手でSORAに編集できる。だからSOBAとSORAの編集距離は2である
距離だから、数学的にはSORAからみたSOBAの距離と、SOBAからみたSORAまでの距離は等しくなる(どちらの単語から始めても編集距離は2になる)
似てる単語同士は編集距離が小さく、似てない単語は編集距離が大きくなる。つまり編集距離という数値を用いれば、似てる・似てないが客観的に計算・判定できるようになる
ではYAKISOBAとYOASOBIの編集距離を求めてみよう。YAKISOBAから編集を開始し、YOASOBIを目指してみる
YAKISOBA
YOKISOBA (Aを削除,Oを挿入,+2回)
YOKSOBA(Iを削除,Sを挿入,+2回)
YOSOBA (Kを削除,+1回)
YOASOBI(Aを削除,Iを追加+1)
YOASOBI
同様に
となる
厳密な判定は、国語辞典などをつかってすべての単語の編集距離を調べて、編集距離の分布を調べる必要があるが
YAKISOBAとYOASOBIよりも編集距離が小さい単語はたくさんあると思われる
YAKISOBAとYOASOBIって似てない?
似てる似ていない、は主観だけでなく客観的に判断することもできる たとえば編集距離という方法がある。発明者であるロシアの数学者レーベンシュタインにちなんで、レーベンシュタ...
ケリブンッジ大学のコピペ(タイポグリセミア)を勘案すると、最初と最後の文字が一致する方が近いとか、別の文字に置換するよりアナグラムの方が近いとか、人の認知する類似度は...
5回で編集できへんか?
YOSAKOI
相手の呼ぶ時に名前を間違えて言うやつ、相手との格の差を見せるためにアラ還以上の世代のJTC古参社員が良くやってた技法なんだけど、言い方や本人に愛嬌がないとただの感じの悪い...
ワイはガチのマジで松本まりかを松本いちかって言い間違えたけど スルーされて事なきを得たやで
わいは昔から上司の名前でもおかまいなく派手に間違えたやで
YAMAKAZI YAMAZAKI YAMAKASHI YAKAMASHI