ATOKで、漢字名からよみがなに変換しよう、と、再変換機能を使って
つらつらと変換して感じたこと。
・人名辞書に載っている名前には強い、
が、辞書に載っているかどうかは、名前ランキングとは密接に関係してない
・再変換時には、前後の文意解析はしない、
ので、名前だけで意味が発生するような文字列や、
通常辞書に載っているような名前は誤変換する。
・再変換時は、人名辞書よりも意味解析や通常辞書を優先するので質が悪い。
・人名読みのルールは数十種類くらい? ちょっと弱い。
・最近の流行にかなり弱いw
最近の流行の方が斜め上すぎる、というのはひとまず置いておいて。
・女性名は正答率3割を切ってる。役にたたねえwww
「麻衣」→「あさぎぬ」とかやられた日にはどうしようかと思ったw
いや、間違ってないけどさwww
女性名の方がルール化しやすいと思うけど。
しかし、まあ、いろんな名前があるもんだなあ、と眺めてて思いました。
でもって、漢字名の読みっていうのは、機械にも難しいのかな、とか思いました。
# 小学校の先生って、最初に名前の読みを確認するけど、
# なんで名簿に読みが載ってないんだろう?
# 役所からデータが来ないのか?
# 戸籍からデータを作るから、そもそも読みのデータがないとかそういうオチ?
コメントする
コメントしても反応がない場合は、気が付いてないだけですので、Twitterなどでつっついてください。