[広告] テストデータ生成なら疑似個人情報ジェネレータ!! (People to People Communications 株式会社)
[広告] 疑似個人情報ジェネレータで個人情報漏洩対策!! (People to People Communications 株式会社)
携帯向けサイト | 過去の記事
気になるニュースや時事の話題を毎朝配信!世界と日本の未来を分析します。デジモノや料理の情報、WQXGAサイズの壁紙も。


ATOKで、漢字名からよみがなに変換しよう、と、再変換機能を使って

つらつらと変換して感じたこと。



・人名辞書に載っている名前には強い、

 が、辞書に載っているかどうかは、名前ランキングとは密接に関係してない



・再変換時には、前後の文意解析はしない、

 ので、名前だけで意味が発生するような文字列や、

 通常辞書に載っているような名前は誤変換する。



・再変換時は、人名辞書よりも意味解析や通常辞書を優先するので質が悪い。



・人名読みのルールは数十種類くらい? ちょっと弱い。



・最近の流行にかなり弱いw

 最近の流行の方が斜め上すぎる、というのはひとまず置いておいて。



・女性名は正答率3割を切ってる。役にたたねえwww

 「麻衣」→「あさぎぬ」とかやられた日にはどうしようかと思ったw

 いや、間違ってないけどさwww

 女性名の方がルール化しやすいと思うけど。





しかし、まあ、いろんな名前があるもんだなあ、と眺めてて思いました。

でもって、漢字名の読みっていうのは、機械にも難しいのかな、とか思いました。





# 小学校の先生って、最初に名前の読みを確認するけど、

# なんで名簿に読みが載ってないんだろう?

# 役所からデータが来ないのか?

# 戸籍からデータを作るから、そもそも読みのデータがないとかそういうオチ?










    [広告] IL MILIONE ~世界の風景100撰~ 特大サイズ壁紙集 (People to People Communications 株式会社)