[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[openoffice:11925] Re: ふりがな関 数エクステンションのWindows Vistaお よびWIndows 7での動作確認のお願 い



curvirgoです。

(2010年03月22日 15:29), たぼたぼ wrote:
> replaceallfast "ミノオ","minoo";
> replaceallfast "ノウチ","nouchi";
> replaceallfast "ノウラ","noura";
> replaceallfast "ノウミ","noumi";
> replaceallfast "ノウエ","noue";
> replaceallfast "ノウラ","noura";
> replaceallfast "ノウシロ","noushiro";
> replaceallfast "ノウタ","nouta";
> replaceallfast "ノウメ","noume";
> replaceallfast "ノウシロ","no-ushiro";
> replaceallfast "ノオカ","nooka";
> replaceallfast "ノオモテ","no-omote";
> 
> 注:上記マクロは半角カナを便宜全角カナにしています。
> 
> というように ノ の後に上記のような住所のものを先に処理し、後は オオ 
> や オウ を o にするようにしています。
> 箕面 は 美濃 と区別するため、あとは、全国の住所のうち更新があった時だ
> けその都度不都合?と思われるような場合にマクロを追加して修正していきまし
> た。
> 特に東京丸の内などの場合、先に「ノウ」を処理しないと不都合が生じます。
> 実際、関数では 「marunochi」(u が入っていない)になります。
> Google で「marunouchi」(uが入る)を検索すると 約 2,930,000件ヒットし
> ますから「marunouchi」になるようにしたほうが良いと思います。
> それに 光の丘 のように ノオカ が付くところも多いです。
> 
> なお、aa ii uu ee はそのままで良いかと・・例 飯田市 → IIDA
> ただ、私の場合、あくまでも住所についてなので、その他の用途では向いていな
> いかもしれませんが・・・
住所だけの場合は例外を処理後、通常のルールを適用することは何とか可能だと思います。
ですが、いろいろと検索してみましたがこの関数の目的からすれば、形態素解析を行ってそれをもとに
長音かどうかを判断せざるをえないと思うようになりました。

「aa」、「uu」などは以下のURLの例にある通り、無視も出来ないと思います。
http://xembho.s59.xrea.com/siryoo/hikion.html

とすれば、全角カタカナからヘボン式のローマ字を生成することは、コード上で完璧に処理は出来ないと
思います。
都合よくMeCabでは「発音」として長音を「ー」として表示してくれるので、それを利用してからローマ字に
変換長音に関するルールを適用することは可能と思います。
ただし、MeCabで解析した結果が正しくない場合は、やはり期待した結果と異なる事になります。


MLホームページ: http://www.freeml.com/openoffice

----------------------------------------------------------------------
MLメールに地図をつけて待ち合わせをスムーズに!
http://ad.freeml.com/cgi-bin/sa.cgi?id=fiUDD
-----------------------------------------------------[freeml by GMO]--