PykakasiというPythonライブラリを使うと、漢字やひらがなをローマ字やカタカナに変換できる。Pykakasiをインストールして漢字やひらがなを変換するところまでやってみる。
環境
WSL2(Ubuntu20.04)。
$ lsb_release -dr Description: Ubuntu 20.04.3 LTS Release: 20.04 $ python3 -V Python 3.8.10
Pykakasiのインストール
変換ライブラリのPykakasiはpipでインストールできる。
$ pip3 install pykakasi $ pip3 show pykakasi Name: pykakasi Version: 2.2.1 ...
漢字やひらがなをローマ字やカタカナに変換する
Pykakasiがインストールできたら、漢字やひらがなを変換してみる。kakasiクラスのインスタンスを作成して、convertメソッドを使うだけで変換結果が得られる。
from pprint import pprint import pykakasi kks = pykakasi.kakasi() text = "ふんわり名人サイコー" # 漢字やひらがななどの文字種ごとに変換結果が得られる result = kks.convert(text) pprint(result, indent=2)
結果は以下のように、漢字やひらがななどの文字種ごとに変換結果が得られる。origが変換元の文字、hiraがひらがな、kanaがカタカナ、hepburnはヘボン式ローマ字、kunreiは訓令式ローマ字、passportはパスポート表記。
[ { 'hepburn': 'funwari',
'hira': 'ふんわり',
'kana': 'フンワリ',
'kunrei': 'funwari',
'orig': 'ふんわり',
'passport': 'funwari'},
{ 'hepburn': 'meijin',
'hira': 'めいじん',
'kana': 'メイジン',
'kunrei': 'meizin',
'orig': '名人',
'passport': 'meijin'},
{ 'hepburn': 'saikoo',
'hira': 'さいこー',
'kana': 'サイコー',
'kunrei': 'saikoo',
'orig': 'サイコー',
'passport': 'saikoo'}]
0 件のコメント:
コメントを投稿