Scroll to navigation

Juman(3pm) User Contributed Perl Documentation Juman(3pm)

NAME

Juman - 形態素解析を行うモジュール

SYNOPSIS

 use Juman;
 $juman = new Juman;
 $result = $juman->analysis( "この文を形態素解析してください." );
 print $result->all();

DESCRIPTION

"Juman" は,形態素解析器 JUMAN を Perl から利用するためのモジュールで ある.

単純に形態素解析を行うだけならば、"Juman::Simple" が利用できる. "Juman::Simple" は,"Juman" モジュールのラッパーであり,より簡単に形 態素解析器を利用できるように設計されている.

CONSTRUCTOR

"Juman" オブジェクトを生成するコンストラクタは,以下の引数を受け付け る.

Synopsis

    $juman = new Juman
               [ -Server        => string,]
               [ -Port          => integer,]
               [ -Command       => string,]
               [ -Timeout       => integer,]
               [ -Option        => string,]
               [ -Rcfile        => filename,]
               [ -IgnorePattern => string,]

Options

各引数の意味は次の通り.

-Server

JUMAN サーバーのホスト名.省略された場合は,環境変数 "JUMANSERVER" で 指定されたサーバーが利用される.環境変数も指定されていない場合は, Juman を子プロセスとして呼び出す.

-Port

サーバーのポート番号.

-Command

Juman の実行ファイル名.Juman サーバーを利用しない場合に参照される.

-Timeout

サーバーまたは子プロセスと通信する時の待ち時間.

-Option

JUMAN を実行する際のコマンドライン引数.省略した場合は, $Juman::DEFAULT{option} の値が用いられる.

ただし,設定ファイルを指定する "-r" オプションと,KNP によって無視さ れる行頭パターンを指定する "-i" オプションについては,それぞれ個別に "-Rcfile", "-IgnorePattern" によって指定するべきである.

-Rcfile

JUMAN の設定ファイルを指定するオプション.

このオプションと,Juman サーバーの利用は両立しないことが多い.特に,サー バーが利用している辞書と違う辞書を指定している設定ファイルは,意図した 通りには動作しない.

-IgnorePattern

JUMAN によって無視される行頭パターン.

METHODS

指定された文字列 STR を形態素解析し,その結果を "Juman::Result" オブ ジェクトとして返す.
"analysis" の別名.

ENVIRONMENT

環境変数 "JUMANSERVER" が設定されている場合は,指定されているホストを Juman サーバーとして利用する.

SEE ALSO

  • Juman::Result
  • Juman::Simple

HISTORY

This module is the completely rewritten version of the original module written by Taku Kudoh <taku-ku@is.aist-nara.ac.jp>.

AUTHOR

COPYRIGHT

利用及び再配布については GPL2 または Artistic License に従ってください。

POD ERRORS

Hey! The above document had some coding errors, which are explained below:

Non-ASCII character seen before =encoding in '形態素解析を行うモジュール'. Assuming UTF-8
You can't have =items (as at line 53) unless the first thing after the =over is an =item
2024-09-11 perl v5.38.2