リンクは自由!
『月刊言語』第28巻(1999)11月号, pp86-87. 掲載
「コンピュータ ソフトなければ ただの箱」という川柳があった。現在 市販されているパソコンの大半は、OSはもちろんのこと、盛り沢山の アプリケーションソフトもバンドルされているので、そのままでもワープロでの 文書作成やウェブのブラウジングといった一般的な目的ではあまり困らないだろう。 しかし、そのような使い方だけではコンピュータの可能性を十分に発揮させたことに ならない。
言語の研究という目的でのコンピュータ利用をより効果的なものにするには、 それなりのソフトウェア(および利用者のイマジネーション )が必要である。 そういったソフトウェアは商品として市販されているものもあるが、研究者自身が 作り配布しているものも少なくない。これらは商業的流通ルートに乗らないため、 その存在すらなかなか広くは知られない。インターネットはこのようなソフトウェアの 流通経路としても有効に働く。
この種のソフトウェアは、 Summer Institute of Linguistics (SIL)の ウェブサイトの中の Linguistic Computing Resources on the Internetのページ (http://www.sil.org/linguistics/computing.html)に比較的よくまとめられている。 テキストや音声等の具体的な言語データを分析するためのものを初めとして、 特定の文法理論をシミュレートするプログラムや比較言語学的に祖語の語形を 推定するプログラムなど、多様な試みが行われていることがわかる。 多少古いものも含まれていて、全てのソフトウェアが短い紹介文から想像できる 機能を十分備えているとは限らないが、レベルの高いソフトウェアも多い。 例えば、SIL Software Catalogに挙げてあるコンコーダンス作成プログラム Concや音声分析ツール Speech Analysis Toolsなどは、テキストや音声の分析に 十分役立つ。
この他に、The LINGUIST List のサイト中の "Software"の項目(http://www.linguistlist.org/software.html)や The Natural Language Software Registry (http://www.dfki.de/lt/registry/) でも、この種のソフトウェアがまとまってリストされている。
日本でも自作のソフトウェアを公開している人は少なくない。例えば、 コンコーダンス作成プログラムだけでも、AKA-sanの TXTANA (http://www.biwa.ne.jp/~aka-san/index.html)、日本大学塚本聡氏 (http://www.mmm.cit.nihon-u.ac.jp/~tukamoto/) の KWIC Concordance for Windows、神戸フェニックスラボの Corpus Wizard (http://www2d.biglobe.ne.jp/~htakashi/indexj.html)などが ある。特に、Corpus Wizardは日本語に対応するよう拡張することができる点で 特徴的である。
現在のパソコンは、スクリーン上のアイコンをマウスでクリックすることで 操作する方式が主流だが、キーボードからコマンドを打ち込んで操作する方式も 決して非合理なものではない。実際、MS-DOSのコマンドラインからも使える プログラミング言語 awk はテキスト処理に向いており、そのためのスクリプトの 例が国立国語研究所 中野洋氏 (http://www2.kokken.go.jp/~nakano/public/indexpub.html)や 東京大学上田博人氏 (http://gamp.c.u-tokyo.ac.jp/ueda/JAPON.HTM)によって 公開されている。awkのスクリプトはテキストファイルであるから、処理の アルゴリズムをたどって理解することができるし、自分の関心に応じて書き換えてみる こともできよう。
これらのソフトウェアをインストールし、使いこなすためには、最低でも コンピュータのハードウェアやOSの基礎知識が要求される。コンピュータを十分に 活用するためには、その習得に手間を惜しむべきではない。なお、インターネット上で 公開されているプログラムであっても、継続的な使用には料金の支払いなどの条件が つけられている場合があるので、付属のドキュメントに注意する必要がある。
(ごとうひとし/言語学・ロマンス語学)
copyright GOTOO Hitosi 1999
著作権法規に則って利用することができます。