|
Windows 2000におけるアラビア語処理の問題点
無責任なようで申し訳ありませんが、筆者はかならずしもWindows
2000を使いこなしているわけではありません。NT自体は日常生活で使用していますが、これはあくまでサーバー版なわけです。つまりいったん設定してしまうとあとはいじくりまわすことはないわけです。Workstationとしての利用ははじめてといってもいいでしょう。というわけで、2000のアラビア語処理で問題があるといっても、それが2000のせいなのか、単に筆者が解決法を知らないのか、あるいは筆者のやりかたが間違っているために、アラビア語の挙動がおかしくなっているのか、かならずしもはっきりしないのです。とりあえず、一般的なWindowsユーザーが常識的な行動を行った場合に、うまくいかなかった例として理解していただければと思います。今後、このエッセーは、Microsoftにも連絡を試みながら、随時アップグレードしていきたいと考えておりますので、もしご意見等ございましたら、筆者までご連絡ください。
数字が打てない
数字が打てないといってもまったく打てないわけではありません。アラビア数字が打てないのです。アラビア数字といっても、もちろんいわゆる算用数字ではありません。アラビア語の数字です。タスクバーで言語設定をアラビア語にし、しかもフォントもアラビア語専用(2000でインストールされる)のものに変更しても、キーボードから数字を打つと、1
2 3 4 5 6 7 8 9 0となってしまうのです。筆者は、自分が住んでいたクウェート、サウジアラビア、イラクの入力ロケールだけを設定しているので、もしかしたら、それ以外のロケールでやると、きちんとアラビア数字が打てるのかもしれません。実際、サウジアラビアでは、しばしばアラビア語の数字ではなく、いわゆる算用数字を使うケースが多々あるからです。と考えていたら、実は打てるようになりました。アラビア語のWindowsを使っているときに同じ経験をしたことを思い出したからです。もう一度「地域のオプション」を開いてください。タグのなかに「数値」というのがあります。これで「数字」の種類を変更できます。ここで標準の数字形式をアラビア文字に変えればいいのです。これで数字を入力すれば、アラビア文字が出てくるはずです。



これで万事うまくいったと思ったら大間違い。たとえばこの設定でWordpadを使うと、日本語を打っていても半角の数字がアラビア文字になってしまうのです。そこで論理的に考えて「標準」をいわゆる算用数字にして、「代替」を「文脈に依存」などとしてみたのですが、うまくいきません。
まあ、全部の組みあわせを試したわけではないので何ともいえませんが、Wordpadなど使う人はいないだろうという前提で、Word
2000のほうに移りたいと思います。Wordでアラビア文字の数字をキーボードから打てるようにするには、次のようにします。なおこの場合は「地域オプション」の設定はとくに関係がないようです。Word標準画面のツールバーに「ツール」というのがあります。このなかに「オプション」というのがあり、そのなかで数字を指定します。

これはあきらかにバグだと思うのですが、「オプション」のなかに「番号」(これは当然「数字」とすべきでしょう)というのがあり、これを「ヒンディー語」あるいは「対象」にすると、数字がアラビア文字になるのです。このなかには「アラビア語」という指定もあり、デフォルトではそれが指定されているのですが、それだとなぜか「インド数字」になり、逆に「ヒンディー語」に設定すると「アラビア数字」が出てくるのです。実をいうと、筆者の使用していたアラビア語版Windows
95+アラビア語版Office 97環境でも同じ現象が見られました。アラビア語で、アラビア文字の数字のことを「ヒンディー」とでもいうのでしょうか。
ペルシア語が打てない
Windows 2000ではペルシア語がどうやら打てないらしい。システム言語の設定のなかにペルシア語がないのです。かわりに「ファーシ語」というのがあります。ファーシというのは当然、Farsiでしょう。たぶんこれがペルシア語のはずです。ファーシ語を選ぶと、入力ロケールは自動的にアラビア語の101キーボードが選ばれます。ちなみにOffice
2000のほうには「ペルシア語」という設定があります。

いちおうファーシ語を選択しても、そしてOfficeでペルシア語を設定しても、残念ながらペルシア語を打てません。アラビア文字は打てるのですが、pとかgなどペルシア語特有の文字は入力できないようです。いや全部ためしたわけではないので、わからないのですが、とりあえず一般的な入力のしかたではペルシア語は打てませんでした。アメリカの経済制裁のせいといわけではないでしょうが、ファーシ語という表記からしてやる気のなさがうかがわれるでしょう(もちろんこれは日本語への翻訳の問題であって、オリジナルの2000の制作とは無関係です)。ただし、pやgなどのフォントがないわけではないと思います。これは、上述の数字の場合も同じなのですが、「挿入」のなかの「記号と特殊文字」による切り貼りは可能です。ただし、切り貼りした文字がキーボードで入力した文字ときちんと接合するかというとこれがしないわけです。なおペルシア語については、あまり真剣に調べていないので、また機会を見て、アップデートしていきたいと思います。なお思いあまってマイクロソフトのWindows
2000のニューズグループに投稿したのですが、何の音沙汰もありません。ものの見事に無視されました。しかし、その後RC2では、ペルシア語が打てるようになりました。ファーシ語もきちんとペルシア語と直されています。またペルシア語特有のハートをさかさまにしたような数字も打てるようになりました。

フォントが少ない
前にも書きましたが、アラビア語のフォントは非常に貧弱です。ナスフ系以外の装飾系がいくつかあればよかったんですが(ただしUnicodeのArialは論外。これは何とかしてもらいたいです)。それからフォントの問題として非常に大きいのが、一部のフォントでは母音記号をつけると、その記号が上下の文字と重なってしまう場合があるのです。これはきわめて読みづらいし、また見た目もよくありません。あとからインストールしたものを含め、かならずしも全部がそうなるわけではないので、今後は改善される可能性もあるとは思いますが。
入力しづらい
とくにアクセスのテーブル画面でアラビア語を入力しているときは、非常に入力しづらいのです。文字が入力した順番に左から右へ移動し、各文字がばらばらになって見えるからです。Enterを押した時点できちんと右から左へというかたちに表示されるのですが、入力するときはものすごくわかりにくいです。テーブル画面ではとくにそれを感じます。下の図は、テーブル画面ではありませんが、ちょっと見てください。出版社名のところが変になっているのがわかると思います。これはal-majma'を入力途中なのです。

これの問題点は、単に入力しづらいというだけではありません。途中でタイプ・ミスしたときにどっから直していいかわからなくなってしまうのです。
ミニチュア・アリフが打てない
アラブ人は、ミニチュア・アリフを使わないのでしょうか。アラビア語学習の教科書にはかならず載っているこの文字(記号)がキーボードから入力できないのです。たしかマックでもダメだったと思うのですが、ミニチュア・アリフの問題は、古典、言語研究者にとってはけっこうめんどうなことになるのかもしれません。でも、コーランを正確にキーボードから入力できないっつうのはまずいような気がするんですが。なお知り合いのアラブ人プログラマーによれば、コーランのCD-ROMなどでは一般に、コーランの文章を表示するのにテキストを使わず、グラフィックを使用するとのこと。その画像とテキストをリンクさせ(サーチャブル・イメージ)、あたかもテキストで検索しているように見せかけるのだそうです。
ユニコードにはいちおうこの文字(記号)が入っており、貼り付けることは可能です(U+0670)。しかし、きちんとミームの上やハーの上に置くことはできないようです。なお筆者の理解では、この文字(記号)は、従来の主要なアラビア語の文字コードには入っていなかったと思います。
さきほどRC2になってペルシア語が打てるようになったといいましたが、実はエザーフェのハムザが打てないのです。いやもしかしたら、打てるのかもしれませんが、小生の試したなかにはありませんでした。同様に、語尾につけるハムザ+イェもあいだにスペースを入れなければならないようです。
Access
2000で並べ替えができないと思ったらできたの話
さきほど並べ替えとか検索ができなければ、本当の意味でアラビア語を処理していることにはならないといいましたが、どういうわけかアクセス2000のデータで並べ替えができません。まだいろいろ試したわけではないので、はっきりしたことはいえませんが、実験用につくったデータで試してみたところ、昇順、降順ともうまくいきませんでした。下の図のふたつのケースはどっちがどっちだか忘れてしまいましたが、アラビア語の人名で並べ替えを行い、どちらかが昇順で、どちらかが降順なのです。まあどちも語順としては明らかに間違いです。


ところが実はこちらもできました。しかも簡単。できなかったのは単なる無知のせいでした。母音記号つきの場合はまだ試していないので完全に対応しているかどうかはまだわかりません。しかし、テーブルなどのデザイン画面でアラビア語を入れる項目でインデックスを設定すれば、きちんとアラビア文字の順番で並べ替えをおこなってくれます。これは、アクセスの重要な機能の1つであるデータアクセス・ページでも同じようにインデックスを設定すれば、並べ替えをしてくれます。ということは、データアクセス・ページを使えば、インターネットでアラビア語と日本語が混在したデータベースを簡単に作れるわけです。まだ試していませんが、なるべく早く結果を報告いたします。ちなみにアクセス以上に簡単にデータベースをインターネットに公開できる機能をもつFileMakerProでもWindows
2000上でアラビア語を無理やり入力することができます。ただし、NT4.0のサーバー上でアラビア語を入力したFMPのファイルを公開してもアラビア文字は文字化けしてしまいました。Windows
2000のサーバーで試してみていないのではっきりわかりませんが、もし可能であれば、多くの人たちが簡単にアラビア語のデータベースを使えるようになるでしょう。
選択機能が不完全
データベースのもう1つの重要な要素は選択です。これにも大きな問題があります。下の例は上と同じデータでサッダーム・フセインを検索し、選択しているところです。


一見すると、きちんと選択できているように見えますが、実はそれがくせものなのです。上のフィルタでの設定画面を見てください。これはarabicというフィールドにサッダームという単語を含むレコードを選択してこちと命令しているわけです。命令をして、その命令を実行すると下の図になる。当たり前の話ですが、上の画面でサッダームの語に母音記号やシャッダがついているにお気づきでしょうか。実は母音記号なしでは、きちんと選択してくれないのです。これはいいんだか、悪いんだかはっきりしません。つまり、母音記号つきの単語は母音記号をつけないと検索できないし、母音記号のついていない単語は、母音記号をつけると検索してくれないというわけです。一般論としていえば現時点では、Accessのデータベースで母音記号をつけるのはやめといたほうがいいでしょう。検索、選択についてはAccessだけではなく、Excelでも同じ症状が出ています。ただし、この場合もさきほどの並べ替えの場合と同じように簡単に直るのかもしれません。
右から左入力への未対応
日本語版Windows 2000に日本語版Office 2000を使用しているわけですから、中心になるのはつねに日本語です。アラビア語を混在させるといっても、基本的には日本語が主で、アラビア語が従の立場です。これを逆にするのは現時点では困難なようです。なぜならシステムとして右から左入力に完全に対応していないからです。ただし、どうしてもアラビア語を主とする文書ファイル(MS
Word)を作りたいという場合は、非常手段があります。つまりアラビア語版MS
Wordの文書テンプレートを使えばいいのです。これをOffice文書の新規作成の適当なところに適当な名前でいれて、アラビア語を主とする文書を書くときは、このテンプレートを呼び出すのです。Office
2000は各国版である程度の互換性がありますので、こういうことができるのです。ちなみにアラビア語版Wordで作ったファイルは、日本語のWord
2000でも読みこんだり、訂正したりすることができます。したがって、アラビア語Windows+アラビア語Word(97)でアラビア語を入力しておいて、その後、日本語Windows(95、98、NT、2000)+Word
2000で読みこんで、日本語を入力すれば、アラビア語と日本語を混在させることができるわけです(2000がなくても大丈夫ということ)。
実はWordはまだいいほうなのです。ExcelやAccessなどでは、いろいろ問題が発生しているようです。このページを公開してから、慶応大学大学院の阿久津正幸氏より、Excelでのアラビア語入力の問題について指摘を受けました。このページはWindows
2000の紹介がメインであって、Office 2000は二の次なのですが、けっこう深刻な問題ですので、阿久津氏の指摘を紹介しておきたいと思います。要するに、Excelでアラビア語を入力する際、本来のアラビア文字以外のものを入れると語順等がおかしくなるということです。具体的にいえば、たとえば括弧を入力すると、その括弧が入力した語順と関係ない場所に移動してしまうのです(同じセル内ですが)。
ここでわかると思いますが、()等が文末にくるとだめのようです。そのあとにまた単語がつづくときは大丈夫みたいです。いろいろ試してはいますが、例外はあるかもしれません。Accessでも同じ症状が出ます。たしかにExcelおよびAccessは右から左への言語には完全には対応していないと書いてありました。マイクロソフトの言い訳はこのことを指しているのでしょうか。

いろいろ試してみてはいるのですが、現在のところ解決策はみつかっていません。どなたかたご存知のかたがいらしたら連絡してください。
ふだん文字の入力にはワードだけを使っているので、気にもとめなかったのですが、たとえば、メモ帳でアラビア語を入力しようとすると、行の最後にピリオドすら打てないということになるのです。これではお世辞にも多言語対応とはいえないでしょう。ちなみにワードパッドでは大丈夫です。マイクロソフトには一刻も早くこの「バグ」を直していただきたいと切に願うしだいであります。もし、まったく修正に向かっての動きが見えないようなら、それなりの考えもあります。
その後、たまたまMicrosoft
Officeの多言語対応にかかわっている人の連絡先を見つけたので、このことについてたずねてみました。先方からの回答は次のとおりでした。
There is a way to force Japanese Excel to try to edit Arabic better, as well as make it show the same sorts of direction buttons for cells and the worksheet that Word has for paragraphs and documents, but it is not recommended if you want to continue having full support for Japanese in Excel. If you want to experiment, try setting this registry key. (If you are not comfortable editing the registry, please do not attempt this). Look for this key and set the value to 401 (in hexadecimal)
HKEY_CURRENT_USER\Software\Microsoft\Office\0.0\Common\LanguageResources\Exe
Mode
Now restart Excel. In the Format toolbar, you should now see some buttons that control the direction of cells and worksheets.
To restore things to normal, either set the value to 411 (Japanese), or simply run Start/Programs/Microsoft Office Tools/Microsoft Office Language Settings and modify any setting. This tool will restore your language settings to the officially supported configuration.
といわけで、レジストリをいじれば、可能性があるとのこと。今のところ原稿を多数かかえているので、しばらくコンピュータを壊すことが怖いため、どなたか試して、結果を教えていただければ幸いです。こちらでもなるべく早く実験結果をご報告したいと思っています。
でもまあ、PC環境では現状まともにアラビア文字を入力できるのはWord
2000だけといっていいでしょう。これだけでも大きな進歩といえるでしょう。エクセルやアクセスなど他のOffice製品でのアラビア文字の入力はこれらがきちんとUnicode、とりわけ右から左に入力する言語に対応するまでは、相当な苦労をかけられると思います。当面は、Wordでタブを入れたり、CSV形式にしながら入力して、あとでエクセルやアクセスに貼り付けるという方法が無難かもしれません。 しかし、まだまだ問題点があるとはいっても、Windowsでアラビア文字が入力できるようになったというのは、画期的といえるでしょう。とくに一部のアラビア語のソフトが日本語のWindows上でも動くようになったことはほんとうに感動的です。筆者にとっては、とりわけハヤートというロンドンで発行されているアラビア語の新聞のCD-ROM版が日本語Windowsで読めるようになったことが大きいです。これは、文字コード自体はUnicodeではなく、Windowsのアラビア語文字コードを使っているのですが、検索システムにHTMLとJavaScriptというきわめて汎用性の高いものを使っているため、日本語システム上でもとくに問題なく利用ができるのです。これで、ハヤートをIE5.0で検索しながら、同じ画面で日本語の原稿を書くことができるわけです。
|