2006年7月15日土曜日

Alfresco 日本語環境での導入方法

先日のエントリでも触れましたが、Alfrescoを日本語環境で利用するためには、いくつかの設定作業が必要になります。



  1. メッセージの日本語化(=ランゲージパックの導入)


  2. ログイン画面の言語選択欄に日本語を追加


  3. 検索文字列の最小長を変更


  4. Luceneの日本語対応版導入


あたりが、必須となる作業になります。



1.のメッセージについては、先日のエントリのリンクから最新版のランゲージパックをダウンロード、解凍し、alfresco/tomcat/shared/classes/alfresco/messages フォルダへコピーするだけで完了します。



2.と3.の設定は、alfresco/tomcat/shared/classes/alfresco/extension/web-client-config-custom.xml.sampleを編集して行います。このxmlファイルのルート要素は<alfresco-config>ですがその直下に<config evaluator="string-compare" condition="Languages">という要素がありますのでさらにその下の<languages>に

<language locale="ja_JP">Japanese</language>

を追加することでログイン画面で日本語が選択できるようになります。
さらに別の<config>要素を追加し、

<config>
  <client>
    <search-minimum>2</search-minimum>
  </client>
</config>

とすることで、検索時に2文字の単語での検索が可能になります。デフォルトでは英語圏の発想から3文字以上のキーワードしか受け付けないようになっています。最後に、web-client-config-custom.xml.sampleの最後の.sampleを取り除いたweb-client-config-custom.xmlという名前で保存することを忘れないで下さい。



4.についてですが、AlfrescoはJavaベースのオープンソース検索エンジンであるLuceneを利用しています。デフォルトではたとえutf8を利用していても日本語コンテンツのインデクシングには対応していません。そこで、lucene-jaというローカライズ版を利用し、形態素分析を活用するJapaneseAnalyzerか二文字区切りで機械的にインデクシングする(その代わり中国語や韓国語にも対応できる)CJKAnalyzerを利用することになります。
どちらも利用可能ですが、辞書の設定などが不要なCJKAnalyzerの方が簡単です。lucene-ja.jarをalfresco/tomcat/webapps/alfresco/WEB-INF/libにコピーし、alfresco/tomcat/webapps/alfresco/WEB-INF/classes/alfresco/model/dataTypeAnalyzers.propertiesを編集します。例えば、

d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.standard.StandardAnalyzer

となっているところを、

d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.cjk.CJKAnalyzer

とします。バージョン1.3からは原則的にこれらの設定変更はwebapps/alfrescoフォルダよりも上の階層でwarパッケージの内部を編集せずに行えるようにする方針になっていますが(messagesフォルダ等のあるsharedというのがそのためのスペースです)、このあたりに関してはまだ対応出来ていません。



以上の作業を行うことで、Alfrescoの日本語化は一応完了します。
# また、ある種のバッドノウハウとして.exeの1ファイルインストーラーは日本語名のフォルダの下では動作しないため、Cドライブ直下などに移してから実行する必要があります。よく引っかかる点なので、本筋とはずれますがメモとして記載しておきます。



(文責 Ishii Akinori)