カスタマーフィードバックから見えたこと
先にご紹介しましたカスタマー・フィードバック機構で、ユーザーが実際にどういうことに困っているのか、また実際に使用されている日本語はどんなものか、がわかります。
以下、IME 2003のデータから見えたことから、具体的な例を挙げてご説明します。
ユーザーニーズの実際
l ユーザーの痛み: ユーザ登録単語には、専門用語、とりわけ入力の難しい用語が多いことがわかりました。ユーザ登録単語は、標準辞書に収録されていない語彙で、各ユーザにとって必要な語彙が集まります。広範囲の語彙にバラけるであろうという予測どおりでした。上位を観察すると、入力の難しい語彙が多く見られます。ユーザー・フィードバック・データが、実際にユーザの痛みを優先度付きで示しているといえます。
l ソフトウェアの問題
Ø ユーザ登録単語には人名が多いことがわかりました。IMEでは多くの人名を、「人名地名辞書」に収録しています。しかし、調査によると、人名地名辞書で既にサポートしているのにユーザは登録しているケースが多いことが分かりました。標準辞書以外の付加辞書は、あってもユーザには使いにくいことが分かったのです。
Ø ユーザ登録単語には、長い定型表現が短い一部の読みで登録されることが多いことがわかりました。入力の生産性ということにユーザは強い関心を持っていることがわかります。
l ユーザの好み: ユーザ登録単語には、顔文字が多いことがわかりました。メールでコミュニケーションすることが多くなっています。そのとき、顔文字という感性的なコミュニケーションを人は本能的に望んでいることがわかります。
日本語の実際
l 語彙: 単語登録データや誤変換レポートから、以下のようなことがわかりました。
Ø 入力の難しい用語: ユーザは、入力する際に IME の辞書に単語がないために入力するのが面倒な語彙などを登録します。したがって、登録単語の統計には、ユーザの語彙に関する問題がその深刻さとともに表現されます。例: 抗鬱、褥瘡(じょくそう)。
Ø 実世界の重要単語
² IME の標準辞書は、従来、言語統計からシステム基本辞書に収録する単語を選んできました。が、お客様のフィードバックを活用することで、従来の言語統計では拾えなかったが、実は人々が日常頻繁に使用している実世界の重要語彙というものを選ぶことができるようになりました。例:離席、角印、円印。
² また、擬態語が多いこともわかりました。例: 「でろでろに酔う」「ピッカピッカに光る」
Ø 新しい外来語
² 社会がグローバル化するにつれて、新しい概念がコミュニケーションに必要となります。最近の日本語は、特に、外来語をカタカナ語でそのまま表記して語彙として取り込む傾向が顕著です。また新しい漢字の訳語も登場しています。例:プロキュアメント、高可用性、リカバリす(る)、カテゴライズす(る)、スケーラビリティ、メッセージング。
² 外来語はサ変名詞ないし形容動詞となることがあります。「サバイバルな」「ダークな」は、形容動詞化した外来語のケースです。「エロい」は、外来語を短縮したうえで、形容詞化したケースです。「キャンセルった」はラ行五段活用連用形に模された用法でしょう。
Ø 短縮語、略語: 日本語の特徴として、新しい単語が生まれやすいということが言えます。外来語は日本語の音韻体系で表記すると間延びし、短いほうが使いやすいため、短縮した新しい単語がつくられやすいといえます。古くはパソコンが良い例です。また、漢字は意味を取りやすい表記なので、それを組み合わせることで新しい単語も生み出されてきました。例: 社販、社食、ディスコン、取説。
Ø 新しい語彙
² 日本語は、いまでも進化しています。例: ばらけ(る)、うざ(い)、びび(る)、ぐぐ(る)、食いっぱぐれ(る)、しば(く)、超(副詞)。
² 日本語は、漢字、ひらがな、カタカナ、ローマ字、と文字種が多様で、表記に自由度が大きいことが顕著な特徴です。最近のメールやチャットなどのコミュニケーションでは、「ケータイ」など漢字の単語を仮名表記したり、カタカナ語をわざとひらがなで表記したりなどして、表現効果を高める傾向があります。つまり、日本語の表記の多様さはますます強まっています。
Ø 特有な読みの人名: 日本語は、漢字を借りて、読みを表現したり(典型は当て字)、意味を表現する(典型は訓読み)ことを行ってきました。これは文化的特徴です。現代でも、これは広く行われていて、顕著なのは人名です。例:岳大(たけひろ)、心咲(みさき)。
l 口語的な表現: 誤変換レポートから、たとえば、以下のような日本語の実際とその傾向が見えました。
Ø 口語的な仮名遣い: 「りょーかい」「ケータイ」「まー」「ふつー」「あーゆー」に見られるように、実際の生活での書き言葉は、規範とされる仮名遣い(長音の表記)から逸脱した表現が、意図的に行われています。
Ø 撥音化、促音化:
² 「ですもんね」「やってらんねーよそんなん」など、砕けた表現では、撥音化が多いことがわかります。
² 「大っ嫌い」など感情を強調するため、促音が使われます。
Ø 助詞抜き、「い抜き」
² 古くは、主格や体格は助詞抜きでした。現代では書き言葉では助詞を明示する用法が普通ですが、実際の口語では「それ除く」「ビデオ撮る」「その気ない」「言いたいこと言ってない」など、現代でも助詞抜きが支配的です。
² 「使われてた」「出てない」ように、「い」を省略した言い方が行われます。
Ø 口語的な付属語
² 「いるですか」など、丁寧な断定を表現する助動詞「ます」の代わりに、通常体言と一部の助詞にしかつかない「です」が用言の終止形に接続したりもします。
² 「け」も「か」も、疑問の終助助詞で、「できっけ」「できっか」などと使われます。「け」は通常学校文法に登場さえしませんが、実世界では登場します。「け」は「か」から派生したようですが、さらに「そうだっけか」という用法があることがわかります。
² 本来、「ぽい」は状態をあらわす特定の体言に付いて、「熱っぽい」などと使われました。しかし実際には、「シナリオっぽい」などといろいろな名詞に付き、「懐かしいっぽい」、「悪いっぽい」など用言の終止形に付く用法も見られます。
² 「手をつないじゃお」の「じゃお」などは、学校文法には登場しない付属語です。「でしまおう」からきたようです。
² 学校文法では「て」は接続助詞とされますが、「これって」のように、促音便を伴う「て」が提題助詞として機能します。
² 「いいっちゃいい」。「ちゃ」も学校文法には登場しません。
このように、カスタマーフィードバックは、現実を豊かに表現しています。IME チームはこれらを踏まえて、機能設計や変換エンジンのチューニングを行っています。
佐藤良治