感情分析とオピニオン マイニングの言語サポート

この記事では、感情分析とオピニオン マイニングでサポートされている言語について説明します。 クラウドベースの API および Docker コンテナーはどちらも同じ言語をサポートしています。

感情分析の言語サポート

サポートされている言語コードの総数: 94

Language 言語コード メモ
アフリカーンス語 af
アルバニア語 sq
アムハラ語 am
アラビア語 ar
アルメニア語 hy
アッサム語 as
アゼルバイジャン語 az
バスク語 eu
ベラルーシ語 (新規) be
ベンガル語 bn
ボスニア語 bs
ブルトン語 (新規) br
ブルガリア語 bg
ミャンマー語 my
カタロニア語 ca
簡体中国語 zh-hans zh も可能
繁体中国語 zh-hant
クロアチア語 hr
チェコ語 cs
デンマーク語 da
オランダ語 nl
English en
エスペラント語 (新規) eo
エストニア語 et
フィリピン語 fil
フィンランド語 fi
フランス語 fr
ガリシア語 gl
ジョージア語 ka
ドイツ語 de
ギリシャ語 el
グジャラート語 gu
ハウサ語 (新規) ha
ヘブライ語 he
ヒンディー語 hi
ハンガリー語 hu
インドネシア語 id
アイルランド語 ga
イタリア語 it
日本語 ja
ジャワ語 (新規) jv
カンナダ語 kn
カザフ語 kk
クメール語 km
韓国語 ko
クルド語 (クルマンジー) ku
キルギス語 ky
ラオス語 lo
ラテン語 (新規) la
ラトビア語 lv
リトアニア語 lt
マケドニア語 mk
マダガスカル語 mg
マレー語 ms
マラヤーラム語 ml
マラーティー語 mr
モンゴル語 mn
ネパール語 ne
ノルウェー語 no
オディア語 or
オロモ語 (新規) om
パシュトウ語 ps
ペルシャ語 fa
ポーランド語 pl
ポルトガル語 (ポルトガル) pt-PT pt も可能
ポルトガル語 (ブラジル) pt-BR
パンジャーブ語 pa
ルーマニア語 ro
ロシア語 ru
サンスクリット語 (新規) sa
スコットランド・ゲール語 (新規) gd
セルビア語 sr
シンド語 (新規) sd
シンハラ語 (新規) si
スロバキア語 sk
スロベニア語 sl
ソマリ語 so
スペイン語 es
スンダ語 (新規) su
スワヒリ語 sw
スウェーデン語 sv
タミル語 ta
テルグ語 te
タイ語 th
トルコ語 tr
ウクライナ語 uk
ウルドゥ語 ur
ウイグル語 ug
ウズベク語 uz
ベトナム語 vi
ウェールズ語 cy
西フリジア語 (新規) fy
コーサ語 (新規) xh
イディッシュ語 (新規) yi

オピニオン マイニングの言語サポート

サポートされている言語コードの総数: 94

Language 言語コード メモ
アフリカーンス語 (新規) af
アルバニア語 (新規) sq
アムハラ語 (新規) am
アラビア語 ar
アルメニア語 (新規) hy
アッサム語 (新規) as
アゼルバイジャン語 (新規) az
バスク語 (新規) eu
ベラルーシ語 (新規) be
ベンガル語 bn
ボスニア語 (新規) bs
ブルトン語 (新規) br
ブルガリア語 (新規) bg
ミャンマー語 (新規) my
カタロニア語 (新規) ca
簡体中国語 zh-hans zh も可能
繁体中国語 (新規) zh-hant
クロアチア語 (新規) hr
チェコ語 (新規) cs
デンマーク語 da
オランダ語 nl
English en
エスペラント語 (新規) eo
エストニア語 (新規) et
フィリピノ語 (新規) fil
フィンランド語 fi
フランス語 fr
ガリシア語 (新規) gl
ジョージア語 (新規) ka
ドイツ語 de
ギリシャ語 el
グジャラート語 (新規) gu
ハウサ語 (新規) ha
ヘブライ語 (新規) he
ヒンディー語 hi
ハンガリー語 hu
インドネシア語 id
アイルランド語 (新規) ga
イタリア語 it
日本語 ja
ジャワ語 (新規) jv
カンナダ語 (新規) kn
カザフ語 (新規) kk
クメール語 (新規) km
韓国語 ko
クルド語 (クルマンジー) ku
キルギス語 (新規) ky
ラオ語 (新規) lo
ラテン語 (新規) la
ラトビア語 (新規) lv
リトアニア語 (新規) lt
マケドニア語 (新規) mk
マダガスカル語 (新規) mg
マレー語 (新規) ms
マラヤーラム語 (新規) ml
マラーティー語 mr
モンゴル語 (新規) mn
ネパール語 (新規) ne
ノルウェー語 no
オリヤー語 (新規) or
オロモ語 (新規) om
パシュトゥー語 (新規) ps
ペルシア語 (新規) fa
ポーランド語 pl
ポルトガル語 (ポルトガル) pt-PT pt も可能
ポルトガル語 (ブラジル) pt-BR
パンジャーブ語 (新規) pa
ルーマニア語 (新規) ro
ロシア語 ru
サンスクリット語 (新規) sa
スコットランド・ゲール語 (新規) gd
セルビア語 (新規) sr
シンド語 (新規) sd
シンハラ語 (新規) si
スロバキア語 (新規) sk
スロベニア語 (新規) sl
ソマリ語 (新規) so
スペイン語 es
スンダ語 (新規) su
スワヒリ語 (新規) sw
スウェーデン語 sv
タミル語 ta
テルグ語 te
タイ語 (新規) th
トルコ語 tr
ウクライナ語 (新規) uk
ウルドゥー語 (新規) ur
ウイグル語 (新規) ug
ウズベク語 (新規) uz
ベトナム語 (新規) vi
ウェールズ語 (新規) cy
西フリジア語 (新規) fy
コーサ語 (新規) xh
イディッシュ語 (新規) yi

多言語オプション (カスタム感情分析のみ)

カスタム感情分析を使うと、1 つの言語でモデルをトレーニングし、別の言語でドキュメントを分類するために使用できます。 この機能は、時間と労力の節約に役立つので便利です。 すべての言語に対して個別のプロジェクトを構築する代わりに、1 つのプロジェクトで多言語データセットを処理することができます。 データセットが完全に同じ言語である必要はありませんが、作成時に、または後でプロジェクトの設定で、プロジェクトの多言語オプションを有効にする必要があります。 評価プロセス中に特定の言語でモデルのパフォーマンスが低い場合は、それらの言語のデータをトレーニング セットに追加してください。

英語のドキュメントを使用してプロジェクト全体をトレーニングし、フランス語、ドイツ語、標準中国語、日本語、韓国語などでクエリを実行できます。 カスタム感情分析により、多言語テクノロジを使用してモデルをトレーニングすることで、プロジェクトを複数の言語に簡単に拡張できます。

特定の言語が他の言語と同じように実行されていないことを確認するたびに、その言語のより多くのドキュメントをプロジェクトに追加できます。

すべての言語で同じ数のドキュメントを追加することは求められていません。 プロジェクトの大部分は 1 つの言語でビルドする必要があります。また、あまりうまく実行されていないと考える言語では、いくつかのドキュメントのみを追加するようにします。 主に英語であるプロジェクトを作成し、フランス語、ドイツ語、およびスペイン語でのテストを開始した場合、ドイツ語が他の 2 つの言語と同様に実行されないことがわかります。 その場合は、元の英語のドキュメントの 5% をドイツ語で追加し、新しいモデルをトレーニングし、ドイツ語でもう一度テストを行うことを検討してください。 ドイツ語のクエリで、より良い結果が得られます。 追加するラベル付けされたドキュメントが多いほど、結果が改善される可能性が高くなります。

別の言語でデータを追加することで他の言語に悪影響を及ぼすことはないはずです。

次のステップ