メインコンテンツへスキップ

概要

Claudeは堅牢な多言語機能を実証しており、特にゼロショットタスク全体で言語間で強いパフォーマンスを発揮しています。このモデルは、広く話されている言語と低リソース言語の両方にわたって一貫した相対的なパフォーマンスを維持しており、多言語アプリケーションの信頼できる選択肢となっています。 Claudeは以下でベンチマークされた言語を超えて多くの言語に対応していることに注意してください。特定のユースケースに関連する言語でのテストをお勧めします。

パフォーマンスデータ

以下は、異なる言語にわたるClaude 4、Claude 3.7 Sonnet、Claude 3.5モデルのゼロショットチェーンオブソートの評価スコアであり、英語のパフォーマンス(100%)に対する相対的なパーセンテージで表示されています:
言語Claude Opus 41Claude Sonnet 41Claude Sonnet 3.7 (deprecated)1Claude Haiku 3.5
英語(ベースライン、100%に固定)100%100%100%100%
スペイン語98.0%97.5%97.6%94.6%
ポルトガル語(ブラジル)97.3%97.2%97.3%94.6%
イタリア語97.5%97.3%97.2%95.0%
フランス語97.7%97.1%96.9%95.3%
インドネシア語97.2%96.2%96.3%91.2%
ドイツ語97.1%94.7%96.2%92.5%
アラビア語96.9%96.1%95.4%84.7%
中国語(簡体字)96.7%95.9%95.3%90.9%
韓国語96.4%95.9%95.2%89.1%
日本語96.2%95.6%95.0%90.8%
ヒンディー語96.7%95.8%94.2%80.1%
ベンガル語95.2%94.4%92.4%72.9%
スワヒリ語89.5%87.1%89.2%64.7%
ヨルバ語78.9%76.4%76.7%46.1%
1 拡張思考を使用。
これらのメトリクスは、MMLU(Massive Multitask Language Understanding)英語テストセットに基づいており、OpenAIのsimple-evalsリポジトリに記載されているように、プロの人間翻訳者によって14の追加言語に翻訳されています。この評価に人間翻訳者を使用することで、特にデジタルリソースが少ない言語にとって重要な高品質の翻訳が保証されます。

ベストプラクティス

多言語コンテンツを扱う場合:
  1. 明確な言語コンテキストを提供する:Claudeはターゲット言語を自動的に検出できますが、目的の入出力言語を明示的に述べることで信頼性が向上します。流暢さを向上させるために、Claudeにネイティブスピーカーのように「慣用的な話し方」を使用するようにプロンプトすることができます。
  2. ネイティブスクリプトを使用する:最適な結果を得るために、音訳ではなくネイティブスクリプトでテキストを送信してください
  3. 文化的コンテキストを考慮する:効果的なコミュニケーションには、純粋な翻訳を超えた文化的および地域的認識が必要です
また、Claudeのパフォーマンスをより向上させるために、一般的なプロンプトエンジニアリングガイドラインに従うことをお勧めします。

言語サポートに関する考慮事項

  • Claudeは、標準的なUnicode文字を使用するほとんどの世界言語で入力を処理し、出力を生成します
  • パフォーマンスは言語によって異なり、広く話されている言語で特に強い機能があります
  • デジタルリソースが少ない言語でも、Claudeは意味のある機能を維持しています