こんにちは、コミュニケーション・ファシリテーターの山下えりかです。ご訪問ありがとうございます。
今月(2024年5月)、Open AIからGPT-4oがリリースされ、ChatGPTの性能が大幅アップデートされました。GPT-4oについては既に様々なレビューが出ていて、どれもとても興味深く拝見しています。
中でも私の興味範囲はやはりChatGPTの通訳の精度です。今回は昨年(2023年)10月に音声会話機能がリリースされた際に公開したChatGPTの通訳動画と、最新版のGPT-4oで試した通訳動画を比較し、この数ヶ月間でどれほど進化したのかを整理します。
関連記事:2023/10/15 【AI通訳】ChatGPTが優秀な通訳になる魔法の言葉と新機能(プロンプト&音声会話の設定方法)
✔ GPT-4 vs GPT-4o 通訳比較動画
言葉で説明をする前に、実際にパフォーマンスがどれほど違うのか、こちらの動画をご覧ください。
✔ GPT-4oがすごい4つのポイント
7ヶ月前と比較して今回大きく改善されたと感じるのは次の4点です。
1.長く詳細なプロンプト不要
2.反応速度向上(3秒ルール)
3.音声認識機能の向上
4.翻訳精度の向上
以下、それぞれの点について解説します。
1.長く詳細なプロンプトは不要
まず驚いたのは、7ヶ月前には長々と詳細なプロンプトを書かなければまともに通訳できなかったChatGPTが、今回のアップデートにより簡単な呼びかけで十分通訳の役割を果たせるようになっていたことです。
ちなみに今回のプロンプトはこちら。
通訳をしてください。英語は日本語に、日本語は英語に翻訳してください。
これだけで、GPT-4oは通訳をしてくれます。
7ヶ月前にChatGPTの音声会話機能がリリースされた直後、私はChatGPTで通訳をするためのプロンプト(指示)の書き方を研究しました。当時試行錯誤して辿り着いたプロンプトがこちらです。
あなたはプロの優秀な日本語と英語の通訳者です。
英語の入力を日本語に翻訳してください。日本語の入力を英語に翻訳してください。
質問の入力があった場合は質問を翻訳してください。
翻訳には丁寧な表現を使ってください。
翻訳以外の言葉は付け加えないでください。
このようなプロンプトになった理由は次の通りです。
1.プロンプトは詳細かつ具体的でなければいけない。
2.ChatGPTは基本的に英語ベースで情報を処理するため、「機械翻訳で正確な英語にできる日本語」を書く必要がある。
例)英語の入力を日本語に翻訳してください。日本語の入力を英語に翻訳してください。
ただ「英語を日本語に」ではなく「英語の入力 (input)」という具体的な表現を使いました。またあえて「翻訳」としたのは、英語で"translate"と確実に認識させるためです。
3.当時は途中から最初の指示を忘れて通訳ではなく普通に返答してしまうことがあった。
例)質問の入力があった場合は質問を翻訳してください。翻訳以外の言葉は付け加えないでください。
せっかく考えたプロンプトだったのになぁ...と思わなくもありませんでしたが、この手間が省けてChatGPTを気軽に通訳として使えるのはありがたいことです。
2.反応速度向上(3秒ルール)
GPT-4oは音声会話機能の反応速度が大幅に向上しました。これは通訳機能に限らず音声会話機能全般で注目されている点です。
7ヶ月前の動画を確認すると、音声入力を終えてから音声通訳が始まるまで10秒から14秒かかっていました。今回は英語から日本語、日本語から英語のどちらも3秒ほどで通訳が始まります。
逐次通訳の場合、話者が話し終わってから通訳者が訳出を始めるまでの理想の時間は3秒と言われています。ChatGPTはこの「3秒ルール」にも対応できるようになっています。現役の通訳者としてこれを脅威に感じないわけではありませんが、ただただ「すごいなぁ」と感心しています。
3.音声認識機能向上
音声認識の精度も向上しています。前回公開した動画では、音声認識、つまり聞き取り・書き取りの部分でミスがあったため、その箇所が正しく翻訳されないということがありました。
例えば冒頭のこの部分です。
〇 対話型AI ChatGPTの生みの親
X 対話型AI ChatGPTの海野洋や
今回はこのような聞き取り・書き取りのミスが全くなく、入力した日本語も英語も完璧に認識できていました。音声会話のスムーズさが増したのにも頷けます。
4.翻訳精度向上
最後に、翻訳の精度についてです。前回公開した動画の翻訳と今回の翻訳内容を比べてみると、やはり今回の方が翻訳精度が上がっていると感じます。前回は「丁寧な表現を使ってください」と指示していたにも関わらずです。
【GPT-4】
Interactive AI ChatGPT’s Hiroshi Unno and open AI CEO Sam Alman visited Japan and had a discussion with students at Keio University in Minato-ku, Tokyo about the potential of artificial intelligence.
【GPT-4o】
Sam Altman, the CEO of Open AI, and the creator of interactive AI, ChatCPT, visited Japan and exchanged views with students on possibilities of artificial intelligence at Keio University in Minato Ward, Tokyo.
【GPT-4】
確かに私には多くの言語を理解しているように感じます
確かに役立つことができます
複雑でニュアンスのあるトピックや
それらがどのように組み合わさっているかを理解するように見えます
【GPT-4o】
確かに、多くの言語を理解しているように感じます
それは確かに役に立つことができ
かなり複雑で微妙な話題やその関連性を理解しているように思います
並べてみると微妙な違いではありますが、以前よりも聞きやすい内容になっているなと感じます。
おわりに
前回ChatGPTの通訳機能について動画と記事を書いてからたったの7ヶ月。ChatGPTをはじめとする生成AIの進化のスピードは益々加速しています。
日々生成AIを使っていて感じるのは、AIの進化は間違いなく私たち通訳者の仕事に多大な影響を及ぼすという一方で、AIを使いこなすためには言葉を仕事にする者のスキルは大いに役立つものであるということ、そして今後それは新しい時代の新たな価値となっていくだろうということです。
AIの進化すべてを網羅することは難しいですが、これからもコミュニケーションの専門家という視点から、楽しみながらこのトレンドを追いかけて行きたいと思います。
次の記事:AI翻訳時代の通訳需要と必要スキル(上)
前の記事:緊張させない通訳指導と恩送り◆サイマル・アカデミーでの経験と私の指導方針
【関連記事】
- AIで通訳の仕事はなくなる?AIとの共生時代と進化系通訳の可能性
- AI時代は可能性の時代◆個の力と自分の価値の創生
- 通訳の技術と経験をフル活用!コミュニケーション・ファシリテーターという生き方
- 通訳の新しいカタチ◆コミュニケーション・ファシリテーターのスキルと仕事内容
- 現役通訳者がポケトークライブ通訳(同時通訳)を使ってみた感想&デモ動画◆精度と可能性を考える
- ポケトークライブ通訳(同時通訳)の英訳精度がグッと上がる日本語の使い方◆現役通訳者が教える機械翻訳を使うための国語力
- ChatGPTが優秀な通訳になる魔法の言葉と新機能(プロンプト&音声会話の設定方法)
コメントやご質問はお問い合わせページからお願いします。
【About Erika】
職業:英語同時通訳者(個人/フリーランス)
現住所:札幌市
留学歴:3年(アメリカ)
特技:柔道(初段)、ピアノ(弾き語り)
趣味:料理、お菓子作り、食器屋巡り