ここから本文です
原則として「聖書でドイツ語」では、Luther 2017と新共同訳を使い、2018年12月からは聖書協会共同訳も利用しています。

書庫翻訳

副業の英語・ドイツ語翻訳や、誤訳記事の指摘など。
記事検索
検索

全76ページ

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11]

[ 次のページ ]

雑誌「英語教育」の今年の連載の1つに、「AI技術と外国語学習の未来」(川添愛、元国立情報学研究所特任准教授、作家)がある。
他の連載にも興味を持ったので、今年度は定期購読にした。

6月号の第3回は、「機械翻訳の現状と展望(前編)」で、ニューラルネットワークを利用した機械翻訳を取り上げている。

説明内容は、主に中澤敏明「機械翻訳の新しいパラダイム」、情報管理、vol. 60, No.5, pp. 229-306 に基づいている(記事末尾の引用では、「vol. 6」と誤記がある)。
この論文はフリーアクセスなので、次のリンクで確認してほしい。
doi.org/10.1241/johokanri.60.299

ニューラル機械翻訳(NMT)では、Google 翻訳が事例として取り上げられることが多い。
著者が試した日英翻訳の例では、驚くほど自然で実用的な翻訳が出力されている。

しかし一方では、「奇妙な凡ミス」という不思議な特徴も持つ。
平昌オリンピックでのノルウェー代表団に起きた、卵の発注数の誤訳の例が紹介されている。
1,500個の卵を注文するために Google 翻訳で韓国語にしたところ、一桁多い 15,000個の卵が届いたという。

この誤訳騒動を伝える BBC の記事は次のリンクから。
www.bbc.com/news/world-europe-42978915

この BBC の記事では、1,500 と 15,000 が韓国語でどのように異なるかも示している。
数字のままであれば、一桁違うことに気づいたかもしれない。
しかし、ターゲット言語の知識がないと、出力結果が正しいかどうかを判断できないため、誤訳を放置してしまう。

このような単純ミスが起きるのは、NMTの手法に起因している。
単語を数百の実数値からなる列のベクトルに変換して計算している。
各単語の数値列から文の数値列が計算され、それをもとにして訳文の単語の数値列を出力する。
数値計算であるため、原文のどの部分が訳文に反映されているのか、解釈することが困難になっている。
卵の数が一桁増えたとしても、「原因不明」としか言えない可能性もある。

また、NMTの特徴として、よく知られているが、入力された原文が過不足なく翻訳される保証はなく、重複訳や訳抜けの発生がある。

「AIが発達すれば、外国語の勉強をしなくてすむ」という言説が広まりつつあるようだが、このようなNMTの現状をまず踏まえてから、次回の後編も読んで、これからの外国語学習について考えてほしいものだ。

開くトラックバック(0)

定期購読している「通訳翻訳ジャーナル」2019年春号が届いた。
書店では明日21日発売だが、いつも1日前に郵便で届くので、少し得した気分だ。

そして今回の号の特集は、
今もこれからも、求められる人材になるために 
−「通訳者・翻訳者がやるべきこと
http://tsuhon.jp/book/7290

私が関わる翻訳分野では、やはり最近話題の機械翻訳への対応が挙げられている。
実際に英日特許翻訳では、機械翻訳+ポストエディットのプロジェクトに参加しているので興味がある。
これから特許翻訳に取り組もうという翻訳者もいるので、今後の予測と共に、読むべき記事だと思う。

本日読んだのは次の2つ。
1) 井口耕二 「道を拓く 何をどう考え、どちらに進むべきなのか」
2) 河野弘毅 「機械翻訳の時代に活躍できる人材になるために」

1) については、執筆者のブログでも紹介している。
buckeye.way-nifty.com/translator/2019/02/post-0853.html

他の媒体と同様に、この記事でも機械翻訳に対する私見が書かれている。
「自分の道は自分で選ぶ」ということで、機械翻訳を使わないことを選んでいるのであって、他の翻訳者が有名翻訳者の私見をそのまま信じ込むことがないことを祈りたい。

機械翻訳を選ばなかった理由として、本当のところはわからないとしながらも、「MTの出力文を読み続けると言語感覚が狂う、という意見もある」と紹介している。

この「言語感覚が狂う」ということについて、データがないためわからないとしながらも、「私は狂うはずだと思っているが、意外なほど狂わないのかもしれない。」と書いており、機械翻訳に反対している人たちのような断言は避けているようだ。

それでも、「翻訳メモリーさえ使わないのだから、機械翻訳を使うことはありえない。… 機械翻訳のおかしな出力文を大量に読んで言語感覚が狂ったら致命的だとも思っている。」と書いている。

また、記事の冒頭にあるように、「MT+PEも(実際のところどうかは別として)コストダウンの口実になるので業界がMT導入に流れていくのは避けられないだろう。」ともある。

機械翻訳の導入による影響については、機械翻訳を使うことを選んだ人たちが行えばよいということなのかもしれないが、翻訳業界が可能な限りまとまって、学術的に研究し、そして翻訳者の育成も含めて、取り組むべきではないだろうか。

2) は、実際に機械翻訳を利用している人の記事なので、これから取り組もうとする翻訳者には有益だろう。

機械翻訳は今後も性能の向上が続くと考えられ、最近は大量の言語データの対訳コーパスが得られなくても、高い翻訳性能を実現する技術が研究されている。

また、アダプディブな機械翻訳エンジンという新技術では、ニューラル機械翻訳エンジンに追加のトレーニングを施して、個別の領域に特化してMTの性能を改善しようとしている。

機械翻訳の利用については、様々な立場の人が情報を発信しているが、どの情報も鵜呑みにすることなく、発言者の立場や意図に注意する必要もある。

人間と機械が役割分担するという新しい働き方に対応するとしても、それでも高い翻訳能力を有する人材が必要だ。
ただし、現在のような翻訳者の仕事とは変わるかもしれない。
アダプディブな機械翻訳エンジンを最適化するには、機械に学習させる対訳データの内容を吟味したり、パラメーターを調整するなど、翻訳者の経験をベースとした新しい職種が生まれるかもしれない。


私は、作業の効率化が実現できるならば、機械翻訳を積極的に利用したいと考えている。
ポストエディットが面倒な場合もあるが、それでも10%〜20%の効率化が実現している。

また、機械翻訳の導入によって、特許技術内容を理解せずになんとなく翻訳をしている人や、誤訳を指摘しても直さない人、推敲せずに納品してしまう人などは、翻訳業界から退場することになるかもしれない。

日々の業務で忙しいが、英語・ドイツ語がわかる化学者として、これからも活躍できるように努力しよう。

開くトラックバック(0)

私は大学で有機化学の研究をしたため、ドイツ語の論文や専門書を読む必要があった。
そのため、現在は、英語・ドイツ語の両方で翻訳の仕事ができるようになった。

しかし、日本では、ドイツ語はマイナー言語の扱いとのことで、ドイツ語翻訳者は足りない。
様々な機会を利用して、英語翻訳者に対して、ドイツ語翻訳に参入するように促してみたが、なかなか増えない。
フリーランスの登録翻訳者を募集しても、
既に他社で専属となっているのか、一緒に仕事ができる人が、なかなか見つからない。

トライアル課題で大丈夫そうだと思っても、実際に依頼してみると、特許の技術内容が正確に理解できていないことに加えて、勘違いやケアレスミスが多い人もいる。

たぶん、CATツールを使用するときの弊害と思われるが、一文ごとに分割されているため、前後の文脈を無視した和訳をする人もいる。
文書全体の流れを把握していれば、推敲の時点で解釈のミスに気付くはずなのに、そのまま納品してしまう人もいる。

最近もあるマニュアルのドイツ語和訳のチェックで、単語の意味を取り違えている和訳に遭遇した。
その実例をそのまま掲載できないので、一部修正して引用しておこう。

Alle Dokumente müssen an folgende Adresse gemailt werden:
(セグメント区切り)
mailto: abc@xyz.com

作成したファイルを、次のセグメントに出てくる電子メールアドレス宛に、電子メールで提出するのだが、和訳では「以下の住所に郵送してください」となっていた。

ドイツ語の動詞 mailen は、自動詞と他動詞の両方の用法があるが、いずれも 「電子メールを送る」 という意味だ。

ドイツ語の mailen に対応する英語の動詞は、e-mail である。
つづりが似ているアメリカ英語の動詞 mail には、「郵送する」という意味があるが、イギリス英語では post を使う。
そしてドイツ語で 「郵送する」 は、通常、et4 per Post schicken / senden を使う。

mailen という動詞はアメリカ英語の mail と同じ意味だと勘違いしたとしても、次のセグメントは電子メールアドレスであり、その後も郵便で送るための宛先住所は出てこないのだから、気付くはずなのに残念なことだ。

やはり、CATツールを使用して一文ごとに分割されていると、そのセグメントのみに注目しすぎて、文書全体での文同士の関係を無視するような意識が生まれるのかもしれない。

私は副業翻訳を始めてから、約8年後にCATツールを使う案件を受注するようになった。
その前は、PDFなどで提供された原文を印刷して、それを見ながらワードに和訳を打ち込んでいたので、文書全体を見ながら翻訳することを学んだと思う。
そのためなのか、CATツールを使うようになってからも、推敲の時点で間違いに気付くことができるのだと思う。
だから他者の翻訳チェックもできるし、機械翻訳のポストエディットもできるのだと思う。

今回の事例で一般化するのは早いが、CATツールを使う前に、昔ながらの紙に印刷した原稿を読んで翻訳するトレーニングも必要なのではないかと思う。

また、PC画面を見ながら翻訳作業するときに、目の動きも含めて、人間の認知機能はどのように働いているのかや、ツールや機械翻訳が提示した訳例や用語を見たときにどのような反応をするのかなど、より科学的な研究も進めて、翻訳者にフィードバックしてほしいものだ。

開くトラックバック(0)

ニューラル機械翻訳(NMT)では、人間と同じ種類の「原文内容の歪曲」というエラーに加えて、「不適切/一致しない訳語」というエラーが同程度発生するという特徴がある。

NMTでは原文全体の文脈は無視しているため、複数の訳語がランダムに出現することが多く、ポストエディット(PE)という独特の後処理工程が必須である。
このPEにどれだけ手間がかかるのか、PEをすれば人手翻訳と同等の品質が保証できるのか、などの課題がある。

NMTの出力結果に対するPEは、人手翻訳に対するチェックとは異なる作業なので、翻訳とは異なるという意識で行う必要がある。
そのため、PE作業を専門とするポストエディターの養成カリキュラムを開発しなければならない。
そのカリキュラムを利用して、人手翻訳をしている翻訳者がポストエディターという新業態に移行できるように教育したり、外国語大学などの学生を翻訳者兼ポストエディターとして育成することになるだろう。

現在、翻訳者として働いている人たちは、私も含めて、このPEに対応できるかどうか、あるいは、PEを受け入れるかどうかを決断する日が来る。
ただ、優秀な翻訳者であっても、PEは翻訳とは異なる作業なので、誰でも向いているわけではない。
PEに向いていない人、そしてNMTを受け入れたくない人は、人手翻訳が必要な高度な題材に取り組むことになるだろう。

ただ、ポストエディターを養成するとしても、翻訳者としてのトレーニングが不要になることはないだろう。

ある実験では、NMTの出力結果に引きずられて、適切な訳が思い浮かばなくなった被験者もいた。
また、知らない単語の意味を調べる必要がなくなって楽だ、と感じた被験者もおり、安易な作業という先入観が生まれると危険だ。

だから、NMTの出力結果は翻訳ではなく、計算結果が並んでいるだけだと、健全に疑う意識を持って、自ら正しい翻訳を生み出す力を持っている必要がある。

PEもできる優秀な特許翻訳者が望まれているが、国家レベルで養成しているわけでもなく、外国語を専攻した大学生が特許翻訳者を目指しているという話もあまり聞かない。

外国語関連の大学や学部で説明会をしている翻訳会社もあるが、文系学生にとっては、特許の技術内容が理解できないのか、あまり興味を持ってもらえないそうだ。

大学や企業の研究者の第二の人生として、特許翻訳者という道もあることを宣伝してもいるようだが、英語翻訳者ばかりのようで、ドイツ語はヨーロッパで主要言語なのに人気がない。

私の会社でも、ドイツ語特許翻訳者としての経歴がある人材を募集しているが、元々人数が少ないのか、既に他社の専属となっているのか、ほとんど集まらない。

私はドイツ語特許翻訳のセミナーにも参加しているが、参加者の中で実際にドイツ語特許翻訳をしている人はわずかである。

特許翻訳者の人数が少ないから、養成にも時間と手間がかかるから、その代わりにNMTを導入するというのは、危険な選択だろう。
翻訳者が足りないということは、PEもできる人材もまた足りなくなり、チェックをすり抜けた低品質翻訳を大量に生み出してしまうという、負のスパイラルを加速することになるのかもしれない。

社内で独日担当が私1人なので、ドイツ語NMTを導入して生産性を上げたいと思っているが、できればフリーランス登録をしている翻訳者にも参加してほしい。
しかし、依頼できそうなのは1人か2人しかいないのが現状だ。

頼めないレベルの人というのは、実はNMTと同じくらいの頻度でエラーを発生させて、しかも推敲せずに納品してしまう人だ。
このレベルの人をポストエディターとして育成しようとしても、人手翻訳を頼んだときに、原文の文脈を考慮しない誤訳、訳語の不統一、数字の転記ミス、請求項で「前記」が漏れている、などを多発しているのだから、NMTの出力結果を修正できないだろう。

つまり、NMTを導入するには、優秀な翻訳者の確保とポストエディターの養成が同時進行で必要ということだ。

そして、ドイツ語特許翻訳者が確保できない場合、ドイツ語NMTを導入してもPEができないので、英訳ができてから英語翻訳者が和訳するという、現在でも問題と思われる重訳が増えるのではないだろうか。

オリジナルがドイツ語特許であっても、英語の方が単価が安いことに加えて、クライアント側にドイツ語を知っている人材がいない場合、納品物の検品ができないので、英訳の使用を希望するかもしれない。

その英訳が人手翻訳であっても、NMT+PEであっても、誤訳・誤記などが残っているリスクがある。
先日も、英訳された特許を和訳していて、どうしても内容が理解できないという部分があった。
それでオリジナルのドイツ語特許を調べてみると、英訳時に誤訳していたり、化合物名が間違っていたことが判明した。

NMTでは原文の文脈を無視しているので、誤記にも対応できない。
人間のように、「この表現は何だか変だな」という違和感を持つこともない。
だから、特許の内容を反映していない表現に出会っても、人間のように、「オリジナルのドイツ語を調べてみよう」という反応はしない。

大学で研究しているとき、「化学者は英語だけではなく、最低もう1つ別の外国語で論文を読めた方がよい」と主張していたが、賛同する人はごくわずかであった。
英語だけ勉強すればよいと思っている人が多いため、今後もドイツ語など非英語人材を確保することは困難であろう。
その少ない非英語人材の中から、特許翻訳を目指す人がどれだけ生まれるであろうか。
日本語がわかるドイツ語ネイティブに期待することになるのだろうか。

翻訳業界全体で協力して人材育成をしなければ、NMTが発達しても、日本では導入不可能ということになるかもしれない。

開くトラックバック(0)

ニューラル機械翻訳(NMT)が登場してから、翻訳者の仕事がなくなると言う人が現れるようになった。
実際には、人手翻訳と同様に、NMTでも誤訳や訳抜けが発生するため、ポストエディット(PE)という後処理作業が必須である。

どのような種類のエラーが発生するのか、「通訳翻訳ジャーナル」2018年春号の40ページに掲載された記事を参照してほしい。
山田優・関西大学教授の報告では、人手翻訳で一番多かったエラーは、「原文内容の歪曲」であった。

この歪曲では、単なる不注意による誤訳もあるが、原文内容を理解しているのに、より適切な訳を求めて修正するときに、言外の意味などを推測して、結果的に改悪してしまうものも含んでいる。

NMTでは、この「原文内容の歪曲」に加えて、「不適切/一致しない訳語」が同程度出現するという。
NMTでは、原文全体を見ていないし、単語相互の関連性を計算しているだけなので、セグメントごとに訳語が変わることも多い。

また、最近出版された「翻訳事典2019-2020」の機械翻訳批判記事? でも、NMTの問題点として、この種のエラー発生を強調しているようだ。

私は業務で、英日特許翻訳の案件で機械翻訳を利用して、PEを毎日していている。
確かに、長文での訳抜けや重訳の出現、数字があちこちに移動したり、PE作業の負担は予想よりも多いという印象だ。

それでも平均すると、最初から人手翻訳をしてタイピングするよりは、10〜20%の時間短縮が実現されていると感じている。
この作業負担感についての論文数は、まだ少ないものの、機械翻訳+PEでの効率改善が10〜20%のレベルであることは、多くの翻訳者に同意してもらえることだろう。

人手翻訳とは異なるNMTのエラーの癖があるため、PEに向く人材についての検討や、どのような点に注意してPEを行うべきなのかという研究も行われている。
www.fellow-academy.com/fellow/pages/tramaga/backnumber/388.jsp
honyakukenkyu.sakura.ne.jp/shotai_vol10/No_10-004-Yamada.pdf

ただ、PEという作業自体は、これまでの翻訳とは全く異なる業務内容となるため、PEをいくらこなしたとしても、翻訳者にはなれないとも言われている。
PEの作業に関する研究では、NMTの出力結果に引きずられて適訳が思い浮かばなくなったという、被験者の感想も明らかになっている。

それで、通訳翻訳ジャーナルでも、翻訳事典でも指摘されていることだが、これから人間がどのように翻訳に関わるのかというと、NMTでは対応できない部分である。
つまり、原文全体を読んで内容を把握し、筆者の意図をくみ取り、読者が理解しやすい適切な訳文を考えることだ。

また、NMTは原文の誤記に対応できない。
翻訳不能として原文ママで単語を残してしまったり、無理やり似たような単語に置き換えたとしても、それが誤訳だとはNMT自体は認識しない。

PEで全てのエラーを修正するとしても、正確な翻訳ができる翻訳者が参加して、正しい訳例としてフィードバックして、NMTに再学習させなければならないだろう。

しかし、機械翻訳+PEをコスト削減の口実に使おうという依頼者がいるのも事実であり、単価切り下げに加担したくない翻訳者が多く、協力が得られない恐れがある。
そのため、実力のない人がPEを受注して、低品質の翻訳が出回る恐れもある。

機械翻訳+PEという新しい業務形態の導入を阻止したい人もいるかもしれないが、どのようにすれば業務の改善ができるのかという視点でも検証を重ねて、PEに対応したカリキュラムを開発し、それと同時に多言語の翻訳者を養成する具体策も検討してほしいものだ。

ところで、翻訳事典2019-2020の40ページ、下から7行目に、「エントロビー」とある。
これは、正しくは、「エントロピー」である。

トップクラスの翻訳者が書いた原稿に誤記があったのか、編集作業による誤植なのかは不明だが、校正作業でも見落とされ、人間がいくら努力してもミスをしてしまう存在であることを再認識した。

今後は他者の翻訳者の協力も得て、独日の機械翻訳を検証したいものだ。

開くトラックバック(1)

全76ページ

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11]

[ 次のページ ]

本文はここまでですこのページの先頭へ
みんなの更新記事