トルコ語と日本語の機械翻訳って案外簡単に作れるんじゃない?

広告

まずはコメントのお返事をします。

POSTED BY 愚痴 ON 2010年7月6日
遅延証明書出してもぐちぐち言われるの嫌ずら。
すし詰めになって、やっと着いたら文句って、朝から気が滅入る。
十五分の余裕をもって出てるんだけど、二十分以上だと無理ぽ。
そこまでカバーできる時間に家を出ないといけないんだろうか。
時間にルーズな俺は、社会人やってるのがしんどいっす。
海外って定時出勤に厳しいんですかねえ。

英語でBe punctualと叱ることがあるし、英米系の教師は授業の遅刻を許さないという話を聞いたことがあります。おいらは当たったことはないですが。

少し前にJR西日本の福知山線の脱線事故がありました。たくさん人が亡くなったのですが、原因は少し電車が遅れて、遅れるとひどいペナルティがあるので運転士が慌ててスピード超過で事故になったというものです。これを世界中のメディアで報道してcrazyと言われたのをみると日本が一番時間には几帳面なのかも知れません。イタリアとか数時間でもOKみたいな話でした。

社内公用語の英語化が日本流の縦社会を崩す

海外ニート氏の「社内公用語の英語化が日本流の縦社会を崩す」を読んで。

日本人が他人に対して気軽に話しかけられないのは、敬語が存在しているのが大きな部分を占めているからだと思います。何を話すのにもかしこまらないといけないなんて、息苦しくて仕方がないですよね。社畜環境もその辺から生まれたのではないかと。学校のクラブのように、敬語というもので上下関係がはっきりとわかれてしまっては、そのような意識無しでは生活できなくなりますもんね。英語で話してる時が一番リラックスできるのは確かです。

面白い切り口だと思うけど、敬語があるから堅苦しいというのは違うんじゃないかな。

コメントにも書いたけど、日本人の多くは敬語なんてできないと思う。ビジネス敬語とかバイト敬語があることを見ればわかる。あれは吉原の「~でありんす」と同じで言葉を教育するのが大変だから利便性の観点で発生した場面方言の一種。そういう言葉が発生すると言うことは、そういう言葉遣いが必要に迫られて出てきたわけ。もし必要とされていなくて、かつ敬語ができない人の集合なら、ふつーにため口になってますって。

仮にまともな敬語ができる良家のお坊ちゃん、お嬢様が社畜に《まともな》敬語で喋ったらびびるか、あるいは「お前の敬語おかしいぞ」と逆に間違った敬語を教育してくれるでしょう。社畜の喋る言葉を敬語というのは日本語に対して失礼。

そんなわけで、そんな社会に英語を入れてもシングリッシュならぬ何て言えばいいかな、日本独特の敬語っぽい表現のある英語もどきができあがると予想する。社会人として~みたいな英語っぽい表記もきっと出てくるはず。

あと、Dan Kogaiのブログにも英語の話題があったけど彼の英語は上手いねえ。

「自力で生活できない人を国が助けてあげる必要はない」と答える人の比率が、日本は世界一

らしい。ソースはここなので根拠は希薄。

Crystal GABAN Set for iPad

iPadのケースはたくさんあるけど、落下を防止するものが欲しいと思っていたら、こんなのが発売になった。これいいね。

トルコ語と日本語の機械翻訳って案外簡単に作れるんじゃない?

難しいのかな。Google翻訳はトルコ語も翻訳できるんだけど、言語対の多さから言って中間言語に一度翻訳しているのではないかという気がする。だから、いまいち良質の翻訳ができない。

例えば、トルコ語のDün evde Türkçe çalıştım mı?という文章を例に採ってみる。訳語は「昨日家でトルコ語を勉強しましたか?」といったところ。表にしてみると

Dün evde Türkçe çalıştın mı?
昨日 家で トルコ語を 勉強しました か?

単語に日本語訳をつけていけば、文章も全体としてちゃんと日本語になる。つまりトルコ語と日本語は語順が同じである。

次に例えばevdeだけど、evは家という意味。deは日本語の「で」と同じなので、まとめて「家で」となる。

deが「で」というのは興味深いことだけど、問題はトルコ語は膠着語という泥団子のような言語で、日本語と同じように後ろに色々つけていくことで過去形にしたりできる。一見すると英語のようにスペース区切りなのだけど、実は膠着語としての性質が強い。

だから、機械翻訳をする際にポイントになるのはevdeを正しくev + deに分割できること。çalıştınはもっと複雑で、çalış + tı + nに分割する。tıは過去形。nは二人称単数であることを示すので、正確に訳せば「あなたは勉強しました」になる。

これをGoogleで翻訳すると「昨日、私は自宅で働いていた、トルコ式バスですか?」となる。どうやったらこういう訳になるのかわからない。少なくとも単語を1つ1つ置き換えていくだけでもここまでひどいことにはならないはずだ。

ということは、ちょっと頑張ってシステムを作れば天下のGoogleよりも優れたシステムを作り上げることができそうである。ただし日本語とトルコ語のみの機械翻訳でGoogleほど多用な言語対ではないのだけど。