「AI vs. 教科書が読めない子どもたち 」を読んでいます(その8):統計的に大量の対訳データが必要
続きです。
意味は無視して確率と統計を意図的に混合する。
機械翻訳は夢、ちょっとした助けにはなるが厳密さで実用に耐えない。
2016年グーグル翻訳の精度が上がった。
出力される英語の英語らしさ。
統計的に大量の対訳データが必要、一番よさそうな語の並びを出力する。
私は先週山口と広島に行った。
私は先週山際と広島に行った。
意味を理解しない限界。
会話文は通常の文と異なる。
対訳データを100万ではなく1000万でだいぶまし。
世の中にある、英会話集、オンラインマニュアル、プレスリリース。
グーグル翻訳のユーザーは貢献できる。「情報の修正を提案」。
諸刃の剣で放送禁止用語のいたずら。
続きます。