「AI vs. 教科書が読めない子どもたち 」を読んでいます(その9):人口の細工に弱い
続きです。
画像認識の限界、検知する物体はあらかじめ学習させておく。
マイク、カメラのハードがバージョンアップし、解像度が上がったり規格が変わったとき教師データを作り直し。
細工をして人間には分からない微細、でも誤判定。
複数の層で目、鼻を認識して猫を判断しているか。
ピクセルごとの位置、色、輝度の特徴の和で判定している。
人口の細工に弱い。顔認証のリスク。
スパコンが活躍する分野はある。気象シミュレーション。
グーグルやフェイスブックはAIに投資する理由がある。
セキュリティ攻撃、ユーザー間の関係の分析、フェイクニュースなどに人手でなくサービスを提供し続けるにはAIしかない。
グーグルカーは画像認識のプラットフォームを売る。
製造物責任を回避しようとしている。
パッケージで利益を得られることはないと認めている。
続きます。
「AI vs. 教科書が読めない子どもたち 」を読んでいます(その8):統計的に大量の対訳データが必要
続きです。
意味は無視して確率と統計を意図的に混合する。
機械翻訳は夢、ちょっとした助けにはなるが厳密さで実用に耐えない。
2016年グーグル翻訳の精度が上がった。
出力される英語の英語らしさ。
統計的に大量の対訳データが必要、一番よさそうな語の並びを出力する。
私は先週山口と広島に行った。
私は先週山際と広島に行った。
意味を理解しない限界。
会話文は通常の文と異なる。
対訳データを100万ではなく1000万でだいぶまし。
世の中にある、英会話集、オンラインマニュアル、プレスリリース。
グーグル翻訳のユーザーは貢献できる。「情報の修正を提案」。
諸刃の剣で放送禁止用語のいたずら。
続きます。
「AI vs. 教科書が読めない子どもたち 」を読んでいます(その7):翻訳できても意味を理解していることにならない
続きです。
中間試験の数学の平均点で1組より2組が高い確率が分からないとき、とりあえず無視するか、適当にパラメーターを入れる。
やる気を5段階で自己申告してモデルにする。
世界と確率を混同する割り切り。
音楽や絵で何を表現したいかは、やる気と同じで無視する。
ロマン主義のピアノ、ゴッホの絵と差が最小になることを目標にする。
机の上にリンゴと鉛筆がある、で絵は合成できる。
太郎は花子が好きだはどうなるか。
手振りや図で表現できないことを言葉で表現している。
英語に翻訳できても意味を理解していることにならない。
文字入力の予測変換で疑似体験できる。
「や」で「やっぱり」、次は「、」、次も「、」ネタ切れ。
確率を動かすきっかけが必要。インクの最初の一滴。
「わ」で「私は」、次は「福島に」がでる。福島に最近行ったので「私は福島に」を書いたことを記憶している。
次は「ならない」。
出来上がりは「やっぱり、私は福島にならない」で意味不明。
ものすごく自然といえるレベル。
続きます。
「AI vs. 教科書が読めない子どもたち 」を読んでいます(その5):まずいとおいしいの違いが分からない
続きです。
文法も構文も教えない。例文の10億単語を覚える。
多くの語順が正しい語順。
例文を増やす。
AIは質問の意味を理解していると思う人は多い。
数式に変換できるか。
統計が論理的に何を意味するのか、解明されていない。
事象の説明に、論理、確率、統計を獲得した。
論理はAならB、BならCならAならC、ランダムな事象は説明できない。
確率はサイコロを何回も振れば1/6と考えてよい。
論理でも確率でも説明できない事象が統計。
過去のデータから、天気、治験、人間の意志、株価、選挙。
アンケートの過去データから規則性を見出す。
データが先、分析して仮説を見つける。
意味を記述する方法がない。私はカレーが好きだ、あなたが好きだ、の違い。
意味が分かっているように振るえるように努力してきた。Siriでこの近くのおいしいイタリアン。
この近くのまずいイタリアンの店ときくと、似た店が出る。
まずいとおいしいの違いが分からない。
イタリア料理以外ときくと、同じ答え。以外が分からない。
以外でなく、中華や和食ときけばよい。
検索は論理はあきらめて、統計と確率にしている。
データは大きくなり、精度が上がるが100%にはならない。
続きまs。
「AI vs. 教科書が読めない子どもたち 」を読んでいます(その4):センター英語特有の不自然な英語
続きです。
偏差値が10上がった。
正答率が75%。
数学は検索では解けない。
ロジックセオリストで論理的に解く。
数字で計算する場合と、数式のまま計算する場合がある。1/3。
そこそこのアルゴリズムが2000年代に出始めた。
偏差値76.2となった。
放射線画像解析、CT,MRT、人は不足、集中力が低下する過酷なアルバイト。
教師データが多いほど精度が上がる。
今後3年でAIに奪われる。
トレーダーはAIに取って代わられた。
アルゴリズム取引、取引の7割を占める。
貿易の紙の取引がブロックチェーンで代替。
不動産登記の審査。
税弱への申告代行。
書類の確認、与信。
労働価値が大幅に下がっている。
頭がよい人を頭の回転が速いという。
過去問のビックデータを使えばできるは、幻想。
第5世代コンピューターの失敗から学べるものが何一つ残されていない。
論理から統計へ。
国語の現代国語はもっとも配点の大きい傍線部の問題に文字の重複など表面的な選択肢を選ぶ荒業。
正答率5割で、そこから先は見込めなかった。
英語、グラフや図表の理解、長文読解、航空チケットや博物館の入館の値段表、キャンプ場の道具のレンタル表、OCRでエラーが続出。
センター英語特有の不自然な英語、日英対訳データが100万。
特許用は旅行用では使えない。国際会議にも使えない。
常識の壁、将棋の名人に勝っても近所のお使いに行けない。
単純と思っているのが非常に複雑。
続きます。
1.
「AI vs. 教科書が読めない子どもたち 」を読んでいます(その3):ディープラーニングの恩恵が画像処理
続きです。
うまくいきそうでうまくいかない例、災害で人命救助。
「可能な限り試しているうちに、いい感じにする」の「可能な限り」が多すぎる。
教師データを作る、目的や制約条件を設定、は人間、役に立つのは何かは人間だけ。
AIに政治には、何がいいかを数理モデルにする必要がある。
人間の幸福は数値化できない。
ディープラーニングの恩恵が画像処理。
1画像10秒が、YOLOは0.02秒。
物体検出は、複数の物体が写っている中でどれが重要か。
左上からフレームをずらしながら総当たり。
写っていそうなところに着目する方法が考案。
ソファの上はパスして猫のあたりに着目。
1枚に2000の物体と仮定、2000回を1回にまとめた。You Only Look Once.
音声データ、データが20~40代に偏り、高齢者の認識率が下がる。
オペレーターが復唱することで教師データが増えていく。
FAQのランキングも表示される。FAQに正解をクリックすることで学習し賢くなる。
東ロボは予算が少なく、100人以上がボランティア。
世界史はワトソンと同じ攻略法、穴埋め、7割が正誤判定。オントロジーは名前や分類。
カール大帝はxxを撃退した。はこの民族を撃退したの質問に書き換える。
選択肢からクイズ問題を作る方式を採用。
オントロジーは人間にしか整備できない。
ランキングし、スコア3.2がアヴァール人、マジャール人は1.1、差2.2が大きい時、誤文と判定。
十分な差をどう設定するかは過去問から機械学習。
続きます。