http://www.shinchosha.co.jp/foresight/web_kikaku/u127.html
うむむん?元の講演聴いていない(聴く時間が無い)からあれなんだけれど, "romantic science" における "romantic" を,日本語の(普遍的な意味の)『ロマンティック』に摩り替えてしまっていることに基づくとんでもない論説という印象ががが?最初 artificial inteligence に限定した狭い話 (GOFAI を「ロマンティック」と称して, Google が今やっていることはそれとは一線を画してもっともっと単純な classification しかやってないよねー,系の話. Google の基盤技術,っていうか今の人工知能において最も興隆を極めている分野も,広い意味では GOFAI に入るけれど) を想像したんだけれど,元のブログの表題がそうなってなくてもう1つ枠を広げた話だし.
「ロマンティックな」研究って言葉を梅田さんがどういう意味で使っているのか判然としないんだけれど,普遍的な意味での「ロマンティック」なら Google の仕事にも「ロマンティックな」研究はそこかしこにあるんじゃね?っていうか研究って基本的にロマンティストじゃなきゃ務まらんですって(言い切った言い切った).
たとえば,
indexing のために印刷物上の文字を電子化する必要があるので,当然「その字句を理解し」っていう過程が入るけれど,「その字句を理解し」っていう部分は「その字句を理解し」っていう8文字で済まされるほど単純じゃないと思うんですよ.今,印刷物上の文字1文字の認識精度が(印刷物上の文字認識精度に対する state-of-the-art の数字知らないので適当に)たったの99%だとしよう.その数字を基に100文字全ての文字認識を正解できる数字をお手元の Windows 付属の電卓で計算してみよう.多分絶望的な数字が出てくるよ.もっと絶望的じゃない数字が欲しいよね?少なくとも俺は欲しいんだけれど(ここに「ロマンティックな」研究のニヨイががが!!!).
世界中の主要図書館と契約し「人類の過去の叡智」たる蔵書数千万冊分をすべてスキャナーで読み取り、その字句を理解し、自動的に索引を生成し、すべて検索可能にするというプロジェクトである。しかし確かに茂木の言うように、ここに「ロマンティックな研究態度」は微塵も存在しない。日々行なわれていることといえば、安い労働力の手作業によって、世界各地の図書館の蔵書が一冊一冊、グーグルのコンピュータに取り込まれて整理されていくことである。
また,
世界全体の衛星写真が手元にあって,それを並べて Google Earth ができれば幸せだあね.実際には衛星写真1枚1枚は撮影における様々な条件が微妙に,ときには大きく異なっている(撮影角度が異なる写真の継ぎ目見たことある人居るでしょ?).それを人手で修正するのは事実上不可能だから,自動的にあまり違和感が無いように画像処理してつなげたいよね(ここにも「ロマンティックな」研究のニヨイががが!!!).
地球閲覧サービス「グーグル・アース」の開発アプローチも、同じようにロマンティックではない。世界全体の衛星写真を購入し続け、システムを新しいものに更新するとともに、世界中のありとあらゆる都市部にはグーグルがチャーターした飛行機が飛び、日々航空写真を撮影している。
ほら, Google って「ロマンティックな」研究の塊なんですよ.
後,いい機会なので一度書いておきたかった話も書いておこうっと.どうも Google すげーというときに,その「膨大なデータ量を扱っている」ところだけが強調されすぎて,「その膨大な量のデータからいかに有効な情報を獲得するかの技術」がないがしろにされすぎている嫌いがあるように感じられてならない昨今,皆様いかがお過ごしでしょうか?データの量と膨大な量のデータからの情報の獲得は完全に車輪の両輪なんだって!(俺にしては珍しく断言)
ブルドーザーっつー表現はちょっと無骨すぎる気がするにゃー.確率と統計と線型代数と数値計算と最適化のエンジンとタイヤを持った機械学習とパターン認識のブルドーザー,って表現なら納得するかも.ブルドーザーのガソリンはもちろん圧倒的な量のデータ.
いまの小学生や中学生が社会に出るころには、あたかも巨大な荒地をブルドーザーが整地するような「ロマンティックではないアプローチ」によって、私たちの世代が想像すらできなかったような「知の基盤」が整備される。
このブルドーザーの部分の技術も圧倒的なのがイマイチ理解されていない希ガス.っていうか Google やべー,敵わねーっていうときに,恐らく一番ここが敵わねーと思うですよ.実際,現在の Google への人材集中・寡占が一番ひどいと思うのが Machine Learning 関連分野じゃねーのかっていうのが個人的な感覚だし,また Google が一番人材集めに躍起になっているところだと思うし.気が付いたらあの人もこの人もみんな Google に行っちゃってるですよ!うわぁ,どうしよう!良いプログラマがかき集められているとか言ってるレベルじゃないんだって!この分野に居ないと全く実感できないと思うけれど.
なんでこういう寡占が生じているのかまで突っ込んで書こうとしたけれど,そんなことしているばやいじゃないことに気が付いたのでしぅりょう〜.