東京永久観光

【2019 輪廻転生】

言語の未来を電算機が見出すか(雑誌WIRED特集より)

雑誌『ワイアード』が「ことばの未来」という特集をしていて、これが非常に面白い。ワイアードはいつも他のメディアにない先端的な視点が、本屋で立ち止まらせる。少し前には「死の未来」という特集もあった。


特集の最初は、言語の翻訳を統計処理によって行うというコンピュータの手法について。フランス語のボンジュールって何だろうというときに、英文ならハローと同じような場所でよく使われているといったことを統計処理で見つけ出すという手法。

しかし言語学者の多くはこの手法に懐疑的だと記事にあり、代表としてチョムスキーのコメントも引かれている。とはいえ、そのコメントは「科学の歴史においてこのようなものをわたしは知らない」であり、単に懐疑的だというふうにはみえないのが、また面白い。

チョムスキーはこの特集で何度か言及されているが、そもそも彼が言語研究を開始した20世紀半ばは電算機が普及しはじめ人工知能もトピックになった時期で、そこからすればチョムスキーの言語探究はコンピュータの言語処理という独特の領域にもともと近かったような気もしてくる。

チョムスキーは「あらゆる言語に普遍の文法がある」そして「その普遍の文法は脳の仕組みに由来する」ということを強く長く主張してきたが、私としては徐々に怪しく感じられてきた後者より、前者のテーゼにこそ探究の妙味があると思う。チョムスキーの著書紹介ページでもそうした意見が出ている。

ともあれ、コンピュータの言語処理が、言語学の探究とは全く異なる言語の骨格・言語の核心を見つけ出す可能性を、筆者のマイケル・ニールセンは感じている。それは未知の言語ユニット、新しい文法規則といったもの。

このことは、人間が自らの直感では自覚できない法則を、ビッグデータの解析がどんどん発見してしまう事態と、同じような変化だろう。そのときは、コンピュータが勝つか負けるかなどどうでもよく、そこで見いだされる新しい法則それ自体に、興味がつきない。

なおさっきの言語の統計処理の話に戻るが、それに対する違和感とはつまり「私は翻訳のとき統計なんか使ってないけど」という気持ちだろう。言い換えれば、言語の理解や使用を含む脳の仕組みの原理がそもそも「統計処理ではない」のかもしれない。じゃあその原理って一体?…と問いは深まっていく。


さて、特集で次に原稿を寄せているのが、円城塔(最適の人選だとおもう)。円城塔は漢字の魅力に惹かれ、ニンベンを横につけたりシタゴコロを下につけたりすれば、言語にも漫画の描写に負けない表現ができるのでは、といった空想を広げているが、それより「なるほど」と目がとまったのは…

アマゾンやヨドバシカメラのウェブサイトを作る人(プログラマー)の文章に興味があるという話。そこにある細かい情報の複雑なコラージュに感動するという。これはつまり、そうしたサイトの設計に使われるプログラムのエレガントさや基本ルールへの関心だろう。

というわけで、図らずもまた、言語の骨格や核心がコンピュータという独自世界で初めて見いだされる可能性が示唆される。ただし、円城小説には「新しもの好き」は全く感じられず、言語に対する旧来の不思議な思いを凝視することで、かえって言語の謎に新しい光が当たる、といった趣きがあるのが吉。


特集、次は、GoogleFacebookなどで言語処理の研究に勤しむ若手研究者の紹介。取材執筆したのは意外にも予防医学で知られる石川善樹。半世紀前なら日本を代表する知性といえばたとえば大江健三郎とか安部公房とかの作家だったろうが、現代の知性とはこの種の人たちにこそ宿るのか。

ここの記事は具体的な理解は難しいが、キーワードやイメージはとても鮮やかで圧倒的に惹きつけられる。最も重要なキーワードだと思ったのは「言語のヴェクター化」。コンピュータが人間の言語を理解する際の壁を超えるカギとして出てくる。

ヴェクターというのは、図形データなどのピクトとベクターの違いを思い浮かべればいいのだろう。ピクトは見た目どおりの図でしかないが、ベクターの図は変形ができる。私たちが使う言語(たとえば単語)も、見た目は同一でも実際は自由自在に使われる。

で、コンピュータが言語をヴェクター化する例で1つ挙げられるのは「王様−男+女=女王」。詳細はわからないが、ともあれ、人間の言語が、記号としての操作性をもつこと、そしてそれとは別だが、概念という可塑性にも富むこと、を改めて強く想起させる。ヴェクター化の真髄はそこにあるのかも。※「ヴェクター」とはすなわちベクトルのことだったのだろう。ChatGPTの言語処理の手法で「ベクトル化」というキーワードが出てきた今、そう思われる(2023年追記)

そして記事は、人間の言語もしくは知性を「方程式で記述しよう」とする試みがいま世界で起こっているのだ、と結んでいる。その背後には「言語は数である」という共通認識があるのだとも。

さて、言語を方程式にする試みというのなら、やはりチョムスキーの探究こそがそれに当たるだろう。最近別の本を読んで、チョムスキーの理論がまたモーレツに気になりだしたところだった。ちょうどよい機会なので、もう少し考えて書いてみよう。


その前に、同特集の参考書籍について。選者の1人が藤田耕司という人で「進化言語学者」の肩書だが、沢田允茂『言語と人間』という論理学系の本を強く推す。意外で興味深い。読んでみたい。「日本初の生物言語学の書と言えるかも」「チョムスキーダーウィンも青ざめるだろう」と評している!


http://wired.jp/magazine/vol_19/ワイアード「ことばの未来」)