東京永久観光

【2019 輪廻転生】

チューリング小論文

大学入試の小論文をコンピューターが採点するとか
http://www.asahi.com/national/update/0215/019.html朝日新聞

《パソコン入力された800〜1600字程度の小論文を、(1)文章の形式(2)論理構成(3)問題文に対応している内容か――の三つの観点から評価し、標準的には、(1)を5点、(2)を2点、(3)を3点の計10点満点で判定する。「語彙(ごい)の多様性が不足」「議論の接続が不十分」「問題文との関係が希薄」などの短いコメントと点数で1、2秒後に判定を打ち返す。》

入試の小論文というのはこうした観点で判定できてしまうものなのだ、ということか。

しかしたとえばブログで読むような文章だと、形式や論理とはいえない不明のノイズが多分に含まれていて、それを抜きにしてどちらが面白いかは判定できない。どちらが正しいかの判定も難しい。

というか、文章というのは、今ここに書いている1行が他のすべての行と複雑に対応してしまうではないか。昨日書いた1行や他の人が書いた1行とも微妙に対応してしまう。というわけで、人にもよるが、たとえば結論を先にするか後にするか、そもそも結論を出すのか出さないのかに始まって、言いたいこと以上に言い回しをどうするかで時間をとられる。そういう苦労はどうなる。

…と確信しているのだが、じつは我々の書く文章なんて、予想を超えてパターン化されており、そうした個性やノイズや苦労も含めてコンピュータが自動採点できる程度のものなのかもしれない。

ちなみに、《…理想の小論文として全国紙の2年分の社説、コラム計約2000本を記憶し、「学習」している。文の長さ、漢字・かなの比、言葉の多様さ、受動態の割合、接続詞の使い方などの統計分布から割り出し、模範に近いほど高い点数を与える仕組みだ。》…理想の小論文。そうですか。

話し言葉は書き言葉以上にノイズが多いと思う。声の響き、顔の表情、その場の雰囲気。言いよどみも言い直しもいくらでもアリだ。書き言葉では書いた文字以外の情報は原則的には伝達されない。それを話し言葉並みにするため、あれこれ言い回しをひねるのかもしれない。そもそも私たちの思いはリニア(直線的)ではないようなので、言葉というリニアな道具でそのままやりとりしようとすると、たぶん何かが不足してしまう。ノイズの出番はそこにあるのだろう。

ちなみに、人間のDNAを100点と採点するコンピュータは、チンパンジーのDNAには98点を与えるのだろうか?

ちょっと参考 → http://www.mayq.net/dna1.html