2019年 11月 23日
国語の採点の難しさ(1)
センター入試の英語民間試験導入が延期されると、今度は、国語の記述試験は無理なのではないか、という議論に移ってきた。
請負会社は、短期間だけの仕事ゆえ、アルバイトの導入は当然という立場で、では、素人が関わることになるが、それでいいのかという議論や、採点準備のため事前に民間会社に問題を教えることになるが、漏洩の危険性はないのかとか様々な議論がある。
この問題について、「(業者には)守秘義務があるから」と大臣は答えていたが、それで漏れないなら苦労はない。関わった人の中で、誰か一人意識の低い人がいて、面白がってスマホで写してSNSに載せたら、それで終わり。
ただ、ここでは、そうしたシステム上の話ではなく、記述の採点を長年やってきての、採点の困難性について述べたい。
実施のための調査テストでは、やはり、いくら基準を作ってそれに従って採点したとしても、多人数が多様な解釈をするので、採点にぶれが出て、このまま実施すると、約一五〇〇人が不適切な採点をされることになるという結果が出ていた。我々の経験からして、最低でもそのくらいは起こりそうな数値、いや、むしろ、素晴らしいくらいである。
採点をしていて、困ることは、その言い方で要素が入っているか判断が難しい場合。これ、人によって×にするだろうなとか、かすっているとか、ちょっと甘いが入っていない訳ではないので〇にしようとか、判断に迷う。
高配点だと、ここの要素点は3点だから2点くらいはあげるかと、多少の強弱をつけられるが、入っている要素を数えるだけだと、黒白をつけないといけなくなって、そこで人によって判断が分かれやすい。
その場合、採点者が少人数で、その場で同時に採点している場合だと意見交換ができて統一基準も作れるが、そうした実際の答案を見ながら、場合分けして、決めなおす機会のないセンター入試では、最初の基準だけで採点し続けることになり、各々の基準の修正がないまま、採点が続くことになる。
お昼のワイド番組ではあるが、国語専門の大学教授を入れて、実際に調査試験の採点のずれを検証していた。それを見ていて、長年困っていたことが、ここで説明されていると納得することが多かった。
例に出されたのは、言葉は通じなくても、あれこれと「指差し」して通じた。指差しは魔法のようなコミュニケーションだという文章の、ある設問。
採点基準では、要素が二つ入っていることとあった。あれ、それだけなら、すぐ後にその要素が二つとも入っているセンテンスがあるぞ。それに「魔法のような」の説明をしなくてもいいのだろうかと思った途端、その教授が、本当なら「驚いたことに」とかいう要素がいりますねと指摘していて、そうだよね、さすが専門家、この方はちゃんと国語の採点業務が判っている人だと、その方の信頼度をこちらは勝手にあげました。
採点の際、上記以上に困るのは、採点基準に入るべきというパーツが、はっきり見えないが、答えの方向性自体は合っていて、この人はちゃんと中身が分かっているなという場合。
今回では、答えに「身体性は言語を超える」と書いた場合の採点がバラけていた。
自己採点した学生側は、それを正答とする人はゼロ。要素が見えないから低いだろうという判断。それに対して、採点教員側の一割は満点をあげていた。その大学教授も、意味はあっているし、「身体性」という専門用語を自分の言葉として使えるので、二重丸だという。
しかし、それ以外の多くの採点教員は、出来ていないという判断か、採点不能という判断。おそらく採点した教員も、この言い方をした人が判っていないとは思っていない。分かってはいるが、国語の解答としてパーツにあう部分が見えないから点があげられないということになる。
近年、情報開示で、例えば、高校入試の採点済みの答案自体が表に出るようになるにつれ、国語の採点は、はっきり「要素」至上主義になっていった。逆に、分かっているなとこちらが分かっていても、本文の抜出し利用的な技術を経ない答えは、結構、バッサリやってしまう傾向になった。それがもうかなり長く続くようになって、そういう採点が当たり前になり、今回も、どういう点をつけたかのバラツキ表を見ると、ほとんどが要素主義で、古い教員などからしたら、点が渋いなあという印象を持つ。
これに反し、大学教授は、大学に入ってしっかり伸びていく人を見極めたいというのが最終的な目的なので、そんなに要素主義にはこだわらない。そこの差が大きい。
新テストでは、三人一チームで見ていくからミスは防げるとの見解だが、三人とも要素主義者、あるいは、三人とも趣旨理解重視主義者なら、それで三人が納得して〇をつける。だからチームごとに違ってくる。三人もいるからミスは起こらないとかいう問題ではないし、そもそも、これは「ミス」ではない。(つづく)