読解力

 書きかけのまま放置していた関係上、ネタ的に古くなってしまったが、「英語やプログラミングの前に日本語力が必要 (8/4 日経産業新聞(日本経済新聞電子版))」について少し書いてみる。
 で、最初から腰を折ってしまう話ではある(いつものこと)のだが、いわゆる反論とか異論とかでもなく、トンデモ論でもない異説や新説、仮説の領域に関する記事につっこみを入れるだけというのもあまり意味のある行為ではないだろう。
 本来であれば封殺されるような考え方を科学の世界で影響力の大きい者が言って初めて少しは気にとめてもいい考え方かもしれないと思う者がちらほら現れることを期待されて記事が作成されていると言ってもいいかもしれない。
 そういう意味で、この記事を選んだのは他でもなく、その威を借りて自説をかぶせてたれ流したいという私の意思の現れである。
 珍しく、前提を先に書いてしまった。
 まぁ、いいや。

 さて、この記事の前半部分にあたる調査というのは、『「仏教は東南アジア、東アジアに、キリスト教はヨーロッパ、南北アメリカオセアニアに、イスラム教は北アフリカ西アジア中央アジア、東南アジアにおもに広がっている」』という説明文に対し、『オセアニアに広がっているのは何か。仏教、キリスト教イスラム教、ヒンドゥ教の4つのうちから選』べ。と『中学生が教科書の文章を正確に読めるかどうか』という調査の一環として出題したところ、『正解の「キリスト教」を選べたのは全体のわずか54%。35%が仏教を、12%がイスラム教を選んだ』という結果になったというものである。
 『テストに何か不備があったのではないか』と書かれてはいるのだが、個人的に、テスト方法、手順がどうだったのか気にはなる。
 『文章を正確に読めるかどうか』という調査であると銘打っているので、多分いらぬ心配であろうとは思うが、例えば、説明文を数秒読ませたあと、その文章を伏せ、設問を提示する形式であるならば、私は正直答えられる気がしない。
 偶然にも、この問題の場合、オセアニアの国別人口比率から考えて上位のオーストラリア、ニュージーランドを考察すれば正答に近いだろう仮定して、歴史的に欧米移民で構成されていることから、キリスト教なのではなかろうかと推定することは可能である。
 先の説明文とは無関係に地理の記憶問題として例えばオーストラリアの各宗教信仰者の比率を知っていればさらに簡単な問題かもしれない。
 ちなみにWikiによると、2011年でキリスト教各宗派を合算した数値は61.1%らしい。
 個人的には、思っていたより低いが、試験問題に類するものなど結果的に合っていれば大抵許されるからいいといえばいい。
 同じ考えを持ち込んでも正しい答えを導くことができないエリア(例えば仏教発祥のインドとか細かい話だとゾロアスター教とイランの関係とか)は、それぞれ例外として覚えればいいという形にはなる。
 実際に世に散らばる設問に対していかようにして解くのかは思った以上に自由度が高いもので、その方法は、結果が求められる基準に収まっていれば、自らが得意とするものでかまわないだろうし、逆に一律な手法を押し付ける方が効率を落とす場合もある。
 先に示した考え方の一例も、私が単に短期記憶が弱いのと長期記憶に依存する傾向から、長期記憶から抽出したデータを用いて仮定を積み上げる方法を問題解決に際して主に用いるというだけであり、人によっては自らの能力や属性から全く別の手法を用いてもいいわけだし、様々な手法から時と場合に応じて使い分けてもいいことになる。
 ただ、今回に関しては、正答(または誤答)に至るまでのプロセスが『文章を正確に読めるかどうか』に依存することで振り分けられなければならないため、いわゆる「説明文の情報以外から得られた(または既に得られている)知見」から正答(または誤答)を導いてしまっては基本的に実験となり得ない。
 そういう意味では、なんとなくだが、分かりやすく説明するためにある程度端折ったりいわゆる「それは言葉のあやだ」的な表現(言葉のあやという意味ではない)なのかもしれない。
 と、とりあえず、テスト方法、手順についての注目点を書いてみた。
 とはいえ、だから、実験として成り立たないとか成り立つとか言っていても始まらないので、『文章を正確に読めるかどうか』が正しく評価できる手法であったとして先に進む。

 その結果の考察であるが、引用したとおり成績は芳しくない、とされる。
 半数以上が理解できたことを現実社会でよしとすべきなのかどうなのかという問題はつきまとうわけではあるが、問題ないとする者もいないわけではない程度とはいえるかもしれない。
 ただ、テスト全体の正答率がどのようであったか記載がないため関連を知ることができないのだが、『約20%の生徒が、「サイコロを転がすのと同じ程度」しか正解を選べていない。』ということが、はたして『事態は想像以上に深刻』と言い切れるものなのかどうかが、実感がわかない。
 20%の意味するところが、『文章を正確に読めるかどうか』という命題に対し、20%の生徒における読解プロセスが『サイコロを転がす』といった確率論的発想による理解(説明文の理解というよりは選択肢を与えられていずれかを選ぶための行為という意味合いが強い)なのか、読解プロセスに何らかの異常が存在し、結果的に『サイコロを転がす』程度の確率でしか正答できないのか、20%の生徒において読解プロセス自体がほとんど存在せず、実質的に『サイコロを転がす』行為と変わらないのか、それとも別の意味なのかよく分からない。
 いずれにせよ、残り80%の生徒は汎用性や応用性の高い読解プロセスを用いて正答を選び、たとえ誤答したとしても『うっかりミス』として処理できるものであったとするならば、結構いい感じじゃない、とか思ってしまう。
 ただ、これだと、残り80%の生徒の『うっかりミス』などを無視するとした場合、先の例のような四択問題として、正答率は「0.8+0.2/4」で85%程度にならなければならない。
 もしそうなら、先の例の正答率が54%というのは作為的事例によるミスディレクションになってしまう。
 さすがにそれはないだろうということで、『約20%の生徒が、「サイコロを転がすのと同じ程度」しか正解を選べていない。』ということは、「正答した生徒のうち、「サイコロを転がすのと同じ程度」の読解プロセス(その中身や生徒1人ごとの正答率は不明だが)を持つ生徒が20%だったぐらいな意味として捉えるべきなのだろうと思われる。
 ただ、それでは「サイコロを転がすのと同じ程度」未満に属するほとんどすべてを誤答した生徒というのは、それはそれで貴重であり、過去の記事でも書いたように、TOEICで全てマークした上で100点台や二桁をたたき出す能力と同じで結構貴重であるとも言える。
 こういった捉え方をすると、もはや全体のどの部分に焦点をあてて話をしているのか分からなくなってくる。
 そんな中で『県立の中高一貫校でも同じ調査をした。(中略)彼らのうち、「サイコロを転がす程度」にしか正解を選べていないのは、約5%だった。』と言われても、数字的な差としては理解できてもどのような領域に対して有意な差として現れているのか直感的に理解できない。
 何というか、数百ページ程度の報告書を数十ページほど飛ばして読んだような置いてけぼり感が半端ない。
 とか言うと、記事の著者は昔から同じようなことを言っているんだからリポジトリでも何でも漁りやがれ!と言われそうだが、それをいっちゃあ、おs(ry。

 Fランをほうほうの体で卒業した私が日本を代表する大学先生の一人をどうこう言うこと自体おこがましいという前提で書くとして、氏の言語認識や言語解釈の考え方に基づいて設計したAIシステムが人間の言語認識や言語解釈の機序と必ずしも一致していないこと、および/またはAIシステムが厳密に人間の言語認識や言語解釈の生理学的機序やプロセスをシミュレートしたものでもないことを難しい話だからと一端保留して、表層的な現象にのみ注目して述べていることが、学術的ではない場での発言においては多く見られる気がしてならない。
 およそ、氏について一般の者が知るとすれば、「東ロボくん」について語っているところぐらいではなかろうかと思うが、ほぼ同様な気がする。
 とはいえ、昨今の学力低下などの問題に対する社会的要請に対して、それを放置して基礎研究に邁進するだけが研究者でもないわけで、人間の言語認識や言語解釈の機序が解明されていないことを理由にAIと人間を比較できないと結論付けてしまっていいというわけでもない。
 それゆえ、一端保留するという考え方も科学的に不毛な行為ではないと思われる。
 ただ、忘れてはならないのは、「一端保留」しているという前提の上に成り立っている論説であるため、「保留」して議論すると問題が起こるような領域には踏み込まないようなゾーニングが欠かせないと思う。
 例えば、人間の言語認識や言語解釈の機序が解明されていないために、その機序が人間という種にとって唯一一意に定まるものかどうかも分からないと仮定して、私自身の経験的、感覚的な話ではあるが、その機序にぶれがあるレベルではなく、かなりの種類や類型が存在し、有機的に各種プロセスを統合したシステムからインタフェースを通じてよく似た表層の現象(今回の場合だと、説明文を読んで理解して四択から正答を選ぶ行為のうち読んで理解する部分。)が観察できるだけのような場合、その仮説を立てた時点で、『読解力を身に付ける。そのようなシンプルな教育目標』と表現した「シンプルさ」は消し飛んでしまう。
 この考えに基づき『読解力を身に付ける』とはどういうことなのか?何に働きかけてより有効に機能するシステムとしていくのか?ということを掘り下げていくと、「保留」した事象に触れなければならないことになるため、このような仮説は氏の考え方からすれば議論に向かないもしくは議論の範疇外ということになるのかもしれない。
 また、義務教育、学校教育の世界になると、その教育内容の精神とは別に現場の遂行能力の問題も大きいため、単純にその教育内容の精神の優劣を測ることは難しくなる。
 個人的な考え方ではあるが、極論としてその子供に合ったオーダーメイドの教育を施すような形でなければ、効率的に読解力を身に付けることは難しいと考えている。

 個人的な経験だが、小学校低学年(多分、1年生、かな?)で習う「は」「を」「へ」の仮名遣いに関して、私が小学校中学年だったころに1年下がそこらの子(多分、その仮名遣いを習う時期はとうに過ぎている)に教えなければならないことがあったのだが、なぜここは「は」になるの?と聞かれて答えることができなかったのを覚えている。
 そもそも品詞が助詞が云々と言って理解できるなら小学校2、3年のレベルまで放置されているわけもない。
 当時なんと呼んでいたか覚えていないが、今だと「くっつきことば」というらしく、多分、私も同様な教育を受けて理解してきたとは思うが、同様にそれで理解できていないのならば、別の方法で教えざるをえないことになる。
 で、そこで思考がストップしてしまったわけである。
 よくよく考えてみれば、プロの教師が四六時中教えていながら改善されていない状態を一介の小学生に解決させようというのがそもそもおかしい話で、どうにもならなくて当たり前といえば当たり前である。
 ただ、当時のことはよく覚えていて、散々悩んだ挙句、私が得意としていたとにかく覚えて何とかするという手法を説いてしまったように思う。
 要は、しこたま例題を作ってあげて訳がわからなくても解答の正誤を積み上げて、そこから類推することで解答の精度をあげるという気合いとガッツと根性でなんとかする方法である。
 はたしてその子がその後どうなったのかは分からずじまいだが、逆に「くっつきことば」とか品詞、助詞を聞いたことも見たこともなく、「は」「を」「へ」の使い分けをまるっきり説明ができない子たちでも「は」「を」「へ」を使い分けているのは、スマホで変換候補が出るからだけではないはずである。
 結局のところ、「くっつきことば」を学習させても、その手法で疾病として診断されることなく理解できない者もいるかわりに、使い分けの認知、解釈、表記などのプロセスが無意識化、深層化してしまって、プロセス自体が自身で認知できないし、推定もできない場合、「くっつきことば」を学習することで得られる使い分けの判断手法でそのプロセスが駆動しているかどうかはわからないし、全く別の機序で使い分けができているという可能性も否定はできない。
 推論に過ぎないが、小児期の様々な言語学習にかかる最も効果的な手段や技法と謳うものが使い捨てのごとく提案されれは消えていき、そしてまた新しいものが生まれるということ、そしていずれの場合も万人に適用可能ですべての者に効果的な手段もしくは技法であるわけではなく、必ず例外なり副作用なりデメリットなりが指摘されるに至ることから、例えば疾病において患者の病状や体質に合わせた多剤併用療法が行われるのと同様に各個人別により効率的かつ効果的な手法や技法の組み合わせが異なるのではないかと考える。
 そもそも私自身が「つめこみ教育」に倣った性質を持っているがために感じることではあるが、単一手法を用いて先の気合いとガッツと根性でなんとかするのが均質に学力を持ち合わせた社会人を輩出する教育システムとして「つめこみ教育」が機能していたと考えることもでき、逆にそのことが非効率的な行為であるといえる者もなかには存在し、気合いとガッツと根性が足りないと認定されてしまうと「おちこぼれ」と呼ばれる者になってしまうことなどが問題視されたわけである。
 ただ、変な話、非効率的であるからといって、気合いとガッツと根性でなんとかするような物量でカバーすることを止めると、今度は「とりこぼし」が発生する。
 さらに、教育現場からすれば、その「とりこぼし」に対する単一手法以外の選択肢をもって教えることもできないために、今度はまた別の問題が顕在化したと考えられなくはない。
 氏が調査結果に対し『読書が好きか、塾に通っているか、などはあらかじめ質問紙で尋ねてあった。だが、両者とも結果との相関はなかった。』とするように、表層的な特質として規定される属性としての『読解力』が意識領域のみならず無意識の領域の相当深い部分まで関わっている上に、それらのプロセスに多様なパターンが存在する可能性があること、『読解力』という表層的な特質と数多くの他の表層的な特質とが有意な相関がないことから考えれば、単純に有意な相関がないだけなのか、『読解力』が複合要因で形成される属性であるために、それらを分解して調査分析しなければ正しい結論が得られないのか、はたまた『読解力』の測定方法に何らかの問題があった(実際のところ、個人的にはOECDの読解力の調査についても同様の問題をはらんでいるとは思う)と考えられなくはない。
 しかしながら、こう言う者もいるだろう。
 2つの条件で実験して双方とも有意な相関がないのだから調査そのものに問題はない、と。
 個人的には、これらの2つの条件は双方独立した母集団であるとは考えにくい、と思う。
 著者も『つまり、調査した全ての因子の中で、結果を左右するのは入試を経て中学校に入っているかどうか、だけだったのである。』としているが、この意図してかどうかは分からないが、『入試を経て』の母集団のふるいわけに用いられるプロセスであるペーパーテストが『読解力』を調査するプロセスと酷似しているならば、相関関係が成り立つとしても不思議ではなく、そこから『入試を経』ること、ひいてはペーパーテストがばんばん解けることが『読解力』であると結論付けられるとは思えない。
 個人的には『読解力』が複合要素で構成されていると考えているが、入力→考察→出力に簡単に分けたとして、実際に計測できるのは入力と出力であろう。
 そのなかでも、基本的に出力側の1種類の測定のみをもって『読解力』とすることが多いように思う。
 具体的にどういう実験方法が適切かは分からないが、被験者に、ほとんど同じ論理的思考で正答を導くことが可能な内容であるが、読解力を必要とする設問形式と必要としない設問形式双方を解答させ、その正誤の傾向と他の属性との相関を調べるとかが考えられるだろう。
 また、『サイコロを転がすのと同じ程度』がどのような調査によって定義されたものか分からないわけだが、実際にサイコロを転がした結果(これだと、そもそもその被験者の読解力は測定できていない)なら別として、一定の読解力が存在した上で『サイコロを転がすのと同じ程度』である理由を探るとした場合、先の「考察」の領域を調査しなければならないことになる。
 脳生理学の領域のように電極を刺すとかそんなことはできないと思われるため、多分、1人ずつ設問ごとにどのように考えて解答したのかヒアリングを行わなければならないのかもしれない。
 また、入力側においては、近年の自動車の運転者における認知に関する技術、例えば視線などを用いた居眠り防止検知などの技術が応用できるかもしれない。
 実際に視覚情報がどのように言語化され認識されていくかは分からないが、読んでいる途中で設問のキーワードになる部分に視線が止まる、複数回その部分を参照している視線移動があるなどの特性と解答の正誤に相関があるならば、また別の考え方もできそうではあると思われる。





 と、だらだらと書いてはみたが、入力→考察→出力の一連のプロセスを読解力とするなら、ぶっちゃけ、その能力がなければバカはがんばってもバカと言われてもしょうがない。
 それぞれのサブプロセスで通過するデータが汚染されていくなら、結果は最高に汚染された状態なものになっているであろうし、それぞれのサブプロセスでザルのごとく脱落していくならば、出力は何もない状態(null値。要は解答用紙に転記できないような状態。)か、もしくは何もないために別プロセスが起動してサイコロを振って出力を行うのかもしれない。
 こういった状態が続けば、学力は下がることはあっても上がることはないと考えられても致し方ない。
 私も読解力ないからなぁ。
 記事を読んだだけではさっぱりなのよ。