SSブログ

#2890 個人別偏差値と地域別偏差値論考(1)  Nov. 30, 2014   [68.H26全国学力テスト・データ分析]

 #2888で14支庁管内別偏差値の解釈について計算過程の説明を交えて解説をしましたが、読者の検索の便に供するために独立させるとともに、加筆を行います。
 偏差値計算手順は簡単なので都道府県正答率データを利用して14支庁管内の偏差値を計算・公表しましたが、その解釈はそれほど簡単ではなさそうです。たとえば、根室管内偏差値29.0は根室管内の中3年生のほとんどが個人別偏差値30以下だということではありません。
 北海道は公立中学校で偏差値が排斥されてきたのでその仕組みや解釈に不慣れであるようですから、この際、統計的に妥当性の高い偏差値の仕組みと限界を説明してみたいと思います。
 書いているうちに私の理解も深くなるものと期待しています。
 2回に分けてアップします。

--------------------------------------------------
<データ取扱上の注意> 11月28日早朝追記
 私が算出している偏差値は道コンのSSや進研模試の個人結果表にある個人別偏差値とは同列に扱えません。
 都道府県別・科目別の正答率データ(47×4科目=188データ)から4種類の標準偏差を計算して、その基本統計量データと新聞が公表した14支庁管内の正答率データを用いて算出した偏差値です。

====================================== //ここから加筆部分

 算式の説明からしましょう。数学記号を使えないので日本語で表示してみます。

 ①平均=(データの合計)÷(受験者数)
 ②偏差=(データの数値)-(平均値)
 ③分散={(偏差の2乗)の合計}÷(データ数)
 ③´分散=(階級値-平均値)^2 × (相対度数)の合計
 ④標準偏差=√分散
 ⑤偏差値={(データ)-平均}÷標準偏差×10+50

(1) 通常の偏差値計算は受験者全員の科目別データから①を計算します。
(2) その平均値を使って続けて②の計算をします。
(3) 次いで③の計算を行い、分散を計算します。(分散)^0.5が標準偏差です。分散の平方根が標準偏差といった方がわかりやすいでしょう。
(4) 標準偏差を使って⑤の算式で計算されるのが、進研模試や道コンの偏差値です。

■都道府県別元データは国立教育政策研究所ホームページにあり、ダウンロードできます。EXCELの使い方は高校生なら知っているでしょうから、興味のある人は自分で計算してみてください。
 
 個人別偏差値を算出する場合には、全部の生徒のデータから分散を累計(∑(分散値))しなければならないのですが、今回の学力テストデータで私がやった方法は都道府県別偏差値を算定するためのものでして、これとは少し取り扱うデータが違います。都道府県ごとの平均正答率とその単純平均値を利用して「∑(分散)」や標準偏差を計算しています。

■ 個人別偏差値を計算して全国レベルで自分がどれくらいの位置にあるのか学力テストを受験した皆さんは知りたいでしょう?
 
とくに北海道のように高校生になるまで全国模試を受験する機会のない地域では小学6年生と中学3年生対象に実施されている全国学力テストが唯一のチャンスです。小6の段階でクラストップの生徒が全国レベルで平均値にも達しないことがわかったらその子は発奮するでしょうね。ところが現実は全国レベルでは平均程度の学力しかないのに、クラストップということで慢心して、努力を怠ってしまいます。そして高校1年生の6月に進研模試を受験して全国レベルでの自分の実力を思い知るのです。大学受験という観点からはほとんどの生徒が手遅れになります。文科省は罪が深い、基本統計量データを非公開とすることで僻地の小中学生が自分の全国レベルでの学力を知る権利を奪い、学力格差を拡大する片棒を担いでいるのですから。意図的にやっていることではないでしょうが、結果的にそうなっています
 根室の子どもたちは小学6年生の全国学力テストで自分の全国偏差値を知るべきです。

■ 都会と地方の学力格差は大きく、僻地の学力の現実は厳しいものがあります。これでは地域が衰退するのも学力から考えて当然です。地方の子どもたちは6年生のときに自分の全国レベルの学力を偏差値で知って、発奮してほしいと思います。大人は子どもたちにそうしたチャンスを与える努力をすべきです

 標準偏差がわかれば誰にでも⑤の算式で計算できるのですが、文科省のデータ非公開が障害になっています。①の平均値は公開資料に全国平均値が載っているので利用できますが、受験者個々の正答数は公開されていないので②以下は文科省のお役人以外は計算できません。
 文科省は①②③④⑤のデータ(基本統計量)を公開すべきです。計算された基本統計量は個人データ(生データ)ではありませんのでプライバシーの問題はありません。全国学力テストは公費で行われているので、国民共有の財産であるから公開すべきだというのがebisuの主張です

■ 私の興味は14支庁管内が全国でどのような学力位置にあるかということです。公開されたデータから同じ方法で偏差値を計算することはできないのかという眼でデータを眺めたら都道府県別偏差値計算のために必要にして充分なデータがありました。
 都道府県別・科目別のデータがEXCELファイルで公開されているので、これを利用します。

   47都道府県×4科目=188データ

 このデータで都道府県別偏差値は妥当な方法とデータで計算できます。

■ ところが14支庁管内偏差値は、全国の行政組織がこのような区分になっていないので計算不可能です。そこで都道府県別・科目別データで算出された標準偏差を全道14支庁管内別標準偏差として代用してみます。もちろん14支庁管内で集計されたデータがベースではないので、影響を受ける部分があります。それがどこなのかがはっきりわかっていれば、データの限界を意識して、限界内で計算された偏差値を理解することができます。

■ 個人別偏差値計算に使うデータと都道府県別偏差値計算に使うデータは違いが大きい。個人別偏差値計算には受験者個々のデータが分散値の計算に用いられますが、都道府県別偏差値には、都道府県別平均正答率が用いられます。、都道府県別に集計したデータの平均値ですから、受験者個々のデータから集計した分散値よりも幅が狭くなります。だから、都道府県別偏差値で計算した標準偏差は個人別偏差値に流用できないのです。

■ しかし、都道府県別偏差値計算で算出された標準偏差を14支庁管内に流用することはOKです。どちらも集計値(平均値)がベースになるので、データの分布の幅が小さくなり、したがって分散値や標準偏差値が小さくなっているからです。

■ 平均値をみてみます。国語Aをサンプルに挙げます。
 A:平均=(都道府県別ごとの平均正答率合計)÷47
 ①の算式で計算した全国平均正答率データは79.8で、Aの都道府県別データで計算した値は79.57ですから誤差は0.23です。真のデータに対しては誤差なしと判定してよいでしょう。
 「分散」と「標準偏差」が影響を受けます。
 ②偏差=(データの数値)-(平均値)
 この算式の(データの数値)に都道府県別の正答率平均値を使ってしまうために個人別偏差値計算のときの標準偏差よりも値が小さくなります。これは当たり前のことです。個人別偏差値計算には個人別の全データから算出した標準偏差を使いますが、都道府県別偏差値を算出する場合には、都道府県別集計データ(平均値)から標準偏差Aを計算しますその結果、③の分散も小さくなり、その平方根である標準偏差(仮に「A標準偏差」と呼びます)も小さくなりますが、都道府県単位での相対的な位置評価にはA標準偏差を利用する使って偏差値を計算するのは統計的には妥当性があります。都道府県単位での分散は全データで計算した③の分散よりも小さいからです。

■ ここまでではっきりしたことは、個々人の偏差値と、都道府県単位の偏差値は計算の仕組みが異なるということです。分散は全データで計算したものよりも地位単位の平均正答率を使うのでずっと小さいのですが、都道府県単位の偏差値として利用することは統計学的に正しいわけです。
 言い方を換えると、個々のデータではなく、学校単位や市町村単位、全道14支庁単位、都道府県単位での偏差値は同じ区分でそれぞれの集計単位ごとに平均化されたデータ、つまり原データの平均値(メタ・データ)を用いて計算されるということです。

■ 市町村単位での偏差値計算には、市町村単位の平均正答率を使って標準偏差を算出し、それを⑥の算式に入れて偏差値を計算すべきですが、文科省は市町村別の平均正答率データを公開していません。それは各市町村教委の判断に任されています、ずるいですね。これでは国民は永久に自分の市町村の子どもたちの偏差値を知ることができません。偏差値を計算するためには全市町村ごとの平均正答率データが必要となりますが、各市町村教委に情報公開の判断を委ねたら市町村別の基本統計量は文科省以外には知る術がなくなってしまいます。

■ もうお気付きでしょうが、14支庁管内別の偏差値計算には全国を支庁管内に分割した単位での平均正答率データがなければなしえません。そういう行政区画の分割は道内以外には存在しませんから、これも暗礁に乗り上げてしまいます。文科省が公開したいと思ったとしてもそういう支庁割が全国的になされていないので不可能です。

■ そこで14支庁管内を偏差値で評価するために、都道府県単位で算出した標準偏差を代用した、それがebisuが採用して方法です。単位の大きさの関係は次のようになっています。右に行くに従って分散と標準偏差が小さくなります。問題はその程度なのですが、それは不明です。市町村データがあれば、それを使った偏差値を計算して、都道府県別データでの偏差値と比較してみたら、14支庁を挟み撃ちにできます、やってみたいですね。

   受験者数<学校<市町村<14支庁<都道府県
  
 受験数:約101.8万人
  参加中学校数:9742校 北海道621校
 市町村数:市790、特別区23、町745、村183、合計1741市町村
  
■個人別偏差値は全データから標準偏差を計算して偏差値を算出するが、学校単位や市町村単位や都道府県単位の偏差値はそれぞれを構成する集団単位の平均正答率を元にして標準偏差を算出し、偏差値を計算するのが正しい。個人別偏差値に集団を単位とした標準偏差を使うのは正しくないし、逆もまた正しくない。集団を単位とする偏差値はそれを構成する細分化された集団の平均正答率を用いて計算されのが当たり前です。平均値が標準偏差計算の元データとなるから、個人別データを元にした標準偏差よりもずっと小さくなります。だから、集団を単位とする標準偏差を個人別偏差値計算に流用してはいけないのです。ですが、特定の集団に細分化した単位での基本統計量を流用しても大きな差は生じないものと予想されます。平均値を出すことでどの単位で計算しても分散が小さくなるからです。

 公開されているのは全国平均と都道府県別・科目別正答率のみ、この制限内で計算したのがご覧いただいている14支庁管内別偏差値です。
 不等号で示された四つの単位は、どれも個々のデータを集計した平均値データです。メタ・データを扱うことでは変わりはない。
 わたしは、これら四つの区分での学力テスト結果データの公表と各区分ごとに計算された基本統計量をEXCELファイルで公開してほしいと思います。
 仕組みについてはだいたいのところはお分かりいただけたのではないかと思います。

■ FB上の掲示板ででいただいたご意見を一つだけ紹介しておきます。それは14支庁管内に偏差値30以下が3支庁あるのは正規分布の出現率を考えると偏差値計算にどこか問題があるのではないかという、至極当然の疑問でした。
 わたしは日高・後志・根室管内の中3の子どもたちは全国レベルでは下位2%以下の学力地域なのだろうと考えています。北海道が偏差値46.8で全国33位、その中で日高・後志・根室の3支庁管内は最底辺の学力ですから、偏差値が30を割るほど学力が低いのだろうと判断しています。(⇒ここはebisuの判断)
 ふだんの学力テストの結果からも根室市内の市街化地域3校の学力がこの数年間ほどかなり下がっているからです。そのことはふだんの学力テスト結果からもいえます。実際にこれら3支庁管内の正答率データは、都道府県別では46番目の高知県(偏差値32.6)よりも低くなっています。
 全国の市町村別の標準偏差データが公表され、利用できれば偏差値は少し上がるでしょうが、下から2番目の高知県よりは下で、一番下の沖縄県との間に位置していることは事実です。

■全道平均正答率と14支庁管内単純平均正答率は次のようになっています。「全道A」の方が14支庁管内単純平均値です。札幌のウェイトが大きいので14支庁管内単純平均値の方が小さくなっています。このことは札幌市の公立中学校の参加が1/3ではなく全数になると14支庁管内正答率単純平均値を実際の北海道平均正答率が大幅に上回ることを意味します。
 都道府県別では北海道の偏差値は46.8ですが、14支庁管内単純平均値の偏差値は42.2に下がります。札幌が全数参加するかしないかで、北海道の全国ランキングは大きく変動します。

  <14支庁管内別正答率データ>
 国語A国語B数学A数学B合計平均
全道A78.547.9164.1456.95247.561.9
全道79.4 49.9 66.0 59.4 254.763.7
0.9 2.0 1.9 2.5 7.2 1.8
全国79.6 51.0 67.4 59.7 257.764.4



======================================// ここまで加筆部分


 本来なら、受験者全員のデータを使って計算すべきですが、文科省からデータが公表されていないのでやむをえず都道府県別・科目別集計データから基本統計量を計算しています。ですから個人別偏差値とは性格が違い、地域全体の相対的な評価を表すものです。その尺度は都道府県別・科目別の集計データを利用して作成された標準偏差や平均値をベースとして作られています。高校生なら進研模試で受験した「学校偏差値」(あれ、「校内偏差値」はあったけど「学校偏差値」はあったかな?)のようなものと考えてください。私の高校の平均偏差値は40で学力の低い高校だとか、学校の平均偏差値が60だから相対的に学力の高い高校なんだという風に。
 いま手元にある「進研模試総合学力テスト個人成績表」を確認しましたが「学校偏差値」は出力されていません。

 次いでですから脱線しちゃいましょう。学校ごとの偏差値を個人成績表のように算出できないかという疑問をもった人がいると思います。もちろんできます。そのときは学校別の正答率データの科目別平均値から標準偏差を計算します、偏差値の計算式はいつでも同じです。どこかに書いておいたのでここでは端折ります。
 学校別偏差値に使う標準偏差を計算するときの作業手順を書いておきます。全国の中学生の正答率データを受験会場になっている学校識別コードで集計して人数で除して平均値を求めます。その学校別の科目別正答率平均値を基礎データにして標準偏差を計算して偏差値を算出すればいいのです。基データは一人一人の中学生のデータで、それを集計したデータから標準偏差を求めることになるので「メタ偏差値」と言い換えてもいいでしょう。全国の生徒が受験した「学校一つ一つの真の偏差値」が計算できます。その偏差値は全国の中学校の中で、それぞれの学校の相対的な学力テスト成績の位置を表すことになります。
 同じ作業を全国の市町村識別コードでデータをソート(並び替え)をして、市町村識別コードごとに集計すれば全国の市町村の学力テスト成績格差が偏差値で表現されます。残念ながら、北海道の14支庁管内のような行政区域の分割は他の県にはありませんので全国データで14支庁管内のような単位で偏差値を算出することは今年度のデータに関しては実務上不可能です。市町村では可能ですから、文科省は市町村別の基本統計量を公開してもらいたい。そのデータで計測しても根室市の偏差値は33前後でしょうね。日高と後志は20代の偏差値が出るはずです。全国でも沖縄に次いで最底辺の学力の地域であることは間違いがなさそうです。ただデータの解釈は間違えないでいただきたい、その地域の中3生全部の学力が低いということではなく、高学力層が他に比べて極端に薄くなっていると同時に、基礎学力の問題のある成績下位層が異常に肥大化していることは間違いのないことだと考えます。
 市町村別の基本統計量は学力の低い全国の地域の子ども達にとって学力向上の大きな武器になるだけでなく、国民が共有すべき重要な財産です。

 次に問題となるのはたった47×4科目のデータ数で、全体の傾向を表しうるのかということです。充分な妥当性があると思っています。20~30だとサンプリングしたデータの「個性」に結果が左右されますが、ベースにしているのは全国の中3生のテストデータを都道府県別に集計したデータですから、妥当性は確保されていると考えていいでしょう。問題は集計データですから、分布の幅が小さくなることや正規分布から大きく外れる可能性が予想されます。前者の問題は避けられませんが、後者の問題は都道府県別の偏差値をご覧いただければおおよそ正規分布に近いであろうことがわかります。沖縄県の偏差値が18ですから、これだけが「外れ」です。「同じ母集団に属さないデータ」、つまり「異常値」と考えていいでしょう。ですが、日高・後志・根室管内は全国市町村レベルで最底辺2%に近いのかもしれません。
 14支庁管内の偏差値の幅は26.5~54.0です。一番低い日高管内の偏差値26.5は正規分布では出現率が1%です。根室管内の偏差値29は1.8%の出現率に相当します。真偽のほどは全国市町村ごとの平均正答率をベースにした標準偏差を公開しない限り不明です。この種のデータは教育行政が独占すべきものではなく国民共有の財産だというのが私の意見です。文科省はこうした国民の権利を侵害しています。私たちは自らの権利を守るためにももっと強く学力テスト・データ公開を主張すべきです。
*参考資料「#2709 偏差値と「100人(百校)中の順位」対応表 June 22, 2014 」
http://nimuorojyuku.blog.so-net.ne.jp/2014-06-22


 ここまで述べてきましたが、皆さんにも全国学力テストの改善点がはっきりと見えてきたのではないでしょうか?

○4科目92問では問題数が少なすぎ、狭い範囲にデータが集中してしまうので、問題数を2倍くらいに増やすべき

 問題数が増えれば、今度は「読み・書き・計算」基本技能の処理速度の差も正答率に現れます。その結果、正答数の分布が広がって有意義なデータがとれます。文部科学省の決意次第でやれることですから、ぜひ改善検討をお願いしたい。


 根室市の偏差値が33.7というのは、もちろん全員が低学力で小学校4年レベルの学力しかないということではありません。500点満点の文協学力テストで400点をを越える生徒が4~8%くらいいます。しかし、石狩管内のデータはありませんが、文協学力テストで400点超は20%前後はいるのではないかと思います。
 読み・書き・計算については中3で小4レベルの生徒は根室管内では20%程度(中1では3035%)いるようです。「読み・書き・そろばん(計算)」の基礎学力に問題を抱えている生徒は偏差値54の石狩管内に比べて比率で3倍くらではないかと考えています。
 なんども弊ブログで根室市内の市街化地域の3中学校のふだんの学力テストの得点分布をとりあげていますが、この数年間、五科目500点満点で400点を超える学力上位層が1/3以下にやせ細り、200点以下の低学力層が肥大化していることに警鐘を鳴らしていますが、今年の学力テストの結果からは、そういう得点分布の異常さが根室管内に広がっており、その実態は根室市内よりももっとひどいということを表しています。今年度の中3年生だけが特別に学力が低かったのかそれとも根室管内全体の中学生の学力がこんなに低いのかは、来年度以降のデータをモニターしなくてはわからないことです。年度ごとのデータの比較ができるように、人口の多い札幌市は学力テストに全校が参加してもらいたいと思います。そうでなくては昨年の根室市教委のように、学力の高い札幌市の2/3が参加しないことで全道平均値が低くなっているのに、「全道との差が縮まった」と(実際には道内でも学力の地域格差が拡大しているのに)データの読み違いをしてのんきなコメントを出すところがでてきます。

 加工したデータの話だけでは誤解の恐れがあるので、実際の正答数の差についても言及しておきます。
 根室管内の中3の生徒たちが4科目合計92問中正解を7問増やせば、石狩管内に並びます。偏差値では54と29ですからその差は25もありますが、実際の正答数の差はそんなに大きくはないのです。

 算出された偏差値は地域ごとの中学3年生の平均的な学力を相対的に表したものです。4科目それぞれ47データあるので母集団全体で計算した標準偏差とそんなに大きな差は出ないと考えます。
 標準偏差の値が動いても、それによって表現される各地域の相対評価は動きません。理由は簡単です、地域ごとの平均正答率データは各地域の全データから集計・計算されたものだからです。

 文科省は全データの基本統計量市町村別の基本統計量を公表してほしいと思います。そうすれば地域の正答率データを市町村教委が公開しているところは高校生でも自分の住んでいる地域の真の偏差値を計算できます。隣の市町村とどの程度の差があるのかもわかります。

 道教委が掲げている「全国平均を超える」という目標を達成するためにも、学校別・科目別のデータを公表すべきなのです。そうすれば各中学校は具体的な数値目標を立て、目標達成のための戦略を策定し、全国学力テスト結果データを見て、自分達の実践が効果があったのかどうかの判定ができます。目標を達成できなかったら、戦略を見直したらいい。どこの企業でもやっているPDCAサイクルがしっかり回ります。

--------------------------------------------------

 #2859 全国学力テスト:根室市教委の「結果報告書」-1   Nov. 7, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-07

 #2886 H26全国学力テストデータ分析 (2) :中学校・都道府県別・科目別偏差値表  Nov. 27, 2014  
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-27-1

 #2887 H26全国学力テストデータ分析(3):14支庁管内別偏差値 N0v. 27, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-27-2

 #2888 H26全国学力テストデータ分析(4):前年対比14支庁管内別偏差値 Nov. 28, 2014  
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-28

  #2890 個人別偏差値と地域別偏差値論考(1)  Nov. 30, 2014   
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-29-1

 #2891 個人別偏差値と地域別偏差値論考(2)  Nov. 30, 2014
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-30

 #2893 個人別偏差値と地域別偏差値論考(3)  Dec. 1, 2014  
http://nimuorojyuku.blog.so-net.ne.jp/2014-12-01

  #2894 個人別偏差値と地域別偏差値論考(4):14支庁管内別偏差値の妥当性  Dec. 3, 2014
http://nimuorojyuku.blog.so-net.ne.jp/2014-12-02


------------------------------------------------

*#2606 根室の中学校の過去6年間の学力低下を検証する  Feb. 28, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-02-27-1

 #2672 急激な学力低下はなぜ起きているのか?:假説 May 10, 2014
http://nimuorojyuku.blog.so-net.ne.jp/2014-05-09ある

 #2806 高校数学面白い問題 :小中学校の先生たちへ Sep. 14, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-09-13-2

 #2869 根室の中学生の学力の現況(1):B中学校の例 Nov. 16. 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-16

 #2870 根室の中学生の学力の現状(2):C中学校  Nov. 16, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-16-1

 #2871 根室の中学生の学力の現状(3):学級崩壊  Nov. 16, 2014
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-16-2

 #2872 根室の中学生の学力の現状(4):B中学校2年生も問題あり Nov. 18, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-18

 #2873 根室の中学生の学力の現状(5):C中学校1年 Nov. 19, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-18-1

 #2875 根室の中学生の学力の現状(6):B中対C中学校1年 Nov. 20, 2014  
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-20

*#2865 マルクスの労働観と日本人の仕事観:学校の先生必読 Nov. 13, 2014 
http://nimuorojyuku.blog.so-net.ne.jp/2014-11-13

 



にほんブログ村 地域生活(街) 北海道ブログ 根室情報へ
にほんブログ村


nice!(0)  コメント(0)  トラックバック(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0