統計学4

January 07 [Sat], 2017, 23:48
統計データの種類 変量 「統計データは少数あるいは多数の変量からなる」 変量:統計の対象となるものを互いに区別することのできる特性・属性 例:30台の中古車の統計 ア色 赤12台、黒10台、白8台 イ車の状態 非常に良い18台、まあまあ、10台、ひどい2台 ウ価格 30万円未満5台、30万円以上60万円未満10台、60万円以上19台 エ使用期間 1年未満8台、1年以上2年未満12台 @質的変量ー数量・数値では与えられない変量 1名義変量→ア・色→名義付け、分類によって成り立つ質的変量 ・大小比較不可能、平均値算出x、割合有意 2順序変量→イ・車の状態 あるものと他のものを比べて人間が判断して得られる質的変量 割合優位、平均算出可能、ダミー変数 A量的変量→数値、数量で与えられる変量→平均、割合、分布有意 1離散変量→ウ・価格 とりうる値が明確に分かれる量的変量 平均値→実在しないことも(リアルでない数字) 2連続変量→エ・使用期間 とりうる値が明確に分かれず2つの値の間に別の値が存在しうる量的変量 時間などリアルな数字 (1)ゼロ点を持つ変量(ウ・エ) 0がゼロである量的変量→倍数比較は不可能 10℃の水と2℃の水、0円、0年など (2)ゼロ点を持たない変量 0がゼロではない量的変量

統計学3

January 07 [Sat], 2017, 11:44
調査票作成の留意点
@調査の目的(利用方法の明示)
Aあいまいな設問の回避
・単位の明示
・期間
・言葉の意味
B設問の客観性の保持
C個人情報
・個人が特定できる項目は必要最小限にカット
・できるだけ最初に聞かないこと
D予備(事前)調査の実施

統計学2

January 07 [Sat], 2017, 1:18
@全数調査(で作られる統計のことをセンサスという)
利点→統計対象をすべて調査するため最も正確性が高い。
問題点→多くの場合、標本調査が必然(統計対象が多い→資金、時間、労力がかかる。)
例:国勢調査(日本に居住している全員が強制的に答える※650億円)
全数調査が不可能な場合→蛍光灯の耐用年数→壊れるまでずっとつけておく→壊れたら売るものがない。
                 →ひとりの人間の血をすべて調べる→すべて抜いたら死ぬ
全数調査→標本調査という結果に終わる場合→ある高校の卒業生の平均的な所得(10年後)→高い人だけをピックアップした結果になる可能性もある
全数調査が不要な場合→濃度が一定な液体の成分→ちゃんと混ぜられているならば必要はない
A標本調査(一部調査、サンプル調査)
標本(サンプル):全体(母集団)からくじ引き式に抜き取った一部のこと
標本調査の目的:標本という一部から全体を推測する。
標本調査の手法
1任意(無作為)抽出(ランダム・サンプリング)
標本をくじ引き的に任意に抽出→人間の判断があまりはいらないからサンプルの偏りが小さい
ア単純任意抽出→母集団の統計対象に番号を付け乱数表などを用いて現れた乱数の順に標本を抽出
イ系統任意抽出→例:さいころを振る→5→母集団リスト「5」からスタートし100番ごとに抽出
ウ層別抽出→母集団を調査内容に影響を与える事柄によりグループ分けし、各グループから、単純任意抽出あるいは系統任意抽出で抽出。例:企業の利益調査→金額いくらか?大企業と中小企業などグループ別に分けて調査
エ多段抽出→例:内閣支持率・政党支持率などの調査→土地に住む人、移り住む人、地域別に何人ずつ選ぶ
※任意抽出法の問題点:完全な任意抽出は困難
例:1936年のアメリカ大統領選挙予測「リテラリー・ダイジェスト」誌の「失敗」→所得の高い人ばかりを調査してしまった。
2切り捨て法
一定の基準により選択的に標本抽出
例:毎月勤労統計調査ー常用雇用者5人以上の事務所から約33000事業所を抽出(4人以下は切り捨て)→大前提・大は小も表す→1年に1回は4人以下も調査
3典型調査(有意抽出調査、代表調査)
例:地価調査
人間の意志をもってピックアップする。(釧路でいう北大通など)
※典型調査の問題:「代表」の選択は人間の判断による→恣意やズレの余地大
例:消費者物価指数をめぐって
B標本誤差(どの方法を用いても、標本誤差は必然的)

統計学1

January 06 [Fri], 2017, 15:22
結果が決まっているアンケート→強制選択
関係がある→相関関係
原因と結果→因果関係
一部を取り出して全体を見る→サンプル調査
「記述統計」としての統計の役割→データをもとにものごとの傾向や法則性を認識
「推測統計」としての統計の役割→記述統計に基づいてこれまでに観測されていないことを推測・予測
統計の存在理由→人間生活の不確実性を減らす、そしてその影響を小さくする。
統計データとはなにか→数値と測定単位。(2、人の人間)(10、個の卵)
a自然統計→統計対象である母集団が自然(動物の体重など)
b社会党系→統計対象である母集団が人間(ある人の一か月の収入と支出など)
母集団→統計的規則性を明らかにしたい対象について、観察可能なすべての潜在的な観測値の集合
測定誤差→自然統計も社会統計も事実とはズレるが自然統計は社会統計よりも隠し事がないぶん確からしさは高い。
労働力調査→それぞれの家庭へ(主に雇われる側、労働者)への調査※おそらく事実に近い
毎月勤労統計調査→やとい主への調査
サービス残業→違法
演出される「正しさ」→数字であるがゆえに正しいように見えがち。演出することができる。
統計と誤差の問題→統計は事実の「反映」。統計は事実からなんらかのかたちでずれるもの。この誤差は0にはならない。
a統計本来の誤差
測定データの場合→測定器具の誤差(精度の問題などどうしようもない誤差)
調査データの場合→人間の判断(個々違う上中下の感覚)
b標本(サンプル)誤差
全数調査が不可能な場合→一定数のサンプル(標本)を選びそこから全体を推測(サンプルが全体を代表するとは限らない)
例・特殊なサンプルから全体を推測してしまった。
例・釧路市議会議員選挙の世論調査
例・平日の午前中の街頭インタビュー→層が限られる
統計を数学的に扱うことの危険→一軒の家を建てるのに人数を増やせば増やすほど早く終わるわけではない
見せかけの正確性の問題→平均月収186321円→19万か186000にする方が正確に。
社会統計における概念の問題→例:本の購入冊数調査
プロフィール
  • プロフィール画像
  • アイコン画像 ニックネーム:準 ちよ子
読者になる
2017年01月
« 前の月  |  次の月 »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
最新コメント
ヤプミー!一覧
読者になる
P R
カテゴリアーカイブ
月別アーカイブ
http://yaplog.jp/juntyokore-to/index1_0.rdf