昨シーズンの原木椎茸栽培のデータを眺めています(データはこちらでオープンデータとして公開しています)。
けっこういろいろ分かるかなと安易な皮算用をしていたのですが、なかなか簡単にはいきませんね。
それでも、あれこれデータを組み合わせてはグラフを作って、眺めて、を繰り返していたところ、やっと分かりやすいそれっぽいものが。
x軸に「平均温度」、y軸に「収穫までの日数」をとった散布図です。
相関係数を求めると、
R = -0.9027907674
でした。
平均温度が上がると、収穫までの日数が少なくなる強い負の相関があると言ってよさそうです。
「平均温度 → 収穫までの日数」という因果関係は明白なので、散布図に単回帰分析の結果を表示してみます。
回帰方程式: 収穫までの日数 = -1.4*x + 37.4
決定係数: R² = 0.817
平均温度が10℃なら収穫までの日数は23.4日
平均温度が15℃なら収穫までの日数は16.4日
平均温度が20℃なら収穫までの日数は9.4日
経験的にも、だいたいこのくらいな感じがしますね。
この回帰方程式が分かると、平均温度の値から収穫までの期間を予測できますので、栽培計画が立てやすくなります。
せっかくなので、もう少し詳細に単回帰分析の結果を見てみます。
Google スプレッドシートのアドオンとして提供されている「XLMiner Analysis ToolPak」というツールを使うと一発で各値が出ます。
使い方は検索すれば出てきますので省略。
「平均温度」を説明変数、「収穫までの日数」を被説明変数として単回帰分析を行った結果がこちら。
補正R²が0.8以上、P値も限りなくほぼ0ですので、「平均温度」で「収穫までの日数」を説明できていると考えて問題なさそうです。
スプレッドシートやツールを使えば簡単に数値は出せますが、統計で肝心なのはその数値をいかに読むかですね。
まだまだ全然勉強が足りていませんが、楽しい原木椎茸栽培ライフのために頑張ります。
***
そういえば、ネット上で教材になるようなものををいろいろ探してみたのですが、「総務省 ICTスキル総合習得プログラム」がめちゃいいですね。データ分析はコース3にあります。
その他、そもそもの統計の勉強のとっかかりには以下の書籍など。
マンガでわかる統計学 素朴な疑問からゆる~く解説 (サイエンス・アイ新書)
by SimpleImageLink
統計の初めの一歩にぴったりですね。まずはこれ。
統計思考入門 ― プロの分析スキルで「ひらめき」をつかむ
by SimpleImageLink
どんな場面で、どんな風に統計を使えばいいのかの雰囲気がわかります。Amazon プライム会員ならPrime Readingで無料で読めます。
・関連投稿
Twitter(@nkkmd)日々更新中です。