マルチコ、もう少し状況を理解する データモデリングの最も重要な手法である最小二乗法をもう一度見てみましょう。最小二乗法は、 を満たすベクトル^β β^ を求めることでした。ここで求めた推定式が、変数x1,x2 x1,x2 の間でマルチコが発生したとしましょう。このときx1,x2 x1,x2 の推定さ […]
一昔前までは、データの取得には大変コストがかかり、貴重でした。しかし現在では様々なデバイスからデータが取得できるようになり、ビッグデータと呼ばれる巨大なレコード数を持つデータセットが手に入るようになりました。これだけデータがあれば、結構自由に分析できる・・・と思うのは少し早いかも。データが増えたのは […]
データの活用で直線のあてはめというのは様々なところに出てきます。何かを予測するとき、データ間の関係性を見るとき、目的はいろいろですが、ばらばらに獲得したデータの関係性を紐解いていくうえでまず直線であてはめてみるというのは定石です。その最も基本的な手法が、推計した直線と実際のデータの差(誤差)を最小に […]
毎年、サンタクロースは24時間以内に世界中を巡るのに、超大型巡回セールスマン問題を解いているそうです。大変なのはそれだけでなく、良い子(nice)だと思っていた子が急に悪い子(naughty)になってしまって、配送計画が狂ってしまうことだそうです。そのようなことを避けるために、サンタさんはDeep […]
最近は便利になったもので、ブログでも比較的自由に数式を書くことができます。それなら、ということで、数学の復習なんかもブログにしてみようと思います。最初の話は、ノルムの話です。 ノルムの概念に近いものとしては、距離(distance)というのがあります。数学的にも非常に近い概念ですが、ノルムは距離の概 […]