データマイニングって何?
自分の時間を堪能中な主婦です。
この年齢で、教養のなさに泣けてきたので自己学習することにしました。
アナリストに近い仕事をしてきたので、やっぱり勉強するなら「データマイニング」でしょ!ということでデータマイニングで何かしてみる事にします。
でも、色々ブログや記事をみて、難しい言葉がいっぱいでてきて結局わからない事が多すぎる!ということで、メモ代わりにブログを書いてみる事にしました。
ということで、
初めてのブログ「データマイニング」って何?
私がやりたいのは、大量のデータをぐりぐりっといじってみてなんか発見してみたい!
でも、世間ではデータマイニング・機械学習・DeepLearning・統計解析など分析に関する記事がたくさんあり、大混乱です。
・・・違いがさっぱりわからない。
私がやりたいのは機械学習なのか?DeepLearning?統計解析?データマイニング??
そもそもタイトルかわってくるじゃんと感じながらググりました。
どれが正解なんでしょう(> <)
イメージでは、
>機械学習・・・・様々な分析手法がプログラミングされていて、ちょっと変数(=特徴)をいじるとなんか出てくる?
>DeepLearning・・・・機械学習の進化版?変数をいじる必要がなさそう
>データマイニング・・・大量のデータから何か発見する?
>統計解析・・・サンプルデータから、取得できていない分散(散らばり)や平均をを推測する?または、
みたいなイメージ。。
素人のイメージはどうでもいいとして、調べてみました。
>機械学習
- コンピューターでアルゴリズムを構築し、学習データを読み込ませることで、自動的に今あるデータを分類&まだ見ぬデータを予測できるようにするもの
- ヒトの情報処理能力を超えて、複雑なデータを分類&予測できるようにするもの
参考サイト:「機械学習とは何ぞや」をゆるーく説明してみる - 東京で働くデータサイエンティストのブログ
>DeepLearning
・ ニューラルネットワークを多層積み重ねたモデルを機械学習させたもの
ニューラルネットワークとは・・・ロジスティック回帰を組み合わせてつくったモデルを機械学習させたもの?
・ データを入力すると、情報が第1層からより深くへ伝達されるうちに、各層で学習が繰り返される。この過程で、データの研究者、技術者が手動で設定していた特徴が自動で計算さる。
参考サイト:ディープラーニング - Wikipedia
勝手に計算してくれるなんて便利!
決定木と線形とPCAを組み合わせても、DeepLearningとはいわないのかな?とか微妙な疑問も残ります。。
機械学習が微妙なのでまだ扱えないかな。あと自分で発見した面白みがないですね。
・ 統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のこと
参考サイト:データマイニング - Wikipedia
ということで、やりたいことは
大量のデータをぐりぐりっといじってみてなんか発見してみたい!
のようです。