前回に引き続き、今日もSIGNATEのBeginnersコンペに挑戦しています。
(【SIGNATE】第6回_Beginner限定コンペ「PCゲームの勝敗予測」に挑戦中【機械学習】 | Best Practice (find-best-practice.com))
コンペ初挑戦なので、この休みの間にモデルを作成して実際に提出を行う段階までを目標としていましたが、何とかこの部分はクリアすることができました。
データを読み込む。基本統計量を調べる。相関係数を調べる。視覚化する。などの部分は他の学習コンテンツを見ながらですが、何とかできました。
ちなみに、sklearnのsvmを使っています。
先週の土日に、何から始めたら良いかわからない段階でスタートしたという理由はありますが、
正直、手法がいくつかある中でそれぞれの特徴や違いも全く理解していないので、ここから先、予測精度を向上させるために何をしたら良いのかがわからず詰まっています。
元々のデータから学習に使用するデータを絞ってみたり、新たな特徴量を作ってみたりしていますが、精度が上がったり下がったりで中々うまくいきません。
次の休みまでに予測精度を向上させる方法と、他の学習手法について調べることにします。
1日の投稿回数は限られているので、毎日少しずつで良いのでトライしていきたいです。
コンペの期限は1/31なので、期限までにBeginnerからの昇格ラインである78.5%まで予測精度を向上させることを目標にします。
SIGNATEのコンペの詳細はこちら
【第6回_Beginner限定コンペ】PCゲームの勝敗予測 | SIGNATE – Data Science Competition
コメント