Elsaの技術日記(徒然なるままに)

主に自分で作ったアプリとかの報告・日記を記載

MENU

Kaggleに登録してみました

OpenCVを触っていくうちに画像処理系の機械学習をもう少し学んだり発信していきたいなと思ってきました。

それで、何かいい方法ないかな?と調べてみたところ、
f:id:Elsammit:20200924230350p:plain
という、機械学習をメインに取り扱うデータサイエンスに携わっている人々のコミュニティを見つけました。


ちょっと自分には早いかな?とも思ったのですが、、、
初心者歓迎的な感じだったので、実際に登録して触ってみたのでちょっと報告です。

■Kaggleとは?

Kaggleとは、世界最大の機械学習コンペティションのプラットフォームです。
企業や研究機関などが提供するデータについて、世界中から集まる参加者が機械学習モデルの性能を競います。
同時に、界中の機械学習・データサイエンスに携わっている約40万人の方が集まるコミニティーとなっているようです。
コンペティションは、企業や政府がコンペ形式(競争形式)で課題を提示し、賞金と引き換えに最も制度の高い分析モデルを買い取るという、最近でいう一種のクラウドファンディングに近いような仕組みとなります。

このコンペティションですが、Kaggleに参加している人たちは無料で参加可能です。
さらにさらに!!
レーニング用のデータセットや必要なデータは企業から提供されており、テストセットでの評価までも可能になっております!!

まぁ、まだコンペティションに参加するまでの技術力はないのでまだまだ先の話なんですけどね(-_-;)


そんな自分のような初心者でも、Kaggleはおすすめとなっております!!
Kaggleには
 ・Notebooks
 ・Courses
の機能があります。
これらの機能を閲覧したり、実際に触ったりすることで少しずつ機械学習を学ぶことが出来るようになっており、
最終的にはコンペティションに参加出来るまでの技術力が身に付きそうです!!

■Coursesとは?

pythonコードの書き方から機械学習入門、pandasの使い方などの学習コースが受けられます。
こちらは基本的に無料で受講可能なようです!!
※作成はKaggleに参加しているデータサイエンティストの方々のようです。

但し、全て英語で記載されていますのである程度の英語力が必要になってしまいます(-_-;)
私、、、英語出来ないんですよね泣。
機械学習入門を受講しているのですが、結構英語の壁にぶつかっております泣。

■Notebooksとは?

Notebooksは、PythonやRなどの言語を使い、自分で作成したプログラムを実行することが出来る環境が用意された機能となります。
このNotebooksのメリットは何といっても
無料で機械学習が実行できる最低限の環境が構築不要で提供されている
ことです!!
勉強したことや試してみたい機械学習を実施するには問題ない環境が無料で使用可能です!!

また、他の人が書いて公開されているコードや説明が閲覧可能です。
先ほど記載した通り、40万人のデータサイエンティストの方々がKaggleに参加しており、
その方々の説明やコードを見るだけでもかなりの勉強にもなります!!

Notebooksのコードや説明は公開/非公開で切り替えられるようになっているため、
自分で公開したい内容に限定して公開することが可能です。
また、公開していると他者からコメントとかも届くようです。

勉強にはもってこいですね。

■Notebooks使ってみた

KaggleにログインするとこちらのようなHome画面が表示されます。
左端のNotebooksをクリックすると、こちらのような画面が表示されます。
f:id:Elsammit:20200924223555j:plain

publicタブでは他の方が公開にしているコードや説明を閲覧することが出来ます。
pandasなどのライブラリの備忘録を作成している人やYOLOなどの実際の機械学習を書いている人など様々です。
閲覧だけでも勉強になるので、よさげ。

まだ機能の利用は出来ていないですが、公開されているコードをコピーしたりAPIとして自分の環境上で編集することも出来るようです。
ベースとして利用することで、自分の実施したい内容に集中できそうです。



Your Worksタブには自分が作成している非公開・公開の環境(コードや説明)の一覧が表示されます。
また、Course機能で受講時に作成したコードもこちらで見るとことが出来るようです。


Notebooks新規作成ボタンがあります。
新規ボタンを押下すると、
f:id:Elsammit:20200924224632j:plain
といった画面が表示されます。
Select Languageにて、「Python」もしくは「R」のどちらかを選択できます。
また、エディターとして、「Notebook」もしくは「Scripts」のどちらかを選択できます。
Notebookはjupiter notebookのようなエディター形式となっております。

Select Languageやエディターについてはお好みで選択ください。

Notebookを選択した場合にはこのような画面になります。
f:id:Elsammit:20200924225439j:plain

左の▶をクリックするとコードの実行が行われます。
また、右タブの+Add Dataクリックするとデータのアップロードが可能です。
Upload DataSet ⇒ Select Files to Uploadsを選択すると自分のローカル環境のファイルをアップロードすることが出来ます。
このアップロードファイルも公開/非公開を切り替えることが出来るようです。

■最後に

これから機械学習を勉強するためにkaggleを有効利用していきたいと思います!!
ただ、ほぼ全て英語なので、、、英語も出来るようにならないとですね(-_-;)
英語の勉強もしていかなきゃ!!
先輩に進められたこちらの本をまずは読んで勉強しようかな??

速読速聴・英単語 Core1900 ver.5 (速読速聴・英単語シリーズ)

新品価格
¥2,090から
(2020/9/24 23:01時点)