講義レポート

自由な発想でRを使っていきたい

「データサイエンスR道場(基礎編))」受講生の声

1日集中講義の「データサイエンスR道場(基礎編)」の卒業生、荒井啓さんに講義の様子をインタビューしました。荒井さんは、化学メーカーで製品の改良業務をされています。受講動機は、データサイエンスに関して、自分で調べるより要点を教わり、演習をした方が理解が早く身につくと考え受講してくれました。


Q1:「データサイエンスR道場」を受講したきっかけを教えて下さい

以前から興味があったものの苦手意識のあった統計とプログラミング。勉強をしてみよう、と決心したタイミングでこの講義を知りました。独学では時間がかかりますが、この講義では短時間で統計の基礎からRの運用方法まで要点を学習できるため受講をしました。

Q2:講義中で目からウロコだったことはありますか?
名言や、同じ受講生の視点が面白かったことなど

目からウロコなことばかりでした。そもそもプログラミング自体を殆どしたことがなかったので入力したプログラムに応答があっただけでも嬉しくなりました。Rを動かしているだけでも楽しくて、受講前に感じていた苦手意識を忘れのめりこみました。

統計分析の活用例はどれも面白く印象に残っています。例えば、おむつを買った人はビールを買う傾向があることをビッグデータから明らかにしたこと。大量のデータの中にこのような意外な関係が埋もれていることと、それを見つけ出すことができることにわくわくしました。

Q3:講義の中で難しかったことはありますか?
また、受講をしてさらに興味が増したことがあれば教えて下さい。

データ分析をするための下準備に苦労しました。データ分析を行うまでに、知りたいことを決め、それと関連するデータを収集し、解析のできる状態にデータを加工する、という手順を踏む必要があるのですが、この前段階に予想以上に時間がかかり発表に間に合うか冷や冷やしました。このように苦心しながら準備したのにも関わらずデータ量が不十分で正確な予測ができていないことを知ったときは愕然としました。授業では主に統計の知識やRの運用方法を学びましたが、それと同じくらいデータの扱いが重要なことを実際のデータ分析を通して学びました。

Rに機械学習を実装できるという話を聞き、人工知能に興味を持つようになりました。人工知能の原理やビジネスへの活用例を勉強する良いきっかけとなりました。

Q4:最終回でどんなことを発表しましたか?今後はどのような事に活用していきたいですか?
発表内容はメジャーリーグの投手の勝利数予測です。好きな投手がなかなか勝ち星を挙げられなくて、どうしたら勝てるのか気になっていたからです。投球回数、防御率、選手の所属チームの打率など思いつく限りのデータを収集しました。やっとのことで求めた重回帰式を使って予測した勝利数と実際の勝利数を数人分比較しましたが、残念ながらあまり一致していませんでした。どうやら収集したデータ以外に勝利に関係する要因があるようです。シーズンが終わり、データが出揃っているのでもう一度計算し直したいです。

私はバーベキューやホームパーティーが好きなのですが、食材や飲み物の量の調整によく苦労しています。今後は余らせたり、買い足す手間を避けるために重回帰分析を活用して最適量を計算できるようになりたいです。他にも活用方法があると思いますので、自由な発想でRを使っていきたいと思います。

 

受講講義:データサイエンスR道場(基礎編)



関連する講義


関連するレポート