講義情報

データサイエンスR道場(基礎編)

データサイエンスR道場(基礎編)

文系、初心者歓迎!統計の世界に一歩踏み出そう

未来を拓く学部-circle未来を拓く学部
データサイエンスR道場(基礎編)

講義について

 勘・経験・度胸だけで仕事していませんか?

『今の仕事にも慣れてきて、昔のように少々のことでテンパることはなくなった。でも、ふと気付くと、勘と経験だけで仕事を回している自分。後輩に仕事の説明をする時にもやけに感覚的な言葉が多くなってしまっている。このままで良いのだろうか…』こういう思いをしたことはないでしょうか?

勘・経験・度胸は、仕事をする上でとても重要です。ただ、新入社員の時に、やけに「俺の経験では…」「私のセンスでは…」という説明を繰り返す先輩に違和感を持ったことはありませんか。そしてその数年後、気付いたら自分も「私の感覚ではね…」と後輩に仕事の説明をしていることはないでしょうか?

繰り返しますが、勘・経験・度胸は仕事でとても重要であることは明らかです。しかし、そこに更にしっかりしたデータ分析に基づいた定量的なデータがあれば、より説得力を増します。また、そういったことが出来る人材が会社で求められていることも事実です。

しかし、数年の経験の積み重ねで勘や感覚が鋭くなり過ぎて、感覚で判断が出来るようになっており、定量化する習慣がなくなってしまっている自分。更に、誰にも言えないこんな心の声が自分の中で響いていませんか?

「そもそも、データの分析ってどうやるんだっけ?!」
「数学なんて、高校の微分・積分からトラウマなんだけど。いつか数字に強くなりたいと思いながら、今になってしまった。」
「確か大学の卒論時に統計の勉強をしたけど、もう忘れてるよ。」

そんな心の声に短時間でお応えするのが、この「データサイエンスR道場」です。数学嫌いの方、高校時代の数学に挫折された方でも理解できるように、わかりやすい事例を多く揃え、基礎的なことから構成しています。更に、難しい数学の理論の説明は必要最小限に抑え、何よりも「実践的に実務で使えるデータ分析」を最短の時間で習得頂けるようカリキュラムを構成しています。お仕事で忙しいみなさんに向けて、ぜひ効率の良い学びの場をつくりたいという想いからこの講義をスタートしました。

 

「データ分析力」という最強の武器

「高校時代に数学が嫌いだったから文系を選んだのに、会社ではマーケティングの部署に配属されちゃって、気付けば数字を扱わないといけない環境に。」
これは実際にR道場の受講生の方からあったお話です。

そうなんです。今はどの仕事でもデータ分析とは切り離せなくなっています。決して、データを扱うのは理系の方々に任せておけば良いという話ではありません。

逆に言うと、データ分析を出来る!統計をわかっている!ということは、大きな武器になります。ビッグデータと言われて久しいですが、ビッグデータは研究部門、設計部門、マーケティング部門は当然ながら、営業でも財務でも、今では人事でも遭遇する課題です。ビッグデータを分析することが出来れば、活躍の場は無限に広がります。データ分析に特化したベンチャー企業を起業する人も非常に増えてきています。

話が変わりますが、最先端の技術と言われている人工知能ですが、どういう仕組みで動いているのでしょう。実は人工知能は、統計学の技術の塊なんです。つまり、統計学を理解することは、最先端技術を垣間見る第一歩にもなるのです。

2

講義が終了したら、データ分析のスキルアップしたあなたになれる

スキルアップ・起業・人工知能、そんな面白くて魅力的な可能性を秘めた「データ分析」「統計」ですが、実はとってもハードルが低いのです。

なぜなら、
・統計用のソフトウェアは無料が多く
・分析するビッグデータも無料が多い
・必要なのは、ちょっとした好奇心だけでOK
なんです。

今は日本政府が、オープンデータと言ってどんどんデータを無料で公開していますので、分析できるデータは大量にあります。また、RやPythonなど、分析用のソフトウェアも無料で入手できます。

必要なのは、そういったソフトウェアを使いこなす少々のプログラミングの知識と、分析方法を判断する統計の基礎知識です。

しかし、この少々のプログラミングの知識と統計の基礎知識を身に付けるのが厄介なんですよね。特に使い始めの時につまずくことが多いのです。でもご安心ください、R道場ではこの辺りをしっかりと説明をしていきます。

つまり、みなさんは、ノートPC、そして「データ分析・統計っておもしろそうだな」という好奇心があればOK! 講義が終了したら、その日の夕方にはデータ分析の基礎を身に付けた一歩進んだあなたの姿があるでしょう。共に受講したメンバーで軽く打上げをしても良いかもしれませんね。

データサイエンスを一緒に学びませんか? チャレンジしてみたい人、大歓迎です。

 

講義の進め方

一方通行に説明する講義ではなく、あなたの身近な事例を統計分析してもらい、教授・受講生間でシェアしながら進めていきます。データサイエンス入門として、実践的に統計・データ分析手法を学べます。

PCに「R」という統計のプログラミング言語をインストール頂きます。基本的には具体的な統計の計算はRを用いて行います。Rの使い方・プログラミング方法を説明しますが、もしエクセルでの講義をご希望の方には、エクセルでの統計分析方法もお伝えします。

 

教授からのメッセージ

私がこの講義を企画した理由はとても単純で、データ解析の面白さを少しでも多くの方々へ広めたいと思ったからです。これまで何となくイメージで感じていたことが、データ解析でスパッと目に見える結果として現れるととても気持ちよく、この快感は何物にも代え難いものがあります。

また、統計を学んで頂くには今は非常に良いタイミングです。ビジネスではデータサイエンスの重要性が広まりつつあり、無料のデータ分析のツールも増えているからです。それにも関わらず、人材不足が叫ばれて久しい業界です。学び始めるにはうってつけの時期と言えるでしょう。

講義では、難しい数学の話やプログラミングの話は出来るだけ割愛し、受講者の方々に実践・体感していただくように工夫しています。特にプログラミグは教授が準備しますので、それをそのままコピペで使えるようにしておきます。ですので、「数学が苦手・・・」「プログラミングなんてやったことない。」という方もお気軽にご参加ください。

ぜひ統計・データサイエンスを共に楽しく学んで頂き、仕事や暮らしに活かして頂ければと思います!

 

(第19期募集開始:2019年12月9日)

こんな方が対象です

文系、初心者歓迎!統計の世界に一歩踏み出そう・統計の基礎を勉強されたい方

・マーケティング部門、リサーチ部門にお勤めの方

・データサイエンス、ビッグデータに興味がある!でも、数学が苦手…という方

・統計学の基礎をすでに勉強されている方

・Rプログラミングの基本的な操作ができる方

・「このデータを分析しといて」と上司にムチャぶりされて困っている方

・KKD(勘と経験と度胸)で物事に取り組むことにちょっと疑問を感じており、具体的に物事を分析されたい方

・統計解析の言語「R 」のプログラミングに関心のある方

・仕事でビッグデータ活用をお考えの方

これまでの受講生

年齢:平均35歳(25〜55歳)

性別:女性55%、男性45%

職種:マーケティング、エンジニア、営業、企画、事務、クリエイター・デザイナー、経営者、貿易、広告代理店、セラピスト、ライターなど

卒業生の声

・Excelでデータ分析をするとなると、フォームを分けて、保存して、読み込んで…という作業が必要になっていましたが、R言語を教えていただいたことで、ほんの数行のプログラミングで様々な分析ができるようになりました。

統計・データサイエンスは仕事に活かせるのでずっと興味がありましたが、なかなか勉強を始められずにいました。今回の講義でとてもスムーズに統計の世界に入っていくことができました。

講義受けてから、生活している上で「どんなことが解析対象になるんだろう」と考える機会が増えました。

今回の講義を通じて、自分の知らない面白い世界がある!ということに感動しました。もっと自分で手を動かして、もっと知らない世界を覗いてみたいと思っています。


講義計画

第1回

データサイエンス的モノの見方

本編に入る前の導入偏として、益々高まるデータサイエンティスのニーズを理解した上で、必要なスキルとこの先受講生の皆さんがどのようなステップで成長していくかを考える。データサイエンティストの定義。オープンデータはWeb上のどこにあるのか。

本編では、統計の入門として身の回りの事例を基に統計用語に触れることから始める。「平均値」「標準偏差」等の代表値を使いながら「営業部の2人のうち誰を昇進させるか」を判断する。無料統計分析ツール「R(読み方:アール)の使い方を理解し、Rを使いながら平均値や標準偏差などの統計値を算出する統計プログラミングを実施する。

予定テーマ:「誰を昇進させるかを統計的に判断する」「極端に優れたスポーツ選手を統計的に分析する」

キーワード:「平均」、「ばらつき(標準偏差)」、「グラフ化(ヒストグラム)」、「外れ値」

第2回

体験!データ解析

統計データを作図するためのRプログラミングを習得する(箱ひげ図、棒グラフ、散布図)。2人のスポーツ選手の事例を基に「2人に統計的な実力差があったか」を分析する。ここでいう”統計的”とは単なる平均値の比較ではなく、統計的な裏付けを意味する。受講生が所属する会社でも活用できるように、検定分析するプロセスを理解し実践する。Rに入力するプログラムは事前に用意しておくので、プログラミング初心者の方でも安心して頂いてOK!分析データがどのような状態(正規分布してるか/等分散しているか等)を把握し、その状態に即した最適な統計プログラムを選択できるように実践する。また、マーケティングで良く使われるABテストの概要を理解し広告の統計的な効果測定を実践する。

予定テーマ:「2人に統計的に実力差があったかを統計的に判断する(t 検定)

     「どちらの広告が効果的かを統計的に判断する(AB検定)」

キーワード:「t(ティ)検定」、「P(ピー)値」、「帰無仮説」、「ABテスト」、「正規分布」

第3回

未来をチラ見 〜回帰分析〜

「アイスコーヒーの販売数と気温」のような身の回りの事例を基に、未来の販売数を予測するスキル(回帰分析)を身に着ける。統計的数値による裏付けと未来予測値の信ぴょう性。Rプログラミングを使って回帰分析を実践する(プログラムは事前に用意しているのでご安心下さい!)。統計分析の基本ステップ(データの読み込み、散布図、相関、無相関、回帰式など)。Rから抽出された解析結果を見て「統計的に有意である/有意でない」の判断。回帰分析の前に散布図をチェックする理由。回帰式の精度を確認する。回帰係数の検定を行う。

予定テーマ:「飲食店での売上に関係するパラメータを探る」

キーワード:「回帰分析」、「相関係数」、「無相関検定」

第4回

データサイエンスの強力なツール「重回帰分析」に挑戦

重回帰分析は第3回の回帰分析の発展版であり、回帰分析プログラミングを少し変えるだけで分析出来る優れた手法である。第3回の統計分析ステップを意識しながら、重回帰分析を実践する。第3回が理解できていれば難しくはない。ある街の家賃データを基にその街の家賃相場を分析する。グループワークで、受講生が所属する会社ではどんな重回帰分析が出来そうか考える。居酒屋の販売データを基にビッグデータの解析に向けたFor文の基礎を学ぶ。

予定テーマ:「家賃に最も重要な影響を与えている因子を、データ解析で統計的に探る」

キーワード:「重回帰分析」「重回帰分析を自社にどのように活かせるか」

第5回

発表会!

あなたの自由なテーマで、回帰式や重回帰式を使って未来予測をしてみよう!これまでの毎回の講義を通じて学んだ統計やデータ分析の手法を使って、自分が関心あるテーマについて40分~1時間で未来予測する。プロジェタを使ってその内容を皆でシェアしながら、統計の奥深さを一緒に味わいましょう。発表では完璧な分析精度は求めていません!まずはやってみる、ということを本講座で実践してほしいのです。発表は強制ではないので他の受講生の発表を聞くだけでもOK。異なる業界の受講生の発表を聴くのはとてもためになると思います。


スケジュール

講義名
データサイエンスR道場(基礎編)
日程

第1回:2月22日(土)10:30~12:00

第2回:2月22日(土)13:00~14:30

第3回:2月23日(日)10:30~12:00

第4回:2月23日(日)13:00~14:30

第5回:2月23日(日)14:30~16:00

定員
15名 ※定員になり次第締切
申込締切日
2020年2月15日(土)
授業料
55,000円(税別)
キャンパス

表参道 COMMUNEキャンパス

持ち物・注意事項
ノートPCをご持参ください。お持ちでない方はPCのレンタルサービスなどをご活用ください。
PythonとRの違い
基礎的な統計のプログラミングにおいては、RでもPythonでも遜色はありません。 ただ、Rは統計分析・データ解析のみをされる方には、利用のし易さなどの観点から適していると思います。一方、データ解析だけではなく、Webアプリ開発やWebスクレイピングなど、統計以外のことにも取り組まれる予定の方にはPythonの方が適していると思います。 RとPythonの細かな違いは多分にあり、詳細の説明は他の媒体に譲りますが、本講義を受けるに当たって初心者の方が選ばれる際には上記をご参考にして頂ければ幸いです。
補講について
欠席した場合、来期の講義開催時に同じ回を受講することが可能です。 ただし、初回講義案内時にお知らせするメーリングリストにて、欠席のご連絡を予めいただいていた方に限り、1回のみ振替を受付ます。