vol.2 SQL初歩的なデータ抽出とグラフ作成
こんにちは
2月14日(インターン2日目)は、
Google BigQueryにある実際のデータを使ってSQLをぽちぽちしてみました。
SQLは、データの管理や操作などができるデータベース言語として広く普及しています。
現時点ではまだすごく簡単なコードですが、とりあえずどこに何を書けばいいのかがよく分からず、何度もエラーを出してました…。
うーーん、、どこに何を書けばいいのか、というのが本当に難しかったです。
この日は「SELECT」、「FROM」、「WHERE」、「GROUP BY」、「ORDER BY」、「LIMIT」の句だけを使ったのですが、句を並べるのにも順番があって、
句の中も、カンマで区切るとかカッコで括るとか、ややこしいな~という。
それで数時間奮闘していたのですが、なんとなく、なんとなく出来てきた気がします。
エラーの頻度はかなり減りました。
できたのは、
①男女別の年齢ごとの会員数
コード…
SELECT gender, age, count(gender) as count FROM [project-id:bizocean.member] WHERE gender ="male" GROUP BY gender, age ORDER BY count desc LIMIT 1000
女性の年齢別会員数はmaleをfemaleにしました。
②業種別会員数
コード…
SELECT industry , count( industry ) as count FROM [project-id:bizocean.member] GROUP BY industry ORDER BY count desc LIMIT 1000
③一番会員が多い業種の職種別会員数
コード…
SELECT industry, job_spec1, count( job_spec1) as count FROM [project-id:bizocean.member] WHERE industry CONTAINS "小売" GROUP BY industry, job_spec1 ORDER BY count desc LIMIT 1000
でした。
(グラフタイトルなどがちゃんとしていないのは目をつぶってください…)
②で小売・卸売・商社の会員が一番多いと分かったので、
③でその会員の職種を見てみました。
なぜ小売・卸売・商社が多いのか、なぜその中でも営業職や経営者が多いのか、
その日はもう時間がなくできませんでしたが
次回のインターンで、その会員の方たちがどういう書式をダウンロードしているのかなどを見て分析を進めていきたいと思いました。
vol.1 初日
はじめまして
このブログでは、
プログラミング未経験の文系大学生が
インターンシップを通して成長していく過程を伝えていきたいと思います。
自己紹介
私は都内の大学に通っている女性で、現在2年生です。
上記の通り、プログラミング経験はありません。
高校生の時から就職は衣料品メーカーを考えていて、商品開発をしてみたいけどデザインできないし、うーん、、と思いながら大学に進学しました。
大学では経営学科に属していますが、統計学系の講義をいくつか受けたり、他大学の知り合いが統計学をやっていたりして、データ分析の存在を知りました。
それで、データ分析ができれば商品開発に携われる!来年の春から始まる就活までにある程度のプログラミングスキルを身に着けたい!と思い、
ビズオーシャンのエンジニアリング部でインターン生として雇っていただくことになりました。
株式会社ビズオーシャンの紹介
株式会社ビズオーシャンは、もともとは株式会社ミロク情報サービスという財務や会計システムなどのサービスを提供する会社の一部署でした。
が、経営責任の明確化や投資効率の最大化などを目的として2016年4月に完全に分社化しました。
ビズオーシャンが運営している同名のサイト「bizocean」では、事業計画書、契約書、スケジュール管理表など、主にビジネスシーンで活用できるテンプレートを会員に無料で提供しています。
2017年2月現在、テンプレートは20,000点以上ありますが、約200万人の会員にメールマガジンを送信することで、無料提供を可能にしています。
ビズオーシャンのサイトでは、会員登録のときに
勤めている会社の業態、勤務地、年齢なども登録するのですが、
こういう情報から、いつ、どんな人が、どんなテンプレをダウンロードしているのか、など細かく分析できるようになれたらなー思います。
今朝初めてオフィスに来たのですが、
雰囲気がわりとラフな感じで、みなさん優しそうな方ばかりなので、
色々と教えてもらいながら頑張っていこうと思います。