2017-01-01から1年間の記事一覧
今回は、会員の属性と過去のメルマガクリック率をもとにモデルを作成し、 今後新しく増えるユーザーのクリック率はどうなるのか、予測の分析をしました。 ここでは、説明変数である会員属性が数値ではないので、 数量化1類という考え方で分析していきます。…
今回は分析ではなく、データの加工についてです。ビズオーシャンの会員属性別に、 どういう書式がダウンロードされているのか、ランキング表みたいなのを作りたかったので その過程を書いていきます。 業種別、職種別、役職別、男女別、企業規模(従業員数)…
今回も、少し前にやった内容です。ビズオーシャンのユーザーの入会日、クリック状況、ダウンロード状況のでデータを使って、 入会日からの日数とクリック数(説明変数)が ダウンロード数(目的変数)にどれくらい影響しているか、分析してみました。 uid:…
少し前にやった内容です。 降水量、気圧、気温のデータを使って、 降水量と気圧(説明変数)が気温(目的変数)にどれくらい影響しているか、線形回帰で分析しました。 まずデータの読み込み weather = pd.read_csv("20170914.csv", encoding="SHIFT-JIS") …
今回はロジスティック回帰の練習をしてみたので、 そこで分かったことや気づいたことを書いていきたいと思います。 使ったデータ ・入会日からの日数(4年未満のユーザーに限定) ・役職(position) ・職種(job) ・性別(gender) ・bizoceanの書式ダウン…
前回の練習は データ…2017年1月1日~3月31日の 東京の降雨量と、東京にいるユーザーのダウンロード数 分析の流れ…東京にいるユーザーのIDのデータテーブルと そのユーザーによる3か月分のダウンロード数のデータテーブルをJOIN ↓ 降雨量データの読み込み ↓ …
今回は今やっている回帰分析の練習について書いていこうと思います。 今回使ったデータは 東京の降水量(2017年1月1日~3月31日) と、 東京のユーザーの書式ダウンロード数 です。本当はロジスティック回帰の練習をしようと思っていたのですが、 そもそもロ…
今回は、ユーザーの過去のクリック状況をもとに 今後のクリック状況を予測し、 クリックする確率の高いユーザーに的を絞ってDMを送れば より効率的にクリック数を得られるのではないか? ということで、 ユーザーのクリック状況をロジスティック回帰で分析し…
4月に入ってからは 機械学習でデータ分析するための下準備を進めていますが、機械学習でデータ分析をするには すべてのデータを数字に変換する必要があるので 今回はそれを中心に書いていって、 そのほか、 わたしが新しく知った関数がいくつかあるので、 最…
3月13日は、作成したデータフレームからグラフを作ってみましたが、その前に備忘録として Pandasとは何なのか? 何のためにdataframeするのか? 自分なりの解釈で書いていきたいと思います。 Pandasについて(備忘録1) ウィキペディア( https://ja.wikiped…
こんにちは 今日は3月2日と3月7日にやった内容を書いていきたいと思います。 まずJOIN句の使い方の練習です。初めてJOIN句を使ったのは2月20日でしたが、 ぼんやりとしか使い方が分からなかったため練習しました。 JOINの練習 JOINでは、FROM句のあとにくっ…
こんにちは 2月20日のやったことを書いていきます。この日は、Google Cloud DataLabを使ってデータ分析の方法を教わりました。 書くコードは前回に引き続きSQLです。前回はBigQueryのQuery Tableにコードを書いていましたが、 複数の文章を書くことができな…
こんにちは 2月14日(インターン2日目)は、Google BigQueryにある実際のデータを使ってSQLをぽちぽちしてみました。 SQLは、データの管理や操作などができるデータベース言語として広く普及しています。 現時点ではまだすごく簡単なコードですが、とりあえ…
はじめまして このブログでは、 プログラミング未経験の文系大学生が インターンシップを通して成長していく過程を伝えていきたいと思います。 自己紹介 私は都内の大学に通っている女性で、現在2年生です。 上記の通り、プログラミング経験はありません。 …