データサイエンティストにはなれなかった

システム屋さんの中でひっそりデータ活用について考えていくブログ

統計検定2級を受けてきました

梅雨らしい雨が降りそうな天気の中、統計検定2級を受けてきました。1週間前から「やばいやばい」と言いながら勉強し始めて まぁ落ちずに済んだのではないか、というところです。 解答は2日程度で発表されるみたいなので、楽しみです。 (すでに2問も間違って…

分析のレベル

5日は長いなーと思っていたGWも残すところあと1日になりました。 このGW今のところ進捗ゼロなので ブログぐらい更新するかという気持ちで書いています。最近「データサイエンティストブーム」が下火になってきた関係か、 ポジショントークっぽいツイートやブ…

グリッドサーチ結果の可視化

春がもう少しで来そうでなかなか来ないもどかしい季節ですね。こんばんは。 最近Rのパッケージの関数を見るのが面白いなと感じる様になりました。 私はあまりコーディングをしないので得意ではないのですが、 下手なりに色々書き換えたりして、自分の欲求を…

ブログのタイトルを変えました。

どうも明けましておめでとうございます。 昨年末は少々やらかしてしまって散々な目にあいましたが この流れを断ち切って2015年は健康で安心に過ごせると良いなと思っています。 皆様今年もどうぞよろしくお願いします。で、本題。当ブログのタイトルを変更し…

kNN関連パッケージの紹介

皆様こんばんは。 今回、R Advent Calendar 2014 : ATND 13日目の記事を担当することになったので 久しぶりのブログを書いています。本記事でご紹介するのはRでkNN(k最近傍法)を実行するためのパッケージです。 kNNについて知らない方はwikipediak近傍法 -…

TokyoR(第43回)でLTしてきました

半年以上空いての更新となってしまいました。文章としてアウトプットする習慣がなかなかつかないです。本題。昨日TokyoRでLTをしてきました。 内容はRのrandomForestの説明と、 使えるメモリに制限がある場合の工夫の仕方についてです。 今回の発表の準備を…

丸一年経ちました

また久しぶりの更新となってしまいました。 最近は、webサイトのクローリングをちょこちょこ行っています。 これについてはまた改めて書くかも、しれません。 データサイエンティストという言葉を知り、目指し始めたのが去年のこの頃だったと思うので、一年…

pythonについて

業務で使う必要があったのでpython始めました。 ソースの可読性が高いなと早速感じていて 一人で勉強するのに向いているなと思います。勉強します。 CentOSに入れようとしたら依存関係の解決が色々面倒だったので断念して、 Windowsに入れました。 本体は本…

近況について

7月末からお盆辺りにかけて担当していた案件が忙しくブログの更新をサボっていました。何となく罪悪感があります。すみません。 最近は仕事が落ち着いたので、為替のデータに対して機械学習を行って儲けられないかとか色々やってました。そのうち結果が出た…

MeCabの辞書編集について

MeCabは以前にも紹介しました形態素解析エンジンです。MeCabを使うと文章を単語に切り分けることができます。 デフォルトの辞書でもそこそこ上手く行くのですが、 固有名詞やあまり一般的でない語句などは変な場所で切ってしまったり、単語と単語を切り離し…

ビッグデータについて

ビッグデータについて何を今更言うんだって感じですが 自分の考えをまとめるために書いておきます。 ビッグデータとは3Vと言われるVolume(大量)Variety(多種)Velocity(高頻度)の3つのうち1つ以上の概念を持つデータです。 上記の3つにVeracity(正確さ…

データマイニングの方法について

最近知ったデータマイニングのフレームワークについて説明します。 「データサイエンティストって何やってるの??」って方には、彼らの仕事の理解の助けになるかもしれませんが、データマイニングの経験がある方にとってはごく当たり前のことなのでつまらな…

勉強会について

初学者の方々は、「勉強会ってなんだか敷居高そうだし、参加しなくても資料が公開されていたりするので勉強会に参加する意味ってあるのか?」と思ってる人も多いのではないかと思います。 私も初めはそうでしたが、意外と参加してみると自分のレベルでも分か…

分析環境やツールについて

私が普段の分析で使っている環境やツールについて簡単に説明します。 ■マシンについて OS:Windows7 32bit メモリ:4GB マシンは一般的なものです。 工夫すればこの程度のマシンでもできることは少なくありません。 ■ソフトについて ・ActivePerl Perlはスク…

私について

はじめまして。 私はデータサイエンティストになるべく日々奮闘している2年目社会人です。 学生時代は、計算機科学(学士)や実験心理学(修士)について 勉強したり研究したりしていました。 データサイエンティストに向いていそうなバックグラウンドではあ…