ビジネスと技術の狭間で

データを活用して生きていく

2013-01-01から1年間の記事一覧

pythonについて

業務で使う必要があったのでpython始めました。 ソースの可読性が高いなと早速感じていて 一人で勉強するのに向いているなと思います。勉強します。 CentOSに入れようとしたら依存関係の解決が色々面倒だったので断念して、 Windowsに入れました。 本体は本…

近況について

7月末からお盆辺りにかけて担当していた案件が忙しくブログの更新をサボっていました。何となく罪悪感があります。すみません。 最近は仕事が落ち着いたので、為替のデータに対して機械学習を行って儲けられないかとか色々やってました。そのうち結果が出た…

MeCabの辞書編集について

MeCabは以前にも紹介しました形態素解析エンジンです。MeCabを使うと文章を単語に切り分けることができます。 デフォルトの辞書でもそこそこ上手く行くのですが、 固有名詞やあまり一般的でない語句などは変な場所で切ってしまったり、単語と単語を切り離し…

ビッグデータについて

ビッグデータについて何を今更言うんだって感じですが 自分の考えをまとめるために書いておきます。 ビッグデータとは3Vと言われるVolume(大量)Variety(多種)Velocity(高頻度)の3つのうち1つ以上の概念を持つデータです。 上記の3つにVeracity(正確さ…

データマイニングの方法について

最近知ったデータマイニングのフレームワークについて説明します。 「データサイエンティストって何やってるの??」って方には、彼らの仕事の理解の助けになるかもしれませんが、データマイニングの経験がある方にとってはごく当たり前のことなのでつまらな…

勉強会について

初学者の方々は、「勉強会ってなんだか敷居高そうだし、参加しなくても資料が公開されていたりするので勉強会に参加する意味ってあるのか?」と思ってる人も多いのではないかと思います。 私も初めはそうでしたが、意外と参加してみると自分のレベルでも分か…

分析環境やツールについて

私が普段の分析で使っている環境やツールについて簡単に説明します。 ■マシンについて OS:Windows7 32bit メモリ:4GB マシンは一般的なものです。 工夫すればこの程度のマシンでもできることは少なくありません。 ■ソフトについて ・ActivePerl Perlはスク…

私について

はじめまして。 私はデータサイエンティストになるべく日々奮闘している2年目社会人です。 学生時代は、計算機科学(学士)や実験心理学(修士)について 勉強したり研究したりしていました。 データサイエンティストに向いていそうなバックグラウンドではあ…