ビジネスと技術の狭間で

データを活用して生きていく

2013-07-01から1ヶ月間の記事一覧

MeCabの辞書編集について

MeCabは以前にも紹介しました形態素解析エンジンです。MeCabを使うと文章を単語に切り分けることができます。 デフォルトの辞書でもそこそこ上手く行くのですが、 固有名詞やあまり一般的でない語句などは変な場所で切ってしまったり、単語と単語を切り離し…

ビッグデータについて

ビッグデータについて何を今更言うんだって感じですが 自分の考えをまとめるために書いておきます。 ビッグデータとは3Vと言われるVolume(大量)Variety(多種)Velocity(高頻度)の3つのうち1つ以上の概念を持つデータです。 上記の3つにVeracity(正確さ…

データマイニングの方法について

最近知ったデータマイニングのフレームワークについて説明します。 「データサイエンティストって何やってるの??」って方には、彼らの仕事の理解の助けになるかもしれませんが、データマイニングの経験がある方にとってはごく当たり前のことなのでつまらな…