ビジネスと技術の狭間で

データを活用して生きていく

2022年の仕事などの振り返り

いつの間にか2023年も1/3が終わりましたが 2022年の振り返りシリーズを完結できていなかったので 簡潔に書いて締めます。 2022年の仕事 1月~6月 2021年末から引続いて週1×3 +月1×1 で働いていました。 週1稼働の1社については 諸々の変化で自分の価値が全然…

法人化しました②

前回に続いて法人化の諸々を記載します。 今回は調べたり考えたりしたことをQ&A形式でまとめました。 fqz7c3.hatenablog.jp 設立まで ・法人の形態はどうやって決めた? 最終的に合同会社を選択したわけですが、法人の形態は意外と多くて 私が理解しているも…

法人化しました①

年末に公開するつもりで書き始めましたが 思いのほか長くなり、1月も終わるタイミングになってしまいました。 2022年の振り返りをこれから3回に分けて公開します。2021年の記事に書いていた通り、個人事業主から合同会社へ法人成りしました。 今回の記事では…

独立後3年目の振り返りなど

今年は年末の振り返りが唯一の記事になってしまいました。 技術的に書けるネタも色々あったので来年は頑張って書こうと思います。 以下、独立して3年目の記録です。 今年の仕事 1月~2月 週3×1 + 週2×1 + 週1×1 +月1×1 という感じで4社の仕事を行っていまし…

独立後2年目の振り返りなど

今年はコロナで世界が大きく変わってしまった1年でした。 独立して2年目の記録を残しておきます。 今年の仕事 1月~5月 年明けから週2×2 + 週1×1 という感じで3社の仕事を行っていたのですが、 参加していたプロジェクトの1つがコロナ直撃により解散すること…

お金回りの話

個人事業主として今年経験したり調べたりしたことをメモしておきます。 記載内容は2020年時点のものであるので 今後変更される可能性があることにご注意ください。 国民年金、付加保険料、国民年金基金、個人型確定拠出年金(iDeCo) フルタイムの会社員から…

Maximal Information Coefficientの使い方

たまには技術系の話も書いてみます。水準数が少ない変数に対して Maximal Information Coefficient(MIC)を計算する場合は注意が必要という話です。MICはだいぶ昔に話を聞いて便利そうだなーと思っていたのですが これまで実際に使う機会はありませんでした。…

独立後1年間の振り返りなど

今年の1月に独立してからの振り返りを記載しておきます。 仕事の変遷 1月~3月 独立する前から決まっていた仕事を週2で行っていました。 開業後の諸々について足場を固めるという意味で ゆっくりスタートできて良かったと思います。 当然ですが、労働が週2だ…

疫学・公衆衛生統計講座を受けてきました

前回のブログを書いた4月は週5労働でしたが 6月からは週4に減らして働いています。 諸々のスケジューリングのしやすさなどから言っても週4が良いですね。そんなところで都合よく週1程度で開催される統数研の公開講座を見つけました。 ism-rcmhds-2019-04.pea…

開業以降

平成も終わるので、1月に開業届を出して以降の動きについてまとめておきます。 事業用口座開設 プライベートと分けて事業用の口座を持ちたかったので 新規に口座を開設することにしました。 いくつか調べてみて、使い勝手も悪くなさそうでかつ 名義の先頭に…

Rで音声データを扱う

音声データの扱いに関してTask View的なものがないか調べていたところ 以下の本のAppendixにまとめられていたので簡単にメモしておきます。Sound Analysis and Synthesis with R 目次を見る限り、この本は音声データの扱いに関して 基本的なところから丁寧に…

開業を届け出てきました

先日、開業届を出してきましたので、その辺りについてのメモを残しておきます。 提出物 開業届に関してググってみた結果、 以下の2つを提出する必要があることが分かりました。・開業届 ・青色申告承認申請 提出時期 ブログによって書いてある時期が揺らいで…

これからの生き方

早いもので1月も中旬になってしまいましたが、 昨年末で約1年半勤めた会社を退職し、独立することにしました。退職を考え始めたきっかけは よくある「データサイエンティストが会社に居着かない理由」みたいなブログに 包含されていますので詳しくは書きませ…

振り返り

今年、人生初の転職をしました。 良い機会だと思うので これまでの仕事観、キャリアなどについて振り返ってみます。 無駄に長くなってしまいました。 高校時代 将来の夢などありませんでしたが 進学校の雰囲気に飲まれて3年間それなりに勉強をしました。進学…

しばらくRから離れることになりました

いつかまた使う日のために お世話になったパッケージについてまとめておきます。 データハンドリング系 dplyr https://cran.r-project.org/web/packages/dplyr/dplyr.pdfstringr https://cran.r-project.org/web/packages/stringr/stringr.pdftidyr https://…

統計検定2級を受けてきました

梅雨らしい雨が降りそうな天気の中、統計検定2級を受けてきました。1週間前から「やばいやばい」と言いながら勉強し始めて まぁ落ちずに済んだのではないか、というところです。 解答は2日程度で発表されるみたいなので、楽しみです。 (すでに2問も間違って…

分析のレベル

5日は長いなーと思っていたGWも残すところあと1日になりました。 このGW今のところ進捗ゼロなので ブログぐらい更新するかという気持ちで書いています。最近「データサイエンティストブーム」が下火になってきた関係か、 ポジショントークっぽいツイートやブ…

グリッドサーチ結果の可視化

春がもう少しで来そうでなかなか来ないもどかしい季節ですね。こんばんは。 最近Rのパッケージの関数を見るのが面白いなと感じる様になりました。 私はあまりコーディングをしないので得意ではないのですが、 下手なりに色々書き換えたりして、自分の欲求を…

ブログのタイトルを変えました。

どうも明けましておめでとうございます。 昨年末は少々やらかしてしまって散々な目にあいましたが この流れを断ち切って2015年は健康で安心に過ごせると良いなと思っています。 皆様今年もどうぞよろしくお願いします。で、本題。当ブログのタイトルを変更し…

kNN関連パッケージの紹介

皆様こんばんは。 今回、https://atnd.org/events/58648 13日目の記事を担当することになったので 久しぶりのブログを書いています。本記事でご紹介するのはRでkNN(k最近傍法)を実行するためのパッケージです。 kNNについて知らない方はwikipediak近傍法 -…

TokyoR(第43回)でLTしてきました

半年以上空いての更新となってしまいました。文章としてアウトプットする習慣がなかなかつかないです。本題。昨日TokyoRでLTをしてきました。 内容はRのrandomForestの説明と、 使えるメモリに制限がある場合の工夫の仕方についてです。 今回の発表の準備を…

丸一年経ちました

また久しぶりの更新となってしまいました。 最近は、webサイトのクローリングをちょこちょこ行っています。 これについてはまた改めて書くかも、しれません。 データサイエンティストという言葉を知り、目指し始めたのが去年のこの頃だったと思うので、一年…

pythonについて

業務で使う必要があったのでpython始めました。 ソースの可読性が高いなと早速感じていて 一人で勉強するのに向いているなと思います。勉強します。 CentOSに入れようとしたら依存関係の解決が色々面倒だったので断念して、 Windowsに入れました。 本体は本…

近況について

7月末からお盆辺りにかけて担当していた案件が忙しくブログの更新をサボっていました。何となく罪悪感があります。すみません。 最近は仕事が落ち着いたので、為替のデータに対して機械学習を行って儲けられないかとか色々やってました。そのうち結果が出た…

MeCabの辞書編集について

MeCabは以前にも紹介しました形態素解析エンジンです。MeCabを使うと文章を単語に切り分けることができます。 デフォルトの辞書でもそこそこ上手く行くのですが、 固有名詞やあまり一般的でない語句などは変な場所で切ってしまったり、単語と単語を切り離し…

ビッグデータについて

ビッグデータについて何を今更言うんだって感じですが 自分の考えをまとめるために書いておきます。 ビッグデータとは3Vと言われるVolume(大量)Variety(多種)Velocity(高頻度)の3つのうち1つ以上の概念を持つデータです。 上記の3つにVeracity(正確さ…

データマイニングの方法について

最近知ったデータマイニングのフレームワークについて説明します。 「データサイエンティストって何やってるの??」って方には、彼らの仕事の理解の助けになるかもしれませんが、データマイニングの経験がある方にとってはごく当たり前のことなのでつまらな…

勉強会について

初学者の方々は、「勉強会ってなんだか敷居高そうだし、参加しなくても資料が公開されていたりするので勉強会に参加する意味ってあるのか?」と思ってる人も多いのではないかと思います。 私も初めはそうでしたが、意外と参加してみると自分のレベルでも分か…

分析環境やツールについて

私が普段の分析で使っている環境やツールについて簡単に説明します。 ■マシンについて OS:Windows7 32bit メモリ:4GB マシンは一般的なものです。 工夫すればこの程度のマシンでもできることは少なくありません。 ■ソフトについて ・ActivePerl Perlはスク…

私について

はじめまして。 私はデータサイエンティストになるべく日々奮闘している2年目社会人です。 学生時代は、計算機科学(学士)や実験心理学(修士)について 勉強したり研究したりしていました。 データサイエンティストに向いていそうなバックグラウンドではあ…