2014年11月10日月曜日

次回のKobe.R #13 はオープンデータ特集です

公共データのビジネス活用等への期待の高まりから、オープンデータが注目されています。

オープンデータとは

「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多くかけずにデータの二次利用を可能とするもの」です。公共データを二次利用可能な形で提供することにより、市場における編集、加工、分析等の各段階を通じて、様々な新ビジネスの創出や企業活動の効率化等が促され、経済活性化が図られることが期待されています。

テーマ

ウェブはこれから人間が読むための「文書のウェブ」から、様々なデータを自在に発見して利用できる「データのウェブ」へと向かうのでしょうか?データマイニング、機械学習、プライバシーはどうやって守る?などテーマは盛りだくさん。オープンデータとRの融合する瞬間を目撃してください。


Kobe.R #13 + Open Data
http://kobexr.doorkeeper.jp/events/16989

日時: 2014-11-24(月)14:30 - 17:30
場所: 〒651-0096 兵庫県神戸市中央区雲井通5丁目1?2 神戸市勤労会館 講習室404


2014年11月7日金曜日

Kobe.R #12 英会話カフェの売上を増やしたい

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。
この日最後の発表者は、神戸で英会話クラブ SMEC を開催されている中澤さんです。

SMEC(Saturday Morning English Club)は土曜日だけやっている英会話カフェです。
英語をしゃべりたいなあと思っているのにしゃべる機会がないという人は多いと思います。そして実は日本にいる外国人だって日本の社会に溶け込みたいと思っているんです。
そんな両者がお互いに交流する機会を作るために、こんなカフェをやってます。
- お金があまりかからない
- みんなが続けることができる
- コミュニティが育っていく



SMEC movie-long ver from Tatsushi Nakazawa on Vimeo.


統計的な手法を使って、英会話カフェの来客数を増やせないか。中澤さんの課題を参加者みんなで考えました。顧客の性別、年齢などの属性をレジで記録できないかなどを検討したのですが、今のところ資金的、時間的に割ける資源がなさそうで、そのようなアプローチは難しいのかなと思いかけたその時、中澤さん自身がするどい分析結果を導き出したのです!

「学生のころからいろいろ集客をやってきたんですけれど、ひとつの原則に気付いたんですよ。男性が集まってくるところに女性は集まってこない。逆に女性が集まってくるところには男性も集まってくるということです。」

人は優れた洞察力をもっています。中澤さんはR言語に頼ることなく、アソシエーションルールを導き出していらっしゃいました。中澤さんからあふれるエネルギーに魅力を感じ、SMECの来客数はこれから増えていくに違いありません。全国にチェーン展開されてPOSレジが導入されたころ、私たちKobe.Rが何かお手伝いできるのかもしれません。などと考えながら、この後みんなでお昼ご飯のカレーライスを食べに行きました。



SMEC (Saturday Morning English Club)
日時: 毎週土曜日朝11時~14時

場所: La luz(ラ・ルス)
JR ・六甲ライナー住吉駅南出口を出て、岡本方面に歩いて徒歩2分(東灘区役所の向かい側)
 阪神魚崎駅を出て住吉川に沿って北上。東灘図書館前の横断歩道を渡って住吉駅方面に歩く。(徒歩15分)

参加費: 無料(ただし、ワンドリンクは必ずご注文ください。)

2014年11月4日火曜日

Kobe.R #12 Rは○○になっていく

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。
次は株式会社ブリリアントサービスの飯田さんによる発表です。

センサーとサーバーを活用したアプリケーション開発が求められている

急激に普及が進み、飽和状態になりつつあるスマートフォンやタブレット型端末アプリケーションにとって、今後の開発展望はズバリ「Rとの融合」なのです。スマートフォンアプリは端末ローカルにデータを持つのではなく、サーバーにデータを蓄積する方向に進化しています。端末の価格を低く抑えたいことや、高速なサーバー側で高度なデータ分析を行いたいということが背景としてあると思います。そしてスマートフォンは実はセンサーの塊りです。位置情報をはじめ、気圧、磁気、心拍など様々なデータを測定することができます。
これらセンサーとサーバーを活用したアプリケーション開発が今後求められるでしょう。
もちろん、他にも iOS, Android 2大OSの同時開発や、美しいデザインも大きな要素です。





ゼロからはじめるR言語勉強会について

飯田さんは「ゼロからはじめるR言語勉強会」を主催されています。この勉強会をきっかけに私@florets1はIT勉強会にはまってしまいました。Rという未知の言語、そして統計学との出会い、たくさんの楽しい仲間と出会うことができて本当に感謝しています。


Kobe.R #12 クラスタリング

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。
次の発表はクラスタリングについてです。様々なクラスタリング手法についてまとめて紹介していただいたあと、実際にirisデータセットの、k-meansで分類した結果を示していただきました。


質疑

irisデータセットにはもともと、種という分類データが含まれています。この元の分類と今回のk-meansによる分類は比べてどうだったか。そこそこ一致していた。単純なユークリッド距離で分けてうまくいったのは、もとがよいデータだということもあるでしょう。

何個のクラスタに分けるべきかという問題がある。分けようと思えば何個にでも分類できる。いくつに分けるのが一番いいのだろうか。これについてはAIC(赤池情報量基準)などの基準がある。この問題はPRML下巻に混合ガウス分布の変分近似として説明されている。読んでみるとおもしろいですよ。

参考文献

The Elements of Statistical Learning: Data Mining, Inference, and Prediction.

「ものまね鳥をまねる会」とは

スライドの2ページ目に紹介されている「ものまね鳥をまねる会」というのは、発表者の @Wakamatz さんが主催されている読書会です。
森に住む鳥たちのファンタジーを読んでいると、いつのまにか、関数型プログラミング言語の理論的基礎「コンビネータ論理」が身についてしまいますよ。「計算」という行為の本質に迫りましょう。
次回は2014/11/16(日)13:00からです。
http://connpass.com/event/9503/

2014年11月3日月曜日

Kobe.R #12 時系列の予測 Holt-Winters法

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。
次の発表は時系列データの予測するモデル Holt-Winters法の紹介です。
季節変動による周期性のあるデータをうまくフィッティングして予測できる様子を見せていただきました。便利そうです。

2014年11月2日日曜日

Kobe.R #12 回帰分析入門

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です.
最初の発表は「回帰分析入門 基礎の基礎から」です。この発表資料は、発表を聞きながら、目の前のパソコンで資料通りにRのコマンドを入力して試すことができるように作成しております。