2014年9月26日金曜日

Kobe.R #9

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。

URL: http://kobexr.doorkeeper.jp/events/14808
日時: 2014/9/21 Sat. 10:00-12:00
場所: 大阪市西淀川区


発表1. 安全なデータ公開のために - Statistical Disclosure Control -


最近のオープンデータという流れに従い、様々なデータが開示されるようになってきました。
しかし、データの開示には個人情報漏えいのリスクが伴います。

社会保障番号や個人名、住所のような直接に個人を特定できてしまうデータはもちろん、性別、年齢、地域、職業のように、単体では個人を特定できなくても、組み合わせることで特定につながるデータがあります。

そのようなデータを開示する場面における
- リスクの評価方法
- データの匿名化
- 匿名化による情報の損失とデータの有用性を評価する方法

について発表していただきました。





参考文献

CRANのSDCの手法を実装したパッケージ
http://cran.r-project.org/web/packages/sdcMicro/

そのリファレンス
http://cran.r-project.org/web/packages/sdcMicro/vignettes/sdc_guidelines.pdf

東京大学 中川裕志 「プライバシー保護データマイニング」
http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/labintro/2010PPDM-summary.pdf

東京大学 竹村彰通 「統計的開示抑制について」
http://park.itc.u-tokyo.ac.jp/atstat/takemura-talks/090704-takemura-ppdm.pdf


発表2. カードで説明する統計的独立

例えば、52枚のカードから1枚のカードを引く時、そのカードが「スペードであること」と「絵札であること」は統計的に独立です。
統計の勉強をしていますと、教科書のあちこちに「独立」という言葉が出てきます。この「独立」とはどういう意味なのか、何の役に立つのかということをカードを例にして説明しました。





発表3. 会社でPowerShellを使ってみた

マイクロソフトの作ったスクリプト言語であるPowerShellを使って、レポート作成を自動化されている方の発表です。
PowerShellを使うメリット、デメリットを説明していただきました。
データベースに接続して、必要なデータを取得、データを加工してレポート出力という流れです。レポート出力部分は今のところMS AccessやMS Excelと連携して行っているそうですが、今後PowerShellだけで出力できるようにしてMS OfficeのインストールされていないPCでも利用できる
ようにしていきたいとのことでした。






次回のKobe.Rは 2014/10/04 (土) 10:00-12:00
三ノ宮で開催です。
http://kobexr.doorkeeper.jp/events/15060

0 件のコメント:

コメントを投稿