日時: 2014/9/21 Sat. 10:00-12:00
場所: 大阪市西淀川区
発表1. 安全なデータ公開のために - Statistical Disclosure Control -
最近のオープンデータという流れに従い、様々なデータが開示されるようになってきました。
しかし、データの開示には個人情報漏えいのリスクが伴います。
社会保障番号や個人名、住所のような直接に個人を特定できてしまうデータはもちろん、性別、年齢、地域、職業のように、単体では個人を特定できなくても、組み合わせることで特定につながるデータがあります。
そのようなデータを開示する場面における
- リスクの評価方法
- データの匿名化
- 匿名化による情報の損失とデータの有用性を評価する方法
について発表していただきました。
安全なデータ公開のために from Wakamatz
参考文献
CRANのSDCの手法を実装したパッケージhttp://cran.r-project.org/web/packages/sdcMicro/
そのリファレンス
http://cran.r-project.org/web/packages/sdcMicro/vignettes/sdc_guidelines.pdf
東京大学 中川裕志 「プライバシー保護データマイニング」
http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/labintro/2010PPDM-summary.pdf
東京大学 竹村彰通 「統計的開示抑制について」
http://park.itc.u-tokyo.ac.jp/atstat/takemura-talks/090704-takemura-ppdm.pdf
発表2. カードで説明する統計的独立
例えば、52枚のカードから1枚のカードを引く時、そのカードが「スペードであること」と「絵札であること」は統計的に独立です。統計の勉強をしていますと、教科書のあちこちに「独立」という言葉が出てきます。この「独立」とはどういう意味なのか、何の役に立つのかということをカードを例にして説明しました。
Eic kobe.r9 from florets1
発表3. 会社でPowerShellを使ってみた
マイクロソフトの作ったスクリプト言語であるPowerShellを使って、レポート作成を自動化されている方の発表です。PowerShellを使うメリット、デメリットを説明していただきました。
データベースに接続して、必要なデータを取得、データを加工してレポート出力という流れです。レポート出力部分は今のところMS AccessやMS Excelと連携して行っているそうですが、今後PowerShellだけで出力できるようにしてMS OfficeのインストールされていないPCでも利用できる
ようにしていきたいとのことでした。
会社でPowershell from kobexr
次回のKobe.Rは 2014/10/04 (土) 10:00-12:00
三ノ宮で開催です。
http://kobexr.doorkeeper.jp/events/15060