日々精進

新しく学んだことを書き留めていきます

学習データを集める時に差分プライバシーが使えそう

AIは学習データをどれだけ集められるかが非常に重要だが、 個人情報などはプライバシー・セキュリティの問題で集めることが難しい。 そういう場合に差分プライバシーが使えそう。 アイデアとしては、個人を特定できないよう、各データにランダムなノイズを載せるが ノイズは小さいので、ノイズを載せた後でも学習データとしては十分有用というもの。 Appleが使っている実績もあるし、今後使ってみたい。

参考: dev.classmethod.jp

DataFrameの値を書き換えるときにSettingWithCopyWarningが出る

df['age'][5]のように[]を二段にしてアクセスすると発生する。これはchained indexingと呼ばれ、やってはいけない。 df.loc['age', 5]のように.locを使えば回避できる。 この警告が出る理由は以下に詳しく書かれているので是非読むことをオススメします。 日本語で詳細な解説が読めるとは、ありがたや~

linus-mk.hatenablog.com

Bitvise SSH Serverにログインすると直後に接続が切れる

sshサーバのログには以下のメッセージが出ていた。

  <event seq="52" time="2019-05-02 20:41:20.671086 +0900" app="BvSshServer 7.21" name="W_SESSION_DISCONNECTED_ABNORMALLY" desc="Session disconnected abnormally.">
    <session id="1006" service="SSH" remoteAddress="192.168.0.100:59781"/>
    <parameters disconnectReason="FlowError"/>
    <error type="Flow" component="SshManager/transport/kexHandler" class="Flow" code="ComponentException" description="Exception in component: Windows CNG (x64) with additions: AsymKey: CngAgree: unexpected secretData-&gt;cbStruct"/>
  </event>

原因はBitvise SSH Serverの不具合で、Windowsのバージョンが1803以降だとログインできなくなるらしい。 Bitvise SSH Serverをバージョンアップすると直った。

参考:

stackoverflow.com