日々精進

新しく学んだことを書き留めていきます

PyTorchで学習を回すと「ctdet/coco_res18ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm).」エラー

shared memoryが足りないのが原因らしい。 dockerコンテナはデフォルトだとshared memoryが64MBになっている。 以下のようにshm_sizeを指定するとshared memory sizeを変更出来る。

services:
  servicename:
    shm_size: '7gb'

参考:

qiita.com