日々精進

新しく学んだことを書き留めていきます

YOLOXの学習を実行すると「RuntimeError: falseINTERNAL ASSERT FAILED at "../aten/src/ATen/MapAllocator.cpp":300, please report a bug to PyTorch. unable to write to file </torch_4492_0>」エラー

原因はshared memoryの容量が足りないこと。学習環境のdocker composeに以下を追加すると直った。

shm_size: '16gb'

参考:

Unable to write to file </torch_18692_1954506624> - #6 by gaily_sun - PyTorch Forums