在主机上开发torch_xla时,使用非root用户在conda环境,遇到tensorflow中报pthread_create 11错误,大意为系统资源不足:
解决方案
分析:此主机多用户使用,资源占用非常大,且大多数情况下在docker容器内操作,不容易遇到这类问题(root与非root用户限制不同);且同样的配置下,在docker内,确实也不会出现上述问题。使用ulimit查看:
参考ChatGPT给出的方案,注意需要
重新登录
用户:
配置实例
参考链接
pthread_create 11