如何帮助Condor找到它应该在作业中执行的文件?

2024-01-24

我正在尝试执行一项工作,但秃鹰似乎找不到我的文件。

我已经确定:

  1. 通过在其绝对路径上执行 ls 和 cat 即可找到该文件
  2. 从Condor交互式会话中运行它
  3. 给它正确的权限,以便它运行它。

我已经这样做了,但收到此错误:

(automl-meta-learning) miranda9~/automl-meta-learning/automl-proj/experiments/meta_learning $ cat condor_job_log_69.out 
000 (069.000.000) 10/21 11:06:06 Job submitted from host: <130.126.112.32:9618?addrs=130.126.112.32-9618+[--1]-9618&noUDP&sock=3715279_f2e6_4>
...
001 (069.000.000) 10/21 11:06:07 Job executing on host: <172.22.224.111:9618?addrs=172.22.224.111-9618+[--1]-9618&noUDP&sock=807_1d04_3>
...
007 (069.000.000) 10/21 11:06:07 Shadow exception!
        Error from [email protected] /cdn-cgi/l/email-protection: Failed to execute '/home/miranda9/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py': (errno=2: 'No such file or directory')
        0  -  Run Bytes Sent By Job
        0  -  Run Bytes Received By Job
...
012 (069.000.000) 10/21 11:06:07 Job was held.
        Error from [email protected] /cdn-cgi/l/email-protection: Failed to execute '/home/miranda9/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py': (errno=2: 'No such file or directory')
        Code 6 Subcode 2
...
(automl)

但该文件显然在那里:

(automl-meta-learning) miranda9~/automl-meta-learning/automl-proj/experiments/meta_learning $ ls -lah /home/miranda9/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py
-rwxrwxr-x. 1 miranda9 miranda9 22K Oct 20 14:54 /home/miranda9/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py

我不明白为什么秃鹰找不到它。有任何想法吗?我不是系统管理员,所以我什至不知道如何开始调试它。

顺便说一句我的提交脚本:

####################
#
# Experiments script
# Simple HTCondor submit description file
#
# reference: https://gitlab.engr.illinois.edu/Vision/vision-gpu-servers/-/wikis/HTCondor-user-guide#submit-jobs
#
# chmod a+x test_condor.py
# chmod a+x experiments_meta_model_optimization.py
# chmod a+x meta_learning_experiments_submission.py
# chmod a+x download_miniImagenet.py
#
# condor_submit -i
# condor_submit job.sub
#
####################

# Executable   = meta_learning_experiments_submission.py
# Executable = automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py
# Executable = ~/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py
Executable = /home/miranda9/automl-meta-learning/automl-proj/experiments/meta_learning/meta_learning_experiments_submission.py

## Output Files
Log          = condor_job.$(CLUSTER).log.out
Output       = condor_job.$(CLUSTER).stdout.out
Error        = condor_job.$(CLUSTER).err.out

# Use this to make sure 1 gpu is available. The key words are case insensitive.
REquest_gpus = 1
# requirements = ((CUDADeviceName = "Tesla K40m")) && (TARGET.Arch == "X86_64") && (TARGET.OpSys == "LINUX") && (TARGET.Disk >= RequestDisk) && (TARGET.Memory >= RequestMemory) && (TARGET.Cpus >= RequestCpus) && (TARGET.gpus >= Requestgpus) && ((TARGET.FileSystemDomain == MY.FileSystemDomain) || (TARGET.HasFileTransfer))
# requirements = (CUDADeviceName == "Tesla K40m")
# requirements = (CUDADeviceName == "Quadro RTX 6000")
requirements = (CUDADeviceName != "Tesla K40m")

# Note: to use multiple CPUs instead of the default (one CPU), use request_cpus as well
Request_cpus = 8

# E-mail option
Notify_user = [email protected] /cdn-cgi/l/email-protection
Notification = always

Environment = MY_CONDOR_JOB_ID= $(CLUSTER)

# "Queue" means add the setup until this line to the queue (needs to be at the end of script).
Queue

看起来你的可执行文件是一个 python 脚本。当脚本本身存在,但解释器列出“#!”时,Linux会报告“no such file or directory”系统上不存在。这可能就是这里发生的事情吗?这个脚本的第一行是什么样的?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何帮助Condor找到它应该在作业中执行的文件? 的相关文章

  • toLocaleDateString Javascript日期格式问题[重复]

    这个问题在这里已经有答案了 我有一个脚本 我想将日期格式化为短日期格式 即 2013 年 7 月 3 日或 2013 年 7 月 3 日 第一个日期格式的呈现方式与 Chrome 中的呈现方式类似 但其他浏览器则不然 它显示日期 月份名称和
  • 在多个程序集中定义的 System.Tuple

    我刚刚在 Windows 8 中安装了 VS 11 当我获得使用 VS 2010 构建的最新解决方案 然后构建它时 我收到此错误 在 VS 11 中 预定义类型 System Tuple 在多个程序集中定义 在全局别名中 使用 c Prog
  • 非全屏时保存 WebBrowser 控件截图

    我得到了 WebBrowser 控件中包含的网页的屏幕截图 正如所描述的那样here http www dreamincode net code snippet3389 htm and here https stackoverflow co
  • MySQL 错误:“列计数与第 1 行的值计数不匹配” - 初学者帮助

    基本上 使用的是 php 和 MySQL 我是初学者 我想做的是将用户注册到我的数据库中 因此将表单输入存储到我的 users tb 中 当我尝试将值插入表单时出现此错误 列计数与第 1 行的值计数不匹配 我认为这是因为我没有插入 user
  • Java:是否可以通过 Object(In|Out)putStreams 在阻塞 SocketChannel 上进行并发读取和写入?

    我创建了一个ObjectInputSteam and ObjectOutputStream在阻塞上SocketChannel我正在尝试同时读写 我的代码是这样的 socketChannel SocketChannel open destNo
  • Android:无法从 json 检索数据

    我从上一个活动到此活动获取某个事件的一个 id 并将该 id 传递到当前活动中的 url 以获取该 url 中存在的城市名称 我的代码是 String s getIntent getStringExtra ar try HttpPost h
  • 仅当“beforeunload”函数返回 true 时才运行 Javascript 代码

    当用户离开页面时 我使用 JQuery 捕获卸载事件 这工作得很好 但我只有在用户发生以下情况时才需要保存数据really想离开 这是我的第二十二条军规 如果我过早保存代码并且用户不想离开 那么我就破坏了支持代码的 Web 服务的状态 因此
  • Pandas:如何循环并删除列具有单个条目的行

    所以我有一个包含一定数量列的 pandas 数据框 下面是一个简单数据框的代码 但真正的数据框有超过 100 列 X pd DataFrame A Z A Z B Z columns COL1 COL2 我想要做的是遍历每一列并删除仅发生单
  • 使用位图进行 9830416 字节分配时内存不足

    我从资产文件夹中获取一些图像 但有一个例外 03 11 10 18 28 019 E dalvikvm heap 4052 Out of memory on a 9830416 byte allocation 我这里有这个错误 stream
  • Fortran 分配/解除分配

    我有以下问题 Fortran90 中分配 取消分配语句的实际开销是多少 即 在循环内分配几个中等大小的数组 例如 do i 1 1000 allocate tmp 20 tmp 1 20 1d0 call foo tmp deallocat
  • 小型 JavaScript 实现? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我需要一个极其微小的 Javascript 实现 也许是它的子集 代码大小和内存使用非常重要 速度不是问
  • django 文件上传:[Errno 13] 权限被拒绝:'/static'

    我正在尝试在 django 中上传多个文件 在我使用 django 内置服务器的本地计算机上 一切正常 但在我的生产力服务器上 我收到此错误 Errno 13 Permission denied static 关于这个问题有很多问题 但我发
  • PyCharm 中使用“Pandas”和“Seaborn”时出现类型错误

    我目前正在使用 Python 和 IDE PyCharm 来绘制在 pandas 和 seaborn 中生成的数据框 我正在应用以下代码 from matplotlib import pyplot as plt import pandas
  • C# - 重命名目录的方法[重复]

    这个问题在这里已经有答案了 我在用着Directory Move oldDir newDir 重命名目录 我时不时地得到一个IOException说 访问路径 oldDir 被拒绝 但是 如果我右键单击资源管理器中的目录 我可以重命名它 没
  • 处理编辑时的 dataGridView FormatException

    我正在制作一个包含四列的 datagridview 最后一列的类型是以小时和分钟为单位的日期时间 HH mm DataTable Columns Add Time typeof DateTime fourth column dataGrid
  • CSS透明金色背景

    I ve been struggling for days on how to achieve this transparent gold at the right side of the image below 这就是 PSD 中的样子
  • 按日期降序对 scandir 进行排序

    我正在使用此代码列出目录 foreach scandir back 1 as folder if in array folder array continue echo basename folder get folder s name 但

随机推荐