对于 git 存储库中的给定文件,我想查找修改该文件的最后一次提交的 SHA 以及时间戳。
在命令行中,该数据对于特定文件路径的 git log 是可见的,例如
git log -n 1 path/to/file
使用 ruby 的“git”gem 我也可以这样做:
require 'git'
g = Git.open("/path/to/repo")
modified = g.log(1).object(relative/path/to/file).first.date
sha = g.log(1).object(relative/path/to/file).first.sha
这很棒,但是当我循环通过很多路径时,运行速度太慢了。由于 Rugged 使用 C 库,我希望它会更快,但不知道如何用 Rugged 语法构建正确的查询。有什么建议么?
这应该有效:
repo = Rugged::Repository.new("/path/to/repo")
walker = Rugged::Walker.new(repo)
walker.sorting(Rugged::SORT_DATE)
walker.push(repo.head.target)
commit = walker.find do |commit|
commit.parents.size == 1 && commit.diff(paths: ["relative/path/to/file"]).size > 0
end
sha = commit.oid
摘自并改编自https://github.com/libgit2/pygit2/issues/200#issuecomment-15899713 https://github.com/libgit2/pygit2/issues/200#issuecomment-15899713
顺便说一句:仅仅因为耐用性是用 C 编写的,并不意味着昂贵的操作突然变得便宜且快速。显然,您节省了大量的字符串解析和类似的东西,但这并不总是瓶颈。
由于您对此处的实际文本差异不感兴趣,因此 libgit2GIT_DIFF_FORCE_BINARY
可能也有助于提高此查找的性能 - 不幸的是,这在 Rugged 中尚未提供(但很快就会提供)。
使用 Rugged 存储库本身进行测试,它可以正常工作:
repo = Rugged::Repository.new(".")
walker = Rugged::Walker.new(repo)
walker.sorting(Rugged::SORT_DATE)
walker.push(repo.head.target)
commit = walker.find do |commit|
commit.parents.size == 1 && commit.diff(paths: ["Gemfile"]).size > 0
end
sha = commit.oid # => "8f5c763377f5bf0fb88d196b7c45a7d715264ad4"
walker = Rugged::Walker.new(repo)
walker.sorting(Rugged::SORT_DATE)
walker.push(repo.head.target)
commit = walker.find do |commit|
commit.parents.size == 1 && commit.diff(paths: [".travis.yml"]).size > 0
end
sha = commit.oid # => "4e18e05944daa2ba8d63a2c6b149900e3b93a88f"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)