我在 GitHub 中有一些 java 文件的 URL。我想将 URL 传递给方法,下载文件并使用不同的唯一名称保存它。
这是我编写的代码,它存在代码片段下面提到的问题。
!pip install wget
import wget
from datetime import datetime
def download_file(url):
# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'
# Download the file and save in colab location
wget.download(url, file_name)
return file_name
我传递给此方法的示例 URL 是“https://github.com/e32wong/CloCom/blob/master/CloneDigger.java”
问题是,下载的 java 文件的内容显示为充满标签的 HTML 内容。但是,GitHub 上的原始文件是一个简单的 java 文件。
我想按原样保存文件。请问有什么解决办法吗?
问题出在 URL 上。您必须传递文件的原始 URL。
Page URL:'https://github.com/e32wong/CloCom/blob/master/CloneDigger.java'
Raw URL: 'https://raw.githubusercontent.com/e32wong/CloCom/master/CloneDigger.java'
您可以通过替换轻松修改 url。尝试这个。
def download_file(url):
# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'
#Edit url as the raw file url of github
url = url.replace('github.com', 'raw.githubusercontent.com', 1)
url = url.replace('/blob/', '/',1)
# Download the file and save in colab location
wget.download(url, file_name)
return file_name
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)